282 12 16MB
French Pages 331 Year 2005
Sources et évolution
delaphysiquequantique Textesfondateurs
José LEITE LOPES et
Bruno ESCOUBÈS
Ki SCIENCES
17, avenue du Hoggar Parc d’activités de Courtabœuf, BP112 91944 Les Ulis Cedex A, France
Une précédente édition de ce livre a été publiée en 1994 aux Éditions Masson. Ouvrage publié avec le concours du Centre national du livre.
ISBN : 2-86883-815-4 Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du il mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d u n e part, que les (( copies ou reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective »,et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, de la physique, décidée par l’ONU2 et lancée par l’UNESCO à l’occasion du centenaire de la publication des travaux de 1’« année d’or >> d‘Einstein, puisque les textes rassemblés s’inscrivent dans la suite directe de ces recherches pionnières, dégageant ce qui apparaissait peu à peu comme la voie royale de la physique de la matière élémentaire, atomique, nucléaire et subnucléaire. Cet ouvrage est susceptible d’aider à renouer, sur des problématiques contemporaines, le fécond et nécessaire dialogue des sciences avec la philosophie. Ces > sont dus à la plume de physiciens importants du XXe siècle, et les organisateurs du recueil sont également physiciens. J. Leite Lopes, qui fut l’élève de Wolfgang Pauli et de José-Maria Jauch lors de ses années de doctorat aux États-Unis, ami de Richard Feynman, de David Bohm, et de nombreux autres physiciens prestigieux, est connu internationalement par ses travaux, notamment sur les interactions faibles (on lui doit une première esquisse de leur unification avec les interactions électromagnétiques dans le domaine quantique) ; il fut lui-même l’un des pionniers de la physique théorique au Brésil, grand professeur et créateur d‘institutions qui ont formé des générations de chercheurs du Brésil et d‘Amérique latine. Homme de progrès, il fut proscrit par la dictature militaire qui sévit dans son pays des années 1960 jusqu’au début des années 1980. Nourri de culture française, c’est en France qu’il trouva l’accueil qui lui permit la poursuite de ses travaux : à l’université Louis Pasteur de Strasbourg où il a enseigné jusqu’à sa retraite, reprenant ensuite ses activités au Brésil où il se trouve aujourd‘hui. Pendant son séjour en France, il engagea de fructueuses collaborations avec les physiciens expérimentateurs, et promut des dialogues riches et stimulants avec des chercheurs d’autres disciplines, et notamment des philosophes, suscitant la fondation du Séminaire sur les Fondements des Sciences de
Aux éditions Masson (Paris). Lors de sa 58eAssemblée Générale.
IV
Sources et évolution de la physique quantique
l’Université Louis Pasteur-Strasbourg-ï3. La collaboration entre José Leite Lopes et Bruno Escoubès (1938-1999), physicien expérimentateur des particules, chercheur au CNRS, également intéressé par les questions de fondements et de méthodologie4, a pris naissance dans ce cadre, enrichie par des rapports personnels d’amitié. Bruno Escoubès n’aura malheureusement pas le plaisir de voir republié le livre Sources et évolution de la physique quantique, où il s’était grandement investi, puisqu’il nous a quittés prématurément, encore en pleine activité, en 199g5. Ce livre est donc de part en part l’ouvrage de physiciens et il intéressera au premier chef les praticiens de cette discipline par les perspectives qu’il leur rappellera dans ce domaine. Mais en même temps on saisira très vite, à la lecture, comment il déborde les aspects spécialisés d u n e discipline scientifique, en faisant revivre à nos yeux toute une aventure intellectuelle et ses enjeux. I1 intéressera, à ce titre, très largement au-delà de la physique, ceux qui se préoccupent de la formation des idées scientifiques, des nouveaux concepts et des théories, de la nature et du rôle de l’expérimentation, et des implications plus générales de la nouvelle physique sur les conceptions de la connaissance et du monde matériel. À cet égard il est utile de reprendre des éléments du commentaire que l’un d’entre nous en donnait pour accueillir la première édition6. c< Pour ceux qui travaillent dans la recherche, la physique va toujours de l’avant, de sorte que le “centre de gravité” des représentations qu’ils s’en font est toujours un petit peu au-delà du présent. Avant même d’avoir terminé l’analyse expérimentale et théorique des phénomènes observés, ils sont déjà en train d e n prévoir d’autres, que la force d’entraînement des premiers réclame - car les explications ne sont jamais fermées, et nécessitent quelque chose en plus. Pour les autres, les non-spécialistes, et jusqu’à un public relativement large, les conceptions de la physique contemporaine font désormais partie de notre univers intellectuel, à tel point que les descriptions et les commentaires qu’on
Fondé, au début des années 1970, et animé par J. Leite Lopes, Hervé Barreau et l’un d’entre nous (MP), ce séminaire eut un rôle important pour favoriser les dialogues interdisciplinaires. I1 nourrit la publication de Cahiers et, jusqu’au début des années 1990, de la revue Fundamenta Scientiz. C’est sur l’initiative de J. Leite Lopes que fut organisé, en 1974, le Colloque Un demi-siècle de Mécanique Quantique, qui compta, essentiellement grâce à son intermédiaire, avec des collaborations prestigieuses ; voir la publication : J. Leite Lopes et M. Paty (eds.), Quantum mechanics, a halfcentury later, Reidel, Dordrecht, 1977. (I1 en existe une version préliminaire avec une partie des textes en français. publiée comme Cahiers Fundamenta Scientile (ULP, Strasbourg), nos25 à 4 i : cette publication peut être consultée dans diverses bibliothèques, notamment la Bibliothèque Universitaire de Strasbourg et la Bibliothèque Nationale de France). Il a notamment donné un ouvrage apprécié sur les méthodes statistiques en physique : B. Escoubès, Probabilités et statistiques à l’usage des physiciens, éditions Ellipses, Paris, 1998. La vie, les travaux et les engagements de Bruno Escoubès sont évoqués dans la brochure à Bruno Escoubès. Hommages et témoignages, CNRS, Strasbourg, 29 septembre 1999. M. Paty, [C-r de lecture] c< J. Leite Lopes et B. Escoubès, Sources et évolution de la physique quantique. Textes fondateurs N, Lettre des Départements scientifiques du CNRS. Physique nucléaire et corpusculaire, IN2P3, no 19, oct.-déc. 1994, 26-27.
Avant-propos
V
en donne sont toujours actualisés, formulés dans des termes d‘aujourd’hui, comme s’ils l’avaient toujours été, participant d u n e connaissance intemporelle et énoncés une fois pour toutes, bien que l’on sache que la physique évolue et que l’on attende toujours son fin mot. En sorte que l’on en oublie les tâtonnements anciens et les surgissements périodiques d‘idées nouvelles qui ont marqué toute son histoire. Cela vaut d’ailleurs pour les accomplissements relativement récents : tendus vers la recherche du sixième quark ou des bosons de Higgs, l’on en oublie presque que ce qui les a motivés, les symétries de jauge, ont fait un jour leur apparition, ellesmêmes suscitées dans la pensée théorique par des problèmes antérieurs... Si nous dévidons, à partir de ce que nous savons aujourd‘hui de la physique des particules élémentaires et des champs quantifiés, le fil des questions et des découvertes, qui sont inextricablement d’ordre expérimental et d’ordre théorique, c’est tout le développement de la physique atomique et quantique qui se présente nous. Telle est l’aventure que nous proposent J. Leite Lopes et B. Escoubès - comme une cure de rajeunissement pour une discipline déjà riche et quelque peu âgée, plutôt qu’un simple album de souvenirs - en nous donnant à lire et en nous présentant l’ensemble de textes fondateurs réunis dans ce livre. Quelle fraîcheur, en effet - et quel plaisir intellectuel - de lire, dans les termes mêmes de leurs inventeurs, dans le halo parfois incertain, parfois déjà étrangement précis, de leur apparition, de leur nouveauté, les énoncés de cette physique qui s’élabore peu à peu, de la découverte de la radioactivité à la recherche de la symétrie des champs unifiés. I1 était, bien entendu, nécessaire de faire un choix parmi l’abondante production d’idées et de résultats couvrant tout un siècle - depuis la découverte faite par Becquerel -, et portant sur un vaste domaine. Celui-ci inclut, en effet, la physique des rayonnements et de l’atome, la physique quantique sous sa première forme, semi-classique, puis comme mécanique quantique, prolongée en théorie quantique des champs, les physiques atomique et nucléaire, celle du rayonnement cosmique, enfin la physique des particules élémentaires, prolongée dans 1’« astroparticule >> actuelle et la cosmologie des premiers instants de l’Univers. Le choix proposé par J. Leite Lopes et B. Escoubès se fonde sur le fait que la théorie des particules élémentaires s’identifie aujourd’hui à la théorie quantique des champs, et que l’axe théorique de tous ces développements - très bien indiqué par le titre de leur ouvrage - est celui de l’élaboration de la théorie quantique, qui culmina un temps avec la mécanique quantique non relativiste, mais qui a pris décidément depuis la direction - relativiste - de la théorie quantique des champs, de l’électrodynamique quantique aux champs de jauge unifiés. Une fois prise la décision de privilégier la physique théorique sous son aspect fondamental, dans la ligne indiquée, le choix des textes apparaît judicieux. Ceux qui ont été retenus comptent parmi les plus significatifs de l’élaboration de la physique quantique, de la radioactivité à la mécanique quantique et à la théorie quantique des champs, tout en restant généralement accessibles au-delà des jargons techniques - et ne serait-ce pas là, d’ailleurs, la définition de ce que l’on pourrait appeler désormais les grands classiques >> ? Ils sont répartis en chapitres, introduits par un commentaire, toujours éclairant, qui les ((
VI
Sources et évolution de la physique quantique
situe dans leur contexte et évoque les autres travaux qui les ont rendus possibles ainsi que ceux, également importants, mais qui ne pouvaient trouver leur place dans ce précieux recueil. Le résultat est une présentation de tout un pan de la physique contemporaine, à travers la lecture directe de certains de ses textes fondateurs, telle qu’elle s’est constituée grâce à l’invention d‘idées nouvelles conçues pour la formulation et la résolution des problèmes posés par la structure de la matière. La plupart des textes choisis sont des articles originaux - souvent d‘accès difficile, notamment en langue française. Quelques-uns sont de nature expérimentale, comme ceux de Becquerel sur la radioactivité, de Rutherford sur l’existence du noyau atomique, de Uhlenbeck et Goudsmit sur la mise en évidence du spin de l’électron. D’autres sont plus (< phénoménologiques »,comme celui de Pauli sur le principe d’exclusion, ou celui de Fermi sur la statistique qui porte son nom. D’autres, enfin, sont de nature plus (c fondamentale >> d u point de vue théorique, et ce sont les plus nombreux, en raison du principe qui a présidé à la sélection. Ils concernent tout d‘abord l‘hypothèse des quanta de Max Planck et d’Albert Einstein. De la période intermédiaire entre les premières idées sur les quanta et l’élaboration de la mécanique quantique, les auteurs ont retenu l’article de S.N. Bose sur la statistique des particules de spin entier. L’absence des articles fondamentaux d‘Einstein de cette période intermédiaire, celui de synthèse de 1915 (((Vers une théorie quantique du rayonnement », republié en 1916), qui fut le point de départ de tous les travaux ultérieurs, vers la mécanique ondulatoire comme vers la mécanique quantique, et ceux de 1924-1925 sur ce qui devait s’appeler la (< statistique de BoseEinstein », s’explique par le fait que ces textes sont devenus des classiques, republiés et plus faciles à trouver7. L’élaboration des mécaniques ondulatoire et quantique est présente par des articles de Louis de Broglie, Erwin Schrodinger, Werner Heisenberg, ainsi que celui de Max Born établissant à la fois 1’ (( approximation de Born N en théorie des perturbations et l’interprétation probabiliste de la fonction d’onde. Celle de la mécanique quantique relativiste nous est donnée avec l’article original de Paul A.M. Dirac. Les questions d’interprétation au sens général, caractéristiques de la mécanique quantique, ne sont pas absentes, représentées par Niels Bohr et la complémentarité, ainsi que par les considérations de Fritz London et Edmond Bauer sur la réduction du paquet d‘ondea. L‘élaboration de la théorie quantique des champs et les développements récents sont confiés à des rétrospectives, plus accessibles et synthétiques que les contributions originales - telles la découverte par Richard Feynman des intégrales de chemin, contée par son auteur de la manière la plus vivante, ou l’invention de la théorie électrofaible évoquée par Steven Weinberg dans son Les Annales de la Fondation Louis de Broglie (1979, 1982) en ont donné naguère des traductions, et l’édition en français des CEuvres choisies d’Einstein (6 vols., Seuil, Paris, 1989-1993) a incorporé de nouvelles traductions de ces articles dans le premier volume, sur Les Quanta (1989). I1 aurait fallu un autre volume entier pour couvrir tout ce domaine, comme par exemple le livre de recueil de textes de John A. Wheeler et Wojcieh H. Zurek, Quantum the0 y of measurement, Princeton University Press, Princeton, 1983.
Avant-propos
VI1
Discours de réception du Prix Nobel - ; ils sont aussi l’objet de prospectives, par la reprise d’un texte de Pierre Fayet, qui sert de conclusion ouverte sur l’avenir, avec les perspectives offertes aujourd’hui à l’unification. Un appendice sur la physique: nucléaire au cours des années 30 dans différents pays et une bibliographie complètent l’ensemble. Au total, on ne peut que se féliciter de l’heureuse initiative prise par José Leite Lopes et Bruno Escoubès en mettant sous nos yeux un ensemble aussi riche d’idées et aussi exemplaire dinventivité, qui témoigne à l’évidence pour la créativité du travail scientifique, avec ceci de remarquable que les formes inventées nous rendent intelligible la constitution matérielle du monde où nous vivons. >> Ces textes représentent des moments marquants de l’histoire de la physique contemporaine et de son développement, tant par le mouvement de la pensée qu’ils rendent manifeste pris dans leur ensemble, que par leurs incidences implicites ou explicites sur les problèmes de la philosophie de la connaissance. Cette réédition, qui se présente SOUS la forme d’un fac-similé, n’appelait pas de changement particulier par rapport à la première, et nous avons également jugé bon de garder la préface, tout à fait pertinente, que Jean-Marc Lévy-Leblond, professeur émérite à l’université de Nice, avait donnée pour la première édition à la demande des auteurs. Nous remercions vivement José Leite Lopes et Salomé de Unamuno Escoubès, légataire de son époux décédé, de nous avoir confié cet ouvrage, de nous avoir fourni tous les éléments pour sa publication, et de ne pas avoir désespéré au vu des difficultés éditoriales rencontrées. Michel PAW et Jean-Jacques SZCZECINIARZ
TABLE DES MATIÈRES Préface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
XI
Chapitre 1 : De l’atomisme grec à la découverte de la radioactivité 1.1 Les intuitions grecques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 L‘atomisme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3Ladynamique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.4 La cosmologie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.5 La synthèse newtonienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.6 Les découvertes du XIXe siècle .............................
4 6
Article I - H . Becquerel :Découverte de la radioactivité
11
...........
1
3
7 9
Chapitre 2 : De la relativité à la première quantification 2.1 La théorie de la relativité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Planck et la quantification de l’énergie ; Einstein et les photons . . 2.3 Les modèles atomiques, de Thomson à Bohr . . . . . . . . . . . . . . . . . .
13 16 18
Article II - M . Planck :Quant3catioiî de l’interaction rayonnementmatière . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
20
Article III - A . Einstein :Le photon
28
Article IV
-
E . Rutherford
........................... : La mise en évidence du noyau . . . . . . . . .
41
Chapitre 3 : La construction de la nouvelle mécanique 3.1 Le principe d‘exclusion et le spin de l’électron. La condensation de Bose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
57
Article V - W. Pauli :Le principe d’exclusion
63
....................
Article VI - G.E. Uhlenbeck et S . Goudsmit :Le spin de l’électron . . . .
78
Article VI - E . Fermi :La statistique des fermions
...............
81
Article VIII - S . Bose :La statistique des bosons
................. .................................
85
3.2 La mécanique quantique
89
Article I X - L. de Broglie :La longueur d’onde associée à la matière
92
Article X - E . Schrodinger :L’équation non relativiste des ondes de DeBroglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
99
.......... 2.3 L’interDrétation Drobabiliste de la mécanique quantique . . . . . . . . _-
Article XI ....
~
I . .
W . Heisenberg ~
I
:La mécanique des matrices I
-
112 126
X
Sources et évolution de la physique quantique
............... Article XIII - N . Bohr :Le principe de complémentarité . . . . . . . . . . . Article XIV . F. London et E . Bauer :Le problème de la mesure enphysique ................................... Article XII . M . Born :Lfndéterminisme quantique
129
133
153
Chapitre 4 : De la mécanique quantique relativiste à la théorie quantique des champs
............. P A M . Dirac :L’équation d’onde relativiste de l’électron . . Article XV . 4.2 L’électrodynamique quantique ............................. 4.3 La quantification par l’intégrale de chemin . . . . . . . . . . . . . . . . . . . 4.1 La mécanique quantique relativiste : l’anti-matière
189 194 209 210
4.4 Les diagrammes de Feynman pour les propagateurs de l’électron etduphoton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 4.5 Le positon et la marche de l’électron vers le passé . . . . . . . . . . . . . . . 215 4.6 La renormalisation des théories quantiques des champs . . . . . . . . 217 Article XVI - R.P. Feynman : L’électrodynamique quantique
.......
219
Chapitre 5 : Les grandes heures de la physique des particules 5.ïLeneutrinodePauli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.2Leneutron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5.3 Le champ de mésons de Yukawa ...........................
241 242 243
Article M I - H . Yukawa :La prédiction du méson
246
................
5.4 Les accélérateurs et les détecteurs de particules . . . . . . . . . . . . . . . 255 5.5 La découverte des mésons : la désintégration des pions et desmuons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256
Chapitre 6 : Vers l’unification des interactions 6.1 Les particules élémentaires et le modèle SU(3) de Gell-Mann . . . . . 261 6.2 Les champs de jauge et les interactions fortes . . . . . . . . . . . . . . . . . 270 6.3 Le modèle standard d‘unification des interactions électromagnétique etfaible . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
.......... 6.4 La super-unification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Article XIX - P. Fayet :L’unification de toutes les interactions ? . . . .
Article X W I I - S. Weinberg :L’unification électro-jiaible
279 296 299
Appendice . La physique nucléaire dans les années 30 aux ÉtatS.unis, en France. au Japon et au Brésil . . . . . . . . . 307 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
311
Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
313
PREFACE Pourquoi (re)lire les classiques ? On n’imagine pas un écrivain qui n’aurait pas lu Proust et Faulkner, un philosophe qui n’aurait pas travaillé Husserl et Sartre, un musicien qui n’aurait pas écouté Stravinski et Messiaen, un peintre qui n’aurait pas regardé Picasso et Malevitch. Mais on ne s’étonne pas qu’un physicien n’ait pas lu Einstein ni Heisenberg - pour nous en tenir à ce siècle : la comparaison entre la fréquentation par leurs successeurs respectifs de Rabelais et Cervantes, Descartes et Kant, Monteverdi et Mozart, Titien et Goya d’une part et Galilée et Newton de l’autre, n’est que trop éloquente. On a même théorisé cette amnésie constitutive : “ une science qui hésite à oublier ses fondateurs est condamnée ” a pu écrire Whitehead au début de ce siècle. I1 est vrai que la science se laissait encore prendre pour le parangon du progrès. Nous abandonnons à peine cette belle mais naïve vision. C’est le développement même de la science qui nous y contraint. On aurait bien surpris les jeunes chercheurs d’il y a trente ans en leur annonçant qu’à la fin de ce siècle, l’un des domaines les plus actifs et les plus prestigieux de la physique théorique serait la dynamique non-linéaire, héritière directe de la “ vieille ” mécanique du l g e , pardessus trois quarts de siècle de physique “ moderne ”, quantique et relativiste. On les aurait choqués plus encore en leur apprenant que la physique des particules et interactions fondamentales, après 50 ans de domination peu contestée sur la physique de pointe ”, allait probablement connaître à son tour une phase de récession. Aussi pourrait-on voir avec quelque malice le présent recueil des grands textes originaux qui ont jalonné le développement de la physique atomique, puis nucléaire et subnucléaire, comme ces albums de souvenir nostalgiques que les grandes stars feuillettent au soir de leur carrière pour se rappeler leurs succès passés. La physique contemporaine a bien sûr d’autres sources et a connu d’autres évolutions, ne serait-ce que dans les domaines de l’astrophysique et de la cosmologie, de la physique des solides et des matériaux, de la physique statistique et de la dynamique des fluides, par exemple, pour se retrouver toute entière dans cette histoire. 11n’en demeure pas moins que cette physique, celle de la plongée vers l’élémentaire de la matière et le fondamental de sa pensée (même si l’un et l’autre sont toujours plus élusifs, d’ailleurs), a connu au cours de ce siècle des succès majeurs et qui resteront dignes d’admiration. La lutte des théoriciens pour rompre avec des représentations trop familières et pour construire de nouveaux concepts adéquats à la compréhension du monde dans ces cantons nouveaux de notre expérience ne saurait être sous-estimée. I1 est bon de pouvoir revivre “ en direct ” ces efforts admirables, et d’en retrouver la vigueur et la complexité, trop souvent affadies ou aseptisées dans les manuels d’enseignement et les livres de vulgarisation.
XII
Sources et évolution de la physique quantique
On peut d’ailleurs formuler le vœu qu’un second volume de cette entreprise vienne bientôt rendre hommage au travail des expérimentateurs qui ne fut pas moindre : Bohr sans Rutherford, de Broglie sans Davisson et Germer, Fermi (thée ricien) sans Fermi (expérimentateur), Feynman sans Lamb, ne peuvent illustrer qu’une face des médailles commémoratives des triomphes de cette physique. Que ces travaux pratiques n’aient pas connu, hors du milieu professionnel, la même notoriété que les recherches théoriques, et n’aient pas fait i’objet d’autant d‘exégèses philosophiques et métaphysiques souvent douteuses ne fait que renforcer la nécessité de corriger une vision par trop désincarnée de la science contemporaine. A propos de ces exégèses d’ailieurs, la vulgate des commentaires épistémologiques et historiques sur la théorie quantique, et beaucoup d’idées reçues sur son interprétation et ses implications, seront sérieusement mises à mai par le retour aux sources que nous offre ce livre ; ce n’est pas l’un de ses moindres mérites. On constatera ainsi, non sans un étonnement porteur d’intéressantes questions, qu’Einstein n’utilise pas le terme de “ photon ”,ni Rutherford celui de noyau ” : plus surprenant encore, les articles fondateurs de de Broglie ne font aucune mention de la “ longueur d’onde en tant que telle, et celui d’Heisenberg élimine d’emblée la position de l’électron des grandeurs “ observables ”. Quant à Born, c’est dans une note de repentir ajoutée lors de la correction des épreuves qu’il interprète comme probabilité le carré de la fonction d’onde ! En d‘autres termes, les idées nouvelles une fois découvertes, il reste à les dégager de leur gangue et à les polir, à les transformer en paradigme, comme on dirait aujourd’hui. Mais c’est une autre histoire - à suivre . . . Le présent ouvrage, cependant, s’il est certes un monument à la gloire d’une noble discipline, n’est pas pour autant un cénotaphe. C’est que la physique fondamentale, si elie n’est plus seule au faite de la renommée, reste encore vivante et riche de problèmes et de promesses. La difficulté même des tâches qu’elle affronte désormais rend certainement nécessaire le développement d’idées neuves. Rien de plus utile dans ces conditions qu’un retour au passé. L’histoire des sciences abonde en situations où l’innovation a surgi d‘œuvres anciennes dont certaines potentialités sont restées incomprises ou négligées (ainsi de la récente relecture des travaux de Poincaré, après plusieurs décades d’oubliettes). I1 est tout à fait plausible que nombre de textes fondateurs, comme ceux ici rassemblés, recèlent, dans la confusion inéluctable des commencements, d’utiles indications pour aujourd’hui ou demain. Il faut donc lire ces textes, non seulement comme des témoignages du pas&, mais comme des appels du futur. C’est dire que, de fait, nous devons considérer Einstein et Heisenberg comme Proust et Faulkner, Husserl et Sartre, Stravinski et Messiaen, Picasso et Malevitch. Physiciens, encore un effort pour être cultivés ! Jean-Marc Lévy-Leblond Nice, février 1994
AVANT-PROPOS Remonter aux sources, aborder les évènements - découvertes et interrogations - qui fondèrent la physique du XXc siècle, comme le firent ceux qui s’intéressèrent les premiers aux dimensions du monde quantique, et par là reaéèrent l a nature à travers ses particules et les forces s’exerçant entre elles, voici le but de ce livre. U propose, en effet, la lecture d’articles originaux choisis depuis la découverte de la radioactivité, et replacés dans leur cadre historique, allant de la vision des philosophes présocratiques à celle des physiciens d’aujourd’hui, ces derniers basant leur connaissance d u monde sur l’étude des leptons, des quarks et de leurs interactions. Quels articles ? Si, bien sûr, les plus importants n’y figurent pas tous, ceux qui ont été choisis eurent et ont toujours une importance capitale. Les uns furent à l’origine de percées théoriques et expérimentales qui bouleversèrent nos conceptions de la structure de la matière. D’autres, comme l’exposé de F. London et E. Bauer, furent considérés par leurs collègues comme essentiels en tant que mises au point sur des problèmes âprement disputés comme le fut - et comme l’est - le problème de la mesure en mécanique quantique. Les deux conférences Nobel de R.P. Feynman et S. Weinberg sont, en plus du témoignage personnel de la démarche de chacun vers la découverte, des résumés de “ l’état de l’art ” à leur époque dans les domaines de l’électrodynamique quantique et des théories d’unification. Ce faisant, nous sommes conscients que nous nous privons de de la contribution d’auteurs aussi importants que E. Wigner ou C.N. Yang, pour ne citer qu’eux. Tout choix entraîne des regrets. En quelle langue ? A quelques éclatantes exceptions près, la langue de la physique avant 1933 fut l’allemand. Quand Einstein reçut, pour donner son avis, l’article de Bose ici reproduit, il le traduisit en allemand afin de lui assurer une meilleure diffusion. Pour faciliter l’accès à des textes parfois ardus, nous avons adopté le français pour tous les textes, y compris ceux écrits en anglais et en italien. Nous mentionnerons pour chaque article le nom de son traducteur. E t nous avons pu indirectement bénéficier pour cette tâche, de collaborateurs aussi prestigieux que A. Proca ou L. Rosenfeld. Ce livre se présente donc comme une séries d‘étapes historiques, pourvues des jalons nécessaires à la compréhension des textes choisis dans l’anthologie, textes donnés quant à eux sans commentaires. L’approche privilégie celle du physicien théoricien, même si on a pris soin de signaler les principales découvertes expérimentales. Des approches complémentaires sont présentées d a n s la bibliographie à la fin de l’ouvrage, parmi lesquelles l’on peut souligner le très beau livre de E. Segrè, et, plus spécifique, celui de R.N. Cahn et G. Goldhaber.
XIV
Sources et évolution de la physique quantique
Nous vouions remercier ici tous ceux qui ont rendu ce livre possible. Et tout d’abord les physiciens de Strasbourg qui ont participé à la traduction des articles : MM. Henri Braun, Georges Fridr, Jean Klein, Georges Oberlechtner pour I’ailemand ; et Mme Clara Matteuzzi-Cundy, de Milan et du CERN, pour l’italien. Nous remercions également la Fondation Nobel de nous avoir permis de r e produire les Conférences Nobel choisies, les Editions du Seuil et Latfont pour les traductions d’Einstein et de Feynman, les éditeurs des revues où furent publiés les articles choisis ; le Niels Bohr Archive ; les Presses Universitaires de France, les éditions Hermann et la Société Française de Physique. Nous tenons aussi à remercier M. Georges Weil, du Centre de Calcul du CNRS de Strasbourg et Mme Alice Tissier, du Centre de Recherches Nucléaires, pour leur précieuse aide lors de la saisie du texte.
Chapitre 1
De l’atomisme grec à la découverte de la radioactivité 1.1 Les intuitions grecques Quelle est l’image physique du monde aujourd’hui ? Comment a-t-elle évolué à travers l’histoire ? Les spéculations sur la structure de l’Univers constituèrent toujours une part importante des systèmes philosophiques et des modèles cosmogoniquesdes anciennes civilisations. En Asie, au Moyen Orient, en Afrique, dans les Amériques, les sociétés anciennes ont produit de belles réalisations dans leur approche mythique de la nature, dans leurs monuments, dans leur génie artistique et technologique, dans leurs observations astronomiques, dans leur philosophie de l’espace, du temps, de la matière, de la vie et de la mort, dans toutes ces créations qui reflètent leur rapport au monde. Si, durant des milliers d’années, existèrent des éléments de culture avancée dans d’autres civilisations, il revint aux Grecs d’inventer les mathématiques comme représentation des principes permanents du monde, de pratiquer la philosophie mmme spéculation scientifique SUT la nature des choses, des corps célestes, de l’univers, tout en développant leur propre imaginaire mythique, religieux et artistique. Bertrand Russel écrivait : Dom toute 1 ’histoire, n’en n’est p l w surprenant ni plus dificile à ezpliquer que l’éclosion subite de la civilbation en Grèce n. Et dans son beau livre sur la philosophie des mathématiques et des sciences de la nature, Hermann Weyl affirmait : Nous devom auz Grecs une comprthemion claire de la nature intime de la structure de l’espace qui se manifeste dans les relations entre configurntiom et datu ses lois de relatiom mutuelles, ef qui est quelque chose d’entièrement rationnel n . Avant les Grecs, les Babyloniens et les Egyptiens avaient déjà fait, pendant des siècles, des observations du mouvement du soleil et de la lune par rapport aux étoiles fixes, et savaient comment prédire les éclipses lunaires et solaires. Mais les Grecs tentèrent les premiers de comprendre l’Univers en tant que tel. Alors que leur mythologie assimilait les corps célestes à des dieux, Anaxagore affinna que le Soleil était semblable à une pierre chauffée au rouge et que la Lune était faite mmme la Terre. Pour les disciples de Pythagore, à la fin du 5’ siècle avant J.-C., la Terre était sphérique ; Aristarque de Samos, au 3‘ siècle avant J.-C.découvrit le système i
Bertrand Russel, History
western philosophy, Unwin Paperbacks, London 1979. E. We 1, Philosophy of mathematics and naturalsciences, Princeton University Press, Princeton i k 9 . O/
Sources et évolution de la physique quantique
2
héliocentrique, et Erathostène, aux environs de 200 ans avant J.-C., calcula, d’après Claudius Ptolémée, la distance maximale entre le Soleil et le Terre. A Pythagore on attribue l’origine du mot théorie, un état de contemplation rempli de passion et d’&dé, origine de la connaissance mathématique et de la physique théorique. Chez Thalès, fondateur de 1’Ecole de Milet, qui prédit une éclipse de Soleil survenue en 585-584 avant J.-C., nous trouvons l’idée de l’existence d’une substance primordiale, un élément fondamental dont seraient faites toutes les choses, et qu’il identifie avec l’eau. ‘L C’est, pense-i-on, pour l’avoir appris des Egyptiena, qu’Homère et Thalès posaient l’eau comme le principe et l’origine de toutes choses ” 3 . Anzdmandre, de Milet, af€irme que toutes les choses sont faites d’une dubstance fondamentale, qui n’est ni l’eau, ni aucun des corps que n o w connaissotu : elle est infinie, éternelle, elle est la matière de tous les mondes, notre monde n’étant qu’un monde parmi beaucoup d’autres. Il existerait, suivant Anaximandre, une proportion définie de feu, de terre et d’eau ; chacun de ces éléments, conçus comme des dieux, tente de dominer les autres, mais sa proportion obéit à une fatalité, à une certaine nécessilé : cette nécessité d’une proportion entre les éléments annonce la notion de loi de la nature. Pour Anaximène, un autre penseur de Milet (antérieur à 494 avant J.-C.), la substance primordiale est l’air, le f e u étant l’air raréfié, l’air se condensant se transforme en eau, celle-ci se condensant en pierres, en terre ; la cohésion du monde serait assurée par une espèce de respiration - une notion qui sera substituée au XIX‘ siècle par l’éther, substance dont le rôle serait de transmettre à travers l’espace les actions physiques. Cette approche matérialiste de la nature s’accompagne d’une intuition qui se révèlera féconde. Pour Pythagore, toutes les choses Jont des nombres. Aristote décrivait ainsi les Pythagoriciens : “ . .comme, e n plw ils voyaient que les nombres ezpn’maient les propriétés et les proportions muaicales ; comme enfin toutes les autres choses leur paraissaient, datu leur nature, formées à l’image des nombres, et comme les nombres parausaient être les réalités primordiales de l’Univers : dans ces conditiotu, iLc considéraient que les principes des nombres sont les éléments de tow les êtres et que IC Ciel entier est harmonie et nombres ‘. Ce principe, qui situe les mathématiques au m u r de la réalité, évoluera sous différentes formes jusqu’à Galilée, Newton, puis Maxwell, Einstein et Dirac, et enfin jusqu’aux physiciens contemporains créant les théories et les modèles d’unification. Que disons-nous aujourd’hui ? Les premiers éléments de toutes les choses se constituent en familles de particules, les leptotu (comme l’électron), les q u a r b (constituants du proton, du neutron) et certains champs de jauge (comme le champ électromagnétique) qui déterminent leurs interactions et obéissent à des structures abstraites : des symétries ; une violation spontanée de certaines de ces symétries engendre la masse des particules et les forces se produisent à travers les quanta
.
‘ 1981.
Plutarque, .cité dans Les Présocmtiques, p 14, Gallimard, Paris 1988. Aristote, La Métaphysique, A, 5, 985b, 25, Librairie Philosophique J. Vrin, Paris
De l’atomisme grec à la découverte de la radioactivité
3
des champs, gluons, gravitons, photons et bosons intermédiaires. Des quarks pro+ ennent les hadrons, parmi lesquels les baryons ; les baryons (comme le proton, le neutron) donnent lieu aux noyaux des atomes ; des leptons (électrons) et des noyaux forment les atomes des corps que nous percevons. Des leptons, quarks, bosons, noyaux et atomes résulte une multitude de structures physiques (dont une structure pensante), l’ensemble formant un cosdos, devenu intelligible grâce à l’étude de ses éléments premiers constitutifs. Autre conception antique qui préfigurait une approche moderne : paraliélement aux Milésiens et à leur recherche des principes unificateurs du monde, apparaît Héraclite qui, lui, pense cette unité du monde comme le résultat de la combinaison des contraires ; de plus il pense que l’un est formé de toutes les choses, et toutes les choses proviennent de l’un ’. Le feu est une substance primordiale, car il possède les propriétés de la matière, au moins la matière corporelle, mais il est p l u subtil. Héraclite h a i t que les êtres mortels sont immortels, les immortels sont mortels, l’un vit de la mort de l’autre et meurt de la vie de l’autre Les photons, nous le savons aujourd’hui, peuvent naître d’une annihilation de paires d’électron-positon, des paires de particuleantiparticule naissent de la mort d’un photon. L’opposition des contraires, l’harmonisation de tensions opposées, comme pour l’arc e f la lyre, telle est l’idée qui semble avoir longuement cheminé à travers de nombreux systèmes conceptuels, depuis la pensée d’Héraclite jusqu’au cœur de la science moderne : le principe fondamental de la conjugaison de charge en est un exemple.
‘.
1.2 L’atomisme Les philosophes grecs fondateurs de l’atomisme furent Leucippe (vers 440 av
J.-C.)et Démocrite (420 av J.-C.),influencés par le monisme de Parménide et de Zénon. Effectuant une sorte de synthèse des systèmes de Parménide et d’Empédocle, ils postulèrent que toutes les choses sont composées d’atomes en incessant mouvement datu le vide ; que les atomes sont indivisibles, qu’ils ont toujours été et qu’ils seront toujours animés de mouvement. Les atomistes admettaient le vide que refusera Aristote, ainsi que le déterminisme : rien n’arrive par haard. La constitution atomique rend compte des différences de densité des corps, les transformations qui se produisent dans le monde sont conséquence des changements dans le temps des distances entre les atomes. Ceux-ci sont invisibles, rigides et impénétrables. La doctrine de Démocrite et de Leucippe fut reprise par Epicure, et, ensuite, par Lucrèce au le’ siècle avant J.-C. Lucrèce écrivait dans son ouvrage De la Nature : Un est le savoir. II connait la pensée par qui sont ouvernées toutes chosw au moyen de toutes choses ”, Diogène de Laerce cité dans Les $résocmtiques, p 155, Gallimard, Paris 1988. Voyez le fragment : Immorteb morteb, mortels, immortelr ;vivant de ce=-là la mort, mourant de ceuz-l0 la uie ”. Ci. Les Prbocratipes, Héraclite, Fragmenta, p 160, Gallimard, Paris 1988. Garnier-Flammarion, Paris 1964.
‘ ’
Sources et évolution de la physique quantique
4
Les corps sont, d’une part les principes simples des choses, les atomes, et d’autre part, les composés formés par ces élémenfs premiers. Quant à ceuz-ci, aucune force n’est capable de les détruire ;à toute tentative dans ce sens, i L résistent avec solidité. Du reste, si l’on n’admettait pas dam la nature un terme ultime de petitesse, les corps les p l u pet& seraient formés d’une infinité de parties, puisque chaque moitié possédera toujours une moitié, et airui de suite jusqu’d l’infini. Quelle différence aurait4 entre l’Univers lui-même et les corps les plus petits ? Aucune différence ne pourrait être établie : aussi petit ou aussi grand que l’on suppose i’univers, les corps les plus petits seraient, euz aussi, composés d’une infinité de parties. La raison se révolte contre cette conséquence et n’admet pas que l’esprit l’accepte ;pour cela, il est nécessaire que tu t’avoues vaincu et que tu reconnaisses qu’il ezUte des particules irréductibles à toute division et qui atteignent le degré ultime de petitesse ; et comme elles ezistent, il te faut reconnaître aussi qu’elles sont solides et éternelles n, I1 est important de signaler que les atomistes n’adoptèrent pas l’idée de finalité, c’est-à-dire l’idée qu’un événement dans le futur détermine I’occurence d’un événement du présent. Leur conception mécaniste des phénomènes, non téléologique, annonçait ainsi une dynamique qui se prêtera à une formulation mathématique, condition sine qua non d’une description exacte du mouvement. Mais entretemps, cette approche sera supplantée par la physique d’Aristote, essentiellement qualitative mais intégrkà la philosophie de la nature la plus cohérente et complète qu’ait produite la pensée antique.
1.3 La dynamique Pour Aristote, les corps célestes et terrestres n’obéissent pas aux mémes lois. Le ciel se caractérise par la réguiarité et l’invariance des mouvements. Sur Terre, les corps se transforment et tendent vers leur fin naturelle. Du point de vue dynamique, la force motrice d’un objet terrestre est directement proportionnelle à sa masse et inversement proportionnelle à la résistance opposée à son mouvement. Un objet mobile est donc soumis à une force motrice permanente durant son mouvement. Qu’un corps terrestre se meuve par sa propre inertie - idéal dynamique ne correspondant à aucune situation réelle - était pour Aristote une impossibilité logique et physique. La pensée d’Aristote est systématisée durant les siècles qui suivent par les philosophes de la civilisation musulmane, notamment, au XI‘ siècle, par Avicenne. Médecin et philosophe perse, auteur de La Philosophie illuminative, il développe la pensée d’Aristote et est de ceux qui contribuent à préserver et à transmettre la culture grecque. Pour lui *, comme pour Aristote ’ Le temps est la m e s u n du mouvement ”. Dans le Randil, une encyclopédie de 51 volumes, connue cornme le Coran après le Coran, on trouve une liste des distances aux planètes (en fonction du rayon de la Terre) et des tailles de celles-ci ; il y est affirmé que l’espace ’ est ~-
~
~~
Cf. C.W. Misner K.S. Thorne,.J.A. Wheeler, Gravitation, p 753, W.H. Freeman and Co, San Francism 1973, d’où est tirée la citation.
De l‘atomisme grec à la découverte de la radioactivité
une forme abstraite de la matière et qui n’a d’ezistence que pour la conscience Cette conception anticipe de nombreux systèmes philosophiques à venir.
5
”.
’La physique aristotélicienne n’est remise en question dans ses principes fondamentaux qu’au VI“ siècle aprk J.-C. par Jean Philippon, puis au XN’ siècle par Jean Buridan et Nicolas Oresme, de l’fiole des Nominalistes de Paris, et par L&nard de Vinci et Jean-Baptiste Benedetti Leurs travaux, ainsi que de nombreuses autres contributions, ont rendu possible l’éclosion de la physique moderne symbolisée par les travaux de Galileo Gaiilei au XVII” siècle. Jean Buridan propose la première formulation du concept de la quantité de mouvement, à laquelle est associée une notion primitive d’inertie, tandis q u ’ O r m e met en évidence une première corrélation entre l’accélération uniforme et une série croissante d’unités de temps (équivalente au carré du temps). La rupture avec la physique d’Aristote est consommée lorsqu’au XVIP siècle Galilée énonce la première relation dynamique correcte permettant de définir la force comme fonction non de la vitesse - proportionnelle à la résistance au mouvement - mais d’un changement de vitessel’, c’est-à-dire d’une accélération - relative à l’inertie du mobile : LI Nous apportotu sur le sujet le plus ancien une science absolument nouvelle. Ii n’est peut-être rien datu la nature d’antérieur au mouvement, et les traités que lui ont consacré les philosophes ne sont petits ni par le nombre, ni par le volume ; pourtant, parmi ses propriétés, nombreuses et dignes d’être connues sont celles qui, à ma connaissance, n’ont encore été ni observées, n i démontrées. Certaines, plus apparentes, oni été remarquées, tel le fait que le mouvement naturel des graves, e n chute libre, est continuellement accéléré ; selon quelles proportions, toutefois, se produit cette accélération, o n ne l’a pas établi jusqu’ici ;nul, e n effet, que j e sache, n’a démontré que les espaces parcounu e n des temps égauz par u n mobile partant du repos ont entre e m même rapport que les nombres impairs successifs à partir de l’unité. On a démontré que les corps lancés, ou projectiles, décrivent une courbe d’un certain type ; mais que cette courbe soit une parabole personne n e l’a mis e n évidence. Ce sont ces faits, et d’auires non moins nombreuz et dignes d’être connus, qui vont être démontrés, e t aimi, ce que j’estime beaucoup plus important, ouvrir l’accès à une science aussi vaste qu’éminente, dont mes propres travauz marqueront le commencement et dont les esprits plus perspicaces que le mien ezploreront les parties les plus cachées ” ll.
’.
Le principe d’inertie se précise ensuite avec Descartes qui le définit comme rectiligne et universel. Les concepts fondamentaux de la future mécanique newtonienne étaient ainsi prêts à être intégrés au plus vaste édifice théorique qu’aura wnnu la physique jusqu’alors. Entretemps, la cosmologie aristotélicienne était, elle aussi, appelée à disparaitre. Cf. A. Koyré, Du monde clos à I’uniuers infini, Gallimard, Paris 1973. lo
Marie.Frsnçoise. Biarnais, in Postface, ZSOQC Newton, Ptincipia Mathematics, C. Bourgois Editeur, Paris, 1985. l1 Galilée, Ducours concernant deuz sciences nouvelles, Armand Colin, Paris 1970.
Sources et évolution de la physique quantique
6
1.4 La cosmologie La conception aristotélicienne qui prévalait au Moyen Age, celle d‘un Cosmos constitué d’un certain nombre de sphères concentriques, ordonnées de manière hiérarchique, fut remplacée par l’idée d’un Cosmos ouvert, d’un Univers infini. Selon Aristote, le ciel consiste en sphères concentriques, celle de la Lune étant celle de plus petit rayon, la Terre étant immobile au centre. Dans la sphère sub-lunaire, tout est soumis à, la désintégration et à la corrup tion. Les mouvements terrestres obéissent à des lois téléologiques, chaque corps tendant à occuper une position privilégiée. Les corps célestes, au contraire, se meuvent indéfiniment, de manière absolument régulière. Au-delà des sphères de Mercure, de Vénus, du Soleil, de Mars, de Jupiter et de Saturne se situe la sphère des étoiles fixes, le Primum Mobile. Au-delà du Primum Mobile, il n’y a pas de mouvement, ni de temps, ni de lieu. Dieu, le Moteur Primordial, l’immobilité propre, impulse la rotation au Primum Mobile, lequel transmet son mouvement aux autres sphères. Dans le nouveau système du monde qui prend une forme précise èr partir de Galilée, cette distinction entre mouvements célestes et terrestres disparaît. Les lo& physiques sont unherselies, elles s’appliquent partout, l’espace physique est identifié à l’espace i d n i de la géométrie euclidienne, dans lequel il est possible d’isoler par la pensée un corps du reste de l’univers, et de lui appliquer le principe d’inertie : le mouvement et le repos sont alors considérés comme des états équivalents, représentations du même concept, l’inertie. Ce sont les deux premières unifications en physique, celle des lois physiques et celle du repos et du mouvement, cette dernière formaliséepar le groupe de Galilée. En 1543, Copernic abolit le géocentrisme. Entre 1609 et 1619,Kepler, formulant les lois du mouvement des corps célestes, met fin définitivement à la hiérarchie des sphères du Cosmos aristotélicien. Enfin, en 1609,Galilée observant le ciel avec un télescope construit d’après une invention hollandaise, découvre de nouveaux objets célestes tels que les montagnes lunaires, les satellites de Jupiter, et les étoiles de son voisinage, objets qu’excluait le modèle aristotélicien, préétabli par Dieu. Ce qui lui valut un procès le 22 juin 1633 par le Saint-Office, l’Inquisition de 1’Eglise Catholique ”. Le principe d‘inertie, la loi de la chute libre des corps et la nouvelle mécanique céleste, ouvrent la voie à la grande synthèse de Newton. A l’instar de Pythagore et de Platon, Galilée déclare que le livre de la nature est écrit en langage mathématique. Par ailleurs, pendant la maturation de la science occidentale, d’autres cultures progressent. Au XVI“ siècle, les navigateurs européens découvrirent l’existence, en Amérique Centrale et en Amérique du Sud, du plateau central mexicain à la
&,
N o w disons nmonçoru, sentencions et déclamru que toi, Galilée, pour les muons déduites au procès tu os confessées ci-dessus, tu t’es nndu envers ce Saint-Ofice vChémentement a y l e c d’hérésie, ayant tenu cette fausse doctrine et contraire à I’Emtun Sainte et Diune uc le Soleil 80d le cmtn du monde et qu’il n e se meut p a de I’ORent à l’occident (. .).‘R.Jean-Pierre Maury, Galilée, le messager d u étoiles, p 136, Gallimard, Paris (1986).
;!p.
.
De l’atomisme grec à la découverte de la radioactivité
7
région des Andes en passant par l’île de Maraj6, des civilisations précolombiennes avancées. Fertiles à coup sûr e n événements dont n o w ignorons à peu près tout, ces siècles engloutk ont heureusement en témoignage des ( ~ u u r ed’art s qui portent la marque des civilisations successives dont elles sont issues ” l3 comme les Olmèques et les Toltèques, les civilisations de Teotihuacan, de Xochicalco, de Monte Alban et de Tula, les Mayas et les Aztèques au Mexique et en Amérique Centrale ; les Chibchas,les Mochiques, la culture Nazca, l’empire Wari et, aux environs du XVe siècle, l’empire inca en Amérique du Sud. On trouve aussi, entre le VIP et le XIVe siècles, la culture Marajoara dans le delta de l’Amazone I‘.
1.5 La synthèse newtonienne Le début de la science moderne recevra d’Isaac Newton, en 1666 et 1667,une impulsion extraordinaire. Beaucoup d’historiens en viendront à appeler ces deux années les années admirables l5 et les physiciens considèreront longtemps Newton comme le plus grand des physiciens théoriciens. En 1666 et 1667,Newton s’éloigna de Cambridge et rentra chez lui en raison de la peste. Pendant ces deux années, il put réfléchir et élaborer les fondements de ses découvertes. L’invention du calcul infinitésimal qu’il partagea (sans le reconnaître) avec Leibnitz, la découverte de l’existence de l’accélération dans le mouvement circulaire uniforme, la force centripète vue comme sa cause, l’importance donnée au principe d’inertie, le conduisirent à la formulation de l’équation fondamentale de la mécanique, base de la physique jusqu’à l’avènement de la mécanique quantique en 1925. L’égalité de la force à la variation de la quantité de mouvement par unité de temps rendait compte à la fois du mouvement des planètes et du mouvement des corps terrestres : celui d’une pomme qui quitte sa branche, d’un project.& qui avance, infléchit sa trajectoire et tombe, est décrit de manière identique à celui de la Lune autour de la Terre. Tous sont soumis à la force de la gravitation. Le fait que cette force exerce une action transmise instantanément à distance perturbait Newton, mais il se garda de formuler la moindre hypothèse sur la nature de cette force ( Hypothesis non fingo ”) : “ (Ainsi), la gravité qui s’ezerce sur le Soleil se compose des gravités qui s’ezercent sur chacune de ses particules et quand on s’éloigne du Soleil, elle décroît ezactement e n raison double des distances jusqu’à l’orbe de Saturne comme le repos des aphélies des planètes le montre manifestement et jusqu’à la dernière aphélie des comètes, si du moins ces aphélies sont en repos. Quant à la raison de ces propriétés de la gravité, j e n’ai pu encore la déduire des phénomènes et j e ne forge p l w d’hypothèses. E n effet, tout ce qui n’est pas déduit des phénomènes doit être appelé hypothèse et les hypothèses, qu’elles soient métaphysiques, physiques, se l3
J. Soustelle, Encyclopedia Universalis, Corpus 1, p 1133, Paris (1985). H. Andrillat, L’Uniuers s o w IC regard du temps, Masson, Paris (1993). L’auteur y décrit notamment les efforts des civilisations chaldéennes, chinoises et mayas pour établir des calendriers à des fins tant astronomiques qu’astrologiques. l5 P. Costabel, Encyclopedia Ilniversalis, Corpus 12, Paris (1985). I‘
Sources et évolution de la physique quantique
8
rapportant auz qualités occultes ou mécaniques, n’ont pas de place en philosophie expérimentale. En cette philosophie, les propositions sont déduites des phénomènes et rendues génémles par induction. C’est ainsi que l’impénétrabilité, la mobilité, a l’impetw des corps et les lou des mouvemenh et de la gmvité se sont fait wnnaitre. Et il s u f i t que la gravité ezi.stc réellement et agisse selon les lob que n o w a v o w ezposées, et soit sufisante pour ezpliquer tous les mouvements des corps célestes et de notre mer * Is.
En concluant son livre sur l’optique conceptions atomiques.
”,
Newton incorpora à son s y s t b e les
Tenant compte de toutes ces choses, il m e parut que Dieu, au commencement, forma la Matière de Particules solides, massives, dures, impénétrables, mobiles, d’une taille telle, de jgures telles, de Propriétés telles, de Proportion à IIEspace telle qu’elles conviennent le mieuz 8 la Fin pour laquelle Il les a formées ; il m e parait a w s i que ces Particules primitives étant Solides, elles sont incomparablement plus dures que n’importe quel corps poreuz composé d’elles, aucun Pouvoir ordinaire n’étant capable de diviser ce que Dieu, lui même, fit dans la Création première. Et plus loin : “
Il m e semble encore que ces Particules ont non seulement une Vis inertiae, accompagnée des lois passives du Mouvement qui résultent naturellement de cette Force, ma& qu’elles sont mues par certains Principes actifs, comme celui de la Gmuitation et celui qui produit la Fermeniation et la Cohésion des Corps. Ces principes, j e ne les considère pas comme des Qualités occu~tes,supposées résulter de Formes spécifiques des Choses, mais comme des Lois génémles de la Nature, grâce auzquelles les propres Choses sont formées. Pour Newton, les atomes sont des centres de force : De leur cohésion, j ’ e w tendance à inférer que leur3 particules s’attirent l’une l’autre grâce à une sorte de Force eztrémement intense lorsqu ’elles sont en contact immédiat, force responsable des propriétés chimiques mentionnées plus haut lorsqu’elles se trouvent à petites distances, force sans effet sensible dès qu’elles s’écartent quelque peu les unes des autres.
Le succés de la mécanique newtonienne, son développement par Huygens contemporain d e Newton, par Euler, Maupertuis, d’Alembert, Lagrange, Laplace, Hamilton, permirent d’esquiver la difficulté d’interprétation de la gravitation ; suivant Ernst Mach,l’attraction gravitationnelle perdit son caractère d’incompréhension eztmordinaire pour passer au stade d’incompréhension ordinaire. Les Philosophiae Naturalis Principio Mathematica, publiés en 1686-1687, conduiront, grâce à la philosophie de John Locke et aux lettres de Voltaire Is, entre autres, à consacrer la physique newtonienne comme base de la science moderne, comme fondement et dogme du système d u monde. l6
I. I.
Principfa Mathematica, p 117, C. Bourgois, Paris, 1985. Optique, C. Bourgois, Paris 1985. Voltaire, Lettres philosophiques, Larousse, Paris 1972. Newton,
Newton,
De l’atomisme grec à la découverte de la radioactivité
9
1.6 Les découvertes d u XIXe siècle Ce ne fut qu’au début du XIX” siecle, avec John Dalton, que l’hypothèse de la constitution atomique de la matière commença à s’imposer pour interpréter les réactions chimiques et leurs lois fondamentales, la loi de conservation de la masse, la loi des proportions définies, la loi des proportions multiples et la loi de Gay-Lussac. Les atomes se combinent chimiquement pour former les molécules et lea réactions chimiques sont décrites comme le résultat de l’échange d’atomes entre les molécules, au cours de leurs collisions. L’acceptation de ces idées fut contrariée par une tradition anti-atomiste, qui se. manifesta vers la fin du siècle par l’opposition de physiciens éminents comme Ernst Mach, Pierre Duhem et Max Planck dans sa jeunesse 19, ainsi que de physiciensContrairement à eux, Ludwig Boltzmann chimistes comme Wilheim Ostwald fut un défenseur infatigable des modèles atomiques qui lui permirent de contribuer, avec James Clerk Maxwell et Josiah Willard Gibbs, à la formulation de la théorie cinétique des gaz et de la mécanique statistique. On admit que les particules d’un gaz devaient obéir aux lois de la mécanique de Newton. Ces;lois étant réversibles, invariantes par rapport au renversement du temps, comme l e fit justement observer Ostwaid, il était nécessaire d’introduire des postulats qui justifient l’irréversibilité des processus décrits par la thermodynamique ; la solution du problème résidait dans Ie fait que le nombre de configurations atomiques, microscopiques, accessibles à un état macroscopique donné est si grand que devient hautement improbable, pratiquement irréalisable, l’évolution d’un système inversée dans le temps. La théorie permit de décrire des variables macroscopiques, comme la température, en fonction de paramètres atomiques, comme la valeur moyenne du carré des vitesses moléculaires. En outre Jean Perrin put mesurer le nombre de molécules rencontrées dans une molécule-gamme. A la fin du XIX‘ siècle, d’importantes découvertes ouvrirent de nouvelles voies à la physique du XX“ siècle. Lorsque Maxwell synthétisa en 1865 les lois
*’.
En 1883 Planck, influencé par son professeur, Hermann Kolbe un chimiste qui accusait la thdorie atomique de donner une fausse inter rétation des lois de la chimie écrivit : y En dépit des grands succès remportés ar la t h o n e atomique @qu’à résen4 il faudra en dernier rusort l’abandonner ou profit $e l’hypolhèae d’une matière confinue : Max Planck, PhysiWuche Abhandiungen und Vortrige 1, 163 (1882)cité par J.L. Heilbron, Planck 1858-1947, p 23, Belin, Paris (1988). ‘O Ainsi s’exprima W. Ostwald en 1895 : y La proposition aiivant laquelle t o w les phénomènes naturels cuvent être finalement réduits auz phénomènes mécaniques, ne peut même p w être aJmise comme une hypothèse de travai utale : elle est simplement une e m u r . Cette e m i r se montre plw clairement par IC fait suivant. Toutes les é aiions de la mécanique ont la propriété d’admettre le renversement de signe des p a n ti% temporelles. C’est-à-dire, des processus en théorie parfaitement mécaniques peuvent se développer également en avant ou en amère (dans le temps). Ainsi, dans un monde purement mécanique il ne poumit y avoir un avant et un après comme n o w avons tow dans notre monde : l’arbre poumat 4 nouveau devenir une pousse et une graine, le papillon pounuit redevenir une chenille, le vieil homme, un enfanf. Aucune explication n ut donnée or la doctRne mécanwte du fait que cela n’amve et elle ne peut la donner e n mwon d! la pro riété fondamentale d u tquatiow mécaniques. L’irrtvemibilité réelle d u phénomènes naLrela prouve ainai l’aistence de processus qui ne peuvent p w être décrits par lu tquatiow mécaniques. Et wee cela, k verdict du m a t é r i a l ~ esnentifique est ttabli. W. Ostwald, Verh. Ges. Deutsch. Naturf. Artzte, 1 155 (1895), Rev. Gm. Sci. 6,956 (1895).
10
Sources et évolution de la physique quantique
de l’électromagnétisme dans un système d’équations différentielles, il fut capable Le sude déduire de ces équations I’ezidence des ondes électromagnétiques. j e t ie pl- fwcinant lorsque ]’étais étudiant ce fut la théorie de Mazwell. c e qui fit apparaître cette théorie révolutionnaire f i t le passage des forces à dwîance auz champs comme variables fondamentales. L’incorporation de l’optique à la théorie de l’électromagnétisme (...) f i t comme une révélation écrivit Einstein ‘l. Vingt ans plus tard, en 1887, Heinrich Hertz produisit ces ondes et les identifia avec des ondes lumineuses, de fréquences différentes, mais susceptibles, comme celles-ci, d’être réfléchies par des corps métalliques et diélectriques, et de se propager à la vitesse de la lumière, qui fut mesurée dans le vide et trouvée approximativement égale à : c cx
3 x iû’Ocm/sec
En 1887, Heinrich Hertz découvrit l’efet photoélectrique ; en 1879, Wiliiam Crookes découvrait les rayotu cathodiques et W. Rœntgen en 1895 les rayotu X. En 1896, Henri Becquerel établit que les sels d’uranium, même sans avoir été exposés aux rayons du soleil, sont fluorescents et impressionnent des plaques photographiques. C’était la naissance de la radioactiuifé. Finalement, en 1897, Joseph John Thomson, se basant sur les expériences de différents physiciens et sur celles de sa propre équipe, montra que les rayons cathodiques sont constitués de particules possédant une charge électrique négative, baptisées par G. Stoney Clectroru en 1891. Ces rayons cathodiques n’étaient donc ni des manifestations de l’éther, ni des faisceaux moléculaires, mais des faisceaux de particules nouvelles. Les recherches se poursuivirent pour déterminer les propriétés de l’électron, sa masse et sa charge, dont les valeurs sont actuellement :
’’
m ( e ) = 9,1083 x
kg
(énergie au repos : mc2 = O, 5109760 MeV) q(e) = e = -4,80286 x lo-’’
= -1,602 x
lo-’’
u.e.s. C
où u.e.s. désigne l’unité électrostatique de charge et C représente le Coulomb c o m e unité de charge dans le système MKS. Le cadre d’une généralisation de la mécanique newtonienne, la théorie de la relativité, était désormais en place. Tandis que sera ensuite élaborée une mécanique fondamentalement nouvelle, à même de rendre compte des phénomènes expérimentaux irréductibles Q la dynamique classique : la mécanique quantique.
Autobiogm hical Notes in P.A. Schilpp, Albert Einstein Philosopha ’! A. Einstein, Saenfut, p 32, The library of fiving Philosophers, Evanston 1949. 22 H. Becquerel, Comptes Rendw de L’Académie des Sciences (C.R.) 123,420 (1896) [Article I page suivante 1.
Article I
Découverte de la radioactivité Sur les radiations émises par phosphorescence
HENRIBECQUEREL Comptes rendus de l'Académie des Sciences (Gauthier- Villars)
122,420-421 (1896)
Dans une précédente séance, M.Ch. Henry a annoncé que le sulfure de zinc phosphorescent interposé sur le trajet de rayons émanés d'un tube de Crookes augmentait l'intensité des radiations traversant i'aluminium. D'autre part, M. Niewenglowski a reconnu que le sulfure de calcium phosphorescent du commerce émet des radiations qui traversent les corps opaques. Ce f a i t s'étend à divers corps phosphorescents et, en particulier, aux sels d'urane dont la phosphorescence a une très courte durée. Avec le sulfate double d'uranium et de potassium, dont je possède des cristaux formant une croOte mince et transparente, j ' a i pu faire l'expérience suivante : On enveloppe une plaque photographique Lumière, au gélatino-bromure. avec deux feuilles de papier noir très épais, tel que la plaque ne se voile pas par une exposition au Soleil, durant une journée. On pose sur la feuille de papier. à l'extérieur. une plaque de la substance phosphorescente, e t l'on expose le tout au Soleil, pendant plusieurs heures. Lorsqu'on developpe ensuite la plaque photographique, on reconnait que la silhouette de la substance phosphorescente apparaît en noir sur le cliché. SI l'on interpose entre la substance phosphorescente e t le papier une pièce de monnale, ou un écran métallique percé d'un dessin a jour, on voit l'image de ces objets apparaitre sur le cllché. O n peut répéter les memes expériences en interposant entre la substance phosphorescente e t le papier une mince lame de verre, ce qui exclut la possibilité d'une action chimique due à des vapeurs qui pourraient émaner de la substance échauffée par les rayons solaires. O n doit donc conclure de ces expériences que la substance phosphorescente en question émet des radiations qui traversent le papier opaque à la lumière e t réduisent les sels d'argent.
12
Sources et évolution de la physique quantique
N e w t , Einstein. Planck, Von Laue auz enviroru de 1920. (Source :Internationes ed., Bad Godesberg, t o m droib rbemés).
Chapitre 2
De la relativité à la première quantification 2.1 La théorie de la relativité En 1905, Albert Einsteinz3 publia un articlez3“ dans les Annalen der Physik qui allait révolutionner et couronner la physique classique. En introduisant des concepts nouveaux pour l’espace et le temps, il formula les b a s s de la théorie qui décrit la physique des hautes énergies. Le problème de la propagation des ondes de lumière dans l’espace avait suggéré la notion d’éther au XIX‘ siècle, une substance qui remplirait l’espace et qui serait la responsable de cette propagation et des phénomènes de chaleur, d’électricité, de magnétisme. L’invariance de l’équation de Newton
? = -dp‘ dt
’
d?(t) dt
U=-
p = m -+ u,
+
quand on passe d’un système de référence d‘inertie, S (où par définition cette équation est valable) à un autre, S’, animé d’un mouvement rectiligne et uniforme, était connue depuis des années et le groupe de transformations qui assure ce passage est le groupe de Galilée : 5‘
=2 -ut,
y’= y ,
z’
= z,
t’ = t
(1)
relatif à une translation de S’par rapport à S parallèle à l’axe Oz avec une vitesse constante u. Des transformations de Galilée résulte la loi de composition des vitesses, suivant laquelle la vitesse de la lumière dépend de l’état de mouvement de sa source. Les transformations (1) consacrent encore la notion de temps absolu de Newton ; la simultanéité de deux événements serait valable pour tous les observateurs, indépendamment de leur état de mouvement. En 1S98, Henri Poincaré remet en question cette notion de simultanéité. Il écrit deux ans plus tard : O n sait d’oG n o w ment la croyance à l’éther : si la lumière n o w a m v e d’une étoile éloignée, pendant plusieurs années elle n’esf p l u sur l’étoile e f elle n’esf pas encore sur la 23
A. Einstein, @urns Choisies, Vol. 2
: Relativités nstninte et générale (édité par
F. Balibar, B. Jech et O . Darrigol), Seuil et CNRS, Paris (1989). z3“ A. Einstein, 891 (1905).
De l’électrodynamique des
corps e n
mouvement n, Ann. d. Phys. 17,
Sources et évolution de la physique quantique
14
T e r n , il faut bien qu’alors elle soit quelque part, et soutenue, pour ainsi dire, par quelque support maiériei ”24. En 1887, Woldemar Voigt établit, pour la première fois, que l’équation des ondes :
n’est invariante pour une transformation des coordonnées que si le temp3 subit également une transformation. Il démontra ainsi que l’équation ci-dessus garde sa forme lorsque les nouvelles coordonnées x’, y‘, 2 , et un nouveau temps t‘, obéissent aux équations : 5)
avec
= z - ut,
y‘ = y/y,
2 = 217, t‘ = t
1
y=------(I-!gl)l/l,
P = v/c
- vx/c2
}
(3)
au lieu des transformations de Galilée (1). En 1906, dans les Rendiconti del Cire010 Matematico di Palermo, Poincaré établit les équations du groupe de transformations qui laissent invariantes les équations de Maxwell, groupe aujourd’hui connu sous le nom de groupe de Lorentz inhomogène ou groupe de Poincaré. Les équations de Voigt (3) sont équivalentes à ceiles du groupe de Lorentz homogène. Ces transformations ont également été établies indépendamment par Einstein et par Lorentz. Mais si Lorentz et Poincaré ont apporté des contributions importantes à la découverte de la théorie de la relativité, sa formulation précise, en tant que corpus théorique complet, ses postulats, l’analyse de la notion physique de temps, les transformations de Lorentz, la relativité de la simultanéité et de la notion de longueur, la contraction des longueurs - déduite du groupe de Lorentz et non pas admise comme un postulat à part (Poincaré) - la dilatation des durées, les transformations du champ électromagnétique, du courant et de la densité de charge, l’effet Doppler, l’ensemble de ces principes a été formulé d’une façon définitive par Einstein dans cet article de 1905. I1 établit que l’énergie a une inertie, et construisit la cinématique relativiste qui contient les célèbres formules de la masse, de l’énergie, de l’impulsion d’une particule en fonction de sa vitesse :
E=mc2,
m=ymo,
+ p =m?.
Pour la première fois, contrairement à ce qu’admettait la physique newtonienne, on introduit la vitesse de la lumière comme une constante universelle, indépendante de l’état de mouvement de sa source et comme la limite supérieure des vitesses de toutes les actions physiques possibles. La loi de composition des vitesses, déduite des formules de Lorentz, attribue toujours à la lumière la vitesse c, ce que confirme l’expérience. Et surtout, la notion d’éther, pleine de contradictions, fut écartée par 24
H. Poincaré, Lo science et i’hypothése, p 180, Flammarion, Paris (1968).
De la relativité a la première quantification
15
Einstein : l’expérience de Michelson et Morley, entreprise pour détecter la vitesse de la Terre par rapport à l’éther, montra que cette notion était superflue et que le champ électromagnétique ne requiert pas un support matériel, comme le voulaient Lorèntz et Poincaré. Les champs physiques ezistent dans le vide et se propagent d travers l’espace physique, ttatuportés, nous le sauotu aujourd’hui, par leurs quanta : les photons transportent le champ électromagnétique, les gravitons transportent le champ de gravitation, les gluons transportent le champ des forces fortes (tous à la vitesse de la lumière e), les bosons vectoriels W + ,W-,2’ transportent eux le champ des forces faibles (à une vitesse inférieure à c). Ce fut le mathématicien Hermann Minkowski” qui établit le formalisme de l’espace à quatre dimensions - l’espace-temps ou espace de Minkowski - pour formuler la théorie de la relativité : le temps devient la quatrième dimension de cet espace, et l’analyse tensorielle permet aux équations de la physique qui satisfont le principe de la relativité d’être écrites d’une façon explicitement covariante. Ce principe postule que les équations de la physique sont invariantes par rapport au groupe de Poincaré propre et orthochrone (c’est-à-dire que les transformations de réflexion spatiale et de renversement du temps sont exclues de ce groupe) : les lois physiques sont alors indépendantes de l’instant et du point où on les observe, et aussi de l’orientation spatiale et du mouvement rectiligne uniforme du laboratoire d’observation. Covariance veut dire validité de la loi dans tous les systèmes d‘inertie ; la covariance ou invariance relativiste explicite exige que les coordonnées d’espace et le temps figurent dans les équations sous la même forme : l’instant t auquel un phénomène arrive au point 3 = (z’,z’, z3)de l’espace à trois dimensions pour l’observateur d’un laboratoire S se mélange aux coordonnées z i , i = 1’2’3, pour donner et l’instant t‘ auquel un observateur d’un autre système d’inertie S‘ observe le même phénomène et le point transformé = (~“,z’’,z‘~) de S‘ de manière à ce que cet observateur trouve les mêmes lois dans ces variables que l’observateur de S dans ses coordonnées 1’2. Dans ce sens, on peut dire que l’espace se transforme dans le temps et vice-versa. Toute la physique classique fut reformulée dans le cadre de la théorie de la relativité restreinte et des conséquences spécifiques de cette théorie, par exemple, la dilatation des durées (vie moyenne des particules instables), l’équivalence masse-énergie, furent vérifiées expérimentalement. Des années furent néanmoins nécessaires pour que les mentalités des philosophes et de nombre de physiciens s’adaptent à ces nouvelles idées. Mais Einstein ne s’arrêta pas là. Après avoir unifié un si grand nombre de concepts physiques - temps et espace comme composantes du quadrivecteur d’espace-temps z ” , p = 0,1,2,3 ; énergie et impulsion, composantes du quadrivecteur p’, p = O, 1’2,s ; champ électrique et champ magnétique, composantes du tenseur antisymétrique, à six composantes FP”,p, v = O, 1’2’3 ; densité de charge et de
2”
“ ’Les. vues sur l’espace et le t e m p s y je voudrais v o w ezposer ont surgi du terreau de la physrque elpérimentale et là rest e leur force. Elles sont radicales. Dorénavant l’espace en soi-meme et le temps par lui-même, sont condamnés à se faner et à devenir de aim les ombres, et seule une sorte d’union des d e w préservera une realité indépendante. H. &inkowski in : A. Einstein, H.A Lorentz, H. Minkowski and H. Weyl, The principle of relativity, p 75, Dover, New York (1923).
16
Sources et évolution de lu physique quantique
courant, composantes du quadrivecteur j ’ , p = O, 1’2’3 - il voulut comprendre pourquoi la covariance n’existe que pour des mouvements rectilignes et uniformes des systèmes de référence. Quand un laboraloire est en mouvement non uniforme, une rotation par exemple, il n’est plus un système d’inertie ; dans l’équation de Newton apparaissent ce que l’on appelait les forces fictives, la force centrifuge et la force de Coriolis. Entre 1905 et 1915, ses recherches l’amenèrent B la découverte du principe d’équivalence (’ la répezion la p l w heureuse de ma vie ”) : il est impossible, au moyen d’observatiom physiques, de distinguer un système d’inertie où régne un champ de gramtation uniforme avec une accélération de la gravité constante g dirigée vers le bas, d’un système non inertiel, sans champ de gramtation, mais doué d’un mouvement uniformément accéléré avec une accélération dirigée vers le haut et égaie à g, en grandeur. En tombant en chute libre, un observateur élimine le champ de gravitation. Comme tous les corps tombent égaiement avec lui, il n’a aucun moyen de contredire sa certitude d’être au repos avec l’ensemble de ces corps : il ne sent pas son propre poids ”. De la même façon que, en passant d’un laboratoire en rotation à un autre au repos, l’observateur élimine la force centrifuge et celle de Coriolis, la gravité peut être éliminée dans un ascenseur en chute libre. Par cette découverte, Einstein donnait une signification plus profonde l’égalité entre la masse gravifique et la masse inertielle découverte par Galilée et établie expérimentalement par Eotvk. Les forces fictives sont donc des forces réelles, des champs de gravitation particuliers. A partir de ces réflexions, Einstein fut conduit à chercher des équations qui généralisent l‘équation de Poisson pour le champ newtonien, dans un espace de Riemann. Le postulat fondamental de sa théorie fut finalement l’identification du tenseur de la métrique de l’espace de Riemann avec le potentiel du champ de gravitation. Les équations du champ furent définitivement établies en 1915 : les propriétés géométriques de l’espace de Riemann décrites par les solutions de ces équations sont les propriétés physiques du champ de gravitation correspondant. Telle fut la fameuse géométrisation de la physique qu’il réalisa pour la gravitation et qui resta pour lui l’idéal de la théorie physique fondée sur ces principes premiers. L’article qu’il publia cette année-là constitue l’une des plus belles contributions théoriques concernant le monde physique qui aient été formulées à ce jour.
2.2 Planck et la quantification de l’énergie ;
Einstein et les photons En 1900, Max Planck s’interrogeait sur le rayonnement enclos dans une cavité vide de matière et en équilibre thermique, et étudiait plus précisémentz6 la distribution de son énergie en ses composants monochromatiques. En 1897, Kirchhoff établit un théorème selon lequel la densité d’énergie du rayonnement u ne dépend que de la fréquence v et de la température T, u = u(v,T ) . Une tentative pour déduire une formule pour u(v,T) basée sur la physique 26
M. Planck, Ann.
d. Phys. 4, 561 (1901) [Article II, page 201.
De la relatiuité à la première quanhpcation
17
classique fut menée par les physiciens anglais Lord Rayleigh et Sir James Jeans mais le résultat se trouva en désaccord avec l’expérience. Les constantes physiques disponibles, c, la vitesse de la lumière et k, la constante de Boltzmann, donnaient une loi de la forme u = ( A / c 3 )vZkT : ce fut d’ailleurs l’argument de Lorentz pour appuyer la loi de Rayleigh-Jeans. Une autre expression fut proposée par Wien : u exp(-av/T). Le problème était le suivant : les mesures très précises de u ( v , T )n’étaient d’accord avec la loi de Rayleigh-Jeans que pour les basses fréquences, alors qu’elles ne suivaient la loi de Wien que pour les hautes fréquences. Ce fut le mérite de Planck de trouver une interpolation entre l’expression de Rayleigh-Jeans et celle de Wien. Ii réussit en 1900 en publiant ce que l’on appelle aujourd’hui la loi du rayonnement de Planck :
-
rigoureusement vérifiée par les mesures. Pour justifier cette formule, Planck fut obligé d’abandonner l’hypothèse de la physique classique suivant laquelle l’énergie e d’un oscillateur et de tout système physique n’est susceptible que de changements continus. I1 supposa au contraire que cette énergie ne change que par des multiples entiers d’une énergie minimale, c’est-&dire que e est plutôt de la forme : e = nhv
où n est un nombre entier et l’énergie minimale d’un oscillateur électromagnétique de fréquence v est égale à hv, h étant une nouvelle constante universelle. h s’appelle le quantum d’action et hv, le quantum d’énergie. Cette constante, une nouveauté à l’époque, a les dimensions d’une énergie multipliée par un temps, d’une action. Néanmoins, Planck n’acceptait pas la révolution conceptuelle que la notion de variation d’énergie par multiples entiers de hv a entraînée en physique : il fut malgré lui le découvreur de la théorie quantique. Les quanta de lumière absorbés ou émis par l’atome d’après Bohr furent introduits en théorie de la lumière par Einstein en 1905”. L’hypothèse des corpuscules de lumière déjà introduite par Newton ne pouvait décrire aucun phénomène spécifique autre que la propagation de la lumière et fut rejetée dès le succès de la théorie ondulatoire, postulée pour expliquer les interférences et la diffraction. Les quanta de lumière furent proposés par Einstein pour comprendre les lois de l’effet photoélectrique que la théorie ondulatoire elle-même était incapable d’expliquer. Contrairement aux ondes lumineuses qui transportent une énergie dont la densité décroît comme le carré de l’inverse du rayon R de l’onde, en l / R z , les quanta de lumière transportent de l’énergie lumineuse concentrée en portions égales à hv, v étant la fréquence de lumière en question. C’est cette notion que Bohr utilisa dans son modèle atomique, l’énergie du photon é m i s ou absorbé par l’atome étant égale à la différence des énergies de l’électron dans son orbite finale, E f , et initiale, Ei : 27
A. Einstein, Ann. d. Phys. 17,132 (1905) [Article III, page 281.
Sources et évolution de la physique quantique
18
hv = A E = Ef - E; Douze ans plus tard, en 1917, Einstein affirma qu’un quantum de lumière possède en plus de son énergie une quantité de mouvement égale à hk/27r, où I. = 27rv/c, c étant la vitesse de la lumière. Ceci complète, pour le photon, le caractère d’une particule (il possède également un spin, ou moment angulaire propre). La période comprise entre 1913 et 1924 se caractérise par les efforts des physiciens pour perfectionner le modèle de Bohr. Arnold Sommerfeld prit en compte la relativité dans le modèle de Bohr et introduisit des orbites elliptiques pour l’électron dans l’atome. Nieis Bohr à Copenhague mena les débats sur la nécessité de nouvelles idées dans ce domaine et formula le principe de correspondunce comme un guide pour la nouvelle théorie atomique - le modèle de Bohr admettait une mystérieuse superposition de théories contraires, la théorie classique et les postulats de quantification. La nouvelle théorie qui restait à trouver devait tendre vers la théorie classique dans la limite des nombres quantiques élevés.
2.3 Les modèles atomiques, de Thomson à Bohr La découverte de l’électron annoncée par Thomson en 1897 impliquait que le dogme de l’indivisibilité de l’atome était erroné car il était évident que les électrons observés devaient provenir des atomes. C’est au physicien hollandais H. A. Lorentz qu’il revint de développer la théorie classique de l’électron. H. Nagaoka suggéra déjà en 1904 que l’atome devait être constitué d’électrons tournant en cercle autour d’un noyau central. Comme ceux-ci, d’après la théorie classique, devraient émettre continuellement de l’énergie et finir par tomber dans le noyau, Thomson proposa que l’atome fût plutôt une sphère chargée positivement à l’intérieur de laquelle vibreraient les électrons (modèle du pain aux raisins ”) ; mais les expériences de Ernest Rutherford sur la diffusion de particules alpha par la matière, effectuées en vue de déterminer la distribution des charges positives dans l’atome, rétablirent les idées de Nagaoka, perfectionnées dans le modèle indépendamment proposé par Rutherford. Alors que le rayon de l’atome est de l’ordre de lO-’cm, Rutherford trouva” que le rayon de la distribution de charges positives de l’atome est dix milie fois plus petit : elles sont donc concentrées dans ce qu’on appelle le noyau afomique. Rutherford trouva ce résultat en distinguant, parmi les diffusions élastiques de particules a et p sur des atomes lourds, celles qui avaient lieu à grand angle. Ce sont les diffusions où la particule incidente, lancée directement vers le centre de l’atome, revient en arrière aprés s’être arrêtée à la distance b du noyau, b étant la distance à laquelie la répulsion coulombienne entre les charges Z1 du projectile et 2, du noyau l’emporte SUI l’énergie cinétique El du projectile :
28
E. Rutherford, Phil. Mag. 21,669 (1911) [Article IV, page 411.
De la relativité à la première quantification
19
Avec des énergies incidentes de l’ordre de quelques MeV, Rutherford put mettre en évidence des dimensions du noyau de l’ordre de lo-’’ cm. Cette même technique (Rutherford Backward Scattering) est encore employée de no8 jours pour analyser les surfaces de matériaux en les bombardant de faisceaux d’ions de quelques MeV : elle permet ainsi de déterminer la nature et la concentration des atomes lourds de la couche analysée. Elle a aussi permis, lorsque les projectiles furent accélérés à des énergies de plusieurs centaines de MeV - comme dans les expériences de diffusion e - p de Hotstadter à Stanford (1958) - la mise en évidence des dimensions du proton. Elle permit encore - lorsque l’énergie des faisceaux atteinrent des dizaines de GeV, comme dans les diffusions de e - p de 7 à 17 GeV au SLAC de Stanford, puis dans les diffusions profondément inélutiques de neutrinos et de muons au CERN2”, et dans les diffusions pp à grand moment perpendiculaire effectuées aux ISR au CERN (1970-1985)28’- la mise en évidence, à des dimensions de l’ordre de cm,de la structure en quarh des protons et des neutrons. Aux énergies de 2000 GeV disponibles au FermiLab, près de Chicago, cette même technique permettra de sonder la matière à des dimensions de l’ordre de 5 x 10-18cm,nous laissant peut-être apercevoir des sous-stnictures communes aux quarks et aux leptons. Deux années plus tard, en 1913, Niels Bohr fit un pas très important dans la compréhension du modèle atomique, en admettant qu’aux lois classiques de la mécanique et de l’électrodynamique devraient se superposer deuz nouueauz posfulab, l’un utilisant l’idée de quantification de I’énergie proposée par Planck en 1900 lors de l’étude du rayonnement du corps noir, l’autre, l’idée d’Einstein, de 1905, suivant laquelle la lumière se propage concentrée en des corpuscules dont l’énergie est proportionnelle à sa fréquence, les photons ou quanta de lumière. En contradiction avec la théorie classique, Bohr postula que ies éiecfmru ne décrivent que certaitu orbites définies par un nombre entier ” (quantification du moment angulaire), et, lorsqu’ils les décrivent, ils n’émettent ni n’absorbent aucune énergie. Cette émission (ou absorpîion) n’a lieu que lorsque l’éiecîron parse brusquement d’une orbite sfationnaire d une autre (sans parcowir les positions intermédiaires), et alors, la fréquence du rayonnement émis (ou absorbé) est donnée par la différence des énergies de l’électron sur les deux orbites, divisée par une constante, la constante de Planck h ou quantum d’action. Bohr fut alors capable de reproduire théoriquement les spectres de l’atome d’hydrogène et put calculer une constante empirique, la constante de Rydberg, en fonction de h, c, m, q ( e ) : un succès éclatant pour ses idées. Ces états stationnaires, et leurs séquences discontinues, furent mis en évidence dans les célèbres expériences de James Ran& et Gustav Hertz en 1914.
28a Voir R. Cahn et G. Goldhaber, The Ezpaimental Foundations of Parîicle Physics, Cambrjdge University Press (1989). W.M. Geist et al, Physics Reports 197 263-374 (1990).
”‘
Article II
La quantification de l'interaction rayonnement-matière A propos de la loi de distribution de l'énergie dans le spectre normal
MAX PLANCK Annalen der Physik 4,553-563
(1901)
(Springer-Verlag)
(remis le 7 janvier 1901) [traduit par Ci. Frick] Communiqué sous une forme différente aux sessions du 19 octobre e t du 14 décembre 1900 de la Société Allemande de Physique, Comptes rendus 2. p 202 et p 237 (1900)
Introduction
'
Les récentes mesures spectrales de O. Lummer et E. Pringsheim et celles, encore plus remarquables, de H. Rubens et F. Kurlbaum confirmant toutes un resultat précédemment établi paf H. Beckmann montrent que, ni la loi d'abord établie par W. Wien à partir de considérations de cinétique moléculaire, ni celle établie ensuite par moi-même a partir de la théorie du rayonnement électromagnétique - qui toutes deux concernent la distribution d'énergie dans le spectre normal - n'avaient de validité universelle. Dans chacun des cas, la théorie nécessite une amélioration : j e tenterai dans ce qui suit d'en proposer une en me fondant sur la théorie du rayonnement électromagnétique que J'ai moi-même établie. II sera alors nécessaire de repérer, dans la suite des ralsonnements qui conduisent à la loi de distribution d'énergie de Wlen, l'argument à modifier ; cet argument devra alors être abandonné e t remplacé de manière appropriée. J'ai montré, dans mon dernier exposé sur ce sujet ', que les bases physiques de la théorie du rayonnement électromagnétique, y compris l'hypothèse du I' rayonnement naturel " (du corps noir, NdT), résistent aux critiques les plus dures. Comme à ma
'
'
O. Lummer et E. Pringsheim, Verhandlungen der Deutsch. Physikal. Geselfsch. 2. p 163 (1900). H. Rubens et F. Kuribaum, Sitzungber. d. k. Akad. d. Wisensch. (Comptes rendus des sessions de l'Académie Royale des Sciences) de Berlin, session du 25 octobre 1900, p 929.
'
H. Beckmann, Thèse, Tübingen 1898. Voir aussi H. Rubens, Wied. Ann. 69, p 582 (1899).
'
M. Planck, Ann. d. Phys. 1 p 719 (1900).
De la relativité a la première quanh5cation
21
connaissance les calculs ne présentent pas d’erreur, il demeure que la loi de dlstrlbutlon d’énergie du spectre normal est entièrement déterminée lorsqu’on peut calculer l’entropie d’un résonateur rayonnant, oscillant de manière monochromatique, en fonction de son énergie d’oscillation O n obtient alors à partir de la relation dS/dU = I/@ la dépendance de l’énergie en fonction de la température 0 ; comme d’autre part une et la denslté du rayonnement à la fréquence d’oscillation relation simple a lie l’énergie correspondante, il en est de meme de la dépendance de la densité du rayonnement en fonctlon de la température. La distribution en énergie normale est alors celle pour laquelle les différentes densités de rayonnement correspondant aux différentes fréquences d’osclllatlon possèdent la même température. Ainsi tout le problème se ramène à trouver en fonction de et i’esentlel de la recherche qui suit est consacré à la solution de cette question. Dans ma première étude sur ce sujet. j’avais, sans autre justification, posé par définition comme étant une expression simple de et m’étais ensuite contenté de prouver que cette forme de l’entropie satisfait toutes les exigences de la thermodynamique. Je pensais alors qu’elle était la seule de sa sorte, et donc que la loi de Wien, qui suivait aussi cette forme, possédait nécessairement une validité universelle. Un examen ultérieur plus approfondi m’a montré qu’il doit y avoir d’autres expressions satisfaisant cette exigence, e t qu’une condition supplémentaire est nécessaire pour calculer sans ambiguné. Je croyais avoir trouvé cette condition en affirmant ce qui, à cette époque, m’apparaissait plausible et évident la chose suivante : lors de petites et constantes perturbations irréversibles, un système composé de N résonateurs identiques placés dans un même champ stationnaire de rayonnement, se trouvant quasiment en équilibre thermique verra augmenter son entropie totale SN = N S en fonction de sa seule énergie totale UN = NU et de ses modifications, sans qu’intervienne l’énergie des rbonateurs individuels. Cette amrmation conduit nécessairement à la loi de distribution d’energie de Wien. Comme celle-ci n’est pas vérifiée par l’expérience, on est amené à conclure que cette loi ne peut etre correcte dans son intégralité, et que la théorie doit s’en écarter IIfaut donc introduire une autre condition pour permettre le calcul de et pour cela, il faut analyser plus profondément la signhication de la notion d’entropie. Une indication sur la marche à suivre nous est donnée en regardant i’inconsistance des suppositions antérieures. Dans ce qui suit, on explore une voie conduisant à une expression simple de l’entropie et par conséquent à une nouvelle formule pour le rayonnement, laquelle ne semble en contradiction avec aucun des faits expérimentaux observés à ce jour. ’
s
u. u
u
u,
s
s
u,
s
-
-
u
’.
1.
s.
Calcul de l’entropie d’un résonateur en fonction d e son énergie
$1. L’entropie conditionne le désordre, et ce désordre intervient en théorie du rayonnement électromagnétique dans les oscillations monochromatiques d’un résonateur - même lorsqu’il se trouve dans un champ de rayonnement durablement stationnaire - à Voir ci-dessous l’équation (8). I?
M. Planck,
O.C.
pp 730 e t sq.
’ On comparera a cela les critiques déjà soulevées par cette affirmation : voir W. Wien au Congrès de 2. p et O. Lommer 2. p 92, (Rapport
Paris
40. 1900)
(id.
1900).
Sources et éuolution de la physique quantique
22
travers l'irrégularité des variations continuelles d'amplitude et de phase, lorsqu'on s'lnt4resw à des intervalles de temps grands par rapport à la durée d'une oscillation, mais petits par rapport au temps d'une mesure. SI amplltude et phase étalent absolument constants, les oscillations deviendraient parfaitement homogènes, l'entropie ne pourrait exister et l'énergie d'oscillation devrait pouvoir se transformer librement et complètement en travail. L'énergie constante d'un résonateur individuel oscillant de manière stationnaire doit alors etre considérée comme une valeur moyenne dans le temps, ou, ce qui revient tout à fait au même, comme la valeur moyenne des énergies d'un grand nombre N d'oscillateurs identiques, se trouvant dans le même champ stationnaire de rayonnement, suffisamment éloignés les uns des autres pour ne pas s'influencer mutuellement. Alors à l'énergie totale
u
UN = N U d'un tel système formé de
N
résonateurs correspond une certaine entropie totale
s
du meme système, où représente l'entropie moyenne d'un résonateur partlculier. Cette entropie SN représente le désordre avec lequel l'énergie totale U N se répartit entre les différents résonateurs 52. Ecrivons maintenant que l'entropie SN du système est, à une constante arbltralre additive près, proportionnelle au logarithme de l a probabilité que les N résonateurs aient tous ensemble i'énergle totale U N ,donc :
w
SN = k log W + const.
(3)
Au fond, cette relatlon revient, me semble-t-il. à une définition de la probabilité
w,car, dans les hypothèses sur lesquelles se fonde la théorie du rayonnement électro-
magnétique, aucune indication ne nous permet de donner à à cette probabilité un sens ou un autre. II convient d'utiliser cette définition pour sa simplicité, et aussl pour la parenté avec sa définltion dans la théorie cinétique des gaz 53. II importe malntenant de trouver la probabilité que N résonateurs possèdent ensemble l'énergie totale UN.Pour cela 11 est nécessaire que UN ne soit pas une quantité continue, Infiniment divisible, mais plutot une grandeur discrète, composée d'un nombre entier de parties finalement égales. Appelons une telle partie l'élément d'énergie e, partant nous avons :
'.
U N = P.€
w
(4)
où P représente un nombre entier, grand en général ; nous Ialsserons pour l'instant la valeur de c indéterminée. II est évident maintenant que la distribution des P éléments d'énergie entre les N résonateurs ne peut se faire que d'un nombre fini e t déterminé de façons. Nous appelerons chacune de ces répartitions une " complexion ", suivant le terme utilise par Boltzmann pour une notion semblable. Si l'on désigne les resonateurs par les nombres 1,2,3.. N ,
.
'
L. Boltmann,Sitzungbef. d. k. Akad. d. Wissensch. zu Wien (Comptes rendus des sessions de l'Académie impériale des Sciences de Vienne), (Il) 70. p 428 (1877).
De la relativité à la première quanh3cation
23
et si on les écrit les uns à la suite des autres ; si en dessous de chaque résonateur on inscrit le nombre d'éléments d'énergie qui lui sont attribués lors d'une répartition arbitraire, on obtient pour chaque complexion un symbole de la forme sulvante :
1 2 3 4 5 6 7 8 9 1 0 7 3 8 1 1 0 9 2 2 0 4 4 5 que N = 10,P = 100. Le nombre % de toutes
Ici on a supposé les complexions possibles est visiblement 6gal au nombre de toutes les configurations de chiffres possibles que l'on peut obtenir de cette manière pour ia rangée inférieure, lorsque N et P sont fix&. Pour être précis, notons que deux complexions sont à considérer comme distinctes si présentant la même configuration de chiffres, ceux-ci sont rangés dans un ordre différent. L'analyse combinatoire nous dit que le nombre de complexions possibles est :
N.(N
IR=
+ 1).(N+ 2 ) . . . ( N+ P - 1) -- (N + P -
l)! (N - l)!P!
1 . 2 . 3 ... P
D'après la formule de Stirling on a, en première approximation :
N!=N N , et Dar suite, avec cette approxima'tion :
31=
+
(N P)NtP NN.PP *
$4. L'hypothèse sur laquelle nous voulons fonder les calcuis à venir s'énonce comme suit : la probabilité pour que les N résonateurs possèdent ensemble l'énergie d'oscillation UN est proportionnelle au nombre [R de toutes les complexions posslbles lors de la répartition de l'énergie UN ; en d'autres termes, une complexion donnée quelconque est aussl probable que n'importe quelle autre. En dernier lieu, seule l'expérience peut vérifier si cette hypothèse est vraiment réalisée dans la nature. Si, de fait, l'expérience tranche en sa faveur, la validité de cette hypothèse devrait entraîner de nouvelles conclusions au sujet de la nature spécifique des oscillations des résonateurs. notamment sur le caractère " indifférencié des cellules de l'espace des phases de grandeur au départ comparable '* qui apparaissent ici. pour reprendre les termes de J. v. Kries Poursuivre dans cette voie la réflexion parait cependant prématuré dans l'état actuel de la question. $5. Après l'introduction de cette hypothèse, e t compte tenu de l'équation (J), l'entropie du système de résonateurs envisagé s'écrit, en choisissant judicieusement la constante additlve :
w
'.
{ SN
:~~+P)log(N+P)-NlogN-PlogP)
(5)
et, en tenant compte de (4) e t de (1) :
U
Ainsi, tenant compte de ( 2 ) , l'entropie s'écrit :
s=k
{ (1+);
s d'un résonateur en fonction de son énergie
log (1
+
t)
- ;log
:}.
Joh. v. Kries, Die Prlncipien der Wahrschleinlichkeitsrechnung (Les principes du
cakul des probabilités), p 36, Freiburg (1886).
Sources et évolution de la physique quantique
24
2. Introduction de la loi de déplacement de Wien 56. Immédiatement après la loi de Kirchoff établissant ia proportionnalité entre le pouvoir d'émission e t le pouvoir d'absorption, la loi de déplacement trouvée par W. W e n - et portant depuis son nom représente la contribution la plus importante à l'établissement des solides fondements de la théorie du rayonnement de la chaleur : eile inclut comme cas particulier la loi de Stefan-Boltzmann sur la dépendance de la quantité totale de rayonnement émis en fonction de la température. D'après la formulation de M. Thiesen lo elle s'énonce :
-
E.dX = 65$(X6).dX, A est la longueur d'ondes, EdX est la densité spatiale d'énergie émise dans la tranche A, X + dX, par le rayonnement '' noir " l1 correspondant, 8 la température, et $(I) une
où
certaine fonction du seul argument I. $7. II nous fait maintenant examiner ce que dit la loi de déplacement de Wien sur de notre résonateur en fonction de son énergie e t de la dépendance de l'entropie sa période propre, et ceci dans le cas général où le résonateur se trouve dans un milieu diathermique ordinaire. A cet evet, nous généraiiserons d'abord la forme donnée par Thiesen a la loi du rayonnement dans un milieu diathermique arbitraire à l'aide de la vitesse de propagation de la lumière c. Comme nous observons non le rayonnement dans son ensemble, mais seulement un rayonnement monochromatique, il sera nécessaire, en vue de comparer les différents milieux diathermiques, de substituer la longueur d'onde A par le nombre d'onde Y . Désignons par udv la densité spatiale d'énergie du rayonnement correspondant aux fréquences Y , Y dv : udv remplace EdX, c / u rem.piace X e t c d v / v 2 remplace dX. II vient alors :
u
s
+
);(
u = e5.C.lj Y=
Or, l a loi bien connue de Kirchoff-Clausius nous dit que l'énergie émise par unité de temps par une surface noire dans un milieu diathermique est, pour une température 19 et un nombre d'onde Y donnés, inversement proportlonnelle au carré c2 de la vitesse de propagation de la lumiere : la densité spatiale d'énergie est donc inversement proportionnelle à c3 e t nous obtenons :
u = - f (e55 ) , YZC3
où les constantes de la fonction f sont indépendantes de c. Au lieu de ceci nous pouvons écrire, si f désigne constamment dans ce qui va suivre
une nouvelle fonction d'un seul argument :
u = -f Y3
(!).
c3 lo
(7)
M. Thiesen, Verhandl. d. Deutsch. Phys. Geseiisch. 2. p 66 (1900).
O n pourrait parier de manière peut-être plus adaptée d'un rayonnement " blanc ",en généralisant convenablement ce que l'on entend habituellement par lumière parfaitement blanche.
De la relativité à la première quantification
25
où nous retrouvons le résultat bien connu que l'énergie rayonnante contenue dans le cube d'une longueur d'ondes à température e t à nombre d'onde donnés : UA3 est la meme pour tous les milieux diathermiques. $8. Pour passer maintenant de la densité spatlale de rayonnement II à l'énergie U d'un résonateur stationnaire synchrone avec le champ de rayonnement où II se trouve, sur les dote du nombre d'onde u, nous utiliserons la formule (34) de mon exposé processus rayonnants irréversibles :
''
(% est l'intensité d'un rayonnement monochromatique, polarisé linéairement) ; ce qui, jolnt à l'équation bien connue :
u = - 8rR C
donne la relation :
8x2
u = -u. i
où c n'apparait plus explicitement. Au lieu de cela nous pouvons aussi écrlre :
s du résonateur en posant :
$9. Introduisons finalement l'entropie
dS
1
e=E'
(9)
II en ressort que :
dU
u
et en intégrant :
S=f
(F),
c'est-&-dire que l'entropie d'un résonateur oscillant dans un milieu diathermique ne dépend que de la seule variable u / u , e t ne contient en plus que des constantes universelles. C'est à ma connaissance la forme la plus simple de la loi de déplacement de Wien. $10. Si nous appliquons la loi de déplacement de Wien sous sa dernière forme à l'expression (6) de l'entropie nous nous rendons compte que l'élément d'énergie c doit etre proportionnel au nombre d'osclllations u, et que donc :
s.
e = h.u l2
M. Planck, Ann. d. Phys. 1, p 99 (1900).
Sources et évolution de la physique quantique
26
Ainsi :
s=k où
{ (1+ E) log
(1
+
E) -
+g$}.
h e t k sont des constantes universelles. En substituant dans (9) on obtient :
hu
U=-
e#-1 et, à partir de
(e), on obtlent la loi de ditribution d'énergie recherchée :
Ou encore, si l'on substitue au nombre d'onde u la longueur d'onde relation indiquée au 97, on a :
-
8nch
à l'aide de la
1
Quant aux expressions pour l'intensité et pour l'entropie d'un rayonnement se propageant dans un milieu diathermique, et à la loi d'augmentation de l'entropie totale lors de processus de rayonnement non stationnaires, l e les développeral dans un autre article.
3.
Valeurs numériques
des deux constantes naturelles h et k peuvent se déterminer de mesures disponibles. F. Kurlbaum l3 a trouvé que, si l'on désigne par l'énergie totale rayonnée dans i'air Par 1 cmz d'un corps noir port4 a la température tdeg C pendant 1sec, on obtient : .
311. Les valeurs
façon assez précise à l'aide des
si
De là on obtlent la densité spatiale de i'énkrgie totale du rayonnement dans l'air 2 la température absolue 1 :
4 x 7,31.106 = 7,061.10-'5 3 x 10" x (373' 273') ~m~degré' *
-
D'autre part, selon (12), la densité spatiale de l'énergie totale rayonnée est, pour
e=i:
u=L
00
8xh
/-
u d u =8nh -l
=9
l3
9
u3
(e-+
u3du e+-i
+e-29
0
F. Kuribaurn. Wied. Ann. 65, p 759 (1898).
+e-'*
+ ...>du
De la relativité a la première quant$cation
27
et, par intégrations successives :
8xh u = -.6
e3
(1+ 2;+ 3 + 3 + ...
k (j-)
1
1
1
48sk' =- eJh3 . ~ , a m .
si l'on
pose ceci
= 7,061.10-'5, on obtient,
avec c = 3.10'' :
k4 = 1,1682.10'5. h3 $12. O.
Lummer et
E. Pringsheim
I'
ont déterminé que le produit
A@ ,,
où A,
est la longueur d'onde du maximum de la dlstributlon en E dans l'air à la température 8 , vaut 2940 p.degré. Ou encore, en unités absolues :
ûX ,
= O, 2M cm.degré.
D'autre part, il ressort de (13). lorsqu'on égale à zéro la dérivée de où X = A,, que :
E
par rapport à
A,
( l - * )5kX,B .e&=l et cette équation transcendante donne :
ch
Arne = 4,9651.k'
II s'en suit que :
h 4,9651 .0,294 -= = 4,866.10-". k 3.10'O
De là et de (14) on trouve les valeurs des constantes naturelles :
h = 6, 55.10-2'erg.sec,
(15)
k = 1,346.10-'6- mg degré' ce sont les memes valeurs que celles Indiquées dans ma communication antérieure.
O. Lumrner et
P 176 (1900).
E. Pringsheim,
VerhJndl. der Deutschen Physikal. Geselixh. 2,
Article III
Le photon Un point de vue heuristique concernant la production et la transformation de la lumière
ALBERTEINSTEIN Annalen der Physik,
XWI, 132-148 (1905)
(Springer-Verlag)
(reçu le 18 mars 1905) [Albert Einstein. Oeuvres choisies I- Le Seuil, Paris (19SS)J [traduit sous la direction de F. Balibar]
II existe une profonde différence formelle entre les représentations théoriques que
se sont forgées les physiciens à propos des gaz et des autres corps pondérables, et la théorie de Maxwell des processus éiedromagnétiques dans ce qu’il est convenu d‘appeler l’espace vide. En effet, alors que nous considérons que l’état d’un corps est parfaitement déterminé par les positions et vitesses d’un nombre d‘atomes et d’électrons, très grand certes, mais néanmoins fini, nous nous servons, pour la détermination de l’état électromagnétique d’une région de l‘espace, de fonctions d’espace continues, si bien que nous ne pouvons pas considérer qu’un nombre fini de grandeurs sumse à fixer complëtement i’ëtat ëlectromagnétique de l’espace. Selon la théorie de Maxwell, l’énergie doit etre conçue, pour tous les phénomènes purement électromagnétiques, et donc également pour la lumière, comme une fonction continue de l‘espace, alors que l’énergie d’un corps pondérable doit, selon la conception actuelle des physiciens, être décrite comme une somme portant sur les atomes et les électrons. L’énergie d’un corps pondérable ne peut pas &tre divisée en parties aussi nombreuses et aussi petites que l’on veut,’alors que l’énergie d’une radiation lumineuse émise par une source de lumière ponctuelle est, selon la théorie de Maxwell de la lumière (ou, selon toute théorie ondulatoire), distribuée de façon continue sur un volume sans cesse croissant. La théorie ondulatoire de la lumière opérant avec des fonctions d’espace continues s’est avérée parfaite pour ce qui est de la description des phénomènes purement optiques et I1 se peut qu’elle ne soit jamais remplacée par une autre théorie. II ne faut cependant pas perdre de vue que les observations optiques portent sur des valeurs moyennes dans le temps, et pas sur des valeurs instantanées ; 11 n’est pas inconcevable, bien que les théories de la diffraction, de la réflexion, de la réfraction, de la dispersion, etc., soient entigrement confirmées par l’expérience, que la théorie de la lumière qui opère sur des fonctions continues de l’espace puisse conduire à des contradictions avec l’expérience lorsqu’elle est appliquée aux phénomènes de production et de transformation de la lumière.
De la relativité a la première quantification
29
De fait, il me semble que les observations portant sur le '' rayonnement noir ' I , l a photoluminescence, la production de rayons cathodiques par ia lumière ultraviolette, e t d'autres classes de phénomènes concernant la production ou la transformation de la lumière, apparaissent comme plus compréhensibles si l'on admet que l'énergie de la lumière est distribuée de façon discontinue dans l'espace. Selon i'hypothbe envisagée ici. lors de la propagatlon d'un rayon lumineux émis par une source ponctuelle, l'énergie n'est pas distribuée de façon contlnue sur des espaces de plus en plus grands, mals est constituée d'un nombre fini de quanta d'énergie localis& en des points de l'espace, chacun se dépiacant sans se diviser e t ne pouvant €tre absorbé ou produit que tout d'un bloc. Dans ce qui suit, Je vais présenter le cours des idées e t relater les faits qui m'ont conduit au point de vue ici exposé, dans l'espoir que d'autres chercheurs pourront en tirer profit.
1.
U n e d i E c u l t é concernant l a
théorie du
"
rayonnement noir '*
Plaçons-nous d'abord dans le cadre de la théorie de Maxwell et de l a théorie des électrons, e t considérons le cas suivant. Supposons que, dans un espace clos, aux parois parfaitement réfléchissantes, se trouvent un certain nombre de molécules de gaz e t d'électrons libres de se déplacer e t exerçant entre eux, lorsqu'ils s'approchent les uns des autres, des forces de type conservatif ; autrement dit, ils peuvent entrer en collision les uns avec les autres, tout comme les molécules d'un gaz en théorie cinétique des gaz l . Soit en outre un certain nombre d'électrons liés à des points de cet espace très éloignés les uns des autres par des forces dirigées vers ces points e t proportionnelles à l'élongation. ces électrons sont susceptibles d'interagir de façon conservative avec les molécules e t les électrons libres lorsque ces derniers s'en approchent sunisamment. Nous appelons r-nateurs " ces électrons qui sont liés à des points de l'espace ; ils émettent e t absorbent des ondes électromagnétiques de période bien déterminée. Selon la manière actuelle de concevoir l'origine de la lumière, le rayonnement dans l'espace considéré, obtenu en appliquant la théorie de Maxwell dans le cas de l'équilibre dynamique, doit étre identique au " rayonnement noir " du moins si l'on considère qu'il y a des r b n a t e u r s correspondant à toutes les frdquences considérées. Faisons abstraction, provisoirement. du rayonnement émis e t absorbé par les résonateurs e t demandons-nous quelle est i a condition d'équilibre dynamique correspondant aux interactions (aux calllsions) des mol,&ules et des électrons. La théorie cinétique des gaz donne comme condition d'équlllbre que la force vive moyenne d'un électron r h n a t e u r soit égale à l'énergie cinétique moyenne de translation d'une molécule de gaz. Decomposons le mouvement d'un électron en trois mouvements oscillants. le long de trois directions perpendicuialres ; la valeur moyenne E de l'énergie de chacun de ces 'I
-
-
Cette hypothèse est équivalente a celle selon laquelle, a l'équilibre thermique, les énergies cinétiques moyennes des molécules du gaz e t des électrons sont égales. O n sait que,frace à cette hypothèse, M. Drude a pu déduire théoriquement le rafport la conductlvité électrique d'un métal.(P. Drude. Zur de la con uctivité thermique Elektronentheorie der Metalle , Anndm der Physik. vol. 111. 1900, p 566-613)
Sources et évolution de la physique quantique
30
mouvements d'oscillation rectiligne est :
où R designe la constante universelle des gat. N le nombre des '* molécules réelles '' dans un 6qulvaient-gramme et T la temperature absolue. L'énergie Ë est en effet égaie, compte tenu de I'égallté des valeurs moyennes dans le temps des énergies cinétique e t potentlelle d'un résonateur, aux deux tiers de la force vive d'une molécule libre de gaz monoatomique. Si, pour une raison ou une autre (en I'occurence, du fait des processus de rayonnement). Il se faisait que l'énergie d'un résonateur prenne une valeur moyenne dans le temps plus grande, ou Plus petite, que Ë, les collisions avec les électrons e t les molécules libres aboutiraient à ce que le gaz gagne, ou cède, une énergie non nulle en valeur moyenne. L'équilibre dynamique n'est donc possible, dans le cas qui nous intéresse, que si chaque résonateur a une énergie moyenne égale à È. Appliquons des considérations analogues à l'interaction entre les résonateurs e t le rayonnement qul se trouve dans l'espace. M. Planck' a, dans ce cas, déduit la condition d'équilibre dynamique, en faisant l'hypothèse3 que le rayonnement pouvait être considéré comme un processus aussi désordonné que possible. II a trouvé :
-E, = L3 8rvz
E,
"*
est Id l'énergie moyenne d'un résonateur de fréquence propre Y (pour chacune des composantes du mouvement oscillant), L l a vitesse de l a lumière, v l a fréquence e t pvd, I'énergle par unité de volume de la fraction du rayonnement dont l a fréquence est comprise entre v et Y dv.
+
M. Planck, Ann. d,
Phys., vol. 1. 1900, p 99.
Cette hypothêse peut etre formuSe de la façon suivante. Développons en serie de de la force électrique (Z), en un point quelconque de l'espace Fourier la composante considér6, entre les Instants t = 0 e t t = T (où T est un intervalle de temps très grand par rapport â toutes les périodes considérées) :
(au meme point de l'espace) autant de fois que l'on veut, en choislssant les instants lnltlaux au hasard ; on obtient divers systemes de valeurs pour les grandeurs A , et a". II existe alors, pour la fréquence de chaque combinaison diRérente de valeurs des grandeurs A, et P. une probabillté (statlstlque) W de l a forme :
.
W = f(Ai, A r . . a i , a l . . .)dAl dAr
...d a , , d a a ...
Le rayonnement est aussl désordonné que posslble si :
f ( A ,As ...al,ax ...) = &!Ai) Fa(Ar) ... f i ( a i ).fZ(aZ)...,
c'est-à-dlre sl la probabillte pour qu une des grandeurs ( A ou a ) prenne une valeur déterminée est indépendante des valeurs prises par les autres grandeurs A ou a. Plus on se rapproche des conditions ob les couples Individuels de grandeurs (Ap, a") dépendent des processus d'hlsslon et d'absorptlon de groupes bien particuliers de reonatcurs, plus on a le droit, dans le cas envisagé, de considérer que le rayonnement est aussi désordonné que possible
.
De la relativité a la première quantification
Si l'on exige que l'énergie du rayonnement de fréquence croisse ni ne décroisse systématiquement, il faut que :
Y
31
dans son ensemble ne
R =L3 -T E =E, = N 8nv2 pu R 8*vz T. N L3
pu=--
Cette relation, obtenue comme condition de l'équilibre dynamlque, n'est pas conforme
a l'expérience ; mals elle Indique également que, dans notre modèle. Il est hors de questlon qu'il y ait partage de l'énergie entre l'éther et la matière. En effet, plus on étend le domaine des fréquences allouées aux résonateurs, plus l'énergie du rayonnement emplissant l'espace augmente à la limite et on obtient :
-y T l m v 2 d u =m.
pudu=
2. A
propos de la détermination par Planck des quanta élémentaires
Dans ce qui suit, nous allons montrer que la détermination des quanta élémentaires donnée par M. Planck est,Jusqu'à un certain point, Indépendante da sa theorle du " rayonnement noir La formule de Planck4 vérifiëe Jusqu'à présent par toutes les expériences, donne pour
".
Pu :
a2
pu OU (I
=e@+-1'
= 6,lO
*
lo-''
j3 = 4,866 lo-". A la limite des valeurs de T / v , c'est-à-dire pour de grandes longueurs d'onde et de fortes densités de rayonnement, cette formule devient :
On constate que cette formule est conforme à celle obtenue au paragraphe 1a partir de la théorie de Maxwell et de la théorie des électrons. Par identification des coefklents de ces deux formules, IIvient :
8%- a -R- = N L3 ,8'
soit :
j3 8nR a L3
N = - -= 6,17-1023. M. Planck. Ann. d. Phys.. vol. IV. 1901, p 561.
Sources et évolution de la physique quantique
32
Limitons-nous à l'étude de la manière dont cette entropie dépend du volume occupé par le rayonnement et notons l'entropie du rayonnement lorsque son volume est 80 ; nous
so
obtenons :
E s-so=-lg
Bu
[ssol.
Cette équation montre que l'entropie d'un rayonnement monochromatique, de densité sufflsamment faible, varie en fonction du volume selon la même loi que l'entropie d'un gaz parfait ou d'une solution diluée. Nous allons dans ce qui suit interpréter l'équation ci-dessus en nous fondant sur le principe introduit dans la physique par M. Boltzmann, principe selon lequel l'entropie d'un système est une fonction de la probabilité de son état.
5.
Etude, dans le cadre d e l a théorie moléculaire. de d e l'entropie d'un gaz o u d'une solution diluée
la
dépendance e n volume
Dans le calcul de l'entropie par les méthodes de la théorie moléculaire, on emploie couramment le m o t " probabilité " dans un sens qui ne recouvre pas la définition de ce mot telle qu'elle est donnée en calcul des probabilités. En particulier, on définit souvent de façon hypothétique des " occurences d'égale probabilité ", dans des cas où les modèles théoriques utilisés sont sumsamment précis pour qu'à la place de cette définition hypothétique on ait une déduction. Je montrerai ailleurs que, dans les considérations relatives aux processus thermiques, on peut très bien se satisfaire de ce qu'il est convenu d'appeler les " probabilités statistiques J'espère ainsi éliminer une difficulté logique qui fait encore obstacle à la mise en œuvre du principe de Boltzmann. Mals ici, il ne sera donné qu'une formulation générale de ce principe qui ne sera appliqué qu'a des cas très particuliers. si parier de la probabilite d'un etat d'un systeme a un sens et si, en outre, toute augmentation d'entropie peut être conçue comme une transition vers un état de plus grande probabilité. l'entropie si d'un Système est une fonction de la probabilité de t'état indantané du système. S i donc on a affaire à deux systèmes et sa sans interaction, on peut poser
".
si
s1 =vi (Wl) s2
= y2 (W2)
.
SI l'on considère ces deux systèmes comme un seul et même système d'entropie probabilité on a : s = s1+s2 = '2 ( W )
w,
et
w1
s et de
w = w, .w,,
Cette dernière relation exprime le fait que les états des deux systèmes sont des événements indépendants les uns des autres. D e ces équations, IIdécoule que :
De la relativité à la première quantification
D'OÙ
finalement :
33
~ ( w i=)C ig(W1) + cte.
+ cte. + cte.
cpi(W2)= C lg(Wz)
p(W) = C ig(W)
c
La grandeur est donc une constante universelle ; elle vaut, d'apres la théorie cinétlque des gaz, R/N, les constantes R e t N ayant Ici la meme signification que plus haut. SI désigne l'entropie d'un système pour un certain état initial e t si est la probabilité on a donc de façon générale : relative d'un é t a t d'entropie
so
w
s,
R s - so = lg w N
.
Occupons-nous d'abord du cas particulier suivant. Soit dans un volume 80 un nombre (n) de points mobiles (des molécules par exemple), sur lesquels nous allons raisonner. II peut y avoir dans l'espace, outre ceux-ci, d'autres points mobiles, en nombre quelconque e t de n'importe quelle espke. Quant à la loi régissant le déplacement des points considérés dans l'espace, elle n'est l'objet d'aucune hypothèse SI ce n'est que pour ce mouvement, aucune région de l'espace, non plus qu'aucune direction, n'est privilégiée par rapport aux autres. On suppose, en outre, que les points mobiles considérés (les premiers nommés) sont suffisamment peu nombreux pour qu'on puisse négliger l'action qu'ils auraient les uns sur les autres. Le système consldéré (qui peut être par exemple un gaz parfait ou une solutlon diluée) a une certaine entropie. SO.Imaginons une portion du volume 80 de grandeur 8 , e t que tous les n points mobiles soient transportés dans le volume 8 , sans que rien par ailleurs ne soit modifié dans le systëme. A cet état correspond évidemment une autre valeur (S)de l'entropie ; nous nous proposons de déterminer cette dirérence d'entropie grâce au principe de Boltzmann. posons-nous alors la questlon : quelle est la probabilité de l'état imaginé en dernier par rapport a celle de l'état inltial ? Ou encore : quelle est l a probabilité pour que, en un instant choisi au hasard, les n points mobiles indépendants contenus dans le volume go se trouvent (par hasard) tous dans le volume 9 ? pour cette probabilité, qul est une " probabilité statistique ", on obtient évidemment la valeur :
w =[ f ] " .
D'où l'on déduit, par application du principe de Boltzmann. que
S-So=R[E]
lg
[i]
II faut remarquer que cette equation, d'où l'on peut, par un raisonnement thermodyna-
mique simple. déduire la lo1 de Boyle-Gay-Lussac',
'
51 E est l'énergie du systbme,
-d(E et donc : pd = R ~ T .
e t son homologue pour la pression
on a
dûT - T S ) = pd9 = T d S = R-Nn V
34
Sources et évolution de la physique quantique
1/1v
Autrement dit, un atome d'hydrogène pèse gramme, soit 1,62 lo-'' gramme. C'est exactement la valeur trouvée par M. Planck, laquelle coincide elle-même assez blen avec les valeurs de cette grandeur obtenues par d'autres voies. Nous arrivons donc à la conclusion suivante : les fondements théoriques dont nous sommes partis sont d'autant plus appropriés que la densité d'énergie et la longueur d'onde du rayonnement sont plus grandes : ils sont complètement inopérants pour de petites longueurs d'onde e t de faibles densités d'énergie. Dans la suite, ie '' rayonnement noir " sera considéré sous le rapport expérimental e t sans prendre pour base tel ou t e l modèle de la production et de la propagation du rayonnement.
3. Sur l'entropie du rayonnement Les considérations suivantes se trouvent déjà dans un travail célèbre de M. W e n e t Je ne les reproduis ici que par souci de complétude. Soit un rayonnement occupant un volume 8. Nous supposons que les propriétb observables de ce rayonnement sont parfaitement déterminées par la donnée, pour toutes les fréquences, de la densité spectrale de rayonnement ~ ( v ) Puisque ~ . l'on considère que des rayonnements de fréquences différentes peuvent être &parés les uns des autres sans travail et sans apport de chaleur, l'entropie du rayonnement peut être écrlte sous la forme :
où p désigne une fonction des varlables p e t v. On peut réduire cp à une fonction d'une seule variable en écrivant que, lors d'une compression adiabatlque à l'intérieur de parois réfléchissantes, l'entropie d'un rayonnernent reste inchangée. Nous ne le ferons cependant pas ; nous allons plutôt examiner comment la fonction cp peut être obtenue à partir de la loi du rayonnernent du corps noir. Dans le cas du " rayonnement noir ", p est une fonction de Y telle que l'entropie, énergie donnée, soit maximale, c'est-à-dire telle que :
lorsque :
6 L W pdv = o . D'où il s'ensult que pour tout choix de 6p, fonction de v :
IIs'agit d'une supposition gratuite. Naturellement, cette supposltion, la plus simple qui soit, sera maintenue tant que I'experience n'oblige pas à y renoncer.
De la relativité à la première quantification
35
où est independant de u. Dans le cas du rayonnement noir, & / o p est donc Independant de u. Pour tout accroissement dT de l a t e m p a t u r e d'un rayonnement noir occupant le volume 9 = 1, on a :
I, "=Oo
ds= soit encore, puisque
&lap
09
- dpdu, ap
ne dépend pad de
u:
a'p dS = dE.
OP
Comme dE est égal à l a chaleur fournie e t que le processus est réversible, on a égaiement :
1
dS = - dE.
T
Par comparaison, on obtient :
-aQ= - 1 op
T
qui est l'expression de ia loi du rayonnement noir. On peut donc déduire la loi du rayonnement noir de la fonction 'p et, à l'inverse, déterminer à partir de cette loi la fonction 'p par intégration, compte tenu du fait que cp s'annule pour p = O.
4. Loi l i m i t e p o u r l'entropie du rayonnement monochromatique d e faible densité Certes, il r e s o r t des observations effectueeS jusqu'à preent sur le " rayonnement noir '' que la loi du " rayonnement noir " propode initialement par M. Wien :
n'est pas tout à fait exacte. Elle est cependant parfaitement confirmée par I'expérlence pour les grandes valeurs de u/T. NOUS allons fonder notre calcul sur cette formule, gardant toutefois à l'esprit que nos résultats ne vaudront que dans certaines limites. De cette formule, il résulte d'abord que :
1 = --1 1g T Bu
P 2
7
puis, en utilisant la relation trouv& au paragraphe précédent, que :
Soit maintenant un rayonnernent d'énergie
u
E, de fréquence comprise entre
+ du. Ce rayonnement occupe un volume 9. Son entropie est :
Y
et
36
Sources et évolution de la physique quantique
osmotique, a été obtenue sans qu'il soit nécessaire de faire la moindre hypothèse 5ur l a loi qui gouverne le mouvement des molécules.
6. interprétation, selon le principe de Boltzmann, de l'expression donnant la dépendance en volume de l'entropie d'un rayonnement monochromatique Au paragraphe 4, nous avons trouvé l'expression suivante pour la dépendance en volume de l'entropie d'un rayonnement monochromatique :
S - S o = B -E ;'g
[;I.
Ecrivons cette formule sous la forme :
e t comparons-la à la formule générale qui exprime le principe de Boltzmann :
R s- so = IgW N Nous aboutissons à la conclusion suivante : SI un rayonnement monochromatique de fréquence u et d'énergie E est enfermé (grâce à des parois rméchissantes) dans un volume 00, l a probabilité pour qu'à un instant quelconque, toute l'énergie du rayonnement se trouve dans une portion 8 du volume fio est :
D'oD nous tirons cette autre conclusion : Un rayonnement monochromatique de faible densité (dans les limites du domaine de validité de la loi du rayonnement de Wien) se comporte, par rapport à l a théorie de la chaleur, comme s'il était constitué de quanta d'énergie, indépendants les uns des autres, de grandeur RBu/N. De plus, comparons, pour une même température, la grandeur moyenne des quanta d'énergie du " rayonnement noir " et la force vive moyenne du mouvement du centre de gravité d'une molécule. Cette force vive moyenne est (3/2) ( R / N ) T ; quant à l a grandeur moyenne du quantum d'énergie, elle vaut, sur la base de la formule de Wien :
O& lors qu'un rayonnement monochromatique (de densité suffisamment faible) se comporte, relativement à l a dépendance en volume de son entropie, comme un milieu discontinu constitué de quanta d'énergie de grandeur RBu/N, on est conduit à se demander si les lois de la production e t de la transformation de la lumière n'ont pas également la même structure que si la lumière était constituée de quanta d'énergie de ce type. Telle est la question dont nous allons maintenant nous occuper.
De la relativité à la première quantification
37
7. A propos de Ir règle de Stokes On considère une lumière monochromatique transformée par photoluminescence en lumière d'une autre fréquence, e t on suppose que, conformément au résultat précédent, la lumière qui produit e t celle qul est produite sont constituées de quanta d'énergie de grandeur ( R / N ) @ , où Y deigne l'une ou l'autre des deux fréquences. Le processus de transformation dolt être alors interprété de la facon suivante. Chaque quantum producteur, de fréquence u ~ est . absorbé et donne naissance à lui tout seul à un quantum de lumière de fréquence y à condition toutefois que la densité de quanta producteurs wit sufFisamment faible. Eventuellement, lors de l'absorption du quantum de lumière producteur, peuvent apparaïtre, en même temps, des quanta de lumière de fréquence us, v4, etc., ou bien toute autre forme d'énergie (telle que la chaleur, par exemple). Peu importent les processus intermédiaires par lesquels ce résultat final est obtenu. si l a substance photoluminexente n'a pas à être considérée comme une source permanente d'énergie. l'énergie d'un quantum d'énergie produit ne peut pas. en vertu du principe de conservation de l'énergie, être supérieure à l'énergie du quantum de lumière producteur ; on dolt avoir
-
soit
Y
I.vi
I
qui n'est autre que la règle bien connue de Stokes. Un point mérite d'etre souligné : selon notre manière de voir les choses, dans le cas d'un faible éclairement, la quantité de lumière produite doit, toutes choses égales par ailleurs, etre proportionnelle à l'intensité de lumière excitatrice, puisque chaque quantum d'énergie excitateur est à l'origine d'un processus élémentaire du genre décrit plus haut, et ceci indépendamment de l'met des autres quanta d'énergie excitateurs. En particulier, il n'y a pas pour I'lntendté de la lumière excltatrice de limite inférieure en dessous de laquelle la lumière serait incapable d'avoir une action excitatrice. L a conception ici exposée des phénomènes laisse à penser qu'il peut y avoir des écarts 21 la règle de Stokes dans les cas suivants : 1) quand le nombre par unité de volume des quanta d'énergie simultanément transform& est suffisamment grand pour qu'un quantum de la lumière produite puisse tenir son énergie de plusieurs quanta d'énergie producteurs : 2) quand la lumlère productrice (ou'produite) n'a pas la structure énergétique de la partie du " rayonnement nolr " qui correspond au domaine de validité de la loi de W e n ; par exemple. quand la lumière excitatrice est' produite par un corps dont la température est si élevée que la loi de W e n n'est plus valable aux longueurs d'onde considérées. Cette dernière possibilité mérite qu'on s'y intéresse tout particulièrement. En effet, selon la conception développée ici. II n'est pas exclu qu'un rayonnement " de type nonW e n *, mCmc très dilué, se comporte, du point de vue énergétique, différemment d'un '' rayonnement noir pris dans le domaine de validité de la loi de Wien.
Sources et évolution de la physique quantique
38
8.
P r o d u c t i o n d e rayons cathodiques par éclairement d'un corps solide
L a conception usuelle, selon laquelle l'énergie de la lumière est distribuée de façon continue dans l'espace où elle est rayonnée, présente, quand on tente d'expliquer les phénomenes photoélediques, de t r b serieuses difficultés qui sont exposées dans un travail déclslf de M. Lenard'. La conceptlon selon laquelle l a lumière excitatrice est constituée de quanta d'énergle (R/N)@vpermet de concevoir l a production de rayons cathodiques par la lumière de l a facon suivante. Des quanta d'énergle pénètrent dans la couche superficlelle du corps ; leur énergie est transform&, au moins en partie, en énergie cinétique des électrons. L a représentation la plus simple que l'on puisse s'en falre est celle d'un quantum de lumière cedant son énergie à un seul électron ; nous ailons supposer que c'est bien ce qui se passe. II n'est pas exclu cependant que d e s électrons ne prennent qu'une partie de l'énergie des quanta de lumière. Un électron, auquel de l'énergie cinétique a €té fournie à l'intérieur du corps, atteint la surface en ayant perdu une partie de son énergie clnétique. Nous allons supposer, de plus, que tout électron doit, pour pouvoir quitter un corps, fournir un certain travail P (caractéristique du corps). Les électrons qui quittent le corps avec la vitesse normale la plus élevée sont ceux qui se trouvent immédiatement à la surface et qui ont été excités normalement à celle-cl. L'énergie cinétique de ces électrons est :
R Npv- P. Si le corps est porté au potentiel positif E.s'il est entouré de conducteurs à un potentiel est tout juste capable d'empêcher le corps de perdre de l'électricité, on a : nul, et si
R
II€ = N p v - P , où E designe la charge électrlque de l'électron. Soit encore :
IIE=RBv-P', où E désigne la charge d'un équivalent-gramme d'ions monovalents e t P ' le potentiel, par rapport au corps, de cette quantité d'électricité négative'. Posons E = 9,6.103; E.10-' est alors le potentiel en volts du corps Illuminé dans le vide. Afin de voir d'abord si la relation ainsi déduite donne un ordre de grandeur conforme â l'expérience, posons P ' = O, v = 1,03.10's ce qul correspond à la limite ultraviolette du spectre solaire) e t = 4,866.10-". Nous obtenons n.10' = 4,3voits * ; reJultat conforme, en ordre de grandeur, à ceux de M. Lenard
B
'I
'.
P. Lenard, Ann. d. Phys., vol. V111, 1902, p 169 et 170.
SI l'on suppose que l'électron doive etre arraché par la lumière à une m o k u l e neutre, e t qu'il faille pour cela dépenser un certain travail, il n'est pas nécessaire de modifier en quoi que ce soit la relation ici déduite ; il suffit de considérer que i" est la somme de deux termes. Lire
D.lO-' = 4,3 volts, e t non D.10'. en optant pour le syame MKSA au lieu du
CGS (NIT).
'
P. Lenard, Ann. d. Phys., vol. VIII, 1902,p
165 e t 184, tableau I, fig. 2.
De la relativité à la première quan@cation
39
n
Si la formule obtenue est exacte, en fonction de la fréquence de la lumière excitatrice doit être, en coordonnées cartésiennes, une droite dont la pente ne dépend pas de la substance étudiée. Autant que je puisse en juger, notre conceptlon n'est pas en contradiction avec les propriétés de l'effet photoélectrique telles qu'elles ont été observées par M. Lenard. Si chaque quantum d'énergie de la lumière excitatrice cède son énergie à un électron Indépendamment de tous les autres, la distrlbutlon des vitesses des électrons, c'est-& dire la qualité du rayonnement cathodlque produit, est indépendante de l'intensité de la lumière excltatrlce ; en revanche, le nombre des électrons qui qulttent le corps dolt, lui, Stre, toutes choses égale d'allleurs, proportionnel à I'lntenslté de la lumière excitatrice Io. II convlendrait de faire ici, à propos des limites de validité présumées des lois mentionnées, des remarques analogues à celles qui ont été faites à propos des écarts présumés à la règle de Stokes. Dans ce qui précède, on a supposé que l'énergie, du moins celle d'une partie des quanta d'énergie de la lumière productrice, n'était jamais cédée qu'à un seul électron. Si l'on ne fait pas cette hypothèse, la plus simple à concevoir, on obtient à la place de l'équation précédente :
rIE
+ P' 5 RPY.
Pour la luminescence cathodique qui constitue le processus inverse d u précédent, on obtient, par des considérations analogues à celles développées plus haut :
Dans ie cas des substances étudiées par M. Lenard, f'E ** est toujours considérablement plus grand que RPv, puisque la tension que doivent avoir traversée les rayons cathodiques pour pouvoir tout juste produire de la lumière visible attelnt, selon les cas, des centaines ou des mllllers de volts II faut donc supposer que l'énergie cinétique d'un électron est employée à produlre de nombreux quanta d'énergie lumineuse.
9. Ionisation des g a z par l a lumière ultraviolette Nous allons supposer que. lors de l'ionisation d'un gaz par de la lumière ultraviolette, tout quantum d'énergie lumineuse absorbe est effectivement employé à l'Ionisation d'une seule molécule de gaz. O n en conclut d'abord que le travail d'ionisation (c'est-à-dlre ie travail théoriquement nbcessaire à l'ionisation) ne peut être plus grand que l'énergie d'un quantum d'énergie lumineuse absorbé et efficace. Si nous notons par J le travail (théorique) d'ionisation par équivalent-gramme, nous devons avoir :
Io
P. Lenard, /bid., p 150 et 166-168.
** ii faut lire IIE (NdT).
P. Lenard, Ann. d. Phys., vol. XII, 1903, p 469.
Sources et évolution de la physique quantique
40
Mais d'après les mesures de Lenard, la Plus grande longueur d'onde efficace est, dans le cas de l'air, de l'ordre de 1,9.10-' cm : on a donc :
RBv = 6,4.1Ol2ergs2 J. On obtient aussi une limite supérieure au travail d'ionisation à partir des tensions d'ionisation des gaz raréfie. D'après J. Stark", l a plus faible tension mesurée dans le cas de l'air (au niveau d'anodes de platine) est d'environ 10 Ce qui donne donc comme limite Supérieure de J : 9.6.1012,du meme ordre de grandeur que celle trouvée cl-dessus. On en déduit une autre conséquence. qu'il me semble três important de soumettre au verdict de l'expérience : si chaque quantum de lumière absorbé ionise une molécule, Il doit exister, entre la quantité de lumière absorbée L e t le nombre j de molécules de gaz qu'elle ionise, l a relation :
Si notre conception correspond bien â la réalité, cette relation doit être vérifiée pour tous les gaz qui (à la fréquence considérée) ne présentent pas d'absorption notable qui ne soit accompagnée d'ionlsation. Berne, le 17 mars 1905.
l2 l3
J. Stark, Die ElektrlzitSt in Gasen, Leipzlg, 1902, p 57.
A l'intérieur des gaz, le potentlel d'ionisation pour des Ions négatifs est cinq fois plus grand.
Article IV
La mise en évidence du noyau La diffusion des particules a e t p
par la matière
et la structure de l'atome
ERNESTRUTHERFORD Philosophical Magazine 21,669-688(1911) (Taylor & Francis) (avril 1911) [traduit par B. Escoub&] Envoyé par l'auteur. Un. bref apercu de cet article a été envoyé à la Société des Lettres et de Philosophie de Manchester en février 1911.
1. II est bien connu que les particules O e t /3 subissent des déviations à partir de leur parcours rectiligne lorsqu'elies rencontrent des atomes de matière. Cette diffusion est beaucoup plus marquée pour les particules p que pour les a à cause de la quantité de mouvement et de l'énergie bien moindres des premières par rapport aux secondes. II ne semble pas faire de doute que des particules se mouvant ainsi rapidement suivent un chemin passant à travers l'atome, et que les déviations observées sont dues au fort champ électrique qu'elles croisent à l'intérieur de l'atome. On suppose généralement que la diffusion d'un faisceau de rayons a ou traversant une fine lame de matière est le r e u l t a t d'une multitude de petites diffusions par les atomes de matière traversés. Cependant, les observations de Geiger et Marsden sur ia diffusion des particules a indiquent que quelques unes de ces particules a doivent subir une déviation d'un angle supérieur à l'angle droit lors d'une seule collision. Ils trouvent, par exemple, qu'une petite fraction des particules Q incidentes, environ 1 sur 20.000, est déviée en moyenne d'un angle de 90° en traversant un dépôt de feuille d'or d'environ .O0004c m d'épaisseur. ce qui est équivalent à 1.6 m m d'air en termes de pouvoir d'arrêt des particules Q. Geiger a montra plus tard que l'angle de déviation le plus probable pour un faisceau de particules a traversant une feuille d'or de cette épaisseur était d'environ 0' 87. Un simple calcul base sur la théorie des probabilités montre que, pour une particule a,la chance d'€tre déviée d'environ 90' est incroyablement petite. En outre, l'on verra plus tard que la distribution des particules (I pour d'flérents grands angles de déviation ne suit pas la loi de probabilité à laquelle l'on s'attendrait si ces grandes déviations étaient produites à partir d'un grand nombre de petites déviations. II semble raisonnable de supposer que ia Proc. ROY. Proc. Roy.
LXXXIï,p 495 (1909). Soc. LXXXIII,p 492 (1910). SOC.
Sources et évolution de la physique quantique
42
déviation à grand angle est due à une seule collision avec un atome, car la probabilité qu'une seconde collision de ce genre produise une grande déviation est sans aucun doute excessivement faible..Un calcul simple montre que l'atome doit etre le siège d'un champ électrique intense pour &tre capable de produire une déviation aussi grande lors d'une seule collision. Monsieur J.J. Thomson a récemment proposé une théorie pour décrire la diffusion d'une partkuie chargée électriquement à travers une petite épaisseur de matière. II suppose que l'atome consiste en un nombre N de corpuscules de charge negative, accompagné d'une quantité d'électricité positive égale Uniformément distribuée à l'intérieur d'une sphère. L a déviation d'une particule de charge négative à son passage à travers l'atome est attribué à deux causes : (1) l a répulsion des corpuscules distribués à travers l'atome, et (2) l'attraction de l'électricité dans l'atome. On suppose que la déviation de la particule traversant l'atome est petite, alors que la déviation moyenne aprks un grand nombre m de collisions est donnée par où 0 est la déviation moyenne due a un seul atome. II montra que le nombre N d'électrons dans l'atome pouvait etre déduit de l'observation de la diffusion de particules électrifiées. La précision de cette théorle de la diffusion compoee f u t examinée expérimentalement par Crowther dans un article ultérieur. Ses rbuitats confirment apparemment les principales conclusions de la théorie, et, supposant que I'éiectrkité positive était continue, II en déduisit que le nombre d'électrons dans un atome é t a i t environ égal à trois fois son poids atomique. La théorie de Monsieur J.J. Thomson est basée sur I'hypothkse que la diffusion due à une seule collision avec un atome est faible, e t la structure particuliëre que l'on a supposée pour l'atome ne permet pas de très grandes déviations pour une particule Q traversant un seul atome, à moins que l'on ne suppose que le diamètre de la sphère d'électricité positive soit minuscule comparé au diamètre de l a sphère d'influence de l'atome. Puisque les particules Q et traversent l'atome, il devrait être possible, à partir d'une étude fine de la nature de leurs déviations, de K faire une idée de la constitution de l'atome capable de produire les effets observe. De fait, la diffusion de particules chargées de grande vitesse par les atomes de matière est l'une des plus prometteuses méthodes d'attaque de ce problème. L e développement des méthodes de scintillation pour compter une à une les particules Q offre des avantages inhabituels d'investigation, et les recherches de H. Geiger effectuées par cette méthode ont déjà ajouté beaucoup à notre connaissance de la diffusion des rayons Q par la matière. 2. Nous examinerons d'abord théoriquement l a coliislon simple avec un atome d'une structure simple, capable de produire de grandes déviations à une particule Q , et nous comparerons les déductions de la théorie aux données expérimentalement disponibles. Considérons un atome contenant une charge &Ne en son centre entouré d'une sphère d'électrification contenant une charge F N e supposée uniformément distribuée à l'intérieur d'une sphère de rayon R. e est l'unité fondamentale de charge, qui dans cet
fi.#,
'
'
'
Crowther. Proc. Roy. Soc.
LXxm,
p 226 (1910).
La déviation d'une particule d'un très grand angle à la suite d'une collision avec un seul atome sera appelée dans cet article une diffusion "simple". L a diffusion d'une particule a résultant d'une multitude de petites déviations sera qualifiée de diffusion "composée" (nous dirions aujourd'hui diffusion "multiple", NdT).
De la relativité à la première quantification
Rutherford
- Lo découverie du noyau
43
43
article est prise égale à 4.65 x lo-'' unités ES. Nous supposerons que pour des distances inférieures à lo-'' cm la charge centrale ainsi que ia charge de la particule Q peuvent etre considérées concentrées en un point. Nous montrerons que les principales déductions tirées de l a théorle sont indépendantes du fait que l'on suppose la charge centrale positive OU négative. Par convention, nous supposerons que son signe est positif. La question de la stabilité de l'atome proposé n'a pas besoin d'être envisagée à ce niveau, car elle dépendra évidemment de l a structure de la partie minuscule de l'atome, et du mouvement des partles chargées qul le constituent. Afin de nous faire une idée des forces nécessaires Pour dévier à grand angle une particule a,consldérons un atome contenant une charge positive N e au centre, et entouré par une distribution d'électricité négative uniformément répartie à l'intérieur d'une sphere e t le potentiel à une distance r du centre d'un de rayon R. La force électrique atome pour un point à I'intérieur de l'atome sont donnés par :
x
v
supposons qu'une particule Q de masse m, de vitesse u et de charge E soit lancée directement vers le centre de l'atome. Elle sera amenée à s'arrêter à une distance b du centre donnée par
1
-mu2 2
1 3 = N ~ (b E - 2R
bz + =).
NOUSverrons que b est une quantité importante dans les calculs qui suivent. s u p posant que la charge centrale soit de 100e, on peut calculer que la valeur de b pour une particule P d'une vitesse de 2.09 x lo0 cm par seconde est d'environ 3.4 x cm. Dans ce calcul on a supposé b très petit devant R. Puisque R est supposé être de l'ordre du rayon de l'atome, c'est-à-dire lo-' cm, il est évident qu'une particule a,avant d'être renvoyée vers l'arrière, s'approche si près de la charge centrale, que le champ dO à la distribution uniforme d'électricité négative peut être négligé. Plus généralement, un calcul slmple montre que pour toutes les déviations plus grandes que un degré, on ne commet pas d'erreur notable en supposant que la déviation n'est due qu'au seul champ créé par la charge centrale. L'électricité négative, 51 elle est distribuée sous forme de corpuscules. peut être responsable de déviations simples, dont à ce niveau la théorie ne rend pas compte. NOUS montrerons plus loin que C e t effet est en général petit comparé à celui qui est dO au champ central. Considérons le passage d'une particule de charge électrique positive au voisinage du centre d'un atome. Supposons que la vitesse de la particule ne soit pas modifiée de maniare appréciable lors de son passage à travers l'atome : la trajectoire de la particule sous I'iniluence d'une force répulsive variant comme l'inverse du carré de la distance est une hyperbole dont le centre de i'atome occupe le foyer extérieur. Supposons que la particule entre dans l'atome en sulvant la direction P o (Fig. l), et que l a direction de son mouvement lorsqu'elle s'&happe de l'atome soit OP'. OP et OP' font des angles égaux avec la ligne SA, où A est le périhélie de l'hyperbole. p = S N est la distance normale du centre à la direction du mouvement
s
Sources et évolution de la physique quantique
44
initial de la particule. Soit 8 = l'angle POA. Soit la vitesse de la particule entrant dans l'atome, vitesse au point A. alors, considérant le moment angulaire :
v
pV = SA.o
u
sa
D
P'
Fig. 1 Par conservation de l'énergie :
1 -mV' =1 2
2
NeE -SA
'
Puisque i'excentricité est sec 8.
S A = S O + O A = p c ç c B ( l +cos@) = pcot 812, p2 = SA(SA - b) = pcot 8/2(pcot 812 - b), b=2pcot8. L'angle de deviation
est
5~
- 28 et COt+/2=- 2P
b Ceci donne l'angle de déviation d'une particule en fonction de b, et de la distance aba'ksée du centre de l'atome normalement à la dlrectlon de propagation. Comme Illustration, quelques valeurs de l'angle en fonction de f sont données dans la table suivante :
4
f...
+...
10 5O.7
5
11".4
2
28'
1
53'
.5
90'
.25
127"
.125 152"
Une simple considération montre que la déviation est la même que la force soit attractive au lieu d'etre répulsive.
De la relativité a la première quantification
45
3. Probabilité d'une simple déviation d'un angle quelconque Supposons qu'un faisceau de particules chargées électriquement arrive perpendiculairement sur un écran de matière d'epaisseur t . A l'exception de quelques particules qui seront déviées à grand angle, les particules sont supposées traverser la plaque presque dans ia direction normale, avec seulement une petite modification de leur vitesse. Soit n le nombre d'atomes par unité de volume du matériau. L e nombre de collisions de la particule avec l'atome de rayon R est alors de xR%t sur l'épaisseur t. La probabilité m d'entrer dans un atome à une distance p de son centre est donnée par
m = np'nt. L a chance
dm de frapper
entre les rayons p et p
dm = 2 n p n t . d ~= -ntb2 n 4
puisque
+ dp est donnée par
cot 4 12 CSC'
4 J2d4,
P
cot 412 = 2 - .
b
La valeur de dm donne la fraction du nombre total de particules qui sont déviées entre ies angles 4 et 4 f d4. La fraction p du nombre total de particules qui sont déviées d'un angle supérieur à 4 est donnée par
n
p = -ntb2 4 cot14J2 La fraction
p qui est déviée entre les angles 41 et
(3) 42
est donnée par
II convient d'exprimer l'équation (2) sous une autre forme afin de la comparer a i'expérience. Dans le cas de rayons a,le nombre de scintillations apparaissant sur une aire constante d'un &ran de sulphure de zinc est compté pour différents angles par rapport à la direction incidente des particules. Si r est la distance du point d'incidence des rayons er de cette énergie. Une curieuse approche awociant la nucléosynthèse et la formation des étoiles, fut proposée tout juste après la decouverte de Becquerel par F. R4,
CR 136,393 (1903).
Sources et évolution de la physique quantique
62
9.1.4
La
condensation de Bose
Lorsque deux particules identiques sont déa-ites par des amplitudes telles que
A l , symétriques par rapport à leur échange, elles obéissent à une statistique nouvelle, la statistique de Bose-Einstein - c'est le cas de particules à spin entier, tels les pions, les photons, les molécules à spin entier3'. Dans ce cas là, on voit que, lorsque les états finals coïncident on aura pour la Probabilité de transition laiLi >-+ la2A > devenue lalbi >-+ Icaza2 > (puisque la2
>=
>) : lAz12 = I < azazla~bl>
+ < azazlaib1 > I' =
= 41 < aza2laIbi > 1' Si les deux particules sont différentes,par exemple, un pion : IT > et un méson p : Ip >, nous saurons distinguer la transition < a ~ l x> < p2lp > de la transition < &lx > < a 2 J p> et la probabilité sera la somme des probabilités partielles,
P = I < a21x >< Alp > IZ
+ I c al. >< a2Ip 7 I2
Si les deux états finais coincident on aura :
Ainsi la probabilité de trouver deux bosons identiques dans un même état final est égale à deux fois la probabilité de trouver deux bosons différents dans le même état. La généralisation de ce résultat nous amène à la conclusion que la probabilité qu'un boson Occupe un état dans lequel il existe déjà n bosons identiques est (n i) fois plus grande que si, dans cet état, il n'y avait aucun boson identique ant&eurement. Ou encore : la présence de bosons identiques dans un certain état augmente la probabilité qu'un nouveau boson identique aux premiers occupe le même état. C'est Is condensation de Bose, responsable de phénomènes comme la superiiuidité de l'hélium liquide (He') et la supraconductivité (due à la formation de paires d'électrons, les paires de Cooper à basse température) ; la supraconductivité de l'hélium-3 (qui est un gaz de fermions) étant due à la formation de paires d'atomes He3 à très basse température.
+
34
S.N. Bose, Zeifachr. f. Phgs.
26, 178 (1924) [Article VIII, page 8.51.
Article V
Le principe d'exclusion Sur la connexion entre la saturation des groupes d'électrons dans l'atome e t la structure complexe des spectres WOLFGANG PAULI JR. Zeitschrlft fiir Physik 31, 765-783 (1925) (Springer-Veriag) (reçu le 16 janvier 1925) [traduit par H.Braun et ci. Oberiechtner]
RésumB Millikan et Lande ont constaté qu'Il est possible de représenter le doublet alcalin par une formule relativiste. Partant de ce fait et compte tenu des résultats obtenus dans des travaux précédents, nous en proposons l'interprétation suivante : dans ces doublets et dans leur effet Zeeman anormal se manifeste une ambivalence ( ' I Zweidcufigkeit ") non descriptible classiquement, propriété que la théorie quantique assigne à l'électron de valence : la configuration saturée du reste de l'atome (comme celle des gaz rares) n'est plus le réceptacle du moment angulaire de l'atome, elle n'est pas non plus le slège de l'anomalie magnéto-mécanlque. O n tente ensuite, malgré la difficulté de principe qul s'y oppose, de prendre ce point de vue particulier comme hypothèse de travail provisoire et de pousser ses conséquences aussi loin que possible à d'autres atomes que les alcalins. En premier lieu, on montre que, contrairement à l'interprétation usuelle, ceci permet de calculer pour les deux systèmes, en présence d'un champ magnétique extérieur suffisamment intense pour que l'on puisse négllger les forces de couplage entre l'électron de valence et le reste de l'atome, aussi bien le nombre d'états stationnaires que la valeur de leurs nombres quantiques et de leurs énergies magnétiques, et ceci sans tenir compte d'autres propriétés que celles utilisées pour décrire le reste de l'atome libre et l'électron de valence dans le cas des Alcalins. Grâce à ces résultats. on parvlendra à une classilication génerale de chaque électron dans l'atome a l'aide du nombre quantique principal n et de deux nombres quantlques supplémentaires k1 et &l auxquels on ajoute, en présence d'un champ extérieur, un nouveau nombre quantique mi. A la suite d'un travail récent de E.C. Stoner, cette classification conduit à une formulation générale, en termes de théorie quantique, de la saturation des groupes d'electrons dans l'atome.
Sources et évolution de la physique quantique
64
1.
L a conservation des nombres quantiques (principe de construction) dans l a structure fine e t dans l'effet Zeeman
Dans un article précédent nous avions signalé que l a représentation usuelle, suivant laquelle les couche5 électroniques saturées internes de l'atome participent de manière essentielle sous forme d'un moment angulaire pris par le cœur et en tant que siège de l'anomalie magnéto-mécanique à l a structure complexe des spectres et à l'effet Zeeman anormal, conduisait à de nombreuses et graves difficultés. D'OU la nécessité de substituer à cette représentation une conception opposée, qui attribue en particulier l'origine tant de la structure en doublets du spectre alcalin que de l'effet Zeeman anormal 3 une ambivalence, non descriptible classiquement, caractéristique de la théorie quantique. Cette interprétation s'appuie par ailleurs essentiellement sur l'observation faite par Millikan e t Landé que les doublets optiques des alcalins sont analogues aux doublets relativistes de Rontgen e t que leur grandeur est déterminée par une formule relativiste. En entreprenant d'étendre ce point de vue, comme Bohr e t Coster le firent pour les spectres de Rontgen (" b y o h c "), nous classifierons les etats stationnaires propres de l'électron de valence dans les spectres d'émission des alcalins en utilisant, en plus du nombre quantique principal n, deux nombres quantiques adjoints kl et k2. Le premier, ki (que l'on désigne généralement par k) prend les valeurs 1,2,3 pour les termes 8 , p , d... et varie d'une unité lors des transitions Permises : il mesure l'intensité de l'interaction de la force centrale entre l'électron de valence e t le reste de l'atome. Le deuxième nombre quantique, k2, est, pour les deux termes du doublet (par exemple pl et p) égal à kl 1 e t k1 ; lors des processus de transition, il change de f i ou 0 et mesure la grandeur de la correction relativiste introduite par Landé pour décrire la pénétration de l'électron dans le domaine du reste de l'atome. Avec Sommerfeld, nous definirons de manière générale le nombre quantlque de moment orbital total de l'atome j comme la valeur maximale compatible avec l'etat stationnaire considéré du nombre quantique ml (d'habitude noté rn) définissant la Composante du moment orbital parallèle au champ extérieur, de sorte 1/2. Le nombre d'états stationnaires en présence que pour les alcalins on a = k2 d'un champ magnétique pour ki e t k2 donnés est 2 j 1 = 2k2, le nombre de ces états pour les deux termes du doublet avec k1 donné étant au total égal à 2(2kl 1). Lorsqu'on applique à présent un champ intense (effet Paschen-Back), on peut lntroduire. en plus de k1 e t du nombre quantique ml cité plus haut, e t en lieu et place de ks un autre nombre quantique magnétique m2 derivant directement l'énergie de l'atome dans le champ magnétique, c'est-à-dire égal à la composante du moment magnétique de l'électron de valence parallèle au champ. Pour les deux termes du doublet, il prend les valeurs et Alnsi, de la même manière que dans la structure en doublet du spectre alcalin se manifeste " I'anornu~ie de c o r n f i o n nZafi&fe '' (dont la grandeur est décrite par un autre nombre quantique que celui déterminant l'intensité de l'interaction créée par l a force centrale s'exertant entre l'électron de valence et te reste de l'atome), de même. dans la déviation Zeeman du triplet normal de Lorentz, te produit '' i'unomalk magnéto-mécanique (ob la grandeur du moment magnétique de l'électron de valence est décrite par un autre nombre quantique que celui du moment orbital). Manifestement, l'introduction de ces deux nombres quantiques (effectifs) e t la
-
-
x
...
-
-
-
-
+
9.
I'
Zeitschr. f. Phys. S t , 373 (1925).
-
La construction de la nouvelle mécanique
65
valeur en elle-même formelle g = 2 du facteur de doublement du terme (niveau) 8 des alcalins ont un rapport très étroit avec le dédoublement de ces niveaux. Nous ne tenterons cependant pas d'entreprendre ici une analyse théorlque plus poussée et prendrons, dans les considérations qui suivent l'effet Zeeman comme un fait expérimental. Sans nous soucier pour i'instant des diftïcultés s'opposant à l'interprétation courante et des discusslons que celle-ci entrame, nous allons tenter d'étendre cette classification formelle de l'électron de valence utilisant les 4 nombres quantiques n. ka. k2, ml à des atomes encore plus compliqués que les alcalins. On montre alors que, Contrairement a l'interprétation usuelle, nous pouvons nous baser sur cette classification pour assurer la conservation des nombres quantiques (principe de construction) aussi bien pour la structure complexe des spectres que pour l'effet Zeeman anormal. Selon ce principe, élaboré par Bohr, lors de l'adjonction d'un électron supplémentaire à un atome (pouvant être complètement chargé), les nombres quantiques définissant les états stationnaires des électrons déjà liés conservent les mêmes valeurs que celles qu'ils avalent lorsque le reste de l'atome était libre. Concentrons-nous d'abord sur les alcalino-terreux. Le spectre se compose ici d'un système singlet et d'un triplet. Aux états quantiques ayant une valeur définie du nombre quantique k1 pour l'électron de valence correspond au total un nombre d'états stationnaires égal à 1.(2ki -1) - pour le premier système e t à 3.(2k1-1) - pour le deuxième en présence d'un champ magnétique extérieur. O n a jusqu'ici interprété cela en disant que dans un champ fort, dans tous les cas. les 2kl 1 états correspondaient à l'électron de valence, alors que le reste de l'atome était susceptible de prendre 1 état dans le premier cas, et 3 états dans le second. Le nombre de ces états est manifestement différent du nombre 2 des états du reste de l'atome (terme s alcalin) dans un champ. Bohr désignalt zwung ") qui n'aurait pas d'analogie cet état de choses sous le nom de coercition avec l'action du champ extérieur. NOUS pouvons malntenant interpréter l'ensemble des 4.(2kl - i ) états de l'atome de la manière simple suivante : deux états sont toujours attribués au reste de l'atome dans le champ, et 2.(2k1 - 1) états le sont à l'électron de valence correspondant, comme pour les Alcalins.
-
(I'
Plus généralement, d'après une règle d'embranchement énoncée par Heisenberg et Landé un état stationnaire du reste de l'atome avec N états dans le champ extérleur donne ileu, par adjonctlon d'un électron supplémentaire, à deux systèmes de termes auxquels correspondent respectivement, pour une valeur donnée du nombre quantique kl de l'électron associê, un total de ( N +1)(2ki - 1) états pour l'un et de (N 1)(2kl 1) pour l'autre, en presence d'un champ. D'après notre interprétation, ces 2N(2kl 1) états de l'atome complet dans des champs intenses sont produits par les h' états du cœur de l'atome et les 2(2kl 1) états de l'électron de valence. En admettant la classincatlon avancée par la théorie quantique pour l'électron, la multiplicité des termes demandée par la règle d'embranchement apparaît comme une simple consequence du principe d'édification. En outre, d'après l'interprétation proposée Ici, la '' coenifion " de Bohr ne se manifeste pas par la violation de la conservation des nombres quantiques
'
-
-
-
'
Nous ne discuterons pas Ici des limites de validité de cette règle, ni, en partkulier, de la signification théorique de ce que l'on appelle les termes éliminés, dont l'interprétation suggère, suivant ia règle d'embranchement, qu'Il existe peut-être une différence entre l'état lié et l'état libre du cœur de l'atome. O n devra néanmoins être très attentif aux règles de combinaison qui s'écartent des règles normales.
Sources et évolution de la physique quantique
66
10- d u couplage de l'électron '' en serie " au reste de l'atome, mals par I'amblvalence sp.&ifique que les propriétés de la théorie quantique confèrent aux électrons individuels dans les états statlonnalres de l'atome.
Nous pouvons cependant grâce à cette Interprétation, conformément au principe d'édilicatlon, calculer non seulement le nombre d'états statlonnaires. mals aussi, dans le cas de champs intenses, ies valeurs de l'énergie (la partie proportionnelle à l'intensité du champ) à partir de celle du reste de l'atome libre et de l'électron de valence de manière additive, en extrayant ces dernières des spectres alcalins. C'est notamment ie cas aussi bien de la composante totale du moment angulaire de l'atome parallèle au champ (mesurée en unlté h/27r) que de la composante Xj du moment magnétique de l'atome dans la même direction (mesurée en unités de magnéton de Bohr), qui sont égales à la somme des nombres quantiques ml (respectivement rnz) des électrons individuels :
Dans ces formules, ml et m2 doivent, indépendamment les uns des autres, prendre toutes les valeurs permises par les nombres quantiques de moment angulaire kl et k2 de ces électrons dans l'état stationnaire considéré de l'atome. (La partie de l'énergie de l'atome proportionnelle au champ est alors -oh, où O est la fréquence de Larmor). Prenons par exemple les deux termes en s des alcalina-terreux (terme en S slnglet et terme en s triplet). IIsufiit. en premier Ileu, de ne considérer que les deux électrons de valence, étant donné que la contributlon des électrons restants disparaît complètement dans les sommes (1). Pour chacun de ces deux électrons de valence, il faut, suivant notre définition générale (Indépendance de l'un par rapport à l'autre) prendre les valeurs ml = -1/2,mz = -1 e t ml = i/2,m2 = 1 du terme s des alcalins. D'après (1). nous obtenons donc les valeurs suivantes pour les nombres quantiques et de l'atome entier : r n l = -112 - 112, -112 -I-112, 112 - 112, i ( 2 1/2
-
mz=
-1-1,
-1
+ 1,
+
1-1,
1+1
ou
(correspondant dans le cas des champs faibles a un terme j = 0 et à un terme j = l)3. Pour les termes p.d des alcalino-terreux. le deuxième électron doit, de facon analogue, prendre dans (1) les valeurs rnl, m2 des termes p , d des alcalins, la contribution du premier électron (terme en demeurant inchangée. Plus généralement, la prescription (1) donne exactement les memes résultats que la méthode proposée récemment par
...
s)
'
...
On voit qu'ici deux termes différents doivent être comptés, par rapport à la valeur de l'énergie indépendante de l'intensité du champ, l'un avec mi = -1/2 pour le premier électron, ma = 1/2 pour ie deuxième électron d'une part, l'autre avec rn1 = 1/2 pour le premier, rnl = -1/2 pour le second électron d'autre part. Peut-&tre s'aglt-il ià d'un défaut de la classification développée Ici. On montrera cependant plus loin que, par suite de l'équivalence entre les electrons de valence Interne e t externe, ces deux termes sont identiques.
La construction de lu nouvelle mécanique
67
Lande' pour le calcul des valeurs de l'énergie dans les champs intenses ; cette méthode, comme l'a montré Landé, dome aussi des résultats corrects dans des cas plus compliqués. Ainsi, toujours d'après Landé. elle donne (dans le cas de champs intenses. d'abord) les termes de Zeeman du spectre du néon lorsqu'on suppose que. dans le reste de l'atome, un électron efficace se trouve dans un terme en p (au lieu d'être dans un terme en s comme ci-dessus), et lorsqu'on laisse à nouveau l'électron excité parcourir les termes
s.p,d.f. ..
Ce résultat nous pousse donc à caractériser, en général, chaque électron dans l'atome à l'aide du nombre quantique principal n, deux nombres quantiques auxilialres kl et k2, qu'il s'agisse de plusieurs électrons équivalents ou de couches d'électrons saturées. De plus, nous lmagnerons (dans les cas cités à l'instant), un champ magnetique si fort qu'il soit possible d'attribuer à chaque électron, indépendamment des autre électrons, et en plus des nombres quantique n et kl, les deux nombres quantiques rn1 et rn2 (ces derniers mesurant la contribution de l'électron à l'énergie magnétique de l'atome). L e rapport entre k2 et r n 2 pour kl et rn1 donnés s'obtient à partir des spectres alcalins. Avant d'appliquer cette classification quantique aux électrons des atomes lorsque les couches d'électrons sont saturées, ce que nous ferons au paragraphe suivant, il nous faut encore discuter de manière plus approfondie des difficultés qui s'opposent à I'lnterpretation proposée Ici pour la structure complexe e t les M e t s Zeeman anormaux, alnsi que des limites de leur signlfication. Tout d'abord, cette Interprétation ne donne pas une explication simple de I'exlstence et de la séparation des différents systèmes de termes (par exemple, pour les alcalinoterreux I'cpparition du système singlet et triplet), qui se manifeste également dans la position des termes de ces systèmes et dans la règle des intervalles de Landé. O n ne peut sûrement pas, pour les alcalino-terreux, donner deux explications différentes pour les différences d'énergie des niveaux du triplet, comme dues à l'anomalie de la correctlon relativiste de l'électron excité et à la dépendance de son énergie d'interaction en fonction de l'orientation réciproque de l'électron et du reste de l'atome. Une difficulté de fond encore plus grave est aussi soulevée par la relation entre l'interprétation proposée et le principe de correspondance, lequel est encore le seul capable d'expliquer les règles de sélection des nombres quantiques k1, j et m, ainsi que la polarisation des composantes de Zeeman. En fait, ce principe n'exige pas d'attribuer à chaque électron dans un état stationnaire donné, une trajectoire deflnie avec la préclsion que donne la cinématique normale : mals Il faut quand même qu'à l'ensemble des états stationnaires de l'atome corresponde une classe de trajectoires pourvues d'un certain type de propriétés de périodicité. Ainsi, dans notre cas, les règles citées de sélection et de polarisatlon exigent, d'après le principe de correspondance, un type de mouvement de la trajectoire centrale Comportant une précession, autour d'un axe particulier de l'atome, du pian des trajectoires superposées ; dans le cas de champs magnétiques extérieurs de faible Intensité, s'y ajoute une autre précession autour d'un axe traversant le noyau dans la direction du champ. L'explication dynamique admise jusqu'lcl de ce type de mouvement pour l'électron de valence reposait sur le fait que les forces s'exerçant sur
*
Ann. d. Phys. 76, 273 (1925) ; voir en particulier 52.
L'équivalence supposée ICI entre la septième couche (le reste de l'atome de néon) et un électron recevra une Justification théorique au paragraphe suivant.
68
Sources et évolution de la physique quantique
cet électron n'ont plus la symétrie centrale qu'elles pr&entent pour le reste de l'atome : cette explication semble incompatible avec la représentation des doublets alcalins à l'aide des formules relativistes (et par là meme avec la grandeur de la fréquence de précession correspondante). Une constatation semblable vaut aussi pour ce type de mouvement dans ie cas des champs intenses. Ici naTt donc le dimcile problème : comment peut être interprété, physiquement, l'apparition du type de mouvement de l'électron de valence exigé par le principe de correspondance, indépendamment de sa signification dynamique spéciflque Jusqu'lci admise e t qui ne peut plus guère être maintenue ? A ce problème semble être étroitement liée la question de la grandeur des valeurs des termes de l'effet Zeeman (spécialement ceux des spectres alcalins). Aussi longtemps que ce problème n'aura pas été résolu, l'interprétation que nous proposons Ici de la structure complexe et de l'effet Zeeman anormal ne pourra être considérée comme suffisante pour donner une base physique à l'explication satisfaisante de ces phénomènes, alors même que ceux-ci peuvent, d'une certaine manière, être mieux reproduits par l'interprétation couramment adrnbe. On ne peut exclure, dans le futur, qu'une fusion de ces deux interprétations puisse réussir. Dans l'état actuel de la question, il nous a paru intéressant également de pousser la première interprétation jusqu'au bout de ses conmuences. Dans cet esprit, on comprendra pourquoi nous allons au paragraphe suivant, à titre d'essai, appliquer le point de vue adopté ici comme point de départ sans tenir compte des difficultés qui s'y opposent dans le problème de la saturation des couches d'électrons dans les atomes. Nous n'en tirerons les conséquences que sur le nombre d'états stationnaires possibles de l'atome en présence de plusieurs électrons équivalents, sans nous prononcer sur la position et l'ordre des termes.
2. Une règle générale de la théorie quantique en cas d'apparition d'électrons équivalents dans les atomes il est bien connu que la présence de plusieurs électrons équivalents dans l'atome, c'est-%dire d'électrons totalement équivalents quant aux valeurs de leurs nombres quantiques et de leurs énergies de liaison, n'est possible que dans des conditions spéciales qui sont très étroitement liées aux lob de la structure complexe des spectres. Ainsi, par exemple, chez les alcalino-terreux, l'état normal dans lequel deux électrons de valence sont équivalents correpond à un singlet du terme s. alors que dans les états stationnaires de l'atome appartenant au système triplet, les électrons de valence ne sont jamais lies de façon équivalente, tandis que le plus grand terme en u du trlplet possede un nombre quantique principal supérieur de un à celui de l'état normal. Prenons comme deuxième exemple le spectre du néon. Celul-cl est composé de deux groupes de termes, avec des limites de d r i e s différentes, correspondant à différents états du cœur de l'atome. Le premier groupe, qui appartient à ceux où un électron est extrait du cœur de l'atome avec les nombres quantiques kl = 2, kz = 1, peut être considéré comme compose d'un système singlet e t d'un système trlplet, alors que le deuxième groupe, appartenant à ceux où un électron est arraché du cœur de l'atome avec kl = kz = 2, peut être désigné système Quintet. Les raies de résonance ultra-violettes du comme système Triplet neon n'ont en effet pas encore été observées, mais nul doute que l'état normal du néon
+
La construction de la nouvelle mécanique
69
doive être considéré comme un terme en p en ce qui concerne ses combinaisons avec les états excités de l'atome ; et en vérité. sans équivoque possible, et en accord avec le comportement diamagnétique de la configuration des gaz rares, il ne peut y avoir qu'un Comme les seuls termes p avec j = O sont les seul terme de ce type, le terme j = 0 termes (les plus bas) du Triplet po des deux groupes, nous pouvons en conclure que pour le néon, seuls ces deux termes du triplet existent pour la valeur 2 du nombre quantique princlpal, et que de plus I l s sont Identiques pour les deux groupes de terme. En général on peut donc s'attendre à ce que certslns termes de multlplet des spectres manquent o u corncldent pour des valeurs n e t ki de nombres quantlques prls par des électrons duà prÉrents dans l'atome. Et se repose la question : quelles règles la t h h r i e quantique assigne-t-elle au comportement de ces termes ? Comme il ressort déjà de l'exemple de spectre du néon, cette question est étroitement liée au problème de la saturation des couches d'électrons dans l'atome déterminant les longueurs 2,8, 1 8 . 3 2 des périodes dans le système naturel des éléments. Cette saturation conslste en ce qu'un groupement d'électrons de nombre quantique principal n n'accepte au plus que 2n2 électrons, soit par émission, soit par absorption de rayonnement, soit encore par d'autres influences extérieures. Comme on salt, Bohr introduisit dans sa théorie du système naturel une subdlvlsion de ces groupements d'électrons d'électrons en sous-groupes ; cette théorie présente une synthèse des aspects spectroxoplques et chimiques et, en partie. une justification quantique de l'apparition d'éléments chimiquement semblables, comme les métaux fer e t platine, e t comme les terres rares dans les périodes ultérieures du système. Partant des états stationnaires d'un mouvement central, 11 caractérise chaque électron des états stationnaires de l'atome, par un symbole nk avec k n : il obtient ainsi en général. pour un groupement d'électrons, nombre quantique principal n. n sous-groupes. C'est de cette façon que Bohr a été conduit au schéma de la construction des gaz rares reproduit dans le tableau 1. Cependant, lui-même inslste sur le fait que I'égallté supposée du nombre d'électrons dans les dMérents sous-groupes d'un groupe principal est hautement hypothétique et' qu'une explication théorique totale et satisfaisante de la saturation des couches d'électrons dans l'atome, en particulier une expikation. des longueurs des périodes 2,8, 18, 32 dans le système naturel, ne pouvait être donnée pour l'instant Cependant, un progrès essentiel a récemment éte r é a l i s par les refluions de E.C. Stoner concernant le problème de la saturation des couches d'électrons dans l'atome. Cet auteur propose, tout d'abord, un schéma pour la construction de l'atome des gaz rares dans lequel, contrairement à Bohr, aucune sous-couche saturée ne peut s'ouvrir par adjonction d'autres électrons du même groupe principal. de façon à ce que le nombre d'électrons dans une sous-couche saturée ne dépende que de la valeur de k. e t non de la valeur de n,c'est-à-dire de la présence d'autres sous-groupes du m€me groupe principal. Cela représente déjà. en sol, une grande simplification qui, de plus, permet de rendre
-
2 n'est pr-nt dans l'état normal. C'est egalcment un nouvel exemple du théorème de réclprodté évoqué ci-dessus. La l i a b n des deux premiers +trans de cette couche a déjà été discutée, et nous supposerons maintenant, par raison de slmplkité. qu'aucun des deux électrons ne sera enlevé du sous-groupe k = 1. celui-ci l3 c'est une conséquence de l'égalité entre la multlplldté des valeurs de rnl dans un sens ou dans l'autre, puisque., même dans le cas des champs faibles. les sommes g vont toutes deux jusqu'au meme e t comportent toutes deux les mêmes termes.
74
Sources et évolution de la physique quantique
étant donc saturé (d le schéma de Stoner ci-dessus). D'après Stoner, donc, dans les éléments qui se suiventjusqu'à saturation de l a couche de5 8 électrons (du Bore au néon, par exemple), dolt toujours figurer un terme en p , ce qul est en accord avec I'expérlence Jusqu'à aujourd'hul. En particulier, le spectre de doublet qui suit. semblable à celui des alcalins, correspond à la liaison du trolslème électron de la couche des huit, et, dans l'état normal, le terme en s de même nombre quantlque principal est supprimé. Nous pouvons donc passer Immédiatement à la liaison du quatrième électron de la couche à 8 électrons. comme elle apparaft par exemple dans le spectre d'arc du carbone non encore analysé e t dans le spectre d'arc du plomb qui, lui, est partiellement analysé. Selon la règle de branchement de Landau-Heisenberg ( d le 8 précédent), le spectre correspondant devrait en général avoir la meme structure que celui du néon, à savoir être compos4 d'un groupe Singlet-Triplet, e t d'un groupe Triplet-Quintet avec des limites de série différentes, correspondant aux termes des doublets 2p1 e t 2pz des lons considér6~'~. Nous voulons cependant montrer que, d'après notre règle ces spectres, contrairement à la structure analogue attendue pour leurs états excites. doivent se différencier notablement, en ce qul concerne le nombre et la valeur de j des termes en p du nombre quantique maximal (pour C n = 2, pour Pb n = 6), du spectre du Ne, 00, à part l'état normal avec la valeur j = O, aucun autre terme en p n'existe avec le nombre quantique principal n = 2, comme nous l'avons mentionné au début de ce f. Nous avons ICI distingué trois cas, correspondant au nombre d'électrons des deux sous-groupes partiels avec kl = 2,kz = 1 e t avec kl = 2,kz = 2. dans lesquels nous devrons placer les deux électrons (les deux premiers électrons devant &tie liés, comme convenu, par des termes en 8 k~ = kz = 1). a) Deux électrons équivalents nil. Pour ces sous-groupes, ml peut seulement prendre deux valeurs ml = f1/2, conformément au terme p l des alcalins. On est Ici dans le cas considéré saturé avec El = O e t j = O. b) Un électron n z l e t un électron nzz. Pour ce dernier sous-groupe. conformément au terme p des alcalins, ml peut prendre les quatre valeurs f 1 / 2 , f 3 / 2 , et celles-ci pourront être combinées à volonté aux vaieurs ml = f1/2 déjà indiquées pour le premier électron, étant donné que les deux électrons se trouvent dans deux sous-groupes partiels dlfférents, e t par conséquent ne sont pas équl~alents'~.Nous avons donc :
ml = (-3/2,
+
-1/2,1/2,3/2) (-1/2,1/2) = f ( 3 / 2 1/2), f ( 3 / 2 - 1/2), f ( 1 / 2 = f 2 , f l , f l , O, o.
+
+ 1/2),f(1/2 - 1/2)
l4 L'analyse incomplète des spectres concernés ne permet pas encore aujourd'hul une vérification définitive des prédktions théoriques ci-dessus. A. Fowler a récemment trouvé (Ploc. Roy. Soc. 107, 31, 1925) dans le spectre de l'azote (Nt) des termes Singlet e t Triplet à c8té des termes manquants (sur l'apparition desquels la théorie ne nous permet pas encore de dire quoi que ce soit). De plus, Kless (Sclence 60, 249 (1924)) trouva dans ce spectre un terme Quintet. Ces résultats, qui se referent aux passionnants états du Nt , ne contredisent en aucune façon les prédictions théoriques. Pour la même raison, on doit compter séparément le cas ml = +1/2 pour le premier, ml = -l/Z pour le deuxleme électron, et le cas ml = -1/2 pour le premier, ml = +1/2 pourle second. Voir la quatrième note de l'article.
La construction de la nouvelle mécanique
75
O n voit immédiatement que les termes se séparent en deux parties, l'une avec mi 5 2 e t i'autre avec mi 5 1. Dans le cas d'absence de champ, ces deux parties correspondent à deux termes-: un terme avec j un terme avec j
=2 = 1.
c) Deux électrons équivalents razz. Dans ce cas, les valeurs de ml des deux electrons doivent être différentes, suivant notre règle, et nous obtenons les valeurs possibles suivantes pour mi :
ml = *(3/2
+ 1/2), f ( 3 / 2 - 1/2), f ( 3 / 2 - 3/2), f ( 1 / 2 - 1/2)
= *2, f l , O, o. II en résulte, en présence d'un champ magnétique, un terme avec j un terme avec j
=2 = O.
En résumé. nous obtenons pour une couche à quatre électrons, cinq termes en p différents avec le nombre quantique maximal, soit deux avec j = 2, un avec j = 1 e t deux avec j = Nous ne pouvons faire aucune prédiction concernant la grandeur de ces termes, ainsi que les rapports des intervalles. Par contre, il nous est possible de donner quelques indications sur les séparations attendues par effet Zeeman pour ces termes. En introduisant les valeurs de mz appartenant aux valeurs rnl indiquées cl-dessus pour l'électron individuel (celles qui sont à considérer pour l'effet Zeeman dans le cas des champs intenses). on arrive, suivant ia prescription (1) à la table suivante qui donne les séparations Zeeman des cinq termes en p de la couche à quatre électrons dans le cas de champs intenses.
o.
-
mi
-2
E5j
-3,-2
-1 -2,-1,-1
O O,O,O,O,O
II en résulte
c g 2 = 512, gi = 312 l6
A. Landé, Ann. d. Phys. 1925, 1. c.
1 -1,-1,-2
2 2,3
Sources et évolution de la physique quantique
76
Une vérification de ce résultat théorique pour la couche à quatre électrons est facilement réalisable dans le cas du plomb. Ici, les quatre termes en p o n t été mis en évidence par des observations, alors que l'existence d'un cinquième terme (en p ) est encore douteuse". Des résultats de E. Back non encore publMs de mesure de l'effet Zeeman de quelques raies du plomb rendent en outre très probable que les valeurs de j (2,2,1,0) soient dévolues aux quatre termes en p cités en premier, et que les valeurs de g soient aussi en accord avec les valeurs théoriques attendues'*. Revenons une fois encore à la discussion concernant la construction progressive de la couche à hult électrons. A l'alde du théorème de réciprocité que nous appliquons au sous-groupe de Bohr avec k = 2 contenant délà dans son état saturé six électrons, nous pouvons, à partir des résultats obtenus pour la couche des quatre, trouver directement le nombre de possibilités de réalisation de la couche des six (quatre électrons avec k 1= 2, comme cela se réalise pour l'oxygène par exemple. Les cas a).b),c) de la couche des quatre électrons se transposent aisément à ceux de la couche des six avec cette proposition : a) Quatre électrons équivalents n22 (deux places vides dans ie groupe n2l). Ce sous-groupe partiel est saturé ; nous avons donc, comme en a) ci-dessus, un terme avec
-
j=O. b) Un électron n21, trois électrons équivalents n22 (une place vide dans le sousgroupe raz', une place vide dans ie sous-groupe n22. Comme ci-dessus : un terme avec j = 2
un terme
avec j
= 1.
c) Deux électrons équivalents n21, deux électrons équivalents n22 (deux places vides dans le sous-groupe n22) L e premier sous-groupe partiel est saturé. Comme ci-dessus : un terme avec j
=2
un terme avec j
= O.
Nous nous attendons donc, pour l'oxygène par exemple, à avoir cinq termes en p avec les nombres quantiques principaux les plus petits. On n'a jusqu'ici observé que trois l7
V. Thorsen. Natumissenschafiefl 11.78 (1923) ; W. Gottrian, Zeitschr. f. Phys.
18. 169 (1923). Ces Indications m'ont été fournies grâce à la courtoisie de Mr Back, qui m'a aimablement permis de prendre connaissance des résultats de ses mesures bien avant leur publication. C'est pourquoi 'aimerais lui dire d'ici un chaleureux merci. Mr Back publiera sous peu en un autre endrdt l'ensemble de ses mesures concernant le problème capital
de la confi uratlon des termes dans le spectre du plomb. Remafquc%rs de la correction des épreuves: les configurations des termes des spectres du plomb et de l'étain ont été a n a m sur ces entrefaites par Fri. Sponer, e t ses principaux résultats présentés à la rCunbn de la Société R ionale de Basse Saxe, à G6ttlngen le 9 février (1925, N I T ) . Pour l'étain, on trouve $ nq t e r m p avec la valeur maxlmak du nombre quantique prlncipal, et les valeurs de J correspondant exactement aux valeurs théoriques attendues. Pour le plomb, les valeurs de j obtenues des quatre termes p connus ks plus importants coïncident avec ceux donnes dans ie texte. L'existence d'un cinquième terme p avec = O, comme celui present dans ie cas de l'étain, peut aussi s'appuyer sur le spectre plomb.
7
du
La construction de la nouvelle mécanique
77
termes de ce type, avec en effet les valeu? j = 2,1,0". II faut attendre pour savoir s'il sera possibk de déduire des expériences les deux autre termes en p des nombres quantiques principaux conccrnCs, ou si notre règle devra ctre modMée dans ce cas. Aucune observation expérimentak n'existe encore pour la couche des cinq (3 électrons avec kl=2), et c'est pourquoi nous ne voulons pas donner le résultat de la discussion, laquelle suivant notre règk devrait conduire à cinq termes en p , dont un avec j = 5/2, trois avec j = 3/2,e t un avec j = 1/2. Pour les couches de sept réalisées dans les spectres de rayons X, les termes se trouvent ressembler à ceux des alcalins, comme cela a déjà été mentionné. Nous ne voulons pas discuter d'autres cas spéciaux avant qu'il n'existe d'observations experimentales plus complètes. Mais à partir des uernples traités, Il devrait être clair que notre règle permet de répondre sans équivoque dans tous les cas à la question des réalisations possibles des dlfférentes couches pour un nombre donné d'électrons équivaients. C'est uniquement jusqu'id dans les cas simples que l'on a p u constater que les r a u i t a t s ainsi obtenus sont en accord avec l'expérience. En générai, on dolt encore remarquer que les considérations effectuées ici concernant le passage de champs forts aux champs faibles (ou des champs qui disparaissent) reposent en principe sur l'invariance des poids statistiques des états quantiques. En ce qui concerne l'existence d'un rapport entre le problème de la saturation des groupes d'électrons dans l'atome avec le principe de correspondance, comme l'a supposé Bohr, les reultats obtenus jusqu'id ne semblent pas en fournir d'lndlce. Le problème d'une meilleure Justffication de la règle générale, prlse ici comme base, traitant de l'apparition d'électrons équivalents dans l'atome ne pourra être réellement pris en compte avec succès qu'après un approfondisement plus pousSe des principes de base de la théork quantique. Hambourg, Institut de Physique Théorique.
*'
J.J Hopfield, Astrophys. Journ. 69, 114. 1924 : O. Laporte. Naturwks. 12, 598, 1924. Voir aussi A. Sommerfeld, Atornbau und Spektralilnkn. 4' édition, 1924, chap. 8. pp 598 e t 599.
Article VI
Le spin de l'électron Remplacement de l'hypothèse d'une contrainte non mécanique par une présomption relative au comportement interne de l'électron individuel
G.E.UHLENBECKet S.GOUDSMIT Naturwissenschaft
13,953-954 (1925)
(Springer-Verlag)
(17 octobre 1925) [traduit par G. Frick]
1. O n décrit habituellement de manière complète la structure et le comportement magnétique des spectres ZI l'aide du modèle de Landé et des quantités R,K,J et m l . Ici R représente le moment cinétique de l'atome restant c'est-à-dire, de l'atome sans l'électron de valence - K le moment cinétique de l'électron de valence, 7. leur résultante et rn la projection de J sur la direction d'un champ magnétique extérieur, toutes grandeurs exprimées dans les u n i t e quantiques usuelles. On doit de plus admettre dans ce modèle : a) que, pour l'atome restant, le rapport du moment magnétique au moment mécanique est le double de ce qu'on attendait d'une description classique. b) que, dans les formules où apparaissent RZ, K2, J2,il convient de remplacer ces quantit6s par R' $,Is.
~
(22)
Théorie quantique :
(ies termes en .Az ayant é t é exclus). Donc, du point de vue adopté ici, l'énergie d'un oscillateur harmonique elle-même n'est pas donnee par la " mécanique classique ", c'est-à-dire par l'équation ( 2 2 ) , mais elle a la forme (23). Un calcul plus précis, tenant compte d'approximations à un ordre plus élevé en W,a, w sera maintenant effectué pour l'exemple plus simple d'un oscillateur anharmonique
Z + ~ ; Z + X Z ~ =o. En théorie classique. on peut dans ce cas écrire z = a1 coswt
+ Xu3 c o s h t + XZaSc o s ~+t ... ;
Nous pouvons tenter par analogie dans le cas de la théorie quantique
a(n, n
- i)cosw(n, n - i)t ;
Xa(n, n - 3) msu(n,n
Les quantités a sont une fois encore des séries en puissance de a la forme, comme dans l'équation (21).
- 3)t ;
.. .
dont le premier terme
( n - r)!' comme on peut le voir en évaluant les équations correspondant à (18) e t (19).
Sources et évolution de la physique quantique
122
Si on prockde à l'évaluation de w e t a à partir des équations (18) et (19) Jusqu'à l'ordre ou respectivement, on obtient
x2
w(n,n
- i) =wa +
3nh -A' 8irwom
3h2 256wOm2r2
3nh
a(n,n - 3 ) =
(17n2 +?)+...
+...).
-
(24)
(25)
'J
3 7 3nb - 2) 32 T uom h3 39(n - l ) h +...). 32irwim
L'énergie est définie comme le terme constant dans l'expression
1 -mi2
2
1 1 + -mw~z' + -mXz4 2 4
(Je ne peux prouver en general que tous les termes périodiques finissent par s'annuler, mais c'est le cas pour tous les termes que j'ai évalués). Cette énergie s'écrit donc :
W=
+
(n I b o ) 2ir
+
+ +
X 3 ( n Z n f)h2 8.4ir2wim
51 59 21 - X2 5 1 2h3~worn,(17n3 + -n2 + -p + 2). 2
(27)
Cette énergie peut aussi être déterminée en utilisant l'approximation de Kramers-Born, en traitant ie terme irnXz' comme une perturbation de l'oscillateur harmonique. Le fait que l'on obtienne exactement le même résultat que (27) me semble corroborer de façon remarquable les équations de la mécanique quantique qui ont été prises ici comme point de départ. D'autre part, l'énergie calculée 2 partir de (27) satisfait la relation (voir l'équation (24)) :
qui peut être considérée comme une condition n e a i r e pour permettre la détermination des probabilités de transition en accord avec les équations (il) et (16): Considérons en conclusion le cas d'un rotateur, et portons notre attention aux reiations entre les équations (7), (8) et les formules donnant l'intensité pour l'effet ZeemanS et pour les multiplets'.
'
S. Goudsmit e t
31 (1925) 340.
R. de L. Kronlg, Natumiss. 13 (1925) 90 ; H. Honi, Zeit. f. Pbys.
R. de L. Kronig, Zeit. f. Phys. 31 (1925) 885 ; A. Sommerfeld e t H. Honi, Sitzongsber. d. Preuss. Akad. d. Wiss. (1925) 141 ; H. N. Russell, Nature 115 (1925) 835.
La construction de la nouvelle mécanique
123
Considérons le rotateur représenté par un électron entourant un noyau a une distance constante a. Aussi bien cisassiquementqu'en théorie quantique, les '' équations du mouvement " établissent simplement que l'électron décrit une rotation plane, uniforme, à une distance a et à une vitesse angulaire w autour du noyau. La " condltion quantique '' (16) conduit à, suivant (12) : d
h = -(27rma2w). dn
et, suivant (16)
h = 27rm{a2w(n
+ i , n ) - azw(n,n
- i)},
D'où il suit, dans les deux cas, que : w(n,n
- i) = h(n -tconst) %ma2
'
Exiger que le rayonnement s'annule dans l'état fondamental conduit à la formule
hn w(n,n - 1) = 2nma2
L'énergie est
W
1
= -mu2,
2
ou, grâce aux équations ( 7 ) , (8) : m
W=-a2
w2(n,n-i)+w2(n+i,n)
2
2
hZ =-87r2ma2 (n2 n
1 + + i),
w(n
(29)
expression qui satisfait encore la condition w(n,n - 1) = (27r/h)[W(n) - I)]. En appui à la validité des formules (28) et (29). qui dimrent de celles de la théorie usuelle, on peut mentionner que, suivant Kratzer' beaucoup de spectres de bande (en incluant des spectres pour lesquels l'existence d'une quantité de mouvement pour l'électron est peu probable) semblent exiger des formules du type (28), (29), formules que jusqu'ici, afin d'éviter une rupture avec la théorie classique de la mécanique, on s'efforçait d'expllquer à travers la quantification en demi-entiers. Afin d'arriver à la formule de Goudsmit-Kfonig-HOnl pour le rotateur, nous devons abandonner le domaine des problèmes à un degré de liberté. Supposons que le rotateur ait une dlrection dans l'espace qui soit sujette à une précession tr& lente O autour de l'axe o z d'un champ extérieur. Soit m le nombre quantique correspondant à cette précession. Le mouvement est alors représenté par les quantitC
z : a(n,n
- i;m,m)cosw(n,n - i)t;
' Voir par exemple B. A. Kratzer Sitzungsber.
d. Bayf. Akad. (1922) p 107.
Sources et évolution de la physique quantique
124
Les équations du mouvement sont simplement z2
+ y' + z2 = 2
Tenant compte de (7) cela conduit à'
1 1 -{-a*(n,n 2 2
- l ; m , m ) + b*(n,n - l ; m , m - 1)+ b2(n,n - i ; m , m
+ 1)
1 + -a2(n + 1,n;m, m) + b2(n + 1,n; rn - 1, m) 2 + b2(n + l , n ; m + i , m ) } =O*.
1 2
-a(n, n
- 1;m, m)a(n - 1, n - 2;m, m) = b(n,n-i;m,m+l)b(n-i,n-2;rn+i,m)
+ b(n,n - l ; m , m - l)b(n - 1,n - 2;m - 1,m). On a aussi la condition quantique donnée par (16) :
L e s relations classiques correspondant à ces relations sont
Elles sufFisent (à la constante inconnue près à ajouter à m ) à déterminer Q, b l , bel de manière unique. La solution la plus simple d e s équations de la théorie quantique (30). (31), (32),qui s'offre elle-même est :
b(n,n
- i ; m , m - i) = a
+ + 4).
( n + m i)(n + m ) 4(n
. 3
a(n,n-i;m,m)=a
'
L'équation (30)est essentiellement la même que les règles de somme de Ornstein-
Burger.
La construction de la nouvelle mécanique
125
Ces expressions sont en accord avec les formules de Goudsmit-Kronig et Hbnl. II n'est cependant pas facile de voir que ces expressions représentent la seule solution des équations (30), (31). (32). bien que ceci'me semble probable au vu des conditions aux limites (a e t b s'annulent sur la " frontière " ; voir les articles de Kronig, Sommerfeld et de Han/, Russell cités plus haut). Des considérations semblables à celles-ci, appliquées aux formules donnant l'intensité des multiplets, conduisent au résultat que ces regles d'intensité sont en accord avec les équations (7) et (16). Ce résultat peut lui aussi être vu comme un appui à la validité de l'équation cinématique ( 7 ) . Seule une recherche mathématique intensive sur la méthode employée ici de manière tres superficielle permettra de savoir si une méthode de détermination de quantités de théorie quantique utilisant des grandeurs observables, comme celle-ci. peut être considérée satisfaisante en son principe, ou si une telle méthode ne représente en fin de compte qu'une approche trop grossière au problème physique qui est celui de construire une théorie physique, ce qui est manifestement un problème très compliqué actuellement. Gottingen, 1925
126
Sources et évolution de la physique quantique
3.3 L’interprétation probabiliste de la mécanique
quantique Au moment où l’on découvrait la mécanique quantique, dans les annéeS 19231926 se posait le problème de l’interprétation de son formalisme. L’interprétation du vecteur d’état ou de la fonction d’onde représentant un système physique fut l’objet d’un nombre important de discussions qui conduisirent Max Born à l’imaginer comme une amplitude de probabilité. Comme l’a dit Abraham Pais40 si les lecteurs du premier ariicle de Heisenberg JUP 1a.mécanique quantique avaient une chose en commun avec son auteur, c’était une compréhension inadéquate de ce qui éfaii e n train d’amver. La mathématique n’était pa^ familière, la physique opaque. La découverte de la mécanique ondulatoire par SchrOdinger apporta un soulagement à plusieurs physiciens, car ils étaient plus à l’aise pour traiter les problèmes au moyen d’équations aux dérivées partielles qu’au moyen de matrices à un nombre iniini de lignes et de colonnes une nouveauté alors pour les physiciens. Jusqu’à l’ônnée 1936, ’ la mécanique quantique, dam sa formulation ondulatoire ou mairicielle, était de la haute technologie mathémaiique de type nouveau, manifestement importante pour les réponses qu’elle donnait, m a u s a w principes physiques sous-jacents clairement afirmés Schrodinger proposa que l’on considérât les ondes comme la seule réalité ; les particules seraient alors déduites des ondes. Juste après l’article de Çchr6dinger où il établissait l’équation de continuité, et reliait le Carré du module de la fonction d’onde à la densité de charge, Born publia deux articles sur la mécanique quantique des collision^'^ en 1926 : il y proposait que, dans le déveioppement d‘une fonction d’ondes décrivant l’état d’un système suivant un ensemble d’états propres distincts non-dégénérés, le c a d du module du coeficient c,, d’un état $, donne la probabilité pour que le système se trouve, lOTJ d’une observation, dans cet état. C’était la clé du problème. La solution définitive. Cette interprétation rencontra une grande résistance chez certains physiciens parmi les plus célébres : Einstein, Schrodinger, de Broglie43. Pour de Broglie, l’onde associée à une particule était comme une onde piiote, une conception qu’Einstein avait déjà formulée en affirmant, à propos de la dualité onde-corpuscule, que les ondes électromagnétiques n’étaient là que pour indiquer le chemin aux photons et détenniner la probabilité pour que le photon suive un certain chemin. Cette conception, néanmoins, ne fut ni reprise ni détendue
-
“ A. Pais, I n w d Bound - Ofmatter and f m w in the physicai world, Clarendon Press, Oxford (1986), p 255. ‘I
”
A. Pais,ibid, p 255-256. M. Born, Zeibchr. f. Phys. 57,863 (1926) [Artide XII, page 1291.
Une collection d’artides importants sur l’interprétation de la mécani ue uantique forme l‘ouvrage Quantum Theosy and Memuemeni, edité par J.A. Wheder Zurek, Princeton University Press (1983). On y trouvera la célèbre discussion entre Einstein et Bohr ainsi que la arabole du chat de SchrOdinger, et, entre autres, des contributions de Von Neumann, \$per Bell, et Aspect. Nous avons choisi, pour illustrer ce roblème, l’un des plus beaux t e x b de ce recueil, d u i de F. London et E. Bauer, La l?héoric de I’ObseruOtion m Mécanique Quantique [Artide XIV, page 1.531.
3 Wk
La construction de la nouvelle mécanique
127
par Einstein qui répugnait à donner à notre connaissance une base probabiliste : Le Seigneur ne joue pas a? dés ”. Après la publication par Heisenberg44 des relations d‘incertitude “451 l’bterpdtation de Born commença à être admise par la majorité des physiciens et Ni& Bohr formula le principe de complémentarité4‘ : il existe des Vanables physiques, représentées par des opérateurs A et B qui ne commutent pas :
[A,B]= A B - B A # O L’bdét&nation
des valeurs de A et de B, mesurée par les fluctuations :
AA= où
[< A’> - < A > 2 ] ’ 1 2
< A > est la valeur moyenne de A, satisfait à la relation : AA . A B 2
1
{ - < 1.4,B]>2}1/2
Pour les coordonnées et l’impulsion d’un électron on obtient :
AzjApk=O,
j#k
Ces variables sont appelées complémentaires par Bok. Son principe affirme qu’il est impossible, dans une même observation, de déterminer exactement la valeur de deux variables complémentaires. La raison essentielle de la complémentarité de certaines %&ables provient du fait que l’observation de ces grandeurs s’eiïectue au moyen de la lumière ou de faisceaux de particules dont l’énergie a un minimum - hu pour un photon ou n’importe qu’elle autre p a r t i d e l u étant la fréquence de de Broglie - et ces particules apportent une perturbation au système observé qui empêdie la détermination exacte (AA = O et A B = O) des deux grandeurs A et B. La précision absolue sur l’une de ces variables AA O entraine le manque de connaissance total de la variable complémentaire, A B 400. La construction de la mécanique quantique basée sur le principe de la rep*tation de l’état physique d’un système par un vecteur d’un espace de Hilbert et de la représentation des variables physiques, des observables, par certains opérateurs linéaires définis dans cet espace, commença à prendre forme dans les années 19261930.
Le valeurs possibles d’une variable physique sont les val- propres de l’op& rateur qui la représente. Un dictionnaire qui contient les règles de comqondance entre le formalisme mathématique et le c o n b u physique de la théorie fut établi, qui permit de d e r les concepts et les propositions mathématiques aux résultats des observations et aux expériences elles-mêmes.Si l’état d’un système est connu à -W. Heisenberg, Zcibdr. f. Phys. Is
45,172 (1927).
Plutôt qu’en termes de dationa d’incerWude, il mudrait mieux parler, en français, en termes de relations d’uldétennimfwn. N. Bohr, Nature 121,580 (1929) [Artide XII, page 1331.
‘‘
128
Sources et évolution de la physique quantique
un instant donné, il aura une évolution au cours du temps et l'équation d'évolution
- la fameuse équation de Schrijdinger -
permet de déterminer le vecteur d'état à un autre instant. La prédiction des résultats d'une mesure, d'autre part, est introduite par les probabilités de trouver l'un de ces résultats dans une expérience où l'on mesure une grandeur physique représentée par uq opérateur. Le formalisme de la mécanique quantique'' est aujourd'hui un système théorique logiquement et physiquement cohérent, en accord avec les données expérimentales en physique atomique et moléculaire, en mécanique statistique, en physique nucléaire, en physique des particules et des champs.
De gauche à droite : M. Born, M. von Laue, O. Hahn lor5 d'une réunion des lauréal du Priz Nobel à Lindau en 1951. (Source :Internationes ed., Bad Godesbetg, t o m droits réservés).
'' cf. P.A.M. Dirac, Principles of antum Mechanics, Oxford Universi Press, 1947 ; Le cours de ph =que de F man, v%me 3 InterEditions Paris 1979 . 2 Leite L o p , ~
%
Eneyclopadia bnmersdia us 15, pp 515-516,Paris 19b5 ; J.M. Lé-&-Leblond Laverne, id., Corpus 15,p'p 501>-511.
et
A.
Article XII
L'indéterminisme quantique Sur la mécanique quantique des collisions * MAX Zeitschriff for Physik
BORN
37,863-867(1926) (Springer-Verlag)
(25 juin 1926) Communication préliminaire
[traduit par C. Frick]
Partant d'une étude des collisions, on développe le point de vue suivant : la mécanique quantique de Schrodinger peut décrire non seulement les états stationnaires, mais aussi les sauts quantiques.
La mécanique quantique fondée par Heisenberg n'a jusqu'ici été utilisée que pour calculer les états stationnaires et les amplitudes d'oscillation (à dessein j'emploierai le mot '' probabilité de transition "). Le formalisme qui s'est beaucoup développé depuis lors s'est révélé adéquat. Cependant, cette problématique ne concerne qu'un seul aspect du problème de la théorie quantique ; s'y ajoute la question au moins aussi importante de la nature de la '' transition " elle-même. Sur ce point, les avis sont partagés : beaucoup admettent que le problème des transitions ne peut être traité dans le formalisme actuel de la mécanique quantique, et qu'au contraire de nouveaux concepts sont nécessaires. Impressionné par la complétude de la logique qui sert à construire la meanique quantique, j'ai été amené à supposer que cette théorie était complète et que les problèmes de transition devalent y être inclus. Je pense être arrivé à le prouver. Bohr déjà avait attiré l'attention sur le fait que les difficultés de principe de la représentation quantique que nous rencontrons lors de l'émission et l'absorption de la lumikre par les atomes existent également pour les interactions des atomes à courte distance, c'est-à-dire pour les collisions. Dans ce cas, plutôt qu'à un champ d'ondes encore obscures, on a affaire exclusivement à un système de particules matérielles soumises au formalisme de la mécanique quantique. J'ai abordé le problème consistant à cerner au plus pres l'interaction entre une particule libre (particule a ou électron) et un atome quelconque, e t à déterminer si la description de la collision est possible dans le cadre de la théorie existante.
*
Cette communication fut initialement destinée à " Natunvissenxhaften ", mais elle ne put y etre acceptée par manque de place. J'espère que sa publication ici ne parallra pas superflue.
130
Sources et évolution de la physique quantique
Parmi les différentes formulations de la théorie, celle de Schrodlnger apparaît comme la plus appropriée, et précisément pour cette raison peut être considérée, il me semble, comme représentant la conception la plus approfondie des lois quantiques. L e s étapes de ma réflexion sont les suivantes. Lorsqu'on calcule en mécanique quantique l'interaction de deux systèmes, on sait qu'il n'est pas possible, comme en mécanique classique, en choisissant un état de l'un des systèmes, de déterminer de quelle manière cet état sera influencé par un état de l'autre systeme : en réalité. les états des deux systèmes sont couplés entre eux de manière enchevêtrée. Ceci est égaiement vrai pouf un processus apériodique, tel qu'une colllsion, 00 une particule, disons un électron, vient de l'infini et disparait à nouveau à l'infini. Mais dans ce cas se fait jour l'idée qu'il doit ëtre possible de définir, tant avant qu'aprh la collision, lorsque i'électron est sumsamment éloigné e t que le couplage est petit, un état déterminé pouf l'atome et un état de mouvement rectiligne e t uniforme pour l'électron. Il s'agit donc de définir mathématiquement ce comportement asymptotique des particules couplées. Avec la représentation matricielle de la mécanique quantique, cela ne m'a pas été possible ; avec la formulation de Schradinger, oui. Selon Schradinger. l'état quantique n d'un atome correspond 3 l'oscillation d'une grandeur d'état dans tout l'espace avec une fréquence constante Un électron en mouvement rectiligne est un cas particulier de mouvement oscillatoire correspondant a une onde plane. Lorsque les deux états entrent en interaction, il en résulte une oscillation enchevêtrée. Mais on voit immédlatement que l'on peut la saisir par son comportement asymptotique à l'infini. On n'a plus qu'un '' probleme de diffraction au cours duquel une onde plane incidente sera diffractée ou diffusée par l'atome. A la place des conditions aux limites que l'on utilise en optique pour décrire les écrans, on aura ici l'énergie potentielle d'lnteraction entre i'atome et l'électron. Le problème est donc : résoudre l'équation de Schrodlnger pour l a combinaison atome-éledron avec la condition aux limites que la solution pour une direction donnée de l'espace de l'électron soit asymptotiquement une onde plane se propageant préclsément dans cette dlrection (celle de l'électron incident). Dans ia solution ainsi définie, ie comportement de i'onde diffusée " à I'lnflni, nous intéresse principalement, car celle-ci décrit ce que devient le système après la collision. Allons plus avant. Soient +~(qi)l&(gt)l.,. les fonctions propres de l'atome non perturbe (nous supposons qu'elles ne forment qu'une série discrete). A I'biectron non perturbé (en mouvement rectiligne) correspondent les fonctions propres sin ?(a. &+rz+6), qui forment une multipliclté continue d'ondes planes, dont les longueurs d'onde (suivantte Broglie) sont liées à l'énergie r du mouvement de translatlon par l a relation r = La fonction propre de l'état non perturbé, où l'électron arrive le long de la direction 4-2, est alors :
iw;.
'I
I'
+
&.
Soit V(z, y, z;q k ) l'énergie potentielle de l'interaction atome-électron. On peut alors, à l'aide d'un simple calcul de perturbations, montrer qu'Il existe une solutlon unique de l'équation différentielle de Schradlnger qui, compte tenu de i'interaction se rapproche asymptotiquement pour z + m de la fonction ci-dessus. II nous faut voir à présent comment se comporte cette solution " a p r b la collision
v,
".
La construction de la nouvelle mécanique
131
Le calcul montre que la perturbation crée une onde diffuusée qui prend à l'Infini l'expression asymptotique :
Cela signiiie que la perturbation, regardée depuis l'infini. apparaït comme une superposition de solutions du processus non perturbé. Si l'on calcule les énergies correspondantes aux longueurs d'onde An, selon la formule de de Broglie cl-dessus, on trouve : Wnm
= bun,
+ r.
où les unm sont les fréquences de l'atome non perturbé. Si l'on interprète ces résultats en terme corpusculaire, Il n'y a qu'une interprétation possible : @n"(alb,7) donne la probabilité pour que l'électron venant de la directlon
z soit envoyé dans la direction définie par a1@,r(avec un déphasage 6), son énergie r s'étant en même temps accrue d'un quantum hv:, au détriment de l'énergie de l'atome. (Dans une collision de première espèce on aurait : < ~ , , h u ~ ,< O ; dans une collision de seconde espeCe : > Wz,hu:, > O). Ainsi, la mécanique quantique de Schrodinger donne une réponse précise à la question de l'effet d'une collision, mais il ne s'agit pas d'une relation causale. On ne répond pa's à la question " quel est l'état après la collision 1 ", mais plutot à la question I' quelle est la probabilité d'obtenir un effet donné après la collision 1 " (naturellement en conservant l'énergie en mécanique quantique). Ici se pose tout le problème du déterminisme. Du point de vue de notre mécanique quantique, il n'existe pas de grandeur qui, dans un cas particulier, déterminerait causalement l'effet d'une collision. De même. l'expérience ne nous donne aucune indication qu'une propriété interne de l'atome détermine un résultat donné pour une collision. Devons-nous espérer que l'on découvre plus tard de telles propriétés (comme des phases dans le mouvement interne de l'atome) et que certains cas particuliers puissent être déterminés 1 Ou devons-nous croire que l'incapacité, partagée aussi bien par la théorie que par I'exdrience. de trouver les conditions d'un déroulement causai provient d'une harmonie préetablie, qui repose sur l'Inexistence de telles conditions ? Je serais d'avis, quant à moi. de renoncer au déterminisme dans le domaine de l'atome. Mais ceci est une position philosophique, pour laquelle les arguments physiques à eux seuls sont insuffisants. En pratique, I'lndéterminisme existe dans tous les cas aussi bien pour le physicien experimentateur que pour le théoricien. La " fonction de rendement " a, bien connue des expérimentateurs. est maintenant parfaitement comprise par les théorlciens. O n peut y, z ; q k ) ; cependant les l'exprimer à partir de Mnergie potentielle d'interaction calculs nécessaires sont trop complexes pour ëtre développés ici. Je voudrais seulement éciairer de quelques mots la signification de la fonction @ n? Si par exemple avant le choc l'atome était dans l'état fondamental n = 1, il en résulte :
wn
wn
v(zl
.
7
+ hv;,
= T - hvm, = W i m > O r
Remarque lors de ia correction des épreuves : une réflexion plus approfondie montre que la probabilité est proportionnelle au carré du module de @.
Sources et évolution de la physique quantique
132
C'est-à-dire, que pour un électron d'énergie inférieure à celle du plus petit niveau d'excitation de l'atome, il faut que rn = 1 e t que par conséquent = T. II en résulte donc une
"
réflexion élastique
w11 r
"
de l'électron avec la fonction de rendement
011,Si I r
est supérieur au premier niveau d'excitation, à l a réflexion s'ajoutera l'excitation avec le rendement @ 1 2 , etc. Si l'atome touché par l'électron est dans un état excité r
si T
< hv&. il y
n = 2 et
aura réflexion avec le rendement a 2 2 e t un choc de deuxième espèce
avec un rendement 0 2 1 . Si T r
> hv&,
r
il y aura d'autres excitations, etc.
Les formules reproduisent fidèlement le comportement qualitatif lors des chocs. L'application quantitative de ces formules pour des cas particuliers exige d'ëtre menée à la suite d'une investigation approfondie. II ne me semble pas exclu que les liens étroits qui apparaissent ici entre mécanique et statistique ne conduisent à une révision des concepts fondamentaux de la thermodynamique statistique. Je crois de plus que le problème de l'absorption e t de l'émission de la lumière doit être traité de façon analogue, c'est-à-dire comme un problème de " conditions aux limites '' de l'équation d'ondes, .et que ceci conduira à une théorie rationnelle de l'amortissement et de la longueur des circuits en accord avec la représentation quantique de la lumière. Une présentation détaillée paraîtra prochainement dans cette revue. Gottingen, 1926
Article XIII
Le principe de complémentarité Le postulat quantique et le dernier développement de la théorie atomique
NIELSBOER Nature 121,580-591 (1928) [traduit par L. Rosenfeld e t A. Legros, extrait de : La théorie atomique e t la description des phénomènes, Gauthier-Villars (1 932)*] Le comité du Congrès m'a aimablement invité à donner un r h u m 4 de l'état actuel de la théorie quantique pour servir d'introduction à une discussion générale sur ce sujet, qui attire actuellement l'attention de tous les physiciens : c'est avec grande Joie, mais non sans certains scrupules. que j'accepte cette invitation. Carje vois parmi mes auditeue non seulement le célèbre créateur de la théorie, mais aussi plusieurs physiciens qui, en raison meme de leur contribution récente à son merveilleux développement, seront sans doute plus familiers que moi avec certains aspects du formalisme mathématique si complexe dont on f a i t usage. J'wayerai toutefois, en m'appuyant sur des considérations très simples e t sans entrer dans des détails mathématiques, d'exposer une manière générale d'envisager la question, que je crois susceptible de mettre en lumière des lignes directrices de I'évoJution de la théorie depuis sa première origine ; j'espère que ce point de vue ne pourra que contribuer à concilier les conceptions apparemment contradictoires défendues par différents physiciens. Aucune théorie ne pourrait, mieux que la théorie quantique, caracteriser le développement de la physique pendant le siècle écoulé depuis la mort du grand homme dont nous commémorons l'œuvre. E t c'est précisément dans un domaine comme celui-là, où nous nous hasardons en des sentiers inexplore e t où notre seul jugement peut nous mettre en garde contre les pièges qui nous entourent de toute part, que nous sommes amenés pius que jamais à avoir toujours preente à l'esprit l'œuvre de pionnier accomplie par les vieux maîtres qui nous ont forgé nos outils.
-
1. Postulat quantique et causalité Ce qui caractérise la théorie quantique, c'est qu'elle apporte une limitation essentielle aux concepts de la physique classique dans leur application aux phénomènes atomiques. II en résulte une situation un peu spéciale, provenant de ce que notre interprétation des données experimentales repose essentiellement
*
Traduction de la version allemande, légèrement modifiée par Bohr en 1931 par rapport au texte envoyé à Nature. Pour l'histoire de ce texte historique, la communication de Bohr à la Conférence de Come en commémoration de Volta (1927), voir : Nieis Bohr, Physique atomique et connaissance humaine. Folio E w i s 157 (1991): Nous avons rajouté à cette traduction les références que Bohr a mentionnées dans I'articie de Nature.
134
Sources et évolution de la physique quantique
sur l'emploi des concepts classiques ; c'est pourquoi il est assez difficile de formuler le contenu de la théorie quantique. II semble cependant, comme nous le verrons dans la suite, qu'il soit possible d'exprimer l'essence de la théorie à l'aide du I' postulat quantique '' ; d ' a p r l celui-ci, tout processus atomique présente un caractère de discontinuité, ou plut8t d'individualité, complètement étranger aux théories classiques. et caractérisé par le quantum d'actlon de Planck. Ce postulat nous oblige à renoncer à une descriptlon a la fois causale et spatiotemporelle des phénomènes atomiques. Car dans notre description ordinaire des phénomènes naturels, nous admettions en dernière analyse que I'observation d'un phénomène ne lui causait aucune perturbation essentielle. C'est bien ce que montre également l'énoncé de la théorie de la relativité, qui a tant contribué à élucider les théories classiques. Einstein a remarqué que toute observation ou mesure repose sur la coïncidence au même point de i'espace-temps de deux événements indépendants. Ce sont précisément ces coincidences qui ne sont pas influencées par les différences que peuvent présenter par ailleurs les descriptions spatio-temporelles des divers observateurs. Le postulat quantique, d'autre part, exprime que toute observatlon des phénomènes atomiques entrafne une interaction finie avec l'instrument d'observation : on ne peut par conséquent attribuer ni aux phénomènes n i à l'instrument d'observation une réalité physique autonome au sens ordinaire du mot. De toute façon, le concept d'observation contient un élément arbitraire : il dépend essentiellement du choix des objets comptés comme faisant partie du système observé. En dernière analyse, toute observation peut évidemment être ramenée à nos perceptions sensorielles. Mais comme i'interprétation des observations exige toujours l'emploi d'Idées théoriques, c'est à une questlon de commodité que se réduit, dans chaque cas individuel, le choix du moment où l'on introduit dans la description le concept d'observation, e t avec lui le trait " irrationnel " lié au postulat quantique. Ceci entrame d'importantes conséquences. D'une part, pour définir selon les conceptions ordinaires l'état d'un système physique, il faut faire abstraction de toute action extérieure ; mais alors, d'aprês le postulat quantique, on exclut du m€me coup toute possibilité d'observation : et en premier lieu, les concepts de temps et d'espace perdent leur sens immédiat. S i d'autre part, pour rendre i'observation possible. nous admettons l'éventualité d'interactions avec des instruments de mesure appropriés, qui n'appartiennent pas au système, ildevient impossible, par la nature même des choses, de donner une définition univoque de l'état du système. et il ne peut plus etre question de causalité au sens ordinaire du mot. II faut donc envisager une modification radicale du rapport entre la description spatio-temporelle e t le princlpe de causalité. qui symbolisent respectivement les possibilités idéales d'observation et de définition, e t dont l'union est caractéristique des théories classiques : d'après l'essence même de la théorie quantique,. nous devons en effet nous contenter de les concevoir comme des aspects complémentaires, mais mutuellement exclusifs, de notre représentation des résultats expérimentaux. O n peut dire que la théorie quantique nous apprend que si notre m'ode d'intuition a ia fois causal et spatio-temporel est bien adapté à son but, cela tient uniquement à la petitesse du quantum vis-à-vis des actions qui interviennent dans nos perceptions sensorielles ordinaires : de même, dans la t h h r i e de la relativité, l a séparation nette entre l'espace et le temps, Imposée paf nos sens, trouvait sa seule justification dans le fait que les vitesses relatives habituelles sont petites par rapport à la vitese de la lumikre. Somme toute, pour tenir compte du postulat quantique dans la description des phénomènes
La construction de la nouvelle mécanique
135
atomiques. nous devons développer une théorie de ia complémentarité ", dont ia noncontradiction ne peut être Jugée qu'en confrontant les possibilités de définition e t les posslbiiités d'observation. Cette conceptlon s'impose déjà dans ia question controver*e de la nature de la lumière et des particules matérieiles élémentaires. En ce qui concerne la lumière, sa propagation dans ie temps et dans i'espace est décrite d'une manière satisfaisante par la théorie électromagnétique. En particulier, le principe de superposition des ondes rend compte sans exception aussi bien des phénomènes d'interférence dans le vide que des propriétés optiques de ia matière. Néammoins, pour arriver à une expression exacte de la conservation de i'énergie e t de i'impuision dans l'interaction entre rayonnement et matière, telle qu'elle apparaît dans i'effet photo-électrique et dans i'effet Compton, ii faut recourir à l'idée de photon développée par Einstein. Cette contradiction apparente avait même fait douter un moment du caractère rigoureux du principe de superposition, ainsi que de ia validité générale des théorèmes d'énergie et d'impulsion ; mais ces doutes ont été définitivement dissipés par des expériences directes. Cette situation montre bien i'impossibüité d'une description causale et spatio-temporelle des phénomènes lumineux. S i nous voulons étudier les lois de la propagation des actions lumineuses dans i'espace et dans le temps, nous sommes réduits, en raison du postulat quantique, à des considérations statistiques. Inversement, en appllquant ie principe de causalité aux phénomènes lumineux individuels caractérise par ie quantum d'action, nous renoncons à la connaissance des rapports spatio-temporels. Naturellement. il ne peut jamais etre question d'appliquer tout à fait indépendamment soit la description spatio-temporelle, soit le concept de causalité. Bien au contraire, ces deux conceptions de la nature de l a lumière constituent deux tentatives différentes d'adaptation des faits expérimentaux à notre forme ordinaire d'intuition. dans lesquelles la limitation des concepts classiques trouve des expressions complémentaires. O n arrive à des conclusions analogues en étudiant les propriétés des particuies matérielles. L'individualité des particuies électriques élémentaires dérive assurément des expériences les pius courantes. Néammoins, pour expliquer différents résultats récemment découverts, notamment la réflexion &ledive des électrons par les cristaux métaliiques, on est obligé d'avoir recours au principe de superposition des ondes, conformément aux idées de L. de Broglie. La situatlon est donc la meme que dans le cas de ia iumiëre : t a n t qu'on s'en tient aux concepts classiques, on se trouve fataiement devant un dilemme, qui pourtant peut Btre considéré comme i'expression exacte de l'analyse des données expérimentales. En réalité, ii ne s'agit pas ià de contradictions, mais bien de conceptions complémentaires, dont seul i'ensembie peut constituer une généralkation naturelle du mode de description classique. Dans la discussion de ces questions, il ne faut pas perdre de vue que, conformément à la conception défendue id, le rayonnement dans le vide aussi bien que les participatlons matérielles libres ne sont que des abstractlons, puisque, d'après le postulat quantique, ieun propriétés ne peuvent etre définies ou observées que par leur interaction avec d'autres systèmes. Néanmoins, ces abstractions sont indlspensables, comme nous ie verrons, pour ramener i'expression des reuitats expérimentaux à nos formes ordinaires d'intuition. II y a longtemps que les dimcuités qui s'opposent dans ia théorie quantique à une description causale et spatio-temporelle fournissent matière à discussion ; elles ont été récemment mises en relief par le développement des nouvelles méthodes symboliques.
Sources et évolution de la physique quantique
136
Heisenberg a discuté dernièrement, dans un travail important', la non-contradiction de ces méthodes. A ce sujet, il a particulièrement insisté sur une certaine indétermination réciproque qui affecte toute mesure de grandeurs atomiques. Mais avant d'examiner de plus près ses résultats, il convient de montrer comment le caractère complémentaire de l a description des phénomènes, qui se traduit par cette indétermination, apparaït déjà inévitable dans l'analyse des concepts les plus simples qui sont à la base de l'interprétation des expériences. L e q u a n t u m d'action e t l a cinématique - L'opposition essentielle qui existe entre la quantum d'action et les concepts classiques se montre déjà nettement dans les formules très simples qui constituent la base commune de la théorie des photons et de la théorie ondulatoire de la matiêre. Si nous désignons par h la constante de Planck, nous avons
2.
Er = IX = h,
(1)
où E et I représentent l'énergie e t l'impulsion, r et la période et la longueur d'onde correspondantes. Dans ces formules nous voyons s'opposer les deux conceptions de la lumière et de la matière : en effet, l'énergie e t l'impulsion se rapportent à l'idée de particule et il est donc possible, d'après la conception classique. de leur faire correspondre des coordonnées spatio-temporelles déterminées ; la période e t la longueur d'onde, au contraire, concernent un train d'ondes planes harmoniques, illimité dans l'espace et dans le temps. Ce n'est qu'en appliquant le principe de superposition que l'on peut retrouver la description ordinaire. En effet, un champ d'ondes limité dans l'espace et dans le temps peut toujours être considéré comme résultant de l'interférence d'un groupe d'ondes harmoniques élémentaires. Et comme l'a montré de Broglie, la vitesse de translation des " individus " associés aux ondes est précisément donnée par la " vitesse de groupe Représentons en effet une onde plane élémentaire par la forme usuelle
".
A où
A
et
quantité
COS
2*(vt
-U
- uyy -
~ Z
U,Z
+ 6),
6 sont des constantes désignant respectivement l'amplitude e t la phase ; la I v = - est la fréquence : uzuyu., sont les nombres d'ondes dans les directions 7-
des axes e t peuvent être considérés comme les composantes du nombre d'ondes u V
dans la direction de propagation. La vitesse de phase est alors définie par groupe par V.
dv du'
I
=-
4
-, la vitesse de U
Or, la théorie de la relativité nous donne, pour une particule de vitesse
Eu I=-
et
C2
vdI=dE,
et c désigne la vitesse de la lumière. D'après la formule (l), la vitesse de phase est donc
2
égale à
- e t la vitesse de groupe égale à v.
vitesses
est toujours plus grande que la vitesse de la lumière, ce qui souligne directement
V
Zeitschf. F. Phys. 45, 172 (1927).
O n remarque d'abord que la première de ces
La construction de la nouvelle mécanique
137
le caractère symbolique de ces considérations. Ensuite, la possibilité d'identifier la vitesse de la particule avec la vitesse de groupe nous donne une idée du domaine d'application des images spatio-temporelles dahs la théorie quantique. En même temps se révèle le caractère complémentaire de la description : l'emploi de groupes d'ondes implique en M e t une indétermination dans la définition de la période et de la longueur d'onde, et par conséquent dans celle de l'énergie et de l'impulsion qui leur correspondent par ia relation
(1). Stricto sensu, la représentation d'un champ d'ondes limité exige une multiplicité d'ondes élémentaires correspondant à toutes les valeurs possibles de u et de uz,uy,6,. Cependant, dans les cas les plus favorables, les valeurs moyennes des différences entre ces grandeurs pour deux ondes élémentaires du groupe seront d'un ordre de grandeur donné Dar la condition
AtAu = AzAu, = AyAuy = AzAu, = î où At, A z Ay, Az expriment respectivement l'extension du champ d'ondes dans le temps et dans les directions des axes spatiaux. Ces relations se déduisent de la théorie des instruments d'optique. et en particulier des considérations bien connues de Rayleigh sur le pouvoir séparateur des appareils spectraux ; elles traduisent la condition pour que les trains d'ondes se détruisent par interférence aux surfaces limitant le champ d'ondes dans l'espace-temps. O n peut remaquer qu'elles expriment que le groupe considéré dans son ensemble, n'a pas de phase, au sens où on l'entend pour les ondes élémentaires. De la formule (1). on déduit maintenant les relations
A t A E = AzAI, = AyAIy = AzAI, = h, donnant l'incertitude minima qui affecte la définition de i'énergie et des impulsions des '' individus " associés au champ d'ondes. En général, quand on voudra faire correspondre à un champ d'ondes une valeur de l'énergie et de l'impulsion, les conditions seront moins favorables. Même s'il satisfait initialement aux relations (2). le groupe d'ondes prendra au cours du temps une extension telle qu'il deviendra de moins en moins susceptible de représenter le mouvement d'un " individu C'est précisément ià le point paradoxal du problème de la nature de la lumière e t des particules matérielles. D'ailleurs la limitation des concepts classiques exprimée par la formule (2) est étroitement liée à la restriction apportée à ia validité de la mkanique classique par la théorie ondulatoire de la matière ; par rapport a cette dernière, la mécanique classique correspond à l'optique géométrique, dans laquelle la propagation des ondes est représentée intuitivement au moyen de " rayons ". C'est seulement dans ce cas limite que l'énergie et l'impulsion peuvent être définies univoquement sans se départir des images spatio-temporelles. Mais pour obtenir une définition générale de ces concepts, il faut remonter directement aux théorèmes de conservation de l'énergie et de l'impulsion ; aussi l'énoncé exact de ces derniers a-t-il constitué un problème fondamental au cours du développement des méthodes symboliques dont nous parlerons en détail plus loin. Dans le langage de la théorie de la relativité, la formule (2) exprime que dans la théorie quantique, il existe une relation réciproque générale entre les incertitudes minima avec lesquelles les vecteurs d'énergie-impulsion et d'espace-temps associés aux " indlvidus " peuvent ëtre respectivement définis. Cette relation peut être considérée comme une
".
138
Sources et évolution de la physique quantique
expression symbollque très slmple de la nature complémentaire de la description spatiotemporelle et du principe de causalité. D'ailleurs, sa forme générale permet de combiner jusqu'a un certain point l'emploi du théorème d'énergie-impulsion avec la représentation spatio-temporelle des observations : au lieu de la coïncidence de deux événements bien deflnis en un point de l'espace-temps, on peut considérer celle d'" individus " définisavec une précision limitée dans les domaines spatio-temporels finis. Cette circonstance permet d'éviter les paradoxes que l'on rencontre chaque fois qu'on veut décrire la diffusion du rayonnement des particules électriques libres ou le choc de deux particules. D'après les concepts classiques, la description de l a diffusion implique l'extension finie du rayonnement dans l'espace e t dans le temps ; le postulat quantique, au contraire, semble exiger une variation instantanée du mouvement de l'électron en un seul point de l'espace. Mais l'impulsion e t l'énergie de l'électron, aussi bien que celles du rayonnement, ne peuvent ëtre définies sans prendre en considération un domaine spatio-temporel fini. De plus, l'application du théorème d'énergie-impulsion au processus suppose que la précision avec laquelle sont définis les vecteurs d'énergie-impulsion est la même pour le rayonnement e t pour l'électron. D'après la formule (2). on peut donc, dans la description de l'interaction, faire correspondre aux deux " individus " le mëme domaine spatio-temporel. Des considérations tout à f a i t analogues s'appliquent au choc de deux particules matérielles ; mais avant que l'Idée d'onde ne se révèle indispensable, on n'avait pas remarqué l'importance du postulat quantique pour ce phénomène. Ce postulat traduit ici I'hypoth&e de l'individualité des particules, qui dépasse l a description spatlo-temporelle pour rejoindre le principe de causalité. Le contenu tangible de la théorie des photons tenait tout entier dans les théorèmes de conservation de l'énergie e t de l'impulsion ; pour les particules électriques élémentaires, il faut de plus tenir compte de la conservation de la charge électrique. II est à peine nécessaire d'observer que les faits exprimés par les formules (1) e t (2) ne peuvent sumre à une description détaillée de l'interaction des " individus ",mais qu'il faut avoir recours à des méthodes qui permettent de tenir compte du couplage déterminant cette interaction : e t c'est là justement qu'apparaTt l'importance de la charge électrique. Comme nous le verrons, ces méthodes nous obligent a renoncer encore davantage à une description intuitive au Sens ordinaire du mot. Les mesures dans la théorie quantique - Dans son travail sur la non-contradiction des méthodes de la théorie quantique, Heisenberg a établi la relation (2) comme I'expression de la plus grande prkision qu'il soit posslble d'atteindre dans la mesure simultanée des coordonnées spatio-temporelles e t de i'énergie-impuision d'une particule. II s'appuie sur les considérations suivantes. D'une part, on peut mesurer, à l'aide d'un instrument d'optlque, par exemple, la position d'une particule avec une précision aussi grande que l'on veut : il s a t d'utiliser, pour former l'image, un rayonnement de longueur d'onde sufrisamment courte. Mais alors, d'aprb la t h k r i e quantique, le rayonnement diffus4 par l'objet subira une variation finie d'impulsion, d'autant plus grande que les ondes sont plus courtes. D'autre part, on peut déterminer l'impulsion d'une particule avec une précision aussi grande que l'on veut, par exemple en mesurant sa vitesse à l'aide de l ' f l e t Doppler accompagnant la diffusion du rayonnement : IIsuffit que la longueur d'onde de la lumière empioyée soit assez grande pour qu'on puisse négliger le recul ; mais de ce fait, la détermination de la position devient d'autant moins précise.
3.
La construction de la nouvelle mécanique
139
Le point essentiel de ces considérations est qu'on insiste sur la nécessité de recourir au postulat quantique pour reconnaitre les possibilités de mesure. Cependant, il faut encore examiner de plus près les 'possibilités de définition pour faire ressortir tous les aspects du caractère complémentaire de la description des phénomènes. Ce n'est pas une variation discontinue de l'énergie-impulsion de la particule au cours du processus d'observation qui pourrait par elle-même nous empêcher d'attribuer aussi bien aux coordonnées spatio-temporelles qu'à l'énergie-impuision des valeurs Précises avant et a p r b ce processus. Aussi bien, si les valeurs que l'on peut assigner à ces grandeurs sont toujours affectées d'une incertitude réciproque, cela tient surtout, comme il ressort de I'expoSe precedent, à ce que l'on ne peut définir ies variations d'énergie-impulsion qu'avec une précision limitée, quand on doit en même temps restreindre sufisamment l'extension des champs d'ondes utilisés dans I'observation pour fixer les coordonnées spatio-temporelles de la particule. A ce sujet, il ne faut pas oublier, quand on détermine la position d'une particule à l'aide d'un instrument d'optique, que la formation de l'image exige nécessairement i'empioi d'un faisceau divergent. Ainsi le pouvoir séparateur d'un microscope est donné par l'expression bien connue
x
-, E
dans laquelle
désigne la longueur d'onde de la lumière,
et E l'ouverture numérique. c'est-à-dire le sinus du demi-angle d'ouverture. Si même on éciaire l'objet par de la lumière parallèle, et si par conséquent l'impulsion du photon incident
-hx est parfaitement déterminée en grandeur et en direction,
on ne pourra pas
connaître avec précision. à cause de i'ouverture finie, le recul accompagnant la diffusion sur laquelle la mesure est basée. Meme si l'impulsion de la particule était connue exactement avant le processus de diffusion. sa composante dans le plan de l'objet après observation sera affectée d'une incertitude évidemment égale à
%h -.
x
Le produit des
incertitudes affectant la détermination de la coordonnée de position et de la composante d'impulsion dans une direction donnée est donc bien exprimé par la formule (2). On pourrait penser qu'en plus de l'ouverture, ia longueur du train d'ondes doive également intervenir dans l'estimation de la précision avec laquelle on peut déterminer la position de la particule, vu que ceile-ci peut modifier sa position pendant la durée finie de l'éclairement. Mais puisque la connaissance exacte de la longueur d'onde de la lumière n'entre pas essentiellement dans le raisonnement précédent, on voit facilement que, pour une ouverture donnée, le train d'ondes peut être choisi assez court pour qu'une variation de position de la particule pendant i'observation soit négligeable vis-à-vis de la limite de précision déterminée par le pouvoir séparateur.
-
Pour faire une mesure d'impulsion à l'aide de l'effet Doppler tout en tenant compte de i'effet Compton -, on se servira d'un train d'ondes parallèles. Mais la précision avec laquelle on peut mesurer le changement de longueur d'onde du rayonnement diffusé dépend essentiellement de la longueur du train d'ondes dans la direction de propagation. Désignons cette longueur par 1, e t supposons que la direction du rayonnement diffusé est oppoSee à celle du rayonnement incident ; si nous mesurons alors les composantes de position et d'impulsion dans cette même direction, nous trouvons que la précision de la mesure de la vitesse est de l'ordre de
CA
-.21
Dans cette formule, on a supposé pour simplifier
que la vitesse de la particule etait faible vis-à-vis de celle de ia lumière. Si
m est La m a s e
140
Sources et évolution de la physique quantique
de la particule, l'incertitude qui affecte la mesure de l'impulsion est donc égale Dans le cas actuel, le recul
2h
a
mcX -. 21
x est suffisamment bien défini pour ne donner lieu a aucune
incertitude appréciable sous l'impulsion de la particule après l'observation. La théorie générale de l'effet Compton permet égaiement de calculer, à partir des longueurs d'onde du rayonnement incident et du rayonnement diffusé, les valeurs de la composante de la vitesse dans la direction avant e t après la variation d'impulsion. Mais même si la position initiale de la particule est exactement connue, la connaissance de sa position a p r h la mesure d'impulsion sera affectée d'une certaine indétermination. En effet, comme il est impossible de déterminer le moment précis du recul, la vitesse moyenne dans la direction d'observation pendant le processus de diffusion ne peut être connue qu'avec la précision
2h -
mx'
1
L'intervalle de temps qui correspond au processus étant -, l'incertitude sur la
position après l'observation sera
2hl -.
mXc
C
O n voit donc que le produit des incertitudes sur
les mesures de position et d'impulsion est encore donné par la formule générale (2). Dans les mesures d'impulsion comme dans celles de position, la durée d u processus d'observation peut Ctre rendue arbitrairement petite : il n'y a qu'à utiliser un rayonnement de longueur d'onde suffisamment courte. Car l'augmentation de recul qui en résulte n'a. comme nous l'avons vu, aucune influence sur la précision de la mesure. II faut encore remarquer que lorsque nous avons parlé à plusieurs reprises de la vitesse de la particule, il ne s'agissait en I'occurence que d'un emploi commode, mais purement formel, de la description spatio-temporelle. Les considérations de L. de Broglie, exposées plus haut, montrent déjà que le concept de vitesse doit toujours être employé avec prudence. L e postulat quantique exclut également toute définition univoque de ce concept ; c'est ce qu'il ne faut pas oublier quand on compare les résultats de plusieurs observations successives. Sans doute, on peut déterminer la position d'un ' I individu " à deux instants différents avec une précision aussi grande que l'on veut. Mais si l'on veut calculer de la manière ordinaire l a vitesse de I"' individu " dans l'intervalle séparant ces deux instants, on n'obtient qu'une idéalisation d'où l'on ne peut pas tirer de conclusions univoques sur le comportement antérieur ou postérieur de I"' individu
".
Toute cette discussion de l'exactitude avec laquelle on peut mesurer l a position et l'impulsion d'une particule peut être repétée en utilisant, au lieu de la diffusion d'un rayonnement. un choc avec une autre particule matérielle ; cela résulte évidemment des considérations précédentes sur les possibilités de définition des propriétés des " individus Dans les deux cas, nous voyons que l'incertitude affecte tout autant l'instrument de mesure que l'objet. Cette incertitude est inévitable dès qu'on rapporte les mouvements des "individus " à un système de coordonnées fixé comme d'habitude par des corps solides et des horloges invariables. Car les seules conclusions que permettent les conditions expérimentales - ouverture et fermeture des diaphragmes, etc. - concernent l'extension du champ d'ondes associé dans l'espace et le temps.
".
Quand on ramène les observations aux perceptions sensorielles. le postulat quantique doit encore intervenir dans la perception de l'instrument de mesure, soit que l'on ait affaire à une action directe sur l'œil, soit que la perception ait lieu par des intermediaires approprie, tels que plaques photographiques, chambres de Wilson, etc. Toutefois, il est facile de voir que le nouvel élément statistique qui s'introduit ainsi n'aura aucune influence
La construction de la nouvelle mécanique
141
essentielle sur l'incertitude affectant la description de l'objet. O n serait même tenté de croire que l'élément arbitraire entrant dans la séparation de l'objet et de l'instrument de mesure implique la possibilité' d'éviter cette incertitude. Considérons par exemple la détermination de la position d'une particule : on pourrait songer à mesurer la variation d'impulsion que subit le microscope, y compris la source de lumière e t la plaque photographique, lors du processus d'observation, e t en déduire. à l'aide du théorème de conservation, l'impulsion cédée à la particule lors de l a diffusion. Mais en y regardant de plus près, on constate que l'on ne peut effectuer une +elle mesure si l'on veut en même temps connaïtre la position du microscope avec une précision suffisante. De l'ensemble des faits qui s'expriment par la théorie ondulatoire de la matière, il résulte en effet que les coordonnées du centre de gravité e t les composantes de l'impulsion totale d'un corps quelconque ne peuvent être définies avec une précision qui dépasse les limites imposées par la formule (2). Stricto sensu, le concept d'observation f a i t partie de la description causale e t spatiotemporelle. Mais en raison du caractère générai de la relation exprimée par la formule ( 2 ) , on peut aussi utiliser ce concept sans contradiction dans la théorie quantique : il suffit de tenir compte de l'incertitude exprimée par cette relation. Pour illustrer le caractère de la description quantique des phénomènes atomiques (microscopiques), il est instructif, comme l'a signalé Heisenberg, de comparer cette incertitude à celle qui, en raison de l'imperfection des mesures, affecte déjà toute observation dans la description ordinaire des phénomènes naturels ; on peut même dire, remarque-t-il à ce sujet. que les phénomènes ordinaires (macroscopiques) sont en quelque sorte engendre par des observations répétées. Cependant, il ne faut pas oublier que d'après la théorie classique, chaque observation nouvelle permet de prédire le cours des phénomènes avec une certitude de plus en plus grande, en nous donnant une connaissance toujours plus exacte de l'état initial du système. Par contre, dans la théorie quantique. un élément tout à fait nouveau, incontrôlable, surgit à chaque observation par suite de l'interaction finie avec l'instrument de mesure. Les considérations précédentes montrent en effet que la mesure des coordonnées de position d'une particule n'implique pas seulement une modification finie des variables dynamiques, mais entraîne toujours une rupture complète dans la description causale de son comportement dynamique : de même, la connaissance de son impulsion n'est obtenue qu'au prix d'une lacune dans sa description spatio-temporelle. C'est précisément cet état de choses qui traduit nettement le caractère complémentaire de la description quantique des phénomènes atomiques ; ce caractère peut être considéré comme une conséquence immédiate de l'antagonisme qui existe entre le postulat quantique e t la distinction exigée par le concept d'observation entre objet e t instrument de mesure.
- Jusqu'à présent, nous n'avons considéré que certains caractères généraux de la théorie quantique. Mais le probleme fondamental qui se pose immédiatement, c'est celui qui consiste à formuler les lois de l'interaction entre les I' individus " s y m b o ï i par les abstractions de la particule libre et de rayonnement. A cet effet, on est parti de l'étude de la constitution des atomes. O n a déjà pu mettre en lumière certains aspects essentiels des phénomènes par une simple application des concepts classiques en relation avec le postulat quantique. Cela tient surtout à ce que l'on peut, dans ces questions, se passer en grande partie d'une
4. Le principe d e correspondance e t la théorie des matrices
142
Sources et évolution de la physique quantique
description détaillée du cours des processus dans l'espace et dans le temps. C'est ainsi que l'hypothèse d'états stationnaires discrets et de processus individuels de transition traduit immédiatement les caractères principaux de l'excitation des spectres d'atomes par chocs électroniques ou par rayonnement. Cette conception de l'origine des spectres est en opposition particulièrement nette avec le mode de description ordinaire : des lignes spectrales qui, selon la théorie classique, devraient provenir d'un meme état de l'atome, sont attribuées, d'après le postulat quantique, à différents processus de transition entre lesquels l'atome a le choix. Malgré cette opposition, on est parvenu à raccorder le formalisme quantique aux idées classiques dans le cas limite où la différence relative entre les propriétés des états voisins disparait asymptotiquement, et où l'on peut faire abstraction des discontinuités dans les appiications statistiques. C'est grâce à cette circonstance que la théorie quantique a pu expliquer dans une large mesure les régularités des spectres conformément à nos idées générales sur la constitution des atomes. En cherchant à concevoir la théorie quantique comme une généralisation rationnelle des théories classiques, on a été conduit à l'établissement du " principe de correspondance ' I . Pour appliquer ce principe à l'interprétation des phénomènes spectraux, on utilisait les formules de l'électrodynamique ordinaire, en faisant correspondre à Chaque processus individuel de transition une composante d'oscillation du mouvement classique des particules de l'atome. Mais sauf à la limite où la différence relative entre les états stationnaires successifs est négligeable, cette application fragmentaire des théories classiques ne donnait que dans certains cas une description rigoureuse, quantitative, des phénomenes. Rappelons en particulier la relation, établie par Ladenburg et par Kramers, entre la theorie classique des phénomènes de dispersion et les lois statistiques d'Einstein réglant le processus de transition qui accompagnent les phénomènes de rayonnement. Cette étude de Kramers sur l a dispersion a d'ailleurs apporté une contribution importante au développement logique de l'idée de correspondance ; mais c'est seulement grâce aux méthodes introduites dans la théorie quantique au cours de ces dernières années que l'on a pu réaliser d'une manière générale la tendance exprimée par le principe de correspondance. c'est Heisenberg qui a inauguré ce nouveau développement de la théorie par un travail fondamental dans lequel il parvient à s'affranchir complètement du concept classique de mouvement. Ainsi, il remplace partout les grandeurs cinématiques et dynamiques ordinaires par des symboles qui se rapportent directement aux processus individuels exigés par le postulat quantique : au lieu de représenter les grandeurs mécaniques par des sommes d'oscillations harmoniques, il utilise des matrices dont chaque élément symbollse une oscillation harmonique et correspond ainsi à une transition possible entre états stationnaires. En exprimant que les fréquences correspondant à ces éléments doivent satisfaire au principe de combinaison des lignes spectrales, Heisenberg a trouvé pour ses symboles des règles de calcul t r b simples, qui permettent de transcrire directement SOUS forme quantique les équations fondamentales de la mécanique classique. Cette maniere hardie et ingénieuse d'attaquer le problkme de la dynamique des atomes s'est révélée tout de suite extrêmement puissante et fructueuse dans l'interprétation quantitative des résultats expérimentaux. Les travaux de Born, Jordan et Dirac ont rapidement donné a la nouvelle théorie une forme qui peut rivaliser de cohérence e t de généralité avec la mécanique classique. II est particulièrement remarquable que l'élément caractéristique de la théorie
La construction de la nouvelle mécanique
143
quantique, la constante de Planck, n'apparaisse plus explicitement que\dans les règles de calcul auxquelles les symboles sont soumis. En effet, deux matrices p et q correspondant à des variables canoniques conjuguées au sens de Hamilton n'obéissent pas à la loi de commutativité de la multiplication, mals satisfont à la relation de commutabilité
h W-qP=Gs;;,
(3)
dont la forme est un exemple frappant du caractère symbolique de toute la théorie, O n a souvent représenté la mécanique des matrices comme un calcul n'utilisant que des grandeurs directement observables. II faut toujours remarquer que cette méthode a précisément en vue des problèmes dans lesquels on peut appliquer le postulat quantlque en faisant abstraction dans une large mesure de la description spatio-temporelle, de sorte que la question de l'observation au sens ordinaire du m o t ne se pose pas. POW pousser plus loin la correspondance entre ia théorie quantlque et la théorie classique, il a été très important de mettre en relief le caractère statistique de ia description basée sur le postulat quantique. Un grand progrès a été réalisé dans cette voie par Dirac e t Jordan ; ceux-ci sont parvenus à généraliser la méthode symbolique de Heisenberg en opérant avec des matrices qui ne sont plus nécessairement ordonnées d'après les états stationnaires, mais dont les éléments peuvent avoir comme indices les valeurs propres de grandeurs mécaniques quelconques, commutables entre elles. Dans la forme première de la théorie, les " éléments diagonaux ", qui se rapportaient à un seul état stationnaire, pouvaient être interprétés comme moyennes temporelles de la grandeur considérée ; d'une manière analogue, la " théorie des transformations " fournit une représentation des grandeurs moyennes plus générales qui correspondent à un I' état " caractérisé par des valeurs données d'un certain nombre de grandeurs mécaniques. les variables canoniquement conjuguées pouvant prendre toutes les valeurs possibles. S'appuyant sur cette méthode ainsi que sur les idées émises par Born et par Pauli, Heisenberg a essayé d'analyser de plus près le contenu physique de la théorie quantique, en ayant spécialement égard au caractère paradoxal de la relation de commutabilité (3). II est arrivé ainsi à la formule générale
ApAq-h,
(4)
donnant la précision maxima avec laquelle on peut observer simultanément deux grandeurs mécaniques canoniquement conjuguées. Dans cet ordre d'idées. il a mis en lumière d'une manière très intéressante les nombreux paradoxes auxquels donne lieu l'application du postulat quantique et a prouvé ainsi dans une large mesure la non-contradiction de la méthode symbolique. A propos de la nature complémentaire de la description quantique, répétons qu'il faut toujours, pour juger de la non-contradiction, considérer à la fois les possibilite d'observation et les possibilités de définition. C'est précisément pour l'éclaircissement de cette question que la mécanique ondulatoire développée par Schrodinger s'est montrée extrêmement utile, en permettant d'étendre le principe de superposition à des particules soumises à des actions mutuelles, et par suite de leur appliquer immédiatement les considérations développées à propos du rayonnement et des particules libres. Nous reviendrons plus loin sur le rapport de la mécanique ondulatoire avec l'énoncé général des lois quantiques donné par la théorie des transformations.
144
Sources et évolution de la physique quantique
-
5.
L a mécanique ondulatoire e t l e postulat quantique Dans ses travaux sur la théorie ondulatoire des particules matérielles, de Broglie avait déjà attiré l’attention sur la possibilité de représenter les états stationnaires de l’atome par un phénomène d’interférence des ondes de phase associées aux électrons libres. Au début, ilest vrai, cette conception ne nous a pas menés plus loin, au point de vue quantitatif, que les méthodes primitives de la théorie quantique, qui reposaient sur l’application des principes classiques, et qui avaient été développées surtout par Sommerfeld. Mais bientôt la théorie ondulatoire propode par Schrodinger a ouvert de nouvelles perspectives et apporté une contribution décisive aux grands progrès réalisés récemment dans la théorie atomique. Les solutions propres de l’équation des ondes de Schrodinger fournissent pour les états stationnaires de l’atome une représentation très simple, dans laquelle l’énergie de chaque état est liée à la période propre correspondante par la relation quantique générale (1). De même. le nombre de nœuds de l’oscillation propre fournit une interprétation très simple d u concept de nombre quantique ; celui-ci s’était déjà présenté dans les anciennes théories. mais la mécanique des matrices l’avait momentanément laissé dans l‘ombre. De plus, Schrodinger associe à chaque solution de l’équation des ondes une densité continue de charge e t de courant électrique qui, dans le cas d’une solution propre, traduisent les propriétés électrostatiques et magnétiques de l’atome dans l’état stationnaire correspondant. La superposition de deux solutions propres correspond de même à une répartition continue d’oscillations électriques qui. d’après l’électrodynamique classique, doivent donner lieu à l’émission d’un rayonnement ; la fréquence e t l’intensité de celui-ci correspondent exactement à celles que donnent, pour le processus de transition entre les deux états, le postulat quantique e t le principe de correspondance, t e l qu’il est formulé dans la théorie des matrices. En traitant par la méthode de Schrodinger le problème du choc entre atomes et particules électriques libres, Born a obtenu des résultats très importants pour le développenient ultérieur de la théorie. II est parvenu notamment à donner pour les fonctions d’ondes une interprétation statistique permettant de calculer la probabilité des processus Individuels de transition entre &tats stationnaires qu’exige le postulat quantique. II en a déduit la forme que prend dans la mécanique ondulatoire le principe des invariants adiabatiques d’Ehrenfest, dont Hund a fait usage avec tant de profit dans 585 recherches sur le problème de la formation des molécules. Devant ces résultats. Schrodinger a exprimé l’espoir que le développement logique de la théorie ondulatoire permettrait d’éviter complètement l’irrationalité contenue dans le postulat quantique et d’arriver à une description des phénomènes atomiques conforme aux lignes directrices des théories classiques. A l’appui de cette conception, il remarque’ que tout processus s’interprétant, d’après le postulat quantique, comme un échange discontinu d’énergie entre atomes se ramène, dans la théorie ondulatoire, à un simple problème de résonance. En particulier, la conception d’états stationnaires individuels serait illusoire e t son applicabilité ne serait qu’un exemple de cette résonance. II faut toutefois remarquer que celle-ci se rapporte à un système mécanique rigoureusement isolé, c’est-à-dire, d’après les idées défendues ici, soustrait à toute observation. Et d’ailleurs, la mécanique ondulatoire, comme la théorie des matrices, doit même, d’aprb ces idées, être considérée comme une transcription symbolique de la mécanique classique, adaptée à la théorie des quanta et ne pouvant être interprétée que par l’application explicite du postulat quanAnn. d . Phys., 83. 956 (1927).
La construction de la nouvelle mécanique
145
tique. Du reste, on peut regarder comme complémentaires ces deux manières d e formuler le problème de l'interaction, quand, on tient compte d e ce qu'elles partent respectivement de la conception ondulatoire et de la conception particulaire des '* individus " libres. Cette complémentarité explique également l'apparence de contradiction naissant de l'emploi d u concept d'énergie dans les deux théories. Les difficultés de principe qui s'opposent à la description spatio-temporelle classique d'un système de particules soumises à des actions mutuelles proviennent directement d e ce que leur comportement individuel est essentiellement réglé par le principe de superposition. MSme dans le cas d'une particule libre, dès que l'on connaît l'impulsion et l'énergie, on ne peut utiliser avec précision les coordonnées spatio-temporelles. II en résulte qu'il est impossible d'appliquer directement le principe de l'énergie en introduisant l'idée classique de l'énergie potentielle d'un système. Dans l'équation de Schrodinger, on évite ces difficultés en transformant l'expression classique d e la fonction hamiltonienne en un oDérateur différentiel à l'aide de la formule
o ù p d e i g n e une composante de l'impulsion généralisée et q la variable canoniquement conjuguée ; de plus, on considère l'énergie du système. changée de signe, comme conjuguée au temps. Ainsi, les concepts d e temps et d'espace aussi bien que ceux d'énergie et d'impulsion n'interviennent tout d'abord dans l'équation des ondes que comme des quantités purement formelles. La méthode d e Schrodinger, comme d'ailleurs celle des matrices, doit essentiellement sa simplicité à l'emploi de nombres imaginaires. Cette circonstance lui confere déjà un caractère symbolique ; mais il y a une raison plus directe qui empêche son rattachement immédiat à nos formes ordinaires d'intuition : c'est qu'au point de vue " géométrique ", l'équation des ondes ne se rapporte pas à l'espace à trois dimensions, mais bien à i'extension en configuration, dont le nombre de dimensions est égal au nombre de degrés de liberté du système. D'autre part, i'énoncé du problème de l'interaction, qu'il soit donné par l'équation de Schrodinger ou par la théorie des matrices, est soumis à une restriction, provenant de ce que, dans ie problème de mécanique classique pris comme base, on ne tient pas compte de la vitesse finie de propagation des forces, exigée par la théorie de la relativité. D'ailleurs, on n'a guère le droit, dans le problème d e l'interaction, d'exiger une représentation intuitive basée sur des images spatio-temporelles. En effet, toutes les expériences sur les propriétés des atomes, à moins qu'elles ne concernent leur mouvement global, sont basées exclusivement sur la manière dont ils réagissent dans des phénomènes de rayonnement ou de choc. Par conséquent, l'interprétation des observations se ramène toujours en dernière analyse à la considération d'un rayonnement dans le vide ou de particules matérielles libres ; c'est sur ces abstractlons que repose toute entière notre conception spatio-temporelle des phénomènes. aussi bien que ia définition des concepts
d'impulsion et d'énergie. Tout ce qu'on peut exiger de ces moyens de description, c'est qu'ils ne soient pas utilisés de manière contradictoire : pour s'en assurer, il faut surtout tenir compte des possibilités d e definition et d'observation. Si les solutions propres de l'équation de Schrodinger sont aptes à représenter les états stationnaires de l'atome, c'est précidment parce qu'elles fournissent, à l'aide d e ia relation quantique générale (l), une définition univoque de l'énergie du système. Ceci nous
146
Sources et évolution de la physique quantique
oblige toutefois à renoncer dans une large mesure à la description spatio-temporelle : nous verrons en effet qu'il est tout à fait impossible de connaître en détail le comportement des partlcules individuelles dans l'atome e t d'appllquer en même temps sans contradictlon le concept d'état stationnaire. Dans les questions où il est essentlel de suivre les particules de l'atome dans te temps et dans i'espace pour Interpréter les obsewatlons, on est amené à étudier la solution générale de l'équation des ondes, qui s'obtient en superposant les solutions propres. II s'agit ici d'une complémentarité de définition et d'observation t o u t a fait analogue a celle que nous avons rencontrée précédemment dans l'étude des propriétés de la lumière e t des particules matérielles libres. Tandis que la définition de l'énergie et de l'impulsion des " individus " était basée sur le concept d'onde harmonique élémentaire, toute description des phénomènes dans l'espace et dans le temps reposait sur I'interf4rence d'un groupe de ces ondes élémentaires. Dans le cas actuel également, on peut mettre directement en évidence la non-contradiction des possibilités d'observation e t de définition. D'apr&s le postulat quantique, une observation susceptlble de nous renseigner sur le Comportement des particules atomiques individuelles entrame toujours une modification de l'état de l'atome. Lorsqu'il s'agit d'états stationnaires de faible nombre quantique, cette modifcatlon conslstera même en générai, comme l'a fait remarquer Heisenberg. en l'expulsion de l'électron considéré hors de l'atome. Dans ce cas, il est donc impossible de déterminer par des observations répétées I"' orbite " de l'électron dans l'atome. Ceci tient a ce qu'li est impossible de représenter, fit-ce d'une manière approchée, le '' mouvement " d'une particule au moyen d'un groupe d'ondes formé d'oscillatlons propres qui n'ont qu'un petit nombre de nœuds. Mais ce qui montre surtout le caractère complémentaire de la description, c'est que, pour obtenir une interprétation univoque d'observations relatives au comportement des particules de l'atome, \I faut que l'on pulsse, pendant le processus d'obsenratlon, faire abstraction des forces mutuelles et considérer les particules comme libres. Ced exige toutefois que la durée du processus soit courte par rapport aux périodes naturelles de l'atome, de sorte que la variatlon d'énergie accompagnant l'observation ne peut atre connue qu'avec une incertitude de beaucoup supérieure aux différences d'énergie entre les états stationnaires successifs. D'allleun, quand on veut se rendre compte des possibilités d'observatlon, li ne faut Jamais oublier que l'on ne peut attribuer un sens intuitif aux solutlons de la mécanique ondulatoire que dans la mesure où elles peuvent Btre interprétées à l'aide du concept de particule iibre. C'est là pr&'kément qu'apparait avec netteté la différence entre la mécanique ciassique et la théorle quantique de l'interaction. En effet, dans la première, une telle restriction est inutile, puisqu'on attribue â la particule une " réalité " immédiate, Indépendante du falt qu'elle sort llbre ou liée. II faut surtout tenir compte de cette situation pour juger de la non-contradlctlon dans l'emploi de la densite d'électrlclté de Schr6dlnger comme mesure de la probablllté de presence des electrons dans des domaines spatiaux donnés à l'intérieur de l'atome. D'aprh les restrictions, cet emploi revient â admettre que la probabilité de prêsence d'une particule libre est déterminée par la densité d'électricité associée au champ d'ondes de la même manière que la probabilité de presence d'un photon est déterminée par la densité du rayonnement, calculée d'aprb la théorie des ondes. Comme on l'a déjà dit, la théorie des transformations de Dirac-Jordan, à l'aide de laquelle Heisenberg a formulé sa théorie générale d'incertitude (4). nous offre un moyen
La construction de la nouvelle mécanique
147
général non contradictoire de tirer parti des concepts classiques dans la théorie quantique. L'équation de Schrbdlnger y a également trouvé une appllcation Instructive. En effet, on utilise les solutions propres de cette equation pour transformer une matrice ayant comme indices les valeurs de l'énergie du système en une autre ayant pour i n d l w les coordonnées spatiales de la particule considérée. A ce propos, Ilest également intéressant de rappeler que Jordan et Klein sont parvenus récemment, en partant d'une représentation ondulatoire des particules individuelles, à formuler le problème de i'lnteractlon en conformité avec l'équation de Schr6dlnger. Ils utilisent à cet effet le procédé symbolique, se rattachant au calcul des matrices, par lequel Dirac avait traité le problème du rayonnement ; nous y reviendrons plus loin.
'
6. La réalité des états stationnaires - Le concept
d'état stationnaire résuite, on i'a déjà dit. d'une application caractéristique du postulat quantique au système considéré. Par sa nature, ce concept exige qu'on fasse complètement abstraction d'une description temporelle : et à notre point de vue, c'est justement à cette même condition que l'on peut définir de manière univoque i'énergie de l'atome. Strictement pariant, le concept d'état stationnaire implique l'exclusion de toute interaction avec des " individus " qui n'appartiennent pas au système. Le fait d'attribuer à un tel système isolé une énergie déterminée peut être considéré comme i'expression directe du principe de causalité contenu dans le théorème d'énergie. C'est ce caractère des états stationnaires qui justifie l'hypothèse de leur stabilité hypermécanique ; d'après cette hypothèse, sur laquelle est basée l'application du postulat quantique au problème de ia constitution atomique, l'atome se trouve toujours dans un état statlonnaire bien défini avant ou après toute action extérieure. Pour discuter les paradoxes bien connus qu'entraîne cette hypothèse dans la description des chocs et des réactions de rayonnement, il est essentiel de tenir compte de la limitation que la relation (2) Impose aux possibilités de definition des agents partlcipant à la réaction. D'après cette relation, si l'on veut que l'énergie des " individus " réagissants soit définie avec assez de précision pour qu'on puisse dire que l'énergie se conserve lors de la réaction, ii faut que l'intervalle de temps soit long vis-à-vis de la période qui se rapporte, d'après la formule (1). au processus de transition entre les états stationnaires considérés. C'est ce que montre d'une manière Intéressante l'étude des processus qui accompagnent le passage d'une particule en mouvement rapide à travers un atome. En effet, d'après la cinématique ordinaire, le temps effectif du choc serait, dans ce cas, faible relativement aux périodes naturelles de l'atome, et par consequent Il pourrait sembler extrêmement difficile de concilier le théorème d'énergie et l'hypothèse de la stabilité des états stationn a i r e ~ ~Dans . la représentation ondulatoire, au contraire, la durée qu'il faut attribuer à la réaction est directement liée à i'incertitude sur notre connaissance de l'énergie de la particule qui heurte l'atome. e t i'on n'a jamais à craindre de contradiction avec le théorème d'énergie. Au cours d'une discussion de paradoxes semblables, Campbell a proposé de considérer le concept de temps lui-même comme essentiellement statistique. Mais les idées défendues ici, d'après lesquelles ia description spatio-temporelle représente
' '
Zeits. f. Phys. 45, 751 (1927). Zeits. f. Phys. 34, 142 (1925). Phil. Mag. i, 1106 (1926).
148
Sources et évolution de la physique quantique
une abstraction fondée sur le comportement général des " individus " libres, s'opposent, fUt-ce en raison du principe de relativité, à une separation aussi essentielle des concepts de temps et d'espace. Si, en relation avec le concept d'état stationnaire, l e temps paraît jouer un rôle privilégié, cela tient uniquement, nous l'avons vu, à la nature particulière des problèmes qui se posent à ce sujet. Pour qu'on puisse appliquer le concept d'état stationnaire, il faut que lorsqu'on effectue, en utilisant par exemple un choc ou une réaction de rayonnement, une mesure permettant de distinguer les différents états stationnaires, on ait le droit de faire abstraction de i'histoire antérieure de l'atome. Au premier abord, on pourrait voir une difficulté dans le fait que les méthodes symboliques de ia théorie des quanta attribuent à tout état stationnaire une phase d'oscillation, qui semble permettre, en contradiction avec l'idée même d'état stationnaire, la possibilité d'une influence d'actions antérieures. Cependant, dès qu'il s'agit d'un problème temporel, il ne peut jamais être question d'un système rigoureusement isolé. Les oscillations propres utilisées dans l'interprétation des observations ne sont que des idéalisations commodes qui, comme dans une discussion plus exacte, devront toujours faire place à des groupes d'oscillations harmoniques se rapportant à des intervalles de fréquence finis. Or c'est là une conséquence générale, déjà signalée, du principe de superposition -, un groupe d'ondes, considéré dans son ensemble, n'a pas de phase au même sens que les ondes élémentaires ou les oscillations propres. Ce caractère inobservable de la phase - déjà bien connu dans la théorie des instruments d'optique - joue un rôle important dans la discussion de l'expérience de Stern et Gerlach sur la déviation des rayons moléculaires dans un champ magnétique, qui a contribué si utilement à l'étude des propriétés individuelles des atomes. Heisenberg anaiyse ainsi les conditions de cette expérience : d'après la conception ondulatoire de L. de Broglie, le faisceau de rayons moléculaires doit être diffusé par le diaphragme nécessaire pour le délimiter ; on ne pourra donc évidemment discerner les atomes d'orientations différentes dans le champ que si l a déviation magnétique du faisceau est plus grande que i'élergissement dû à cette diffusion. Un calcul simple permet d'exprimer cette condition en fonction du temps mis par les atomes pour traverser le champ magnétique. et de i'indétermination qui affecte notre connaissance de l'énergie des atomes individuels dans le champ, par suite de la largeur finie du faisceau. On trouve que le produit de ces deux grandeurs doit être au moins égal au quantum d'action. Heisenberg a vu dans ce résultat une confirmation de la relation (2) concernant les incertitudes réciproques qui affectent une détermination simultanée de i'énergie et du temps. Toutefois, dans le cas actuel, il ne s'agit pas à proprement parler d'une mesure de l'énergie de l'atome à un instant donné. Mais la période des oscillations propres de l'atome dans le champ est liée à l'énergie totale par la relation générale (1). Par suite, la condition envisagée exprime précisément que si l'on veut discerner les différents états de l'atome dans le champ, il devient impossible de déterminer la phase. On peut résoudre de la même façon les contradictions apparentes, souvent discutées, que présentent certaines expériences idéales sur le rayonnement de résonance. imaginées par Heisenberg. En comparant, comme nous venons de le faire, un atome à un systëme isolé, nous faisons abstraction de l'émission du rayonnement, qui, même en l'absence d'actions extérieures, met un terme à la vie moyenne des états stationnaires. Si l'on a le droit de négliger ce rayonnement dans beaucoup d'applications, c'est que le couplage entre atome et champ de rayonnement, calculé d'après l'électrodynamique classique, est généralement
-
La construction de la nouvelle mécanique
149
faible vis-à-vis du couplage entre les particules de l'atome. On peut donc décrire l'état de ce dernier en laissant de cdté dans la plupart des cas la réaction du rayonnement, ce qui revient à faire abstraction de I'lndétkrmination sur l'énergie déduite par la relation (2)de la vie moyenne des états stationnaires6. C'est précisément cela qui permet l'application directe, conforme au principe de correspondance, de l'électrodynamique classique au problème du rayonnement. C'est aussi de là que partent, pour traiter ce problème, les nouvelles méthodes de la théorie quantique, se basant sur les considérations primitives de Heisenberg. En particulier, Klein a récemment donné7, en s'appuyant sur le principe de correspondance, une analyse instructive de l'application de la méthode de Schrodinger au problème considéré. Dirac* traite la question d'une manière plus approfondie en considérant au contraire le champ de rayonnement comme une partie d'un système total isolé. De catte façon, on peut tenir compte logiquement du caractère lndivlduel des processus de rayonnement, exigé par la théorie quantique, et édifier une théorie de la dispersion qui comprenne la largeur finie des lignes spectrales. Cette théorie, où l'on renonce dans une large mesure aux images spatio-temporelles, offre un exemple frappant du caractère nécessairement complémentaire de la description quantique. Ceci est en relation étroite avec les points essentiels par lesquels les phénomènes de rayonnement s'écartent de la description causale : ces divergences, comme nous l'avons vu, se résument dans le fait que, pour l'émission des lignes spectrales, les atomes ont généralement à choisir entre différents processus de transition possibles. Si l'on observe que, d'après le principe de correspondance, les propriétés des atomes doivent se raccorder asymptotiquement à l'électrodynamique classique, on serait tenté de voir une difficulté dans l'exclusion mutuelle du concept d'état stationnaire et de la description du comportement des particules individuelles de l'atome. Car cette concordance asymptotique signifie que dans le domaine des grands nombres quantiques, où la différence relative entre états stationnaires successifs disparait à la limite, on peut rendre compte du comportement des électrons à l'aide d'images mécaniques. Mais il ne s'agit là en aucune façon d'un passage graduel à la théorie classique, au cours duquel le postulat quantique deviendrait peu à peu Superflu ; au contraire, les conclusions que l'on peut tirer du principe de correspondance à l'aide des images classiques s'obtiennent précisément en conservant même à cette limite le concept d'état stationnaire et les processus individuels de transition. ,Sur cette question, les nouvelles méthodes ont fourni des éclaircissements intéressants. Schr6dingerg a montré que, dans le domaine considéré, on peut construire, par une superposition d'oscillations propres, un groupe d'ondes dont l'extension est faible visà-vis des '' dimensions '' de l'atome, e t dont la propagation devient aussi proche qu'on le veut de la représentation classique du mouvement d'une particule matérielle, lorsque les nombres quantiques sont suffisamment grands. Dans le cas particulier d'un oscillateur harmonique, il a même pu montrer que l'extension de ce groupe d'ondes ne se modifie pas au cours du temps e t qu'il est animé d'un mouvement de va-et-vient correspondant à
' '
6.Proc. Camb. Phil. Soc. (1924) (Supplement), ou Zeits. f . Phys. 13, 117
(1923). Zeits. f. Phys. 41,707 (1927). a Proc. Roy. Soc., A114,243 (1927). Natumis.,
14,664 (1926).
Sources et évolution de la physique quantique
150
l'image classique d'une vibration. C'est précisément sur cette remarque que Schrodinger a fondé l'espoir d'édifier une théorie purement ondulatoire de la matière sans utiliser le postulat quantlque. Mais, comme Heisenberg l'a exposé en détail, la simplicité du cas de l'oscillateur constitue une exception qui tient à la nature purement harmonique du mouvement classique correspondant. De plus, d'après la nature même de la question, il ne s'agit pas du tout d'un passage graduel au mouvement d'une particule. Dans le cas général, le groupe d'ondes s'étale peu à peu dans tout le domaine de i'atome, de sorte que le mouvement d'un électron ne peut être suivi que pendant un nombre de révolutions du même ordre de grandeur que les nombres quantiques attribués aux oscillations propres. Cette question a été étudiée en détail dans un récent travail de Darwin", qui renferme un grand nombre d'exemples Instructifs du comportement des groupes d'ondes. Kennard" a traité des problèmes analogues au point de vue de la théorie des matrices. Ici encore, nous nous heurtons donc à cet antagonisme, que nous avions déjà observé dans le cas des particules libres, entre le principe de superposition des ondes et l'hypothèse de l'individualité des particules. En même temps, la concordance asymptotique avec la théorie classique, qui ne connaït aucune différence de principe entre particules libres et particules iiées, Illustre d'une manière très simple les considérations précédentes sur l'emploi non contradictoire du concept d'état stationnaire. Comme on l'a vu, si l'on veut déceler la présence d'un atome dans un état stationnaire déterminé, on introduit dans la description temporelle une indétermination de l'ordre de grandeur des périodes qui correspondent aux processus de transition entre les états stationnaires considérés. Or, dans le domaine des grands nombres quantiques, ces périodes peuvent précisément s'interpréter comme des périodes de révolution et nous voyons donc que, même dans ce cas, il est impossible d'établir une relation causale entre des observations qui permettent de déceler un état stationnaire déterminé et des observations antérieures sur le comportement des particules individuelles de l'atome. En résumé, on peut dire que, dans leur domaine d'application, les concepts d'état stationnaire et de processus individuel de transition possedent autant de réalltë, ou aussi peu. que les particules indivlduelles elles-mêmes. Dans un cas comme dans l'autre, il s'agit d'une expression du principe de causalité, complémentaire à la description spatiotemporelle, et dont l'emploi logique n'est limité que par les possibilltés de définition des concepts considérés.
7. Le problème des particules élémentaires - Si l'on tient compte du caractere de complémentarité exigé par le postulat quantique, les méthodes symboliques paraissent vraiment fournir une description non contradictoire des phénomènes atomiques, qui peut être regardée comme une généralisation naturelle de la description causale et spatiotemporelle ordinaire. Toutefois, ceci ne veut pas dire que ia théorie classique des électrons peut être considérée simplement comme un cas limite correspondant à une valeur infiniment petite du quantum d'action. En effet, ia description des faits expérimentaux que cherche à donner la théorie des électrons repose sur des hypothèses qui ne peuvent être séparées de l'ensemble des problèmes de la théorie quantique : c'est ce que montre déjà la difficulté de concilier l'individualité des partlcules électriques élémentaires lo
Proc. Roy. Soc., A117. 258 (1927). ieits.
r.
Phys. 47, 326 (1927).
La construction de la nouvelle mécanique
151
et les principes de la mécanique et de l'électrodynamique ordinaires. Dans cet ordre d'idées, la théorie de la gravitation,. telle qu'elle est formulée dans la théorie de la relativité générale, n'a pas répondu davantage aux espérances qu'on avait fondées sur elle. Une solution satisfaisante de ces questions ne peut sans doute venir que d'une modification rationnelle de l'interprétation de la théorie générale des champs, dans laquelle le quantum élémentaire d'électricité aurait trouvé sa place naturelle comme expression de I'lndivldualité caractérlstlque de la théorie quantique. Récemment, Klein a attiré l'attention sur la possibilité de rattacher ce problème à la représentation unitaire de l'électromagnétisme et de la gravitation dans l'univers à cinq dimensions introduit par Kaluza ; dans cette théorie. en effet, la conservation de l'électricité prend une forme analogue à celle de la conservation de l'énergie et de l'impulsion. Ces derniers concepts fournissent une description des phénomènes atomiques complémentaire à la description spatio-temporelle. De même, dans la théorie de Klein, puisque la charge électrique se présente toujours comme un quantum élémentaire bien défini, la cinquième dimension, qui lui est conjuguée, n'entre pas directement dans l'interprétation des faits expérimentaux. C'est sur ce point que reposeraient essentiellement la commodité de la description ordinaire à quatre dimensions ainsi que son utilisation symbolique dans la théorie des quanta. Abstraction faite de ces problèmes importants, encore sans solution, la théorie classique des électrons a joué un role fondamental dans les perfectionnements apportés tout récemment à la description des phénomènes basés sur le principe de correspondance. Ces perfectionnements résultent surtout de l'idée, émise pour la première fois par Compton, d'attribuer aux particules él&nentaires, en plus de leur masse et de leur charge, un moment magnétique, provenant lui-même d'un moment d'impulsion dont la valeur est déterminée par le quantum d'action. Cette hypothèse a été introduite avec succès par Goudsmit et Uhlenbeck dans la discussion de l'effet Zeeman anormal. Heisenberg et Jordan entre autres, ont montré qu'elle restait tout aussi féconde dans les nouvelles théories. On peut meme dire que I ' h y p o t h b de l'électron magnétique -jointe à l'analyse. due à Hei~enberg'~ , du phénomène de résonance qui se présente dans la description quantique des atomes à plusieurs électrons - a permis de parachever l'interprétation des spectres et des régularités du système périodique conformément au principe de correspondance. Les caractères fondamentaux de cette interpretation ont meme ouvert la voie à la découverte de certaines propriétés des noyaux atomiques. Ainsi, Dennison est parvenu ré~emment'~. en partant de certaines idées d'Heisenberg et de Hund, à surmonter les difficultés qui s'opposaient jusqu'ici à l'explication des variations de la chaleur spécifique de l'hydrogène aux basses températures : il suffit d'admettre que le proton possède aussi un moment d'impulsion, égal celui de l'électron. En raison de sa masse PIUS grande, il faut d'ailleurs attribuer au proton un moment magnétique beaucoup plus petit que celui de l'électron. Dans ces questions, l'insuffisance des méthodes existantes vis-à-vis du problème des partlcules élémentaires apparait dans leur inaptitude à fournir une justification univoque du '' principe d'exclusion " établi par Paull, qui révèle une dlfférence si caractéristique entre les particules électriques élémentaires et les " individus " symbolisés par l'idée l2
Zeits. f. Phys. 46,188 (1927).
l3 Zeits. f. Phys. l4
41,239 (1927).
Proc. Roy. Soc., A115,483 (1927).
152
Sources et évolution de la physique quantique
de photon. En effet, ce principe, dont les conséquences sont si importantes pour le problème de la constitution des atomes ainsi que pour le récent développement des théories statistiques. ne se présente que comme une possibilité parmi plusieurs autres imaginables, qui satisfont toutes au principe de correspondance. D'autre part le problème de l'électron magnétique nous offre un exemple particulièrement instructif de la difficulté que l'on éprouve dans la théorie quantique à satisfaire au principe de relativité. Thomas a montré qu'il était essentiel de tenir compte de la cinématique relativiste pour expliquer les résultats expérimentaux ; e t jusqu'ici ses observations n'avaient pu trouver place dans les w a i s si encourageants de généralisation des méthodes quantiques, que Darwin et Pauli avaient proposés pour traiter l a question. Mais Dirac vient d'attaquer avec succès'5 le problème de l'électron magnétique grâce à une nouvelle extension, fort ingénieuse. de la méthode symbolique ; II est ainsi parvenu à rendre compte de tous les détails des phénomènes spectraux qui en dépendent, tout en satisfaisant au principe de relativité. L e procédé de Dirac ne présente pas seulement, comme les preédents, une complexité caractérisée par l'emploi de grandeurs imaginaires ; mais de plus, il introduit dans les équations fondamentales elles-mêmes des groupes de nombres d'une complexité encore plus grande. D'après sa nature même, l'énoncé du principe de relativité suppose déjà l'union de la coordination spatio-temporelle e t du principe de causalité particulière aux théories classiques. Si l'on essaie d'adapter logiquement le principe de relativité au postulat quantique, il faut donc s'attendre à devoir renoncer à l'emploi des formes ordinaires d'intuitiog plus encore que dans les méthodes quantiques discutées ici. Nous avançons ainsi dans la voie suivie par Einstein : adapter graduellement les formes d'intuition dérivées des perceptions sensorielles à une connaissance des lois naturelles peu à peu approfondie. La principale difficulté que nous rencontrons dans cette voie provient de ce que, somme toute, chaque m o t de notre langue dépend de ces formes d'intuition. Dans la théorie quantique, nous nous heurtons à cette difficulté dès que nous VOUlOnS exprimer le caractère nécessairement irrationnel du postulat quantique. J'espère toutefois que le concept de complémentarité contribuera à élucider les difficultés actuelles, qui présentent une analogie si profonde avec les difficultés d'ordre général, résultant de la nécessité de faire une distinction entre sujet e t objet dans la formation des concepts humains.
l5 Proc. Roy. Soc..
A117,483(1927) [Article XV page 1941.
Article X I V
Le problème de la mesure en physique La théorie de l'observation en mécanique quantique F.LONDONet E. BAUER Exposés de Physique Générale III, 1-51, Hermann, Paris (1939)
introduction On sait que la physique théorique s'est transformée depuis le début de ce siècle en une doctrine essentiellement statistique et que c'est la découverte des quanta qui a rendu cette révolution inévitable. L'objet principal de cette étude sera l'interprétation statistique du formalisme de la théorie quantique. Bien que ces questions d'interprétation fussent déjà réglées il y a environ dix ans', on rencontre encore souvent des idées assez vagues sur le sens de l'apparition des probabilités dans la physique moderne. D'après certains, ce caractère statistique serait un symptôme de ce que notre connaissance des lois atomiques est encore jncomplète : il resterait à trouver des paramètres cachés, determinant les processus que, provisoirement, nous nous contentons de décrire en langage statistique. A les en croire, on pourrait espérer réussir quelque jour a refondre la théorie dans un moule détermin'kte. D'autres comprennent que c'est /'action de /'observateur qui est en jeu. Ils pensent parfois que celle-ci serait une action causale, mais incomplètement connue, parce qu'on ne sait jamais exactement dans quel état se trouve l'observateur. De là résulterait la dispersion statistique des mesures. dont il serait peut-être possible de prévoir les résultats exacts, si l'on pouvait mieux tenir compte de l'intervention de l'observateur. On a dit aussi que la loi de causalitéserait peut-être valable mais inapplicable, parce qu'il n'y aurait aucun moyen de reproCuire deux fois les conditions identiques. La discussion de ces questions n'est point un objet de speculation, c'est un problème positif, qu'on doit traiter en appliquant la théorie quantique au processus même de mesure, sur lequel elle fournit des précisions essentielles. On peut se convaincre que les distributions statistiques, telles qu'elles sont données par la mécanique qUantiqUe et confirmees par l'expérience, ont une structure telle qu'elles ne peuvent pas être réduites W. Heisenberg, Zeit. f. Phys., 43 1927 ; J.V. Neumann, GBttinger Nachrichten. 1927; P.A.M. Dirac, Proc. ROK Soc. A 113 1927.
Sources et évolution de la physique quantique
154
à l'aide de paramètres cachés. II ne s'agit pas, comme on l'a souvent prétendu, d'une question d'interprétation philosophique : la mécanique quantique devrait être fausse objectivement, si les processus atomiques étaient déterminés en réalité et seulement connus incomplètement. En effet il faudrait changer foncièrement la théorie et en abandonner des résultats assurés si l'on voulait la ramener a une base déterministe. La causalité n'est plus applicable, il est vrai ; mais la raison de ce fait n'est pas une Imposslbillté éventuelle de reprodulre identlquement les conditions d'une expérience. C'est essentiellement que la séparation de l'objet et de l'observateur présente des difficultés. C'est un trait assez général de la physique moderne que souvent ses conquetes ne sont obtenues que par le sacrifice de certaines de nos convictions philosophiques traditionnelles. L e cas de la mécanique quantique est particulièrement instructif. On a cherché en toute innocence à construire une théorie ne contenant que des relations entre les grandeUK '' observables " de la théorie de Bohr, notamment les fréquences et les intensite des raies spectrales. Heisenberg y parvint et réussit ainsi à obtenir un formalisme qui résolvait ce problème. Mais comme il arrive en physique théorique, le formallsmede la théorie une fois établi portait plus loin qu'on ne s'y attendait. II impliquait plus de relations que ses fondateurs n'en avaient mises explicitement, relations entre des grandeurs tout â fait anodines, observables elles aussi (coordonnées, impulsions, etc.). O n f u t conduit ainsi tout naturellement à chercher a p r b coup à interpréter ces relations qui découlaient automatiquement de la théorie. C'est ainsi que la discussion de ce formalisme nous apprit que le point de départ philosophique apparent de l a théorie, l'idée d'un monde observable, totalement indépendant de l'observateur, était une idée vide. Sans avoir eu l'intention d'aborder une théorie de la connaSance, bien qu'ils fussent même guidés par une philosophie assez contestable, les physiciens furent entraÏnés, pour ainsi dire, malgré eux à découvrir que le formalisme de la mécanique quantique implique déjà une théorie bien définie de la relation entre l'objet et l'observateur, relation bien différente de ce réalisme naïf, qui semblait jusqu'alors une des bases necessaires de toute science de la nature. Pour la discussion de l'acte de mesure il est nécessaire de considérer au moins deux systèmes. l'observateur et l'objet. II nous faudra donc appliquer la théorie quantique d'un système de plusieurs corps. Celle-cl n'existe à présent que dans l'approximation non relativiste. Nous serons donc forcés de nous borner 3 cette approximation qui néglige encore tous les M e t s des retards de propagation. II ne peut pas s'agir ici de donner une introduction détaillée à la mkanique quantique. Nous nous bornerons (1. et 2.) à rappeler brièvement, sous une forme un peu dogmatique, les définitions et les lois fondamentales dont nous aurons besoin2.
1. Résumé des principes de la physique quantique L'emploi de conceptions statistiques en physique atomique est beaucoup plus ancien que la mécanique ondulatoire. Le premier pas en ce sens a peut-être été fait au moment où
'
Pour un exposé plus détaillé de la théorie de quanta. voir par exemple : L. de Broglie. Introduction à l'étude de la meanigue ondulatoire. Paris, 1930 : E. Bloch, L'ancienne et la nouvelle TheOrie des Quanta. Pads, 1930 ; E.C. Kemble. Quantum Mechanics. New York, 1937 : 5 . Dushman, The elements o f Quantum Mechanics. London, 1938.
La construction de la nouvelle mécanique
155
l'on décrivit par des lois de probabilité les décompositions radioactives spontanées. Bien entendu, on a pensé d'abord qu?l s'agissait d'un état de choses provisoire provenant de notre ignorance de ce qui se passe à l'intérieur des noyaux. Mais quand Bohr, évidemment guidé par une analogie avec ces conceptions statistiques, construisit son modèle d'atome avec ses sauts quantiques spontanés, e t surtout quand Einstein établit sa démonstration célèbre de la loi fondamentale du rayonnement de Planck en prenant pour base l'idée de probabilités élémentaires de transition spontanée ou forcée (coefficients de probabilité A e t B ) , on eut déjà le sentiment net que ces probabilit6s devraient Etre quelque chose de fondamental et d'irréductible. Dans un monde de phénomènes discontinus, l'apparition d'une forme statistique des lois élémentaires semblait presque inevitable. La théorie de Bohr, bien qu'elle ne fournit pas encore un schème mathématique complet et cohérent, permettait déjà de poser les questions principales auxquelles devait répondre plus tard la théorie quantique : Dans une physique concernant des grandeurs dont les domaines de variation ne sont pas nécessairement continus il s'agit de savoir : 1. Quelles sont les valeurs possibles d'une grandeur physique 7
2. Avec quelles probabilités sont-elles réalisées dans un système e t dans des circonstances donnés ?
L a mecanique quantique nous fournit un schéma précis qui permet de traiter de façon quantitative les questions de ce genre. Nous pouvons le résumer de la manière suivante : " L'état " d'un système, donné en mécanique classique à chaque instant t par les 2f valeurs des variables ql(t),q*(t)...q1( t ) , P l ( t ) , p z ( t ) ...pf( t), est représenté en mécanique quantique par une fonction complexe des f variables QI,qz q j e t de t, la '' fonction d'onde de Schrodinger "
...
qui est normée de telle manière que' :
L'évolution du système dans le temps est réglée en mécanique classique par une "fonction hamiltonienne " H ( q , p ) caractéristique du système en question. Cette fonction des coordonnées QI, B.. q j e t des impulsions p 1 , ~ . p f , qui n'est autre que l'énergie, permet d'écrire les équations hamiitoniennes du mouvement. C'est essentiellement' la même fonction B ( q , p ) qui en mécanique quantique aussi donne l a loi d'évolution du
.
.
a (q, *,> en remplacant && et q k par l'opération de
représentant tl, de l'état du système : on forme l'opérateur p k dans I'hamiltonien par l'opérateur de différenciation
multlplication par qk. II s'introduit ici une certaine ambiguïté en ce qui concerne l'ordre des facteurs, parce que ias opérations q k e t ne sont pas comrnutables. II nous sufiira
&
~~
~~
Dans ce qui suit les intégrales j d q sont toujours prises sur tout i'espace des configurations pl, 6.. . q j e t $* est la valeur complexe conjuguée de
'
+.
Complétée par un terme
se rapportant au
spin 'I.
Sources et évolution de la physique quantique
156
de savoir qu'il y a des prescriptions suffisantes en général pour déterminer univoquement l'ordre des opérateurs, mais nous ne nOUS occuperons pas ici de ce détail. L'opérateur
a (q, A&),une fois donné, nous Permet d'écrire l'équation d'évolution :
Cette équation, découverte par Schradinger, a la propriété importante de lav& ser invariante i'intégraie J$tp'dq, ce qui est nécessaire pour que notre normalisation $$*dq = 1soit possible. Donc 4, une fois norme. garde pour toujours sa normalisation. $(q, t o ) représente un " état " du système à un instant t o . Nous prenons ici ce mot dans un sens tout à fait analogue à Celui qu'il a en mécanique classique où l'on dit que les données q I ( t 0 ) . q f ( t o ) , p i ( t o ) . pf(t0) " représentent un état La connaissance du représentant de l'état 2 un instant donné est nécessaire e t sufisante pour calculer de façon univoque, à l'aide de la loi dynamique, le représentant de l'état en chaque instant ultérieur. Nous ne pouvons pas nous passer d'une partie de ces données sans perdre la possibilité de calculer l'avenir. Nous ne pouvons pas non plus y ajouter de données supplémentaires sans introduire des tautologies inutiles ou des contradictions aux données dejà rassemblées. Les €tats stationnaires de Bohr correspondent à des solutions particuliers de I'équation de Schrodinger, solutions purement périodiques dans le temps et de la forme complexe :
I
..
..
' I .
rl, = e Y E f . u(q1 Par suite de (1) et (2). 1'" amplitude du temps
"
(3)
u(q) obéit à une équation qui ne dépend pas
:
[H,u]=E.u
(4)
et à la condition de normalisation :
I
uu*dq = 1
(5)
Ce couple d'équations (4) et (5) n'a pas en général de solution pour toute valeur de
E. IIreprésente un problème aux valeurs propres ". C'est seulement pour un '' spectre de valeurs particulières El,&,& ... pouvant contenir aussi des intervalles continus5, que la condition (5) peut être remplie. Pour les autres valeurs de E t'équation Ilnéaire "
I'
u contenant un facteur arbitraire ; mais elles ne sont pas de carré sommable, ce qui rend la normalisation (5) impossible. Les valeurs a d m i w (4) a naturellement aussi des solutions
E l , &...Et...
'
Au cas d'un spectre continu la condition (5) devrait être imposee 2 une fonction u adjointe à un petit intervalle d d du continu (" différentielles propres "). Dans ce qui
suit, nous ne tiendrons pas compte de ces subtilités, qui ne touchent que des questions de pure forme, et nous écrirons toutes les formules comme s'il n'y avait que des spectres discontinus.
La construction de la nouvelle mécanique
157
sont appelées les " valeurs propres " de l'opérateur H. Les solutions correspondantes u sont appelées " fonctions propr,es " e t désignées par des indices correspondants
Ce fut l'idée fondamentale de Schrodinger d'identifier les spectres des valeurs propres les dimensions d'une énergie, aux valeurs permises de l'énergie dans la théorie de Bohr et l'on sait le succès de cette idée ingénieuse. O n sait aussi que les fondateurs de la mécanique ondulatoire ont été d'abord guidés par la conviction qu'il fallait se débarrasser des discontinuit&, ou plutôt les fonder sur une substructure essentiellement continue, sur une théorie de champ, et bouleverser ainsi l'image foncièrement statistique de Bohr e t d'Einstein. Mais ce programme ne s'est pas montré réalisable. L'interprétation statistique de la mécanique ondulatoire peut être considérée comme une tentative particulierement conservatrice pour maintenir l'image de Bohr et d'Einstein et l'encadrer en un système théorique cohérent. Maintenant que nous savons interpréter les solutions monochromatiques de l'équation d'onde (2) telles que
E,, & ..., qui ont
$ =e F E k i .
Uk(4)
comme représentant les états possédant l'énergie E k , il nous faut apprendre quelle est la signification des solutions plus générales. On peut montrer que, si l'on se borne aux fonctions de carré sommable (1). la solution la plus générale de l'équation ( 2 ) , s'écrit
où les Ck sont des constantes complexes. C'est Born qui, en répondant à cette question, posa les fondements de l'interprétation statistique de la théorie : il admit que la grandeur Ick12 donne la probabilité de trouver
+ zk
ia valeur d e l'énergie, lorsque ie système dans l'état = ckevEki soumis à une mesure de cette énergie. SI nous introduisons l'abréviation + k = c k e Y E k * , nous pouvons écrire
u k ( q ) est
es coemcients +k ne dépendent que du temps, et, comme 1tjk1' = Ick12. nous pouvons interpreter aussi la grandeur I$k(t)12 comme ia probabilité de trouver dans i'état rl, la valeur E k de l'énergie. Les c o d d e n t s G k peuvent d'ailleurs être calculés très facilement à l'aide des deux propriétés fondamentales des fonctions propres : 1. être " orthogonales " :
]
Uk*u- W f 4 d s’annule :
D’où résulte aussi :
=
*f*f
f
/ *3’4
= 1.
C’est-à-dlre que la somme des probabilités de trouver n’importe quelle valeur de l’énergie art l’unlté ; si nous cherchons quelle est l’énergie, nous pouvons être assures d’en trouver toujours une valeur. Bien entendu, Il faut qu’Il en soit ainsi pour que les definitions de Born aient un sens. Alnsl nous voyons comment, pour l’énergie au moins, la théorie quantique répond aux deux questions qui se posaient * à toute théorle du discontinu : 1. Les valeurs possibles de l’énergie sont les valeurs propres &,&,E3 de i’opérateur
iï (g, &F8 ,
...
.
2. La probabilité de trouver dans l’état, représenté par
$J, la valeur
de i’énergie
est donnée par
oh
u& est la fonction propre de l’énergie
pour une valeur propre &.
En particulier, si par hasard l’état est représenté par une fonction propre de l’énergie, C’&-%dln $1
41, = uk, voir P 157
159
La construction de la nouvelle mécanique
l'équation (IO) donne les probabilités 1 pour la valeur E, e t O pour toute autre valeur. Dans la théorie primitive de Bohr on s'était préoccupé surtout de I'energie. Cependant dans notre formalisme actuel l'énergie ne joue un role singulier que pour 1'6volutlon dans ie temps d'un état r e p r h n t é par sa fonction 16 (équation (2)). Si $ est donné à un certain instant, nous pouvons chercher aussi des prévisions statlstiques concernant à cet instant une grandeur F(q,p) quelconque. La généralisation de nos délinitions à d'autres grandeurs F (q, p ) (comme par exemple zp, ypS, qp., etc.) est tout indiquée :
-
Nous formons i'opérateur F (q,
-,njq)
et detinissons à i'aide des équations du
problème propre
... ...
les valeurs propres fi, fi f,, de i'opérateur F et les fonctions propres correspondantes v i l v2.. u p . , Les mathématiciens ont montré que ces dernières forment, elles aussi, sous des conditlons suffisamment larges, un S y S t h e complet de fonctions orthogonales, C'est-à-dire que nous avons les relations
.
.
I
v,,v;dq = sw
(12)
e t que nous pouvons développer la fonction 16 à un moment donné t o en série convergente de ces fonctions up :
Il(%
to) =
c
4,,(tO)V,,(P)
C
Ob
+,,(to) = /4(P,to)v;(od* L a généralisation de nos définitions antérieures est immédiate : 1. Les valeurs posriblcs de la grandeur F sont données par les valeurs propres
,
fi fi..
4)
.f,,...de i'opérateur F q,* ; -.
(
2. L a probabilité de trouver dans i'état r e p r h n t é par
16 la valeur f,,de la grandeur
F(q,p) est donn6e par
P r o w , , ) =I
1
16(at.)+?)dq
12=1
$,
I2
(13)
En particulier, si par hasard l'état est reprCHnté par une fonction propre Y,,de c'est-à-dire si
f,
16 = vp on obtient la probabilité 1 de trouver ia valeur valeur la probabilité O.
f,,de
la grandeur F e t pour toute autre
Sources et éuolution de la physique quantique
160
De ces définitions résulte immédiatement la valeur moyenne de
F
dans /'&at
4
:
Cette expression peut ëtre écrite sous une forme p l u commode, qui permet de calculer immédiatement la moyenne, sans qu'il soit nécessaire de recourir à un calcul explicite des valeurs propres individuelles f p e t à un développement de 4 en série des vp. O n vérifie aisément que
MoydF) =
/ 4'[F41dq
(14')
car, par suite de (11) e t (12). cette expresslon s'écrit :
2.
N o t a t i o n vectorielle
Nos définitions sont maintenant complètes. II nous reste seulement à introduire une notation un peu plus commode, celle du langage vectoriel. Vecteurs Nous dirons que l a fonction $(q), représentant l'état instantané d'un système, est un vecteur " dans un espace à un nombre infini de dimensions, l'espace fonctionnel de Hilbert. L'intégrale du produit des deux fonctions $* e t 4 prise sur toutes les coordonnées q1, q2 qf sera appelé le " produit scalaire de $ e t " :
-
...
I#I
E, vecteur. propres v i , y ...vp... d'un opérateur F satisfont à la relation (1..
La grandeur ($,$) = S$*$dq = I IPp 1' sera le c a r e de la longueur du (q,4) = 0 signifie que les vecteurs $ e t 4 sont " orthogonaux 'I.
Les fonctions
eq(12))
:
Elles forment donc un systêrne de vecteuriunités orthogonaux qui définissent un système de coordonn6es orthogonales où l'on peut représenter un vecteur
sous la forme
4(n)= C+P% P
Les composantes $p du vecteur
$ sont
définies par la
"
projection
"
4 quelconque
La construction de la nouvelle mécanique
de
161
$ en direction du vecteur vp.
Cette décomposition en composantes est tout à fait analogue à celle d’un vecteur dans l’espace ordinaire. Nous pouvons considérer l’ensemble des $, comme équivalent à la fonction $(q) elle-meme ; c’est une décornposition particulière du vecteur $ en composantes orthogonales. Les coeflicients
donneraient une décomposition analogue du même vecteur suivant un autre système d‘axes orthogonaux Ui,U2.. Uk La représentation de $ par lui-même, c’est-à-dire la fonction 11>(q), peut être considérée comme un cas special de représentation en composantes orthogonales, à savoir à l’aide du système orthogonal de fonctions propres de l’opérateur particulier F = q. Le problème aux valeurs propres de cet opérateur s’écrit :
.
...
q.vu(q) = qa.va(q)
Ses solutions sont les fonctions
”
(q
ou
-qu).47) =0
limites ” de Dirac
vu(q) = 4 2 qui sont par définition égales à O pour q
# qa
-
mais telles que
jS(q-~u)dP=l. En terme de ces fonctions propres particulières, on obtient pour $(q) le développement banal :
=
c
$(nu)a(B
- qu)
U
où $(qa) = J$(q)6(q
- qa)dq sont les coefficients du développement.
De nos définitions générales r h u l t e donc en particulier :
I $(q) 1’
dq = Probabilité de trouver q dans l’intervalle [q, q
Tenseurs - Dans cette image, les opérateurs F
(
q,
L8,)
--
+ dq].
, représentant les gran-
deurs physiques, sont des tenseurs, c’est-à-dire des transformations linéaires des vecteurs : appliqués à un vecteur 3, ils le transforment en un autre vecteur $‘ = [F$].ils sont linPaires parce que, pour toutes les combinaisons de différentiations et de multiplications, on a toujours la relation distributive :
et que, pour toute constante e, on a :
Sources et évolution de la physique quantique
162
Comme ils représentent des grandeurs physiques réelles (non complexes), ils ont encore une autre propriété importante :
(4, F$)=
($9
F99* *
(3)
Ce sont des opérateurs du type hermitien. L a relatlon (3) se démontre aidment par intégratlon par parties, en tenant compte du f a i t que chaque différentiation contenue dans
F
apporte un facteur
i et
que
F,considérée comme fonction de p e t
-a est 2*i aq I
une fonction réelle. si nous utilisons pour la représentation par les $k, c'est-à-dire si nous nous référons au système de coordonnées u1 u 2 . . . U t . . il faut décomposer aussi l'opérateur F en composantes suivant ces mêmes coordonnées, d'où résulte évidemment la transformation linéaire eRectuée par la matrice
4
,
..
En effet si l'on applique cette transformation à un vecteur $1
on obtient la composante d'indice k de la fonction De (3) résulte immédiatement la relation
[F$].
.
des " matrices bermitiennes " II y a un système de coordonnées, dans lequel la matrice representant l'opérateur F montre une forme particulièrement simple. Ce sont les coordonnées définies par les fonctions propres v i . . .Y,, de cet opérateur lui-meme. Pour celles-ci l'on obtient :
...
Dans ces coordonnées
"
propres
", la matrice F
prend donc la forme diagonale e t
ses éléments diagonaux sont les valeurs propres de F :
F, =
fi
O
O
f2
O O
O O
......
...... O O f3 O ...... O O O f4 ...... ..................
Dans le système de coordonnées $J , relatif à un développement de q$ en &rie des fonctions propres VI u p . . d'un opérateur quelconque F,I'opdrateur hamiltonien H prend la forme H , = (vp, a v , ) et I'équatlon de Schrminger s'&rit :
...
.
La construction de la nouvelle mécanique
163
forme discontinue sous laquelle Heisenberg. Born e t JorUan ont trouvé tout d'abord les équations de la mtkanique quantique.
-
.
Invariants. R6servons les grandes lettres H , F . . pour les tenseurs, les lettres grecques $,cp,. pour les vecteurs ; nous pourrons alors supprimer 1- indices (ou arguments) caractéristiques d'une décomposition particulière en composantes et écrire (7) sous forme invariante, indépendante du système de coordonnées, ou plutbt comprenant tous les systèmes possibles (cf.éq.(2) $1) :
..
h
I?$=-$.
2iri
Deux repr&ntations
et
différentes d'un même vecteur
$,
rbP = ( y p , 3 ) sont liées entre elles par une transformation rbk
s k p $p
avec
skp
par exempte $k linéaire :
=(ut,
= ( U k , $)
rb)
(8)
P
En &et,
comme
$=
skp
vp (vp +), on a :
P
Pour les coefficients
-
OQ s k p
Skp,on
obtient facilement tes relations :
= spk.
Ces relations caradérlsent la transformation (8) comme une t r a n s f o m a t l m taire
".
" un&
Deux représentationsdifférentes du même tenseur F , par exemple F k r = ( U k , Fui) e t Fw = (up, Fu,). sont liées entre elles comme on le vkrme aisément. par les relations :
En f l e t . c o m m U k
=
vp (vp U k ) = P
S o h p vp. on
P
a
Sources et évolution de la physique quantique
164
es valeurs numériques ayant une signiflcation physique doivent naturellement €tre des salaires invariants par rapport à ces transformations unitaires. Les seuls scalaires invariants que nous rencontrerons sont le " produit scalaire " de deux vecteurs $ et 9 :
e t la
"
trace
"
d'un tenseur
Ri :
Ainsi par exemple la valeur moyenne d'une grandeur F dans l'état forme invariante par un produit scalaire
est donnée sous
Les autres données de la théorie pourront s'écrire aussi de manière invariante. Nous. y reviendrons au
$5.
L e produit scalaire peut aussi être considéré comme la trace d'une matrice particuiière ($ x Q) définie par :
('b et qu'on appelle le
3.
"
produit direct
"
= #JEQP
x '+')Lo
des vecteurs
(10)
$ et y.
Statistique e t objectivité
Déjà dans le mémoire classique' où il posa les premières bases.de l'interprétation statistique de la mécanique des quanta, Born remarqua que les probabilités qu'il y introduisait devaient avoir un caractère assez étrange et très différent de ce que l'on entend en générai lorsqu'on parle de probabilités. C'est ce qu'il exprima sous une forme un peu paradaxale : " Bien que les mouvements des particules ne soient détermine que par des probabilités. ces probabilités memes Ce qu'il entend ici par '' loi causale ", c'est évoluent conformément à une loi causale une connexion entre des " états I' à différents instants, telle que la connaissance d'un état initlal à un instant quelconque implique univoquement la connaissance de l'état à t o u t instant ultérieur. Un " état ", d'autre part, c'est une collection bien définie de données relatives au système en question. à un instant donné. II n'y a natureliement aucun moyen de prévoir a priorisi, dans un certain domaine des sciences, il existe des lois causales ainsi définies e t quelles sont les données nécessaires et suffisantes pour les constituer. Si l'on n'aboutit pas à des prévisions univoques, si l'on se voit forcé de se contenter de probabilités. cela peut provenir ou bien de ce que notre connaissance de " l'état " n'est pas encore complète, ou encore de ce qu'il n'y a
".
Zeit. f. Phys. 37,1926.
La construction de la nouvelle mécanique
165
pas de causalité. Mais, par contre, losqu'on a réussi à établir des lois causales, cela est évidemment un critérium du fait que l'on a atteint une connaissance complète de l'objet, dont on dispose ainsi. en quelque sorte, d'une description maximum. O r l'équation de Schrodinger présente tous les caractères d'une connexion causale : si la fonction $ est connue à un moment donné, elle est déterminée pour tout instant ultérieur. II semble donc difficile de concevoir que cette fonction contienne néanmoins une collection de statistiques. A première vue. il semble impossible d'éviter le dilemme suivant : 1. - O n pourrait concevoir que la fonction $ a le caractère d'une fonction de probabilités ordinaires telles qu'on en fait usage par exemple pour décrire le mouvement brownien : une fonction de ce type contient certaines prédictions statistiques. que nous pouvons vérifier. Nous constaterons alors laquelle des possibilités prévues théoriquement est réalisée en fait dans un cas donné. Après cette observation, nous sommes naturellement en droit de faire usage, pour des prédictions ultérieures, de ia connaissance ainsi obtenue et de rempiacer notre fonction de probabilités primitive par une fonction du même type, mais mieux adaptée. Cela n'est évidemment possible qu'en vertu de l'enrichissement de notre connaissance, toujours partielle. Bien entendu, nous ne prétendons pas que l'objet lui-même ait changé d'état par suite de notre observation. Seul a changé l'écart entre notre connaissance et l'objet. Dans ce cas la fonction $ représenterait donc i'état de notre connaissance partielle de l'objet et non i'état de l'objet lui-même. II.- Supposons par contre que la fonction $ ait un caractère '' objectif" comme, par exemple, les fonctions d'onde de l'optique. Elle prétend alors représenter, sous une forme idéaliee et simplifiée. quelque chose de complet. une image maximum de l'état de l'objet. peut Mais s'il en est ainsi, il semble difficile de comprendre comment cette fonction impliquer une statistique : si l'on soumet à un contrôle expérimental les prédictions qu'on en peut déduire et si l'on observe lequel est réalisé parmi les cas possibles - cas prévu par la théorie, mais seulement avec une certaine probabilité -, de quel droit pouvons-nous ajouter cette noueelle connaissance à notre conna'ksance antérieure prétendue complète ? C'est Heisenberg qui trouva la solution de ce dilemme. II remarqua que c'est le processus de mesure lui-mëme qui introduit l'élément d'incertitude sur l'état de l'objet. Ainsi l'élément statistique n'interviendrait qu'à l'occasion d'une mesure e t si la fonction $ nous fournit des probabilités. elle ne le fait qu'en vue d'une mesure éventuelle. Ce ne sont donc pour ainsi dire que des probabilités y p o t e n t i e I h qui entrent seulement en vigueur à l'occasion d'une mesure actuelle. Elles ne touchent pas la précision avec laquelle l'état du système est actuellement connu ; celle-ci est maximum lorsque la fonctlon $ est donnée. Blen entendu il peut arriver qu'il existe en outre une incertitude sur l'état du système. c'&-&dire sur la fonctlon (I elle-même. Dans ce cas il s'agit de probabiiita au sens ordinaire du m o t : elles proviennent d'une connaissance incomplète de l'état de l'objet ; il faut les distinguer clairement des probabilités potentielles fournies par les fonctions $.
Sources et évolution de la physique quantique
166
4. Mélanges e t cas purs
c'est par un exemple que l'on comprendra le mieux qu'Il s'agit ici d'une distinction essentielle : 1.
- Considérons d'abord le cas OU un systeme est représenté par une fonction d'onde t
...
.
où u1, uz ut.. sont par exemple les fonctions d'onde de l'énergie. Nous savons que la grandeur nous donne la probabilité de trouver la valeur Ek de l'énergie lorsque le système dans l'état 4 est soumis à une mesure de cette dernière.
-
II. On a souvent pens$ que ce cas correspond simplement à un ensemble virtuel de systèmes identiques en différents états possédant respectlvement les énergies El,&; &. chacun d'eux étant contenu dans l'ensemble avec les concentrations pk =
...
..,
1né de cetle conception u t clairement a p y u avec la théorie de la nlaiivité génémie Et il écrivit : y L’apérimce peut sugghrr w concepts mathématiquw ad+& mou ceuz-ci nepeuvmt en 2tn dlduits. L’apGence -te, natunll~ment le seul critk d’utilité ph nque des construction, mathématiques. Maw le pnncape mefatcur r&de dans lu mnthkatiqucs. Dans un certain aens je mainiiem donc comme mai que la pende pure eut saisir la réalité, comme le rivaient les Ancicns A. Einstein, Idcw and opinioru, p. 574, Souvenir Press, Londres, 1957.
.
.
De la mécanique quantique relativiste à la théorie quantique des champs
191
alors suffisante pour déterminer son état à un instant ultérieur, sans qu’il soit besoin de connaître la vitesse de changement de l’état à l’instant initiai. L’invariance relativiste exigeant de l’équati8n qu’elle soit aussi du premier ordre par rapport aux coordonnées spatiales, Dirac supposa dors pour l’équation de la fonction d’onde de l’électron l’expression50 :
+ où 7? et /3 sont quatre opérateurs, indépendants de z‘ et de P qui doivent décrire de nouveaux degrés de liberté de l’électron. De plus, le principe de correspondance exigeant que l’équation (4.3) reste valable, l’équation (4.6) doit impliquer l’équation (4.4) pour cette même fonction Q. Cela oblige les opérateurs Q I et B à satisfaire les règles d’anticommutation suivantes : (4.6a) Ce sont des matrices à quatre lignes et quatre c01onnes~~~ ce qui exige que la fonction Ql dans l’équation (4.6)’ ait quatre composantes. Cette équation prend donc la forme :
où la somme de 1 à 4 sur b est sous-entendue. Cette équation doit être invariante lors d’une transformation de Poincaré. Cette équation connut un grand succès. Le spin de l’électron, t h , en fut déduit, et sa description se ramène à celle donnée par Pauli dans la limite des faibles vitesses. Cette d e u r du spin signifie que sa composante sur un axe de coordonnées physiquement déterminé, par exemple par un champ magnétique, ne peut prendre que deux valeurs possibles, $ti ou -+fi. Ainsi un électron au repos ne peut se présenter qu’en deux états possibles, ceux qui correspondent à ces deux valeurs du moment angulaire propre. Ces états sont alors décrits par deux composantes de la fonction d’onde de Dirac (elles furent déjà introduites par Pauli en 1926). Si l’on prend les quatre équations (4.6b)’ on trouve que ce système admet quatre solutions, dont deux correspondent aux deux valeurs possibles du spin et possèdent une énergie positive :
7
E = + c2P +m2c4 les deux autres possédant une énergie négative :
P.A.M. Dirac, Pmc. Roy. Soc. A 117,341 (1928). P.A.M. Dirac, Proc. Roy. Soc. A 117, 610 (1928) [Article XV suivant] ; A 118, 341 (1928).
Sources et évolution de la physique quantique
192
Les solutions à énergie négative ne peuvent être ni ignorées, ni mathématiquement écartées. Elles constituent en effet, avec les solutions à énergie positive, un ensemble complet, une base, dans l’espace des solutions de l’équation (4.6). Et pourtant, un électron avec une énergie négative aurait une masse au repos négative : il se déplucerait, #ow Z’uction d’une force - y compris celle de la gravité - dans le sens contraire à celui des électrons ordinaires d’énergie positive. Dirac interpréta alors ces solutions en postulant que les électrons libres à énergie négative occupent tous les états correspondants, chaque état étant occupé par un électron en accord avec le principe de Pauli. Le vide serait alors défini comme la situation où aucun des états à énergie positive n’est occupé, alors que tous les états à énergie négative le sont, ceux-ci étant par definition inobservables. On voit aisément que l’absence d’un électron dans un état d’énergie négative - par transition à un état d’énergie positive où il devient observable en tant qu’électron - aura le même effet que l’apparition d’une particule observable d’énergie positive, mais de charge opposée à celle de l’électron ordinaire (voir la figure 4.1) (dans le vide, les grandeurs observables ont une valeur nulie).
0
O O
Energie
_ - -- - - - --
g. élec tron
observé
-------,--Clianip externe I
I
---C----moc2 O O
pliolon neutre
+ nlonie
O O
Q I vide) =O Figure 4.1
O
û(initiai)= û(finaI1 exige charge du ”trou”= charge de l’électroii
-
C’est ainsi que Dirac prédit l’existence de l’électron positif ou posiion ou antiéiectron (et non celle du proton comme il le pensa initialement), particule dont la découverte fut annoncée en 1932 par Carl Anderson et Seth Neddermayer, observant les rayons cosmiques, et fut confirmee par Patrick Blackett et Giuseppe Occhidini. Une telle transition, provoquée par exemple par un photon d’énergie supérieure à 2mccZdans le champ d’un atome, apparaît comme la création d’une paire éiectronpositon. Ainsi, le vide contient des paires virtuelles : c’est un système dynamique complexe, puisque la notion d’antimatière s’étend à toutes les particules de spin f, donc décrites par l’équation de Dirac. La présence d’un noyau d’atome ou d’un champ externe lors de la créatjon de paire et e- par un photon est nécessaire pour que la quantité de mouvement et l’énergie soient conservées dans cette transition. La transition inverse est l’annihilation d’un électron avec un anti-électron conduisant à
De la mécanique quantique relativiste à la théorie quantique des champs
193
l’émission d’un photon en présence d’un noyau, ou,en l’absence de champ externe, à l’émission d’au moins deux photons. Cette interprétation de l’état du vide où Dirac cachait les particules à énergie ‘négative donna lieu à l’époque à une controverse : Pauli remarquait, dans un séminaire donné dans les années 30 à l’Institut d’Etudes Avancées de Princeton, que le succès était plutôt du côté de Dirac que de celui de la logique. Mais Dirac vit confirmé le succès de sa théorie lorsque, grâce à elle, on obtint les énergies de l’atome d’hydrogène (dans sa structure hyperfine) précédemment calculées par Sommerfeld ; et lorsque la valeur mesurée du moment magnétique associé au spin de l’électron se trouva en accord presque parfait avec son équation relativiste, alors que la théorie non-relativiste développée par Pauli postuiait ce moment lors de son interaction avec un champ magnétique. Du point de vue mathématique, la fonction d’onde de Dirac à quatre composantes se transforme, lors d‘une transformation de Poincaré du système de coordonnées, de façon spécifique, différemment de celle d’un quadrivecteur. Elle constitue ce que l’on appelle un spineur relativiste ou spineur de Dirac. La notion de spineur, développée par plusieurs chercheurs parmi lesquels Elie Cartan, Hermann Weyl, B.L. van der Waerden, apparaît naturellement dans l’étude des représentations h i e s du groupe propre orthochrone de Poincaré (Eugene P. Wigner”). Le spineur de Dirac, à quatre composantes, peut être écrit, dans une représentation des matrices de Dirac appelée représentation de Weyl, comme une paire de spineurs à deux composantes, les spineun de Weyl. Dans une autre représentation des matrices de Dirac, où la matrice ,9 est diagonale, deux composantes du spineur de Dirac deviennent petites pour des vitesses de la particule petites par rapport à la vitesse de la lumière, les deux autres composantes restant finies obéissant à l’équation que Pauli avait proposée pour la description non-relativiste du spin de l’électron. Cette dernière équation est invariante par rapport au groupe des rotations, et la transformation du spineur lorsqu’on fait subir aux coordonnées d’espace une rotation appartenant à ce groupe caractérise le spineur de Pauli à deux composantes. Remarquons que l’équation (4.6) peut se mettre sous la forme :
(ira& - /I)*(.)
=O
(4.7)
qui tait intervenir les matrices yo = @, =j‘= PQ et où :
et sont telles que :
1
$7’7’
+ ru%)
= VPVi
p, v = O,
1,2,3
et
52 cf. M.A. Naimark, Les reprCsentations linéaires du groupe de Lorentz, Dunod, Paris, 1962 ;E.P. Wigner, Ann. Math.,40,149 (1939) est la référence fondamentde.
Article XV
L'équation d'onde relativiste de l'électron La
théorie quantique de l'électron
PAUL ADRIENMAURICE DIRAC Proceeding o f the Royal Society A
117,610-624 (1928)
(Transmis par R.H. Fowler, F.R.S., reçu le 2 janvier 1928.) [traduit par B. Escoubès]
Lorsqu'on applique la nouvelle mécanique quantique au problème de la structure de l'atome en considérant l'électron comme une charge ponctuelle, les résultats obtenus ne sont pas conformes à l'expérience. Les désaccords proviennent du phénomène de '' dédoublement " (dupiexity), le nombre observé d'états stationnaires pour un électron dans un atome étant deux fois celul donné par la théorie. Pour faire face à cette difficulté, Goudsmlt e t Uhlenbeck ont introduit l'idée d'un électron possédant un moment angulaire de spin d'un demi-quantum e t un moment magnétique d'un magnéton de Bohr. Ce modèle pour l'électron a été intégré à la nouvelle mécanique par Pauli' et Darwin', travaillant sur une théorie équivalente, a montré qu'elle donne des résultats en accord avec l'expérience pour des spectres hydrogénoïdes à la précision du premier ordre. Reste la question de savoir pourquoi la Nature a-t-elle choisi ce modèle particuller de l'électron au lieu de se satisfaire de celui d'une charge ponctuelle ? On souhaiterait découvrir quelque imperfection dans les méthodes antérieures appliquant la mécanique quantique à l'électron considéré comme une charge ponctuelle de telle sorte que, lorsque cette imperfection est éliminée, l'ensemble du phénomène du dédoublement en découle sans hypothèses arbitraires. L'article présent montre que c'est en effet le cas, l'imperfection des théories antérieures résidant dans leur désaccord avec la relativité, ou, alternativement, avec la théorie générale des transformations en mécanique quantique. II apparalt que I'hamiltonien le plus simple pour un électron chargé ponctuel satisfaisant les exigences à l a fois de la relativité et de la théorie générale des transformations mène à une explication de l'ensemble des phénomènes de dédoublement sans hypothèse supplémentaire. De même, il y a une grande part de vérité dans le modele de l'électron tournant, au moins en première approximation. L e défaut le plus important du modèle semble être que la grandeur du moment angulaire orbital d'un électron en
'
Pauli, Zeitschr. f. Phys. 43, 601 (1927). Darwin, Proc. Roy. Soc.
A 116, 227 (1927).
De la mécanique quantique relativiste à la théorie quantique des champs
195
mouvement sur une orbite dans un champ de forces central n’est pas constante, comme le prévoit le modèle.
1. Traitements relativistes antérieurs Suivant la théorie classique, I’hamiltonien relativiste pour un électron ponctuel en mouvement dans un champ électro-magnétique arbitraire de potentiei scalaire A. et de potentiel vecteur A est :
F=
(c
-+-Ao
)2+(p+fA)2+m2~2,
ob p est le vecteur de quantité de mouvement. Gordon3 a suggéré que l’opérateur de l’équation d’onde de la théorie quantique devait être obtenu à partir de cet F par ia meme procédure que celle utilisée en théorie non-relativiste, c’est-à-dire, en y efFectuant la substitution :
a
W = ih-
at’
pr=-ih-,
a axr
r=1,2,3,
Cela donne l’équation d’onde :
F
=
[
( i h az
+ EAo)
2
+c
û
(-iha
r
Ir
e + -Ar)’ C
+m2c2] $ = O ,
(1)
$ est une fonction de z1,x2,13, t . Ceci donne lieu à deux difficultés. La première concerne l’interprétation physique de 4. Gordon, et indépendamment Klein‘, partant de considérations sur des théorèmes de conservation, émirent l’hypothèse sont deux solutions, alors que si $m, où la fonction d’onde
doivent s’interpréter comme la charge et le courant associés à la transition m + n. Ceci s’avère satisfaisant tant que l’on s’intéresse à l’émission ainsi qu’à l’absorption, mais n’est pas aussi général que l’interprétation de la mécanlque quantique non reiativlste, qui a été suffisamment développée’ pour que l’on puisse répondre à la question : quelle est la
’
Gordon, Zeitscbr. f. Pbys. 40, 117 (1926).
‘ Klein, Zeitschr. f. Pbys. 41,407 (1927).
Jordan, Zeitschr. f. Pbys. 40,809 (1927) ; Dlrac, Proc. Roy. Soc. A 113. 621 (1927).
196
Sources et évolution de la physique quantique
probabilité pour une variable dynamique quelconque à un instant donné d'avoir une valeur comprise entre des limites données, lorsque le système est représenté par une fonction d'onde donnée $, ? L'interprétation de Gordon-Klein peut répondre à des questions de ce genre si elles concernent la position de l'électron (en utilisant pmn), mais non SI elles concernent sa quantité de mouvement, ou son moment angulaire, ou n'importe quelle variable dynamique. Nous attendons de l'interprétation de la théorie relativiste qu'elle soit au moins aussi générale que celle offerte par la théorie non relativiste. L'interprétation générale de la mécanique quantique non relativiste est basée sur la théorie des transformations. et elle est rendue possible par le fait que l'équation d'onde est de la forme
(H- W)$J = O,
w
a/&,
c'est-à-dire par le fait qu'elle est linéaire en ou de sorte que la fonction d'onde à un instant quelconque détermine l a fonction d'onde à n'importe quel instant pour ultérieur. L'équation d'onde de l a théorie relativiste doit aussi être linéaire en que l'interprétation générale soit possible. Dans l'interprétation de Gordon, la deuxième difficulté provient du fait que si on prend le complexe conjugué de l'équation (1). on obtient
w
qui est la même que l'autre si on y met -e au lieu de e. L'équation d'onde (1) concerne donc aussi bien un électron avec une charge e qu'un électron avec une charge -e. Pour être précis, si on considère le cas limite des grands nombres quantiques, on trouverait que quelques-unes des solutions sont des paquets d'onde se déplaçant de la mëme manière que le ferait une particule de charge -e en théorie classique. alors que d'autres sont des paquets d'onde se déplaçant comme le ferait classiquement une particule de charge e. Pour cette deuxième classe de solutions, w a une valeur négative. On dépasse la difficulté en théorie classique en excluant arbitrairement les solutions qui ont un négatif. On ne peut le faire en théorie quantique, car en général une perturbation peut causer une posltif vers des états à négatif. Une telle transition transition depuis des états à apparailrait expérimentalement si un électron changeait soudainement sa charge de -e à e, phénomène qui n'a pas été observé. La vraie équation d'onde relativiste devrait être telle que ses solutions se découplent en deux ensembles ne se combinant pas, se référant respectivement à la charge -e et e. Dans l'article présent, nous nous intéresserons seulement à éliminer la première de ces deux difficultés. La théorie qui en résulte n'est donc encore qu'une approximation, mais elle se révele être suffisamment bonne pour tenir compte de tous les phénomènes de dédoublement sans hypothèses arbitraires.
w
w
w
2. L'hamiltonien en absence de champ Notre problème est de trouver une équation d'onde de la forme (2) qui soit invariante lors d'une transformation de Lorentz et soit équivalente à (1) à la limite des grands nombres quantiques. Nous considèrerons le cas où il n'y a pas de champ, lorsque l'équation
De la mécanique quantique relativiste à la théorie quantique des champs
(I) se réduit a
+ p2 + mzc2)tj= O
(;pi si i'on pose
197
(3)
w = ih- a w =-
c cat' p i , n , m exigée par la relativite montre que, puisque La symét e en I'hamiltonien que nous cherchons est linéaire en p o . il dolt aussi etre linéaire en pi,p1 et m. Notre équation d'onde est donc de la forme
(PO
+ a i p i + s p z + a m i-D)J, = O,
(4)
où, pour l'instant, tout ce que l'on sait des variables dynamiques ou des opérateurs a l r a z , a 3 , B est qu'ils sont indépendants de p o , p l , p 2 , p 3 , c'est-à-dire qu'ils commutent
avec t , 2 1 , 2 2 , 2 3 . Puisque nous sommes en train de considérer le cas d'une particule en mouvement dans un espace vide, tous les points dans l'espace sont équivalents, nous nous attendons à ce que I'hamiltonien ne dépende pas de t , ~ 1 , 2 2 , 2 3 . Cela signifie que a l , a 2 , a 3 , B sont indépendants de t , 21, 2 ~ ~ 2 c'est-à-dire 3 , commutent avec Nous sommes donc obligés d'avoir d'autres variables dynamiques que les coordonnées et quantité de mouvement de i'éiectron, afin que a1 ,QZ, a 3 , puissent être fonction d'elles. La fonction d'onde doit donc dépendre de plus de variables que simplement z l , z ~ , z 3 , t . L'équation (4) entrafne
po,pl,n,p3.
signifient des permutations cycliques sur les suffixes 1.2.3. Ceci est en accord où les avec (3) si
Si nous posons /3
,
uz = i
+
aras
a: = 1,
pz= rn2c2, Q,P
= O (r # S)
asUr
+ @a, = O
1
r,s = 1,2,3.
= n r m c . ces conditions deviennent
+
aCuY a w n p= O
(p # u)
p , u = i,2,3,4.
(6)
Nous pouvons supposer que les a,, s'expriment comme des matrices dans un certain schéma matriciel, les éléments des matrices a,, etant, disons, a,,((',("). La fonction d'onde 111 doit maintenant être fonction de ( aussi bien que de Z i , Z 2 , ~ 3 , t . Le résultat de la multiplication de $ par Q, sera une fonction (a,,$) de 21,Z Z , Z ~ , ~ ,définie < par
a,,((z,t , C) = c'
Nous devons maintenant trouver quatre matrices a,, qui satisfassent les conditions (6). Utilisons les matrices
O
-i
1
0
Sources et évolution de la physique quantique
198
que Pauli Introduisit6 pour décrire les trois composantes du moment angulaire de spin. ces matrices ont Justement les propriétés u; = 1
orus
+
~
=~O,
s
r
( r # s),
(7)
que nous exigeons de nos a. Nous ne pouvons cependant prendre simplement les u pour Stre trois de nos a , car il ne serait alors pas possible de trouver la quatrième. Nous devons prolonger les O de manière diagonale afln qu'elles offrent deux colonnes et deux lignes de plus, de sorte que nous pouvons introduire trois matrices supplémentaires p l l p 2 , h de la meme forme que u 1 , u 2 , 0 3 , mais où les colonnes e t les lignes sont dans des positions différentes, de cette manière :
0
0 1 0 0
4
0
1 0 0 0 - 1 0
O
1 0 0 0
o
0 0 1 0
o
i
O
O
0 O
0-1
Les p sont obtenus à partir des u en échangeant les deuxième et troisième lignes, et les seconde e t troisième colonnes. Nous avons, en plus des équations (7)
Si nous prenons maintenant 01
= plul,
02
= ploz,
03
=pi631
0 4
= P39
toutes les conditions (6) sont satisfaites, par exemple, 0:
QiQ2
=p1alpIal =piUlpiU2
=p:u: = p:UlO2
=1 = -p:U2U]
= -a201.
Notons les équations suivantes, en vue de leur emploi ultérieur :
pip2 U]U2
= iP3 =iu3
= -P2Pi = -a201
1
ainsi que les équations obtenues par permutation des suffixes. L'équation (4) prend maintenant la forme
[Po où
O
'
+ Pl(..P) + P 3 4
sont les matrices se référant respectivement
à la première et à la seconde particule, e t r12 est la distance entre elles.
Donc l’hamiltonien pour le système est donné, en l’absence de champs extérieurs, par
OD p1 et p2 sont les moments des particules. Cet hamiltonien est équivalent à I’hamiltonien (1) de Heisenberg‘. si nous prenons comme ” intégrale de Platzwechsel *’ (intégrale de l’échange de places)
mis à part le fait de n’avoir pas pris en compte l’Interaction entre les neutrons ni la répulsion électrostatique entre les protons. Heisenberg a pris le signe positif pour J ( r ) . de sorte que le spin de l’état de plus basse énergie de H Z était O. alors que dans notre cas, grâce au signe négatif devant g 2 , l’état de plus basse énergie a le spin 1. ce qu’exige
l’expérience. qui apparaissent dans les équations ci-dessus doivent être Les constantes g et déterminées par comparaison avec l’expérience. Par exemple, si l’on utilise I’hamiltonien (10) pour les particules lourdes, on peut calculer le défaut de masse de H 2 e t la probabilité de diffusion d’un neutron par un proton, pourvu que leur vitesse relative soit petite par rapport à la vitesse de la lumière‘. Une première estimation montre que tes valeurs calculées sont en accord avec les résultats expérimentaux si nous prenons pour X une valeur comprise entre io+’’ cm-’ et cm-’ et pour g plusieursfois la valeur de la chargeélémentaire e, les considérations ci-dessus n’impliquant néanmoins aucune relation directe entre g e t e. 1. ‘ Heisenberg, Ces calculs avaient déjà été faits, suivant la théorie de Heisenberg, par M.Tomonaga
à qui l’auteur doit beaucoup. Une petite modification est nécessaire dans notre cas. Des calculs détaillés seront faits dans un prochain article.
Sources et évolution de la physique quantique
250
3.
N a t u r e des quanta accompagnant le champ
u
L e champ considéré ci-dessus doit être quantifié suivant la méthode générale de la théorie quantique. Puisque le neutron et le proton suivent tous les deux la statistique de Fermi, les quanta accompagnant le champ doivent suivre la statistique de Bose et la quantification peut s'effectuer de manière semblable à celle du champ électromagnétique. L a lo1 de conservation de la charge électrique exige que le quantum ait la charge +e ou -e. La quantité de champ correspond à l'opérateur qui augmente le nombre de quanta chargés négativement e t abaisse le nombre de quanta chargés positivement d'une unité respectivement. le complexe conjugué de correspond à l'opérateur inverse. Si nous notons
u
u
u,
u,
p z = -ih-
a
etc.
al
a
,
IV = ifi-,
at
mUc = AL, alors l'équation d'onde pour
u dans l'espace libre peut s'écrire
sous la forme
{ de sorte que le quantum accompagnant le champ a une masse propre
Ah mu = -.
Sup-
C
posant que 1 = 5 x 10"cm-', nous obtenons pour mu une valeur 2 x 10' fois plus grande que la masse de l'électron. Comme un quantum de grande masse e t de charge positive ou négative n'a jamais été trouvé expérimentalement, la théorie ci-dessus semble mal engagée. Nous pouvons montrer, cependant, que lors d'une transformation nucléaire ordinaire, un tel quantum peut ne pas être émis dans l'espace extérieur. Considérons, par exemple, la transition d'un état neutron d'énergie WN à un état proton d'énergie w p , les deux énergies propres étant incluses. s'exprimer grâce aux fonctions d'onde + N ( z , y, z ,
t , 1) = ~
( 5y,,
z)ëiWNt/',
q N ( 5 , y,
Ces états peuvent
E,
t , -1) = O
et $ p ( z , y, z , t ,
+ p ( z , y, z ,
i) = O,
t , -1) = u ( z , y,
z)e-i"'p'/*,
de sorte que. dans le membre droit de l'équation (4). apparaît le terme -4Tg,jUe-it(WN-W~)/h Posant
ob w =
W N
U = U 1 ( z ,y, z)eiw*,(4)
- W P . En intégrant, ti
nous donne
nous obtenons une solution
251
Les grandes heures de la physique des particules
laI ou mGc2 > ( i v -~I v p l , p >-
Si
est réel e t la fonction J ( r ) de Heisenberg
C
e-~r
a la forme -g2-.
dans laquelle p , cependant, dépend de
l r V ~- IVpl, e t devient de
plus en plus petit à mesure que cette quantité s'approche de muc2. Ceci signifie que la portée de l'interaction entre un neutron e t un proton croit lorsque IIVN lvpl croît. Or la diffusion (élastique ou iné1astique)'d'un neutron par un noyau peut être considérée comme le résultat du double processus suivant : le neutron tombe sur un niveau de proton dans le noyau et le proton saute ensuite 3 un état de neutron d'énergie positive, I'energie totale étant conservée dans le processus. L'argument ci-dessus montre alors que l a probabilité de diffusion peut parfois croître avec la vitesse du neutron. Suivant l'expérience de Bonner', la section efficace de collision du neutron croit, de fait, avec la vitesse dans le cas du plomb alors qu'elle décroit dans le cas du carbone et de l'hydrogène, le taux de décroissance étant plus faible dans le premier que dans le second cas. L'origine de cet effet n'est pas claire, mais les considérations ci-dessus, au moins, ne le contredisent pas, En effet, si l'énergie de liaison du proton dans le noyau devient comparable à mr;c2, la portée de l'interaction du neutron avec le proton croÏtra considérablement avec la vitesse du neutron, alors que la section efficace,décroitra lentement dans des cas comme celui de l'hydrogène, c'est-à-dire du proton libre. Quant a l'énergie de liaison du proton dans C12, que l'on estime à partir de la différence des masses du C12 et du B l l , elle est
-
12,0036- 11,0110 = 0,9936 Ceci correspond à une énergie de liaison de 0,0152 en unité de masse, soit trente fois la masse de l'électron. Donc, dans l e cas du carbone, nous pouvons nous attendre 3 l'effet observé par Bonner. Ces arguments ne sont donnés qu'à titre d'essai ; d'autres explications ne sont naturellement pas à exclure. Si à présent
Iw I ou mut' < Irv,v - rvpI, p muc2. La vitesse de l'onde de u est plus grande, mals la vitesse de groupe est plus p e t i t e que la vitesse de l a lumière c comme dans le cas de l'onde de l'électron. La raison pour laquelle de tels quanta massifs. s'ils existent, n'ont pas été encore découverts est peut-etre due au fait que la masse mu est si grande que la condition ~IVN W p l > muc2 n'est pas remplie dans les transformations nuclëaires ordinaires.
-
4. Théorie de la désintégration
p
u
Jusqu'lci, nous n'avons considéré que les interactions des quanta avec les particules lourdes. Mais, suivant notre théorie, le quantum émis lorsqu'une particule lourde saute d'un état neutron à un état proton peut être absorbe par une partlcule légère qui, par suite de l'énergie absorbée passera d'un état neutrino d'énergie négative à un état d'électron
'
T.W. Bonner. Phys. Rev. 45, 606 (1934).
Sources et évolution de la physique quantique
252
d’énergie positive. Ainsi un anti-neutrino e t un électron Sont émis simultanément du noyau. Cette intervention du quantum massif ne modifie pas essentiellement la probabilité de la désintégration p. qui a é t é calculée en supposant Un couplage direct d’une particule lourde e t d’une particule légère, de la même manière que, dans la théorie de la conversion Notre interne d’un rayon 7,l’intervention du proton n’affecte pas le résultat final’. théorie, par conséquent, ne dimre pas de manière appréciable de la théorie de Fermi. Fermi considéra qu’Un électron et un neutrino sont émis simultanément du noyau radioactif, mais ceci est formellement équivalent à l‘hypothèse d’une particule légère sautant d’un état neutrino d’énergie négative à un é t a t d’électron d’énergie positive. En effet, si les fonctions propres de î‘éiectron e t du neutrino sont +k et y k , respectivement, où k = 1, 2, 3, 4, un terme de la forme 4
6kVk
4x9’
k=i doit être ajouté au membre droit de l’équation (5) pour Ü, où g‘ est une nouvelle constante ayant la mme dimension que g. Or les fonctions propres de l’état neutrino possédant une énergie e t un moment opposés à ceux de i’état q k sont données par y; = -5i,+c e t réciproquement pk = -6&, où
/O
-1
O
O\
Ainsi (15) devient
Des équations (13) e t (15) on Obtient. pour l’élément de matrice de l’énergie d’interaction de la particule lourde e t de la particule iégère une expression
qui correspond au double processus suivant : une particule lourde tombe de l’état neutron avec la fonction propre u ( r ) dans I’etat proton avec la fonction propre u(r) e t Simultanément une particule legère saute de l ’ é t a t neutrino yk(r) d’énergie négative a l’état d’électron $k(r) d’énergie Positive. Dans (17). on a pris au lieu de p , puisque l a diflérence des énergies de l’état neutron et de l’état proton, qui est égale à la somme de la limite supérieure du spectre d’energie des rayons p et de l‘énergie propre de l’électron e t du neutrino, est toujours petite comparée à mye'. Comme est beaucoup plus grand que le nombre d’onde de l ’ é t a t électron et de e-.hz
l’état neutrino, la fonction
peut en bonne approximation r12
ëtre prise pour une
H.A. Taylor e t N.F. Mott, Proc. Roy. Soc. A 138,6 6 5 (1932).
Les grandes heures de la physique des particules
fonction 6 multipliée par
253
4a
- en ce qui concerne les intégrations par rapport à 22, yz, z2. A2
L e facteur
4x provient de A2
Donc (17) devient
k
ou, à l'aide de (16)
qui est la même que l'expression (21) de Fermi, celle qui correspond à l'émission d'un neutrino e t d'un électron d'énergie positive +;(r) e t +t(r), excepté le fait que le facteur
4*99< est substitué par le facteur g de Fermi. A2
Donc, dans cette approximation, le résultat est le même que celui de la théorie de Fermi, pourvu que nous prenions
résultat à partir duquel la constante g' peut être déterminée. ' ~g = 2x10-9,.nous obtenons g' z 4x10-", En prenant par exemple A = 5 ~ 1 0 et qui est environ io-' fois plus petite que g. Cela signifie que l'interaction entre le neutrino e t l'électron est beaucoup plus petite qu'entre le neutron e t le proton, de sorte que le neutrino sera beaucoup plus pénétrant que le neutron et par conséquent beaucoup plus difficile à observer. La différence entre g e t g' peut ëtre due à la différence des masses des particules lourdes et légères.
5. Résumé Les interactions des particules élémentaires sont décrites en considérant un hypothétique quantum possédant la charge élémentaire et une masse propre et obéissant à la statistique de Bose. L'interaction de ce quantum avec la particule lourde doit être beaucoup plus grande que l'interaction avec la particule légère, de manière à rendre compte de la grande interaction entre le neutron et le proton, aussi bien que de la petlte probabilité de désintégration Ces quanta, s'ils existent et s'approchent suffisamment pres de la matière pour être absorbés, cèderont leur charge e t leur énergie à cette dernière. Si. alors, les quanta de charge négative apparaissaient en excès, la matière se chargerait à un potentiel négatif.
8.
254
Sources et évolution de la physique quantique
Ces arguments, bien évidemment de caractère purement spéculatif, sont en accord avec l'opinion que les particules de grande vitesse des rayons cosmiques sont engendrées par le champ électrostatique de la terre, qui est chargé à un potentiel négatif'. Les quanta massifs peuvent aussi avoir quelque Impact sur les gerbes produites par les rayons cosmiques. En conclusion, l'auteur tient à exprimer ses chaleureux remerciements au Dr. Y. Nishina et au Pr. S. Klkuchl pour leurs encouragements durant le cours de ce travail.
Département de Physique Université Impériale d'Osaka
G.H. Huxley, Nature, 134.418, 571 (1934) ; Johnson, Phys. Rev. 4 5 , 5 0 9 (1934).
Les grandes heures de la physique des particules
255
5.4 Les accélérateurs et les détecteurs
de particules Simultanément à la découverte du positon et du mésotron dans les rayons cosmiques et à celle du neutron au laboratoire, et parallèlement à l’annonce de l’existence du neutrino par Pauli, d’importants développements concernant la physique nucléaire expérimentale eurent lieu au début des années 1930. En 1930,Ernest O.Lawrence et Stanley Livingstone inventèrent le cyclotron, une machine capable d’accélérer des ions en leur faisant parcourir des trajectoires en spirale avant de les éjecter en faisceaux d’énergie bien définie : les p a r t i d e s ainsi accélérées étaient utilisées pour bombarder des noyaux cibles et provoquer des réactions nucléaires. Les projectiles accélérés étaient des protons, des particules alpha et d’autres ions : ces faisceaux, à la fois plus intenses et plus énergiques, allaient remplacer les particules alpha émises par le polonium, les sources les plus employées jusqu’alors. En 1932, John Codrroft et Ernst Walton construisirent le premier accélérateur électrostatique. Successivement furent inventées de nouvelle3 machines destinéea à accélérer des protons, des ions et des électrons : le générateur de R Vaa de GraafT, le bétatron de Donald Kerst, le synchro-cyclotron de 4.7Q m de Mac Millan à Berkeley, le bévatron à Brookhaven, llaccélérateur linéaire de Stanford et celui d’Orsay, et finalement les accélérateurs du CERN (Centre Européen de Recherches Nucléaires) à Genève, du Fermi National Laboratory à Batavia (près de Chicago), de Serpubrhov, en URSS. La construction, entreprise en 1990 au Texas, du SSC (Superconducting Super Collider) destiné à élever l’énergie dans le centre de masse de la collision à 20 20 TeV (Tera électron-Volt, c’est-à-dire miXe milliards d’électron-Volts), a brutalement été stoppée en novembre 1993, sur décision du Sénat des Etats-Unis. Cet abandon, joint à celui de l’anneau de collisions russe UNK en 1990, pourrait bien marquer la fin d’une course presque ininterrompue depuis les années 30 vers des énergies de plus en plus hautes. Le LHC (Large Hadron Collider), un collisionneur de 8 8 TeV qui utiliserait le tunnel du LEP (Large Electron Positron) à Genève, devrait voir son sort décidé dam le courant 1994. Quelle que soit la décision prise, il restera toujours aux physiciens des hautes énergies l’ouverture vers l’astrophysique, où la détection des grandes gerbes cosmiques permettra d‘observer des évènements certes rares et aléatoires, mais dont les énergies peuvent atteindre jusqu’à 1021 eV. Les appareils qui permettent d’identifier et éventuellement de découvrir les particulea produites dans les réactions provoquées par les accélérateurs sont aussi importants que les accélérateurs eux-mêmes. C’est grâce aux détecteurs que l’on peut mesurer les paramètres caractérisant les p a r t i d e s qui les atteignent, comme leur énergie et leur quantité de mouvement, voire leur masse et leur charge électrique. Peut-être devons-nous citer, parmi les plus anciens détecteurs, l’électroscope à feuilles d’or utilisé par Jean Perrin pour étudier la charge des électrons qui constituent les rayons cathodiques ; la d u l e photo-électrique, qui servit à détecter les photons de basses énergies ; les tubes Geiger-Müller, qui permettaient de compter les particules ionisantes. Les chambres d’ionisation, la chambre de Wilson permettent de voir la trace laissée par les particules chargées : les ions formés par le passage de ces particules attirent des molécules de vapeur d’eau qui se condensent
+
+
Sources et évolution de la physique quantique
256
et rendent visible lorsqu’on les illumine le parcours des particules. Les chambres de Wilson sont des détecteurs à traces. Elles furent suivies par les chambres à bulles, les émulsions photographiques et les chambres à étincelles. Actuellement, on utilise les chambres développées par Georges Charpak, les chambres proportionnelles multifils, pour déterminer la trajectoire des particules chargées, et les calorimètres pour mesuer l’énergie aussi bien des hadrons (neutres ou chargés) que des électrons et des gammas“. Tous ces développements techniques n’ont été possibles que grâce à une nouvelle organisation de la recherche scientifique, en créant des institutions et des laboratoires d’échelle jusqu’ici inconnues dans l’histoire des sciences. Nous déuirons brièvement en Appendice quatre exemples de ces développements, ceux qui eurent lieu aux Etats-Unis, au Brésil, au Japon et en France et qui permirent à la physique nucléaire, puis à celle des particules d’obtenir les résultats que nous exposerons maintenant.
5.5
La découverte des mésons : la désintégration des pions et des muons
Après la Deuxième Guerre mondiale, en 1947,deux séries d’observations expérimentdes marquèrent la naissance de la physique des particules élémentaires et sa séparation de la physique nucléaire. L’expérience de M. Conversi, E. Pancini et O. Piccionis3 en Italie mit en évidence que l’interaction des mésons observés par Anderson et Nedermeyer dans le rayonnement cosmique au niveau de la mer est beaucoup plus faible que celle que les mésons de Yukawa étaient supposés avoir avec les nucléons. Ce résultat suggéra à Robert Marshak et Hans A. Bethe“ l’idée de l’existence, dans les rayons cosmiques, de deux espèces de mésons, les uns interagissant par une interaction forte, les autres interagissant par une interaction environ io1* fois plus faible, avec la matière nucléaire6’. A peu près à la même époque, des chercheurs, à Bristol, le Brésilien César M. G. Lattes, l’Italien Giuseppe. Occhialini et l’Anglais Cecil utilisèrent la technique des émulsions nucléaires - développée dans leur laboratoire avec la collaboration de H. Muirhead et du Français Pierre Cüer - pour la détection des traces de particules chargées : ils découvrirent ainsi, dans des émulsions exposées au Laboratoire de Chacaltaya, à La Paz, en Bolivie, à 5 000 m d’altitude, des traces de mésons, possédant une masse 62 Pour une vue d’ensemble des accélérateurs et des dédecteurs, on peut se reporter à la dernière édition de ReMew of Parficles Properties, Phys. Rev., D 45, Part II (1992), pourvue de nombreuses références.
63
M. Conversi, E. Pancini et O. Piccioni, Phys. Reu. 71,209 (1947).
64
R. Marshak et H.A. Bethe, Phys.
Reu. 72,506 (1947).
‘‘ E. Fermi, E. Teller et V. F. Weisskopf, Phys. Rcu. 71, 314 (1947). 66
C.M.G. Lattes, G.P.S. Occhialini et C.F. Powell, Nature, 160,453, 486 (1947).
Les grandes heures de la physique des particules
257
de l'ordre de 212 me ; ces particules, les muons, provenaient de la désintégration, après ralentissement, des piolu positifs : T+ --+
p+ +PO
Les pions négatifs, pas contre, étaient capturés lors de leur ralentissement par les noyaux de l'émulsion, et donnaient lieu à une explosion nucléaire : T-
+ noyau -+ explosion nucléaire
En effet la masse d'un pion au repos étant de l'ordre de 140 MeV, cette énergie est absorbée par le noyau et produit une étoile nucléaire. Quant à la particule neutre p o qui accompagne le méson p+, on montra plus tard (Léon Lederman, Melvin Schwartz, Jadc Steinberger en 1962) qu'il s'agit en réalité d'un nouveau type de neutrino, le neutrino muonique v,, distinct du neutrino de Pauli, le neutrino électronique Y, : quand les Y, bombardent des neutrons au repos, ils produisent des protons et des p - , alors que les Y, produisent des protons et des électrons. La désintégration du pion au repos en deux particules est caractérisée par la valeur constante que prend l'énergie du muon p+ dans ce type de réaction (dite à 2 corps). Lattes, Ocdiialini et Powell montrèrent encore que les muons p + qui proviennent de la désintégration pion-méson se désintègrent à leur tour et produiçent des positons, selon la réaction : p++v;+e++v,,
le positon étant accompagné des deux neutrinos V; et v,. Cette réaction (dite à trois corps) donne lieu à des positons d'énergie variable d'un événement à l'autre, comme c'est le cas pour la désintégration bêta du neutron. Si l'on assigne aux muons (et aux électrons) négatifs un nombre quantique L, égai à 1 (Le= i), les muons positifs (et les positons) seront les antiparticules respectives des particules précédentes, avec les nombres quantiques L, = -1 (Le = -1). On admet pour ces réactions le principe de la conservation séparée de chacun des nombres leptoniques L, et Le, et par conséquent vp et v, sont associés à p - et e-, tandis que v; et y; sont associés à p+ et e+. En 1948, Lattes et l'Américain Eugene Gardner6' furent capables de détecter pour la première fois des pions produits dans la collision de protons contre des noyaux atomiques dans le synchrotron de Berkeley, suivant les réactions : p+n--+p+p+*p+p
+p
+ n
+
T+
Puis furent détectés les pions neutres à travers leur désintégration en deux gammas : "O--'T+T
C.M.G.Lattes e t E. Gardner, Science 107,270
(1948).
258
Sources et évolution de la physique quantique
Dans les années 1947-1950, les travaux de recherche sur ces particules se multiplièrent, d n de trouver leurs propriétés et celles de leurs interactions. Les pions s'avérèrent être des bosons de spin Zéro,représentés par des champs pseudo-scalaires, alors que les muons ont, eux, le spin 1/2. Le Brésilien Jayme Tiomno, en collaboration avec John A. Wheeler", Bruno Pontecorvo6', Oskar Klein'O et Gianpetro Puppi'l d'une part, et Tsung-Dm Lee travaillant avec M.Rosenbluth et Chen-Ning Yang" d'autre part, arrivèrent indépendamment à la conclusion que la réaction
et la réaction de capture des muons négatifs : p- + p
-t
n t up
sont toutes deux décrites par les interactions de Fermi responsables de la désintégration bêta du neutron : n+p+e-+Y;
Iis trouvèrent également que les constantes d'interaction qui déterminent l'amplitude de ces réactions ont approximativenient la même valeur :
Un principe à'univcr~alitéde l'interaction de Fermi fut alors énoncé, et la phénoménologie de ces réactions fut réexaminée par Louis Michel" de manière systématique : cet auteur introduisit le paramètre p qui caractérise la forme du spectre d'énergie des électrons émis dans la désintégration du muon, avec une valeur qui change suivant la nature géométrique (scalaire, vectorielle, axiale, pseudoscalaire, tensorielle) de l'interaction de Fermi. Ce principe trouva son expression finale après l'introduction d'un paramètre (l'angle de Cabbibo) qui relie les quarks u, d et s, paramètre que l'on généralisa ensuite en une matrice 3 x 3 unitaire (la matrice de mélange de Kobayashi-Maskawa) dans le modèle à 6 quarks". Ce ne fut que dix ans plus tard que la nature de l'interaction de Fermi - l'interaction faible directe entre d e w paires adéquates de fermions - fut déterminée. R P. Feynman et M. Gell-Mann" et simultanément R Marshak et E.C.G. i~~ en 1958 qu'une combinaison de l'interaction Sudarshan, et J.J. S a k ~ r amontrèrent 6*
" 'O
J. Tiomno et J.A. Wheeler, Rev. Mod. Phys. 21, 144, 153 (1949). B. Pontecorvo, Phys. Rev. 72,246 (1947). O. Klein, Nature 161,897(1948).
'' O. Puppi, Nuouo Ciment0 5,587 (1948). '' .T.D. Lee, M. Rosenbluth et C.N. Yang,Phys. Rev. 75,905 (1949). 73 'I4
'' "
L. Michel, Proe. Phys. Soc. A63,514, (1950). cf. J. Leite Lopes, Gauge field theories, Pergamon Press, Oxford (1983). R.P. Feynman et M. Gell-Mann, Phys. Rev. 109,193(1958). R. Marshak et E.C.G. Sudarshan, Phys. Rev. 109,1860(1958); J.J. Sakurai, Nuouo
Cimenta, 7,649 (1958).
Les grandes heures de la physique des particules
259
+
vectorielle V et de l’interaction axiale A , à savoir U A bV représente l’interaction faible ci-dessus si l’on prend a = -1, b = 1. C’est la fameuse interaction V - A. Après avoir pris exnnaissance de l’article de Feynman et Gell-Mann, l’un des auteurs de ce livre77effectua la première estimation réaliste de la masse des bosons intermédiaires W, les agents reponsables de l’interaction de Fermi, en égalant la constante d’interaction entre ces bosons et la matière nucléaire g, et la constante d’interaction entre les photons et le courant électrique, e : e=g
Cette égalité était possible en raison du caractère vectoriel aussi bien des champs de photons que des champs de bosons W : elle suggérait une unification des interactions électromagnétiques et faibles. Cette égaiité fut remplacée par la relation e = gsinBw dans le modèle standard” d’unification électro-faibledéveloppé plus tard par Steven Weinberg (1967)’ Sheldon Glashow et Abdus Salam (1968)’ où Bw est l’angle qui détermine le mélange du champ E,, associé au groupe U(1) avec la composante A P 3 du champ A,,,,,a = 1,2,3 associé au groupe SU(2) dans le modèle SU(2) x U(i) pour former le champ électromagnétique A,, et le champ Z,,associé au boson neutre
ZO . Ce boson neutre Zo, responsable des interactions faibles sans changement de charge électrique (appelées interactions faibles neutres), fut d’ailleurs prédit par l’un des auteurs” dans l’article où il suggérait la relation e = g ; en 1958, date de l’article, on n’avait pas encore mis au point les faisceaux de neutrinos susceptibles de provoquer ce type d’interaction faibles neutres, c’est pourquoi l’auteur proposa d’observer les collisions élastiques neutronélectron pour vérifier si ces interactions transmises par le boson Zo existaient effectivement. il chercha aussi, en 1958, quelle serait la contribution de l’interaction forte du pion avec un proton et de celle de son interaction faible avec un muon pouvant donner lieu à la capture d’un muon négatif par ce pro tor^'^. il trouva ainsi une interaction effective, de caractère pseudoscalaire, induite par les couplages mentionnés plus haut, d’intensité plus faible que l’interaction V - A , mais s’y rajoutant, et étant proportionnelle à la masse du muon. La combinaison des deux interactions rend bien compte de la situation expérimentale. Cette approche - l’échange d’une particule pseudoscalaire - n’a pas perdu toute actualité : dans le modèle standard d‘unification, le rôle joué par le pion serait alors repris par le boson de Eggs (voir p. 277)’ particule jusqu’à ce jour hypothétique, mais dont la découverte serait la clé de voûte de ce modèle. J. Leite Lopes, Nucl. Phys. 8,234 (1958).
S. Weinberg, Phys. Rev. Lett. 19, 1264 (1967) ; A. Salam, Nobel Symposium,N. Svartholm Editor (1968) ; S.L. Glashow, Nucl. Phys. 22,579 (1961). ‘Is J. Leite Lopes, Phys. Rev. 109,509 (1958) ; L. Wolfenstein, Nuouo Cimcnto 8,382 (1958) ; L. Wolfenstein, The weak pscudoscalar interaction in h i t e Lopes Festschrift, p. 365, World Scientific, Singapore (1988).
260
Sources et évolution de la physique quantique
Hu«, Leiie Lopes, Pauli, Jarrch (Princeton, 1945. Célébration du Priz Nobel de Pauli).
Chapitre 6
Vers l’unification des interactions 6.1 Les particules élémentaires et le modèle SU(3) de Gell-Mann A partir de 1948, de nouvelles particules furent découvertes. Les préjugés d’un grand nombre de physiciens d’antan contre l’existence de nouvelles particules s’effondrèrent alors. On peut citer à ce propos Dirac, lorsqu’il tenta d’interpréter les solutions à énergie négative de son équation comme des protons. Ii écrivait : It h a always been the dream of philosophers to have all the matter built up from one fundamental kind of particle, so that it i s not altogether satufactory to have two in our theory, the electron and the proton. There are, however, reasons for believing that the electron and the proton are really not independent, but are just two manifesîations of one elementary kind of particle ”*O. En réalité, comme l’ont montré Robert Oppenheimer et Hermann Weyl, les solutions à énergie négative de l’équation de Dirac pour l’électron correspondent à de nouvelles particules, les positons, qui ont exactement la même masse que l’électron - ce furent les premières particules d’antimatière découvertes. Chaque particule de spin 1/2, comme le proton, le neutron, le muon, est décrite par une équation de Dirac et est associée à une anti-particule correspondante, dont la charge (le moment magnétique et les nombres quantiques qui leur sont liés) est opposée à celle de la particule. Après la découverte des pions et des mésons, on découvrit les mésons eta ( q ) , qui se désintègrent suivant les modes principaux : LL
q-
7+7 n++r-+nO 3n0
4 ---t
On découvrit ensuite les mésons K ou kaons, chargés :
K++ 4
p++v, *++*O
et les kaons neutres, dont nous reparlerons plus loin. Les années 50 et 60 virent aussi la découverte de fermions plus lourds que le proton et le neutron, à savoir le baryon A’, le triplet E+,Co,C-, le doublet -0 , et le baryon fi-, prévu théoriquement par Gell-Mann dans son modèle des quarks. Ces baryons reçurent dans les années 50 le nom d’hypéron, ; Gell-Mannet
- -
I _
I
I
P.A.M. Dirac, The proton, Nafure 128,605 (1930)
262
Sources et évolution de la physique quantique
Kazuhiko Nishijima introduisirent un nouveau nombre quantique, Z’éfrangeféS, à partir duquel et du nombre baryonique B on déiinit Z’hypercharge Y :
Y=S+B
On abandonna alors à cette époque la conception simpliste des années 30 qui consistait à penser que les seules particules fondamentalesétaient les nucléons (proton et neutron), les leptons (électron et neutrino de Pauli), et le photon, résumée dans la tableau 1. Tableau 1
Les particules élémentaires dans le8 années 1930 Nom
Nucléon
Masse (MeV/c’)
Charge (I e
I)
Spin ( f j
Proton
938
-+I
112
Neutron
940
O
112
%O
O
112
Electron e
0,511
-1
112
7
O
O
1
Leptons Neutrino v
Avec la découverte du neutron, on perdait la notion héritée de l’atomisme, ceile de particules indivisibles et immuables solides, matsives, dures, impénétmbles, (...), aucun pouvoir ordinaire n’étanf capable de diviser ce que Dieu, Lui-Mime,jit un dam la première Création suivant les paroles de Newton. Ainsi, dans la description qu’il donna de la d6sinGgration bêta du neutron, Fermi employa lea opérateurs de création et d’annihilation de quanta d’un champ. D’après la théorie, le neutron est annihilé et à sa place est créé un proton : simultanément une paire électron-antineutrinoest à la fois créée et émise. L’analogie avec l’électrodynamique quantique (développée par Dirac, et par Heisenberg et Pauli) selon laquelle, lorsqu’un atome excité émet de la lumière, un photon est créé et l’atome subit une transition vers un état à énergie, quantité de mouvement et spin inférieurs, cette analogie guida la construction des fondements de la théorie quantique des champs. Toutes les particules sont instables à l’exception de l’électron, du neutrino et du proton - et lorsqu’une de W. particules rencontre son antiparticule, les deux disparaissent et se transforment en bosons. Dans les théories de grande unification, cependant, le proton pourrait se désintégrer (au bout de quelques 10j2 années) en un positon et un xo : cette désintégration n’a pas été observée à ce jour. De plus, les particules sont les quanta d’un champ déterminé et elles sont créées dès qu’une énergie suffisante est disponible. Comme nous l’avons déjà souligné, le vide est le siège de fluctuations des valeurs du champ et est peuplé de quanta virtuels. Pour interpréter le fait que la chaîne de désintégration des baryons s’arrête au proton et qu’il y a toujours le même nombre de baryons dans l’état final que dans
Vers l‘unification des interactions
263
l’état initial, Wigner inventa un nombre quantique 8,égal à 1 pour les baryons, à -1 pour les anti-baryons, et Zéro pour les autre particules, leptons et bosons : la loi de conservation du nombre baryonique dans toutes les réactions et désintégrations nucléaires est toujours vérifiée. Elle serait violée dans les théories de grande unification, encore dépourvues d’appui expérimental, que nous venons de mentionner. L’isospin i fut introduit par Heisenberg pour exprimer le fait que, la masse du proton et celle du neutron étant approximativement égales, ces deux particules ne représenteraient que deux états d’une même particule, le nucléon, de charge I e I et zéro, respectivement. Le nombre I fut alors attribué au nucléon avec la valeur 112 et la charge Q fut exprimée en fonction de la troisième composante I 3 grâce à :
avec I3 = i / 2 pour le proton et I3 = -112 pour le neutron. Avec la découverte des hypérons et la définition de l’étrangeté S et de l’hypercharge Y,la charge Q vint à prendre l’expression :
Q = I3 +YI2 Ainsi la classification des particules possédant l’interaction forte, les hadrons, put s’établir comme le montrent les deux tableaux suivants, le tableau 2 pour les baryons, avec B = 1, le tableau 3 pour les mésons, avec B = O. Tableau 2
I
Les baryons B = 1
264
Sources et évolution de la physique quantique
Tableau 3 Les méso s B = O
Nom
ymbole r+
Pions
(spin zéro)
ifo
a-
Mésons
êta
'I
(spin zéro)
K+ Kaons (spin zéro)
KO
KO
O
-1
K-
-1
Parallélement à ces mésons de spin zéro, pseudoscaiaires, on trouve des mésons de spin 1 : ce sont les mésons vectoriels p + , p o , p- et les mésons 9. et K*. L'interprétation des objets ainsi classifiés a été effectuée d'après la tentative menée par Fermi et Yang de décrire les pions comme des structura de nucléons et d'anti-nucléons. Une interaction très forte serait ainsi capable de lier un proton à un antineutron pour former le pion positif :
ce qui donnerait de même : et
Cette représentation est basée sur la théorie du groupe SU(2) qui agit s u r un espace à deux dimensions, l'espace des isospineurs
(3 .
Une fois les kaons découverts, Shoichi Sakata proposa que l'on prenne en considération le trivecteur
(i)
au lieu de l'isospineur
();
: ies mésons K auraient
265
Vers l’unification des interactions
une structure de la forme :
Les diacultés rencontrées par le modèle de Sakata pour décrire les hypérons furent surmontées dans l’étape décisive suivante, due à Gell-Mann”. Tel Anaximandre, pour qui la substance primordiale de toutes choses n’était ni l’eau, comme le supposait Thalès, ni aucun corps connu, Gell-Mann affirma que les éléments primordiaux des hadrons n’étaient ni les nucléons, ni le Ao, mais des objets inconnus, les quarks doués des nombres quantiques appropriés ; les mésons seraient formés de combinaisons de produits d’un quark par un antiquark et les baryons d’une combinaison de trois quarks. Au début, Gell-Mann supposa l’existence de trois quarks, u , d et s, les trois composantes d’un vecteur dans un espace complexe à trois dimensions sur lequel agit le groupe SU(3), c’est-à-dire l’ensemble des matrices unitaires à trois lignes et trois colonnes dont le déterminant est égal à +1, la théorie attribuant un isospin i/2 aux quarks u et d et une étrangeté au quark s. De très beaux travaux furent alors entrepris, qui donnèrent lieu à l’algèbre des courants, à l’étude des groupes SU(n) et de leurs représentations. Le quark s est responsable des particules étranges : Gell-Mann put alors proposer les structures suivantes pour les pions :
(à la façon de Sakata) et K+-Zu,
KO-Zd
I1 postula que si les quarks devaient aussi engendrer les baryons, et si - hypothèse naturelle - le spin des quarks valait 1/2, chaque baryon devrait être constitué de trois quarks, chacun devrait donc avoir un nombre baryonique B = La structure des pions impose aux u d’avoir une charge $e et aux d une charge de -+e. Cela conduit à la structure suivante pour les baryons :
i.
P
-
uud,
N
-
udd,
A‘
-
uds
(s doit donc avoir une charge - t e et une étrangeté -1).
L’étude des représentations du groupe SU(3) conduisit à la classification des hadrons en multiplets bien définis, comme le montrent les tableaux suivants.
81
M. Gell-Mann et Y. Ne’eman, The Eightfold Way, W.A. Benjamin (1964).
Sources et évolution de la physique quantique
266
On obtient ainsi l'octet baryonique :
Les quarks de Gell-Mann reçurent les attributions suivantes :
Tableau 5
Tableau 4 ie
Les quarks de Gell-Mann I
Is
d 112 -1}2 J
O
O
Y
I
B Q=IJ+~
y
Is
Q(lCl
omposition
L/2 112 1
1
uud
LI2 -1/2
1
O
udd
113 113
O
0
0
O
Uds
-2/3 113
1
1
0
1
uw
1
0
0
1
Uds
1
-1
O
-1
dds
1/2 112 -1
O
Wd
1/2 -112 -1
-1
&a
ainsi qu'un décuplet de baryons : Tableau 6
-
-
!cuplet baryonique
't Q / I e I = I s + $
A++
1
2
A+
1
1
A0
1
O
A-
1
-1
om position
Y'+
O
1
uw
Y.0
O
O
Uds
Y'-
O
-1
dds
=.O
-1
O
=.-
-1
-1
0-
-2
-1
u
L
-
Le modèie de Gell-Mann rencontra donc un grand suc& puisque les partid e s et les tbonancwB2 (particules qui se désintègrent rapidement sous l'efiet de l'interaction forte, telles que le A++) qui ne semblaient obéir à aucune régularité "
Voir par exemple R.A. Salmeron, Baryon Resonances, p. 366 in Subnuclear Phcno-
Vers l’unijication des interactions
267
purent alors être comprises comme des représentations du groupe SU(3). En particulier, 1’0- fut prédit théoriquement a w t d’être observé expérimentalement. Les hadrons apparaissant alors comme des structures de quarks et d’antiquarks, ce furent les interactions entre les quarks qui devinrent fondamentales. Ainsi la désintégration bêta du neutron s’interpréta comme celle du quark d :
d
u
+ e- +
et les recherches s’orientèrent vers la mise en évidence des quarks et de leurs interactions. Certaines particules telles que le A++ et l’a- avec spin 3/2 étaient considérées comme formées de trois quarks identiques, u(l), u(2), ~ ( 3 et ) s(l),4 2 ) , s(3) respectivement. Or l’état fondamental de trois fermions identiques (les quarks ayant un spin 1/2) devait être symétrique par rapport à la permutation des trois corps, ce qui est interdit par le principe de Pauli. On a alors imaginé qu’il doit exister un nouveau nombre quantique, la couleur, susceptible de prendre trois valeurs. De cette manière, chaque quark est représenté par un spineur q! af€ecté d’un nombre quantique a, a = 1,2,3. Chaque type de quark j = u,d,s etc. est appelé une saueur. On pense actuellement qu’il existe 6 saveurs différentes, donnant lieu aux quarks u (up), d (down), c (charme), s (étrangeté), t (top) et b (beauté), et que pour chacun de ces 6 quarks il existe trois états de couleurs différentes (soit qd ,j = 1 à 6 ; a = 1 à 3). L’état fondamental d’une particule telle que le A++ est ainsi décrit par une amplitude anfisymétrique par rapport à la couleur :
A++
Gbcua(l)ub(2)uc(3)
où u,,(l) est le quark u de couleur a dont les coordonnées d’espace-temps et de spin sont 1, et C& est ie tenseur d’ordre 3 totalement antisymétrique avec dl23 = i ; la somme s u r tous les indices a,b, c est sous-entendue. Cette amplitude est en accord avec le principe de Pauli. Chaque baryon est décrit par une amplitude de la forme :
-
cabcq.(l)qb(2)!&(3)
Ainsi le proton est représenté par l’amplitude :
et la résonance A++ est représentée par une fonction d’onde symétrique par rapport à l’échange de tous les nombres quantiques exceptée la couleur, pour laquelle elle est antisymétrique :
~
ed. par A. Zichichi Academic Press Inc. Londres 1969 ; et R.A. Sdmeron What Old Baryo&?, p. 565 in Proc. of the 1977 huropean Conference on $article Physics, Budapest, Hungary, 4-9 July 1977, ed. L. Jenik et I. Montvay, p. 565. mena,
is New on
Sources et évolution de la physique quantique
268
(le quark ul(1) au point 1et le quark uz(2) au point 2 ont des couleurs différentes). De la même façon, un méson est constitué d’un quark lié à un antiquark, l’amplitude étant la somme sur l a couleurs de ces paires : Méson
-
3
zqa 0=1
Ainsi :
+
r+ -&u,
&?A2
K + -Gu, +;szu,
+ Gu3 + Ku3
Le tableau 7 donne la liste des quarks dont l’existence est aujourd’hL admise, chacun d’entre eux pouvant prendre trois états de coule? différents a = 1,2,3. Les quarks sont colorés, mais ne sont pas observables ; leur existence découle de la description des hadrons observés qui, eux ne portent pasLdeCouleur. Tableau 7 Quarks ?om (anglais)
aveur I
13
s c b i Q(1el
UP
t/2 1/2 O O O O
2/3
down
1/2 -1/2 O O O O
-1/3 2/3
charm
O
O
0 1 0 0
strange
O
O
-1 O , O O -1/3
top
O
O
O 0 0 1
2/3
O
O O 1 O
-1/3
bottom
O
Q = 13
+ $ ( B + s + c t b + t)
a = 1,2,3 correspondent aux 3 états de couleur
Le quark charmé fut postulé par Sheldon Glashow, Jean Iliopoulos et Luciano Maiania3 pour justifier l’absence de courants faibles neutres qui changent
l’étrangeté. Il fut mis en évidence en 1974 lorsque Sam Tinga4, analysant auprès du synchrotron à gradient alterné de Brookhaven la production de paires e+,eà partir d’interactions de protons sur du béryllium d’une part, et Burt Richterss, indépendamment, examinant à l’anneau de collision SPEAR au voisinage de l’accélérateur linéaire de Stanford SLAC les annihilations e+, e-, découvrirent l’existence d’un état lié ( c - E), que l’on appela J / @ , et qui est constitué d’un quark charmé c s3
”
S . Glashow,J. Iliopoulos et L. Maiani, Phys. Rev. D2, 1285 (1970). J.J. Aubert et al., Phys. Rev. Lett. 33,1404 (1974). J.E. Augustin et ai., Phys. Rev. Lett. 33, 1406 (1974).
Vers l’unification des interactions
269
lié à son antiquark charmé E. Il s’agit d’un état qui, par analogie au positronium, fut appelé chatmonium : 3
0=l
-
Sa masse est 3 , i GeV. En 1978, l’équipe de Léon Lederman“ au Fermi National Laboratory étudiant les paires p+p- produites dans des interactions de protons de 400 GeV/c sur des noyaux découvrit un méson de masse élevée, m 9,5 GeV, dont les propriétés sont très bien décrites si on suppose qu’il s’agit d’une structure de type b$ : c’est le méson upsilon, T :
-
T
-
3
xxb, o=l
Remarquons qu’un doublet comme celui du nucléon :
ou le doublet des quarks u et d :
sont des éléments de l’espace dans lequel agit le groupe SU(2) et où l’on introduit un nombre quantique qui est celui de l’isospin I. Dans l’espace des isospineurs, trois matrices de base sont déhies, Il = 2,I2 = y, 1 3 = y , dont l’une est diagonale et distingue le quark u , 13 = 112, du quark d, 13 = -112 : ce sont les générateurs du groupe SU(2). Dans le modèle de Gell-Mann, les trois quarks u , d , s forment un tri-vecteur, élément d’un espace où opère le groupe SU(3) dont les générateurs sont huit matrices à trois lignes et trois colonnes. Deux de ces matrices sont diagonales, ce qui permet de définir l’isospin et l’étrangeté. Dans le cas de quatre quarks, u , d, e, s, on a affaire au groupe SU(4) et l’on introduit un nouveau nombre quantique, le chatme c. De la même manière, on d é h i t le nombre quantique b lorsqu’on traite des particules contenant le quark b. On fera de même avec le quark 2 lorsqu’on aura observé des particules le contenant, ce qui n’est pas encore le cas aujourd’hui (voir cependant page 278) : un nouveau nombre quantique t sera alors introduit.
S.W. Herb et al., Phys. Reu. Lett. 39,252 (1977).
270
Sources et évolution de la physique quantique
6.2 Les champs de jauge et les interactions fortes La notion de champs de jauge s’est avérée aussi féconde pour décrire les interactions fortes qu’elle l’avait été pour les interactions électromagnétiques. Et avant de parler des modèles d’unification de ces dernières avec les interactions faibles, nous d o n s l’expliciter. Le premier exemple de champ de jauge est le champ électromagnétique. On sait que le champ électrique E(z) et le champ magnétique B(zj se déduisent des
+
potentiels 4(z) et A(z) au moyen des équations :
ïi convient de noter que ces équations ne changent pas lorsqu’on remplace ces potentiels par d’autres, #(z) et relations :
A’(lj
liés aux potentiels
4(z) et
4
A ( z ) par les
dA
4’b)“4b) - Z ’
A’(=)=À’(z) + TA(=) où A(z) est une fonction dérivable arbitraire. En effet :
puisque le rotationnei d’un gradient est identiquement nul. La transformation de
$’Â en q1f A s’appelie une
trawformation de jauge. Les équations de Maxweli homogènes aussi bien que celles qui relient les champs aux sources ne changent pas lors de cette transformation - elles sont invariantes de jauge. Cela est naturel : les lois physiques ne doivent pas contenir des fonctions arbi-
traires, telles que A(%). Ainsi, en physique classique, ce sont les &s 3,B qui sont observables, non les potentiels (en mécanique quantique, cependant, les potentiels ont une action physique directe, comme le montre l’effet Bob-Aharonov : cet &et est défini par un facteur de phase qui dépend des potentiels, mais qui est invariant de jauge). Bien que le lagrangien et l’hamiltonien classiques ne soient pas invariants de jauge, on postule en mécanique quantique que l’équation de Schrodinger est invariante de jauge, puisque cette équation sert à décrire des situations physiques. Pour qu’elle le soit, il faut que la trançformation des potentiels décrite par l’équation (1) soit accompagnée d’une transformation des fonctions d’onde de la forme : -.)
(2)
Vers l‘unification des interactions
271
L’ensemble des transformations (1) et (2) constituent les tramformatiom de jauge électromagnétique ou transformations du groupe U(i). On vérifie que les équations qui contiennent des opérateurs avec les dérivées usuelles :
sont invariantes de jauge si l’on y remplace les opérateurs de différentiation :
3+3= a- hieA
4
(4)
par les dérivées covariantes qui contiennent un champ se transformant suivant l’équation (1)’ et une fonction d’ondes $ 8e transformant d’après (2). Le champ qui s’ajoute aux dérivées usuelles pour rendre effective cette invariance s’appelle, depds Hermann Weyl, un champ de jauge. L’équation invariante de jauge associée à l’équation (3) s’écrit donc :
3
et Di sont définis par les équations (4). L‘apparition du champ de jauge dans les dérivées covariantes implique que ce champ interagit avec le & $ - c’est, dans le cas présent, l’interaction du champ électromagnétique avec le courant électrique déterminé par le champ $. La notion de champ de jauge fut généralisée en 1954 par C.N. Yang et R. Mills8’. Ils remarquèrent qu’un champ défini par un isospineur, comme celui des nucléons - proton et neutron - ou celui du doublet de quarks u et d, peut subir une transformation de phase similaire à celle décrite par l’équation (2). Ainsi, si N(x) est l’isospineur du nucléon
où
et compte tenu du fait que si on néglige la différence de masse entre le proton et le neutron, les lois de la physique nucléaire (en excluant celles de l’électromagnétisme) sont invariantes lors du changement de l’un en l’autre, ceci se traduit par le fait que ces lois sont invariantes par la transformation de N ( z ) en N’(z),où :
(‘2)
N’(2) = e x p i x . -
N(z)
(5)
où les 7’ sont les générateurs du groupe SU(2) (les matrices de Pauli) et Xl,X2, sont les trois paramètres (les constantes du groupe). Dans cette transformation ” C.N.Yang et 1597 (1956).
R.L. Mills, Phys. Res. 96, 191 (1954) ;R. Utiyama, Phys. Rev. 101,
272
Sources et évolution de la physique quantique
apparaissent les générateurs d’un groupe de transformations non commutatives, (groupe appelié non-abélien en mémoire du grand mathématicien norvégien Abel). L’invariance implique la conservation d’un courant, analogue au courant électromagnétique pour les charges, le courant d ’isospin ;en raison de cette analogie avec le cas électromagnétique, on introduit alors un nouveau champ de jauge qui interagit avec ce courant. Le remplacement des constantes X1,X2,& par trois fonctions arbitraires h l ( z ) ,A ~ ( z ) A , ~ ( z dans ) la transformation (5) définit les transformations de phase locales :
et I’invaxiance, pour N(z),de ces équations lors de la transformation (6) est assurée par le remplacement des dérivées ordinaires nouvelles dérivées covariantes :
9 et & dans l’équation (3) par les
où a,b = 1,2,3 définissent les trois lignes et les trois colonnes des matrices 4
--$
7,et Ak
et q5 sont les composantes spatiales et temporelles de trois champs quadrivectoriels : --+ A,,,p = O, 1,2,3. g est une constante similaire à la charge e en électromagnétisme (la flèdie indique un trivecteur dans l’espace des isospineurs). Les champs de jauge se transforment d’après des lois qui généralisent les équations (1) et se généralisent eux-mêmes aux groupes SU(n). Lorsque les transformations sont celles du groupe SU(3). dans l’espace de la couleur pour les quarks, il existe huit champs quadrivecteurs : ce sont les champs des gluons, qui déterminent huit états de couleur pour les gluons, et qui sont associés aux huit générateurs du groupe. Les gluons possèdent donc une couleur, ce qui leur permet d’interagir avec eux-mêmes. La chromodynamique quantique est la théorie des interactions fortes : on admet que les interactions fortes ne sont pas dues primordialement à un échange de mésons entre des nucléons, mais sont le résultat de l’échange de gluons entre des quarks. On considère aujourd’hui les interactions fortes comme dues à l’existence du nombre quantique de couleur. Le3 leptons, qui n’ont pac de couleur, ne produisent ni ne subissent d’intemctions fortes. De la même façon que l’interaction de Van der Waals entre deux molécules neutres résulte de l’échange de photons virtuels entre les constituants électroniques des molécules, l’interaction de Yukawa, eiie, est une sorte d’échange de gluons virtuels entre les quarks qui composent deux nucléons, de sorte que la couleur de l’ensemble soit nulle. Si nous rep&entons par un diagramme de Feynman la structure d’un proton, celui-ci, étant composé de trois quarks, aura la forme donnée par la figure 6.1 :
Vers l’unification des interactions
273
N Figure 6.1
Figure 6.2
En plus des quarks on trouve dans un proton libre des gluons et des paires de quarks et antiquarks virtuels. Ainsi l’émission d’un pion négatif A- par un neutron se transformant en un proton est représentée par le diagramme de la figure 6.2. La réaction d’échange d’un pion chargé entre un proton et un neutron peut être représentée par la figure 6.3 page suivante.
Les gluons, qui ont une couleur, ne sont pas directement observables, de même que les quarks. Mais ils produisent des jerS de bosons, formés de paires quarksantiquarks. On admet que si l’on écarte un quark d’un antiquark, l’union des deux constituant la structure d’un boson, la force d’attraction entre eux augmente avec leur distance de séparation et en arrive à donner lieu halement à la création de nouvelles paires : ce sont ces paires qui constituent un jet de bosons. Et c’est ce processus qui entre en jeu lorsqu’on essaie d‘isoler aussi bien un quark qu’un gluon.
La figure 6.4 montre la réaction de production d‘un méson KO et d’un ho à partir du bombardement de protons par des A- : x- + p
--t
Ir’’ + A o
Dans l’état initial on a le proton (uud) et le pion x - (Ud). La réaction fait naître la paire quark 5 - antiquark 3 qui s’accrochent respectivement aux quarks u et d pour constituer le A”, et au quark d pour donner naissance au méson KO. On voit que dans cette réaction, il y a production de particules étranges et conservation de l’étrangeté (c’est la produciion rusociée). L’essentiel dans cette réaction est l’annihilation de la paire de quarks u , ü et la création de la paire 5,s’ ainsi que la substitution du quark u du proton par le quark 5 nouvellement créé, et celle de l’antiquark U du A- par le nouvel antiquark F du ICo.
274
Sources et éuolution de la physique quantique
N
,
i
Figure 6.4 Répétons, néanmoins, que l’interaction forte primordiale est celle s’exerçant entre les quarks qui échangent des gluons, et non celle s’exerçant entre baryons avec échange de mésons. L’énergie d’un système de quarks en interaction se compose non seulement de celle des quarks supposés libres et de celle de leur interaction avec les gluons, mais également de l’énergie de l’interaction des gluons avec eux-mêmes : ce terme, mathématiquement non linéaire en fonction du champ de gluons, exprime le fait que les gluons ont une couleur (une ‘ charge par analogie électromagnétique) et par conséquent interagissent entre eux ; ce que ne font pas les photons, qui ne possèdent pas de charge électrique mais qui peuvent néanmoins donner lieu à une d i h i o n photon-photon par l’intermédiaire de paires virtuelles électron-positon, comme l’indique la figure 6.5.
Figure 6.5
Vers l’unification des interactions
275
6.3 Le modèle standard d’unification
des interactions électromagnétique et faible La théorie utiljsant le premier champ de jauge, le champ électromagnétique, se développa à partir de l’unification du champ électrique et du champ magnétique découverte par Maxwell en 1867 et complétée par Einstein en 1905. En 1928-1929, on appliqua la méthode de quantification à ce champ et il en résulta l’électrodynamique quantique, grâce aux travaux de Dirac, Heisenberg et Pauli. Finalement, en 1948, on découvrit la procédure de renormalisation qui permit le calcul à tous les ordres d’approximation, grâce aux travaux de Richard Feynman, Juiian Schwinger, Freeman Dyson et Sin-Itiro Tomonaga. La découverte du champ de jauge de Yang-Milis ouvrit de nouveaux horizons et conduisit à l’unification des interactions électromagnétiques et des interactions faibles. Dès 1958,lorsqu’on attribua les interactions faibles à l’action d’un boson vecde l’égalité de la constante de couplage g de ces toriel W + ,W - , bosons avec les courants faibles et de e - la constante de couplage des photons avec les courants électriques - indiquait pour la première fois que les deux types de quanta, les W et le 7, possédant le même spin et la même constante d’interaction avec la matière, devaient constituer deux manifestations d’une même particule. La difficulté essentielle provint du fait que l’égalité e = g impliquait une masse élevée pour le boson W alors que la masse du photon est nulle. II devenait donc difficile de mettre ces deux particules dans un même multiplet, ce qui suppose l’existence d’une certaine symétrie : en choisissant pour celle-ci l’invariance de jauge, on était conduit à attribuer aux bosons intermédiaires une masse nulle, comme dans le cas des photons. La solution fut trouvée vers la fin des années 1960 par Steven Weinberg, et, indépendamment, par Abdus Salam et Sheldon Glashow88b. Un résultat expérimental de première importance, la violation d e la parité dans le3 interactions faibles, allait lui servir d’argument. Nous allons rappeler sa genèse. Des recherches entreprises sur la désintégration des mésons K surgit en 1955 un paradoxe qui fut appelé le puzzle û - T . Le méson K+ symbolisé alors par û+ se désintègre en deux pions :
e+ -,
-
ir+ + * O
Un autre méson K - symbolisé alors par T+
A+
T+
-
se désintègre en trois pions
+*+4- ir-
Les données expérimentales indiquaient que ces deux particules, 0 et T , avaient la même masse et la même durée de vie. Mais selon l’analyse théorique, les pions ayant une parité intrinsèque négative, les deux particules devaient être distinctes si l’interaction faible, responsable de leur désintégration, conservait Is parité (c’est-àdire l’invariance par rapport à la réflexion dans un miroir). Ce fut alors que T.D.
’“ J. Leite Lopes, Nucl. Phys. 8,234 (1958). cf réf. 78, p 259, et la conférence Nobel de S. Weinberg, p 279.
276
Sources et évolution de la physique quantique
Lee et C.N. Yang sotunirent à un examen critique toutes les données relatives à l’interaction faible et conclurent qu’il n’y a 6 t aucune évidence de conservation de la parité par cette interaction. Si donc la parité’ n’était pas conservée, û et 7 pourraient n’être bel et bien qu’une seule et même particule, et le puzzle serait ainsi résolu. Des expériences spécifiques inspirées par Lee et Yang furent réalisées par différents chercheurs et montrèrent qu’effectivement l’interaction faible ne conserve pas la parité. Ce fut le cas de l'expérience analysant la distribution angulaire des électrons émis lors d’une transition bêta permise par des noyaux radioactifs polarisés tels que le cobalt 60 :
+ + Y;
Cos0 -+ Nido e
par Mme C.S. Wu et ses collaborateurs à Washington 8 9 . D’autres expériences indiquèrent également une violation de l’invariance par rapport à la conjugaison de charge. En 1964, une équipe comprenant le Français R. Turlay et les futurs prix Nobel V. Fitch et J. Cronin, ainsi que J. Christensonso montra que les mésons K neutres se désintègrent en violant la transformation CP - violant de plus séparément la conjugaison de charge C et la parité P. De nombreux physiciens, tels W. Pauli et E. P. Wigner, accueillirent avec surprise ces résdtats : ils impliquent en effet que les interactions responsables de la désintégration des mésons K violent également l’invaxiance par renversement du temps T,puisque la théorie, aujourd‘hui encore, suppose l’invariance de toutes les interactions par rapport à la transformation définie par l’opérateur CPT. Revenons maintenant aux déductions de Weinberg lors de la construction du modèle standard. La violation de la parité dans les interactions faibles implique que le neutrino v, ait une héiiuté négative : Weinberg considéra donc que la partie lévogyre de l’électron devait accompagner le neutrino entièrement lévogyre pour former un isospineur L ; et en plus, il devait exister un singlet S constitué par la partie dextrogyre de l’électron. Ainsi, en considérant ces champs comme des champs de Yang-Mills,on est amené à considérer le groupe SU(2) agissant sur I’isospineur L et le groupe U(i) agissant sur le singlet S. Si l’on admet que la théorie est invariante par rapport au groupe SU(2)QDU(l),toutes ces particules devraient avoir une masse nulle, la masse nulle du neutrino, due au fait qu’il n’existe pas de neutrino dextrogyre, impliquant une masse nulie pour l’électron lévogyre. Weinberg eut alors l’idée d’introduire un nouveau champ dans la théorie, un doublet de champs scalaires pourvus d’une masse imaginaire et en interaction avec les leptons, ce champ ayant en plus une interaction spéciale, une autc-interaction du quatrième ordre proportionnelle au carré (négatif) de cette masse imaginaire. Ce champ a la propriété d’avoir deux états fondamentaux - un vide dégénéré - qui
C.S. Wu, E. Ambler, R.W. Hayward, D.D. Hoppes et RP. Hudson, Phys. Rev. 105, 1413 (1957). J.H. Christenson, J.W.Cronin, V.L. Fitch et R Turiay, Phys. Rev. Lett. 13, 138 (1964).
277
Vers l’unijïcation des interactions
se transforment sous réflexion du champ. Les quanta de ce champ sont appelés les boson, de Eiggs. Si l’on choisit l’un des deux états fondamentaux autour duquel on développe tous les champs, la symétrie sera brisée. Mais en même temps
apparaîtront des termes dans le formalisme qui donneront au champ scalaire physique une masse réelle, ainsi qu’une masse (réelle) pour l’électron physique - tout en conservant une masse nulle pour le neutrino. La symétrie de jauge imp& initialement sera en partie brisée - seule restera intacte la symétrie de jauge du groupe U(i), la symétrie électromagnétique (sans masse). Cette brisure partielle conservera une masse nulle pour le photon, tandis qu’une masse apparaîtra pour les bosons W + , W - , ainsi que pour le boson neutre 2”. Dans ce modèle, l’existence du 2” devient une conséquence du formalisme : le modèle prévoit donc l’existence d’interactions faibles mettant en jeu des couranis faibles neutresg1. Aux quatre générateurs des groupes SU(2) et U(1) correspondent quatre champs vectoriels de jauge introduits par le modèle : A,, , dP2, APs,B,. Les deux premiers se combinent pour décrire les bosons chargés W + ,W - , tandis qu’un mélange entre A,, et B,, défini par une rotation à deux dimensions d’un angle de mélange ûw, déterminera les champs 2, du boson neutre 20 et le champ A, des photons :
On voit qu’à la limite ûw Au lieu de l’égalité :
-+
on a Z,(z)
-t
-d,,(z),
A,(.) -+
B,(z).
e=g suggérée en 1958, on a maintenant l’égalité e = gsinûw
reliant la charge de l’électron - la constante de couplage électromagnétique - à la contante g de couplage des interactions faibles : la limite û + 5 signifierait l’identification électrofaible, la vraie unification. Ce modèie, appiiqué aux leptons aussi bien qu’aux quarks, est en excellent accord avec l’expérience jusqu’à aujourd’hui (1994)’ et les paramètres suivants ont été déterminés : sin2Ow = O, 2325 f O, 0008 MW = (80,22 f O, 26) GeV/cZ
Mz = (91,173 f O, 020) GeV/cZ Néanmoins, on n’a pas encore découvert expérimentalement les bosons de Higgs, et les données sur les masses de ces particules sont actuellement des limites
d réf. 88a et aussi S.L. Bludman, Nuovo Cimento 9, 433 (1958). Notons que la découverte expérimentale de l’existence des courants faibles neutres est due à une é uipe du CERN travaillant sur des photos de la chambre à bulles Gargamelle. Voir F.J. Hasert et a l , Phys. Lett. 48B,138 (1973).
Sources et évolution de la physique quantique
278
''
inférieures (à 95% de confiance, c'est-à-dire que l'on estime à 5% la probabilité que la vraie d e u r de ces masses soient plus petites que d e s qui sont indiquées) :
MHO> 58,4 GeVf c' MHi > 41, 7GeV/c' Quant au quark top, un groupe de physiciens utilisant le détecteur CDF (Collider Detector at Fermilab) a annoncésa découverte s ' % ~ printemps 1994. L'anneau de collision de ce laboratoire était rempli d'antiprotons et de protons circulant en sens inverse, et offrant lors de leurs chocs une énergie disponible de 1,8 TeV. Parmi les interactions observées, 12 événements sont apparus comme des candidats possibles à la réaction de production d'une paire de topantitop ,production suivie de la désintégration purement leptonique :
P
+F
- t
+5
+ p -+
t
e ( d + 4P)-
Vc(p) ü e ( p )
ou semi-leptonique : p
+ Z +e ( p ) v + jets.
La mesure de l'énergie de leurs produits de désintégration permit de donner au top la masse : Mt
= 174 f1 0 t : ~GeV/c'
Ce résultat doit être considéré comme préliminaire, la probabilité que ces candidats ne soient pas de vraies réactions de production du top n'étant pas encore négligeable. Elle le deviendra lorsque les physiciens du Fermilab auront accumulé un nombre d'événements statistiquement significatif. Si les étapes postérieures de l'analyse c o n h e n t ce résultat, la découverte du top possédant une masse de cette valeur serait un suc& remarquable pour le modèle standard d'unification des interactions électro-faibles.
''
Voir Review of Partides Properties, php3. Reu. D50,1192 (1994). F. Abe et ai., FEUILAB-PUB 94/097-E,avril 94.
'ln
Article XVIII
L'unification électro-faible Théorie des champs des interactions faibles et électromagnétiques
STEVENWEINBERG Conférence Nobel 1965
*
[traduit par W. Escoubès]
Notre travail. en physique, est de voir les choses de manière simple. de comprendre un grand nombre de phénomènes compliqués de façon unifiée. en termes de quelques principes simples. Parfois, nos efforts sont projetés en pleine lumière par une brillante expérience, comme le fut en 1973 la découverte des réactions de neutrinos par courants neutres. Mais même dans l'intervalle obscur qui sépare les percées expérimentales, les idées théoriques continuent toujours leur régulière évolution, conduisant presque lmperceptiblement au changement de nos convictions antérieures. Dans cet exposé, je veux présenter le développement de deux lignes de pensée en physique théorique. L'une d'elles est le lent approfondissement de notre compréhension de la symétrie, et en particulier de la symétrle brisée ou cachée. L'autre est le vieux combat pour en finir avec les Infinis en théories quantiques des champs. A un degré remarquable, nos théories détaillées actuelles des interactions entre les particules élémentaires peuvent être comprises de manière déductive, comme des conséquences des principes de syrnetrie e t d'un principe de renormalisation auquel on fait appel pour manier les infinis. Je décrirai brièvement comment la convergence de ces lignes de pensée m'a conduit à mon travail sur l'unification des interactions faibles et électromagnétiques. Pour la plus grande part, mon expos6 sera centré sur mon apprentissage progressif de ces matières, car c'est un sujet dont Je peux parler avec une certaine assurance. Moins assuré, toutefois, j e tenterai aussi de regarder plus loin, et de suggérer quel rble ces lignes de pensée pourront jouer dans la physique du futur. Les principes de symétrie ont fait leur apparition dans la physique du vingtième siècle en 1905, Iorsqu'Einstein identifia le groupe d'Invariance de l'espace et du temps. Grâce à ce précédent, les symétries dans l'esprit des physiclens prennent le caractère de principes a priori de validité univenelle, d'expressions de la simplicité de la nature à son niveau le plus profond. De sorte qu'il fut douloureux et difficile dans les années 1930 de réaliser qu'il existait des symétries internes, comme la conservation de I'isospln [l],
*
Copyright Fondation Nobel
Sources et évolution de la physique quantique
280
qui n'avaient rien à voir avec l'espace et le temps, des symétries qui sont loin d'être évidentes et qui ne concernent que ce qu'on appelle maintenant les interactions fortes. Les années 1950 voient la découverte d'une autre symétrie interne - la conservation de l'étrangeté [2) - que ne respectent pas les interactions faibles, et on découvrit même que l'une des symétries de l'espace-temps que l'on croyait sacrée la parité
-
-
était violée par les interactions faibles [3]. Au lieu d'aller vers l'unité. les physiciens étaient en train d'apprendre que les difiérentes interactions obéissaient apparemment à des symétries tout à fait différentes. Les choses devinrent encore plus confuses lorsqu'on découvrit un groupe de symétrie au début des années 1960 - la " eightfold way 'I (la
-
voie octuple) qui n'était méme pas une symétrie exacte des interactions fortes [4]. Ce sont toutes des symétries " globales ", pour lesquelles les transformations de symétrie ne dépendent pas de la position dans l'espace-temps. O n s'était rendu compte [5] dans les années 1920 que l'électrodynamique quantique possédait une autre symétrie de type beaucoup plus puissant, une symétrie *' locale " lors de transformations où le champ de l'électron subit un changement de phase qui peut varier librement d'un point a l'autre de l'espace-temps et où le potentiel vecteur subit une transformation de jauge correspondante. Aujourd'hui on I'appelerait une symétrie de jauge U(l), car un simple changement de phase peut être vu comme une multiplication par une matrice unitaire 1 x 1. L'extension à des groupes plus compliqués fut faite par Yang et Mills [SI en 1954 dans un article fécond où ils montrerent comment construire une théorie de jauge des interactions fortes. Le nom " " signifie que les transformations du groupe de symétrie consistent en des matrices unitaires 2 X 2 ' I spéciales ", en ce sens que leur déterminant vaut l'unité. Mais l à aussi, il semblait que la symétrie, si tant est qu'elle existe, devait être approchée, car au moins à une approche naïve, l'invariance de jauge exige que les bosons vectoriels comme le photon doivent avoir une masse nuile, et il semblait évident que les médiateurs des interactions fortes ne sont pas des particules de masse nulle. La vieille question demeurait : si les principes de symétrie sont une expression de la simplicité de la nature, comment peut-il y avoir des choses comme une symétrie approchée 1 La nature est-elle approximativement simple I Entre 1960 et le début de 1961. j'entendis parler d'une idée qui avait trouvé son origine bien avant dans la physique de l'état solide. Elle avait été lancée en physique des particules par des gens comme Heisenberg, Nambu et Goldstone qui avaient travail@ dans les deux domaines. C'était l'idée de la symétrie brisée : I'hamiltonien et les relations r de commutation d'une théorie quantique pouvaient posséder une symétrie exacte et les états physiques pouvaient néanmoins ne pas constituer des représentations pures de la symétrie. En particulier, une symétrie de I'hamiltonien peut ne pas être une symétrie du vide. Comme cela arrive parfois aux théoriciens, je tombai amoureux de cette idée. Mais comme il arrive souvent dans les affaires de cœur, j e fus pris au début d'une certaine confusion quant à ses prolongements. Je pensais (cela s'avéra faux) que les symétries approchées parité, isospin, étrangeté, " eightfold way " - devaient en réalité être des principes de symétrie exacts a priori et que les violations observées de ces symétries devaient en quelque manière se faire jour lors de la brisure spontanée de la symétrie. Je où au fus donc plutôt perturbé lorsque l'entendis parler d'un résultat de Goldstone moins dans un cas simple, la brisure spontanée d'une symétrie continue comme I'isospin entraînait nécessairement #'existence d'une particule de masse et de spin nuls - que l'on
su(2)
su@)
-
[?I,
Vers I'unzFcation des interactions
281
appellerait aujourd'hui un Soson de Goldstone. II me semblait évident qu'il ne pouvait exister aucune nouvelle particule de masse zéro de ce type qui n'ait déjà été découverte. J'eus de longues discussions sur ce problème avec Goldstone, à Madison. l'et6 1961, et aussi avec Salam dont J'étais l'hôte à l'Imperia1 College en 1961-1962.Tous les trois, nous Mmes bientôt capables de montrer que les bosons de Goldstone doivent de fait apparaltre lorsqu'une symétrie comme I'isospin ou l'étrangeté est spontanément brisée, et que leurs masses demeurent nulles à tous les ordres de la t h a r i e des pertubations. Je me souviens avoir été si découragé par ces masses nulles que lorsque nous &rifimes notre article en commun sur le sujet [8], l'ajoutai une note nnaie à l'article pour souligner combien il était futile de supposer que l'on pût expliquer quoi que ce soit en termes d'état du vide non-invariant : c'était la réplique de Lear à Cordelia, " Rien ne vient de rien : continue de parler ' I . Bien entendu, la Physical Review défendit la pureté de la littérature physique et supprima l a note. Si on considère ce qui advint d u y i d e non-invariant en physique théorique, ce ne fut pas si mal. II y eut finalement une exception à cette démonstration, signalée peu après par Higgs, Kibble et d'autres [9].Ils montrèrent que si la symétrie est locale, si c'est une symétrie de jauge comme l'invariance de jauge électromagnétique, alors, les bosons de Goldstone peuvent être éliminés par une transformation de jauge, bien qu'ils existent de manière formelle, et dans un certain sens sont réels, de sorte qu'ils n'apparaissent pas comme des particules physiques. Les bosons de Goldstone manquants apparaissent à la place comme des états d'hélicité zéro de particules vectorielles, qui de ce fait acquièrent une masse. Je pense que les physiciens qui à cette époque entendaient parler de cette exception la considéraient en général comme un détail technique. De nouveaux développements en physique théorique semblèrent soudainement convertir les bosons de Goldstone d'intrus indésirables en amis bienvenus. En 1964, Adler et Weisberger trouvèrent, de manière indépendante des règles de somme qui donnèrent le rapport g A / g v de la constante de couplage axiale à la constante de couplage vectorielle dans la désintégration beta en termes des sections efficaces pion-nucléon. Une manière de voir leur calcul (peut-ëtre la manière la plus courante à l'époque) était d'y trouver l'analogue à la vieille règle de somme dipolaire de la physique atomique : un ensemble complet d'états hadroniques est inséré dans les relations de commutation des courants axiaux. C'est l'approche dont on se souvient sous le nom d'algèbre de courants [il]. Mais ily avait une autre manière de considérer la règle de somme d'Adler-Weisberger. On pouvait supposer que les interactions fortes p o e d a i e n t une symétrie approchée, basée sur le groupe su(2) X et que cette symétrie était spontanément brisée, donnant lieu entre autres à la masse du nucléon. Le pion est alors identifié comme étant (approximativement) un boson de Goldstone, avec une petite masse non-nulle, une idée proposée déjà par Nambu [12]. Bien que la symétrie X soit spontanément brisée, elle contient encore un grand pouvoir de prédiction. Mais ses prédictions prennent la forme de formules approchées, qui donnent les éléments de matrice pour les reactions avec des pions de basse énergie. Dans cette approche, la règle de somme de AdlerWeisberger est obtenue en utilisant les longueurs de diffusion prévues pour la diffusion pion-nucléon en liaison avec une règle de somme bien connue (131, qui avait été obtenue des années auparavant à partir des relations de disperslon pour cette diffusion pion-
[io],
su(2)
su@) su@)
282
Sources et évolution de la physique quantique
nucléon. Dans ces calculs, on exploite en réalité le fait que non seulement les interactions X spontanément brisée. mais aussi que fortes ont une symétrie approchée les courants de ce groupe de symétrie peuvent être identifiés, à une constante près, aux courants vectoriel et axial de la désintégration bêta. (Cette hypothese permet de faire rentrer gA/gv dans cette formulation à travers la relation de Goldberger-Treiman [14],qui exprime ie rapport gA/gV en fonction de ia constante de désintégration du pion et du couplage pion nucléon). Ici, dans la relation entre les courants des symétries des interactions fortes et les courants physiques de la désintégration bêta, on avait une indication stimulante d'un profond rapport entre les interactions faibles et les interactions fortes. Mais ce rapport ne f u t en fait pas réellement compris pendant près de dix ans. Je passai les années 1965-1967 en développant avec bonheur les implications de la brisure spontanée de symétrie pour les interactions fortes (151. Ce fut ce travail qui conduisit en 1967 à mon article sur l'unification faible et électromagnétique. Mais avant d'en arriver là, je dois revenir en arrière et signaler une autre ligne de pensée, qui traite du problème des infinités en théorie quantique des champs. Je crois que ce furent Oppenheimer et Waller en 1930 [16], qui, indépendamment, notèrent les premiers que SI l'on étendait l a théorie quantique des champs au delà de l'approximation la plus basse, elle donnait lieu à des résultats divergents dans l'ultraviolet pour le rayonnement dû à l'auto-énergie. L e Professeur Waller m'a dit la nuit dernière que lorsqu'ii présenta ce résultat à Pauli, celui-ci ne le crut pas. On auralt pu croire que ces Infinis constitueraient un désastre pour la théorie quantique des champs qui venait d'être développée par Heisenberg et Pauli en 1929-1930. En effet, ces Infinis provoquèrent un sentiment de découragement envers la théorie quantique des champs et de nombreuses tentatives furent faites dans les années 1930 et au début des années 1940 pour trouver des alternatives. Le problème fut résolu (au moins pour l'électrodynamique quantique) après la guerre, par Feynman, Schwinger et Tomonaga [17]et par Dyson [19].Ils trouvèrent que tous les infinis disparaissent si l'on identifie l a masse et la charge de l'électron non pas avec les paramètres m et e apparaissant dans le lagrangien. mais avec la masse et la charge qui sont CJ/CU/& à partir de m et de e, lorsqu'on prend en compte le fait que l'électron et le photon sont toujours entourés d'un nuage de photons virtuels e t de paires Tout d'un coup, toutes sortes de calculs devinrent possibles et electron-positon donnèrent des résultats en spectaculaire accord avec l'expérience. Mais même après ces succès, les opinions continuaient de différer sur la signification des dlvergences ultraviolettes de la théorie quantique des champs. Beaucoup pensaient - et quelques-uns continuent à penser - que l'on n'a fait que repousser le vrai probleme sous le tapis. Et il devint bientôt clair qu'il n'y avait qu'une classe limitée de théories dites " renormalisabies " dans lesquelles les infinis pouvaient être éliminés en les absorbant dans une redéfinition. une " renormalisatlon " d'un nombre fini de parametres physiques. (Grossièrement parlant, dans les théories renormalisables, aucune constante de couplage ne peut avoir les dimensions de puissances négatives de la masse. Mais chaque fois que nous ajoutons un champ ou une dérivée par rapport à l'espace-temps à une interaction, nous réduisons le nombre de dimensions de ia constante de couplage associée. Seuls quelques types simples d'interaction sont renormalisables). En particulier, ia thCorie de
su(2) su(2)
[is].
Fermi existante pour les interactions faibles était clairement non renormalisable. (La constante de couplage de Fermi a les dimensions d'une [masse]-2). La sensation de
Vers i'unijication des interactions
283
découragement persista Jusqu'aux années 1950 et 1960. J'ai étudié la théorie de la renormalisation en préparant mon master, essentiellement en lisant les articles de Dyson (191. Dès le début il me parut merveilleux qu'un trbs petit nombre de théories quantiques des champs fussent renormalisables. Les limltations de cette sorte sont, en fln de compte, ce que nous voulons avant t o u t : non pas des méthodes mathématiques capables de donner un sens à une lnflnlté de théories sans Intérêt physique, mais bien des méthodes qui apportent des contraintes, car ces Contraintes peuvent indiquer la voie vers la seule vraie théorie. En particulier, j'étals impresslonné par le fait que l'électrodynamique quantique pouvait dans un sens se déduire des principes de symétrie et des contraintes dues à son caractère renormalisable ; le seul lagranglen renormallsabie invariant de Lorentz et Invariant de jauge pour des photons et des électrons est précisément le lagrangien original de Dirac de l'électrodynamique quantique (EDQ). Bien entendu, ce n'est pas de cette manlhre que Dirac trouva sa théorie. II bénéficia de l'information glanée durant des siècles d'expérimentation en électromagnétisme et afln de fixer la forme finale de sa théorie, il s'appuya sur des idées de simplicité (de manière spécifique, sur ce qui est parfois appellé le couplage électromagnétique minimal). Mais nous devons regarder au-delà, tenter de faire la théorie de phénomènes qui n'ont pas été SI bien étudiés expérimentalement, et II est possible que nous ne soylons pas capables de croire à des Idées purement formelles de simplicité. Je pensais que le caractère renormalisabie pouvait Btre ie critère clé, celui qui imposerait a w l dans un contexte plus général un type précis de simplicité à nos théories et nous aiderait à dégager la seule vraie théorie physique de ia variété infinie des théories quantiques des champs concevables. Comme j e l'expliquerai plus loin, je dirais cela d'une manière un peu différente aujourd'hui, mais je suis tout à fait convaincu que l'usage du caractère renormalisable comme contrainte pour nos théories des interactions observées est une bonne stratégie. Plein d'enthouslasme pour la théorie de la renormalisation, ]'écrivis ma thèse de doctorat sous la direction de Sam Treiman, en 1957, sur l'utilisation d'une version limitée du caractère renormalisable pour mettre des contraintes aux interactions faibles [20].Un peu plus tard, je démontrai un petit théorème plutôt coriace [21],qui complétait la preuve donnée par Dyson [19] et Salam [22] que les divergences ultraviolettes s'annulent en réalité à tous les ordres dans les théories nominalement renormalisables. Mais rien de tout cela ne semblait nous aider pour le problème Important : comment produire une theorle renormalisable des interactions faibles ? Revenons maintenant à 1967. J'étais en train de considérer les implications de la X des interactions fortes et j e pensais tester l'idée que symétrie brisee la symétrie SU(2) x SU(2) était peut-être une symétrie '' iocaie *', non simplement '' globale C'est-à-dire que les interactions fortes peuvent être décrites par quelque chose comme une théorie à la Yang-Mills, mais qu'en plus des vecteurs p de la théorie de Yang-Mills, ii devait aussi y avoir des mésons vecteurs Al. Pour donner une masse au méson p, II était nécessaire d'insérer un terme de masse commun à p et à A l dans ie lagrangien. La brisure spontanée de la symétrie X séparerait alors le p du A l par quelque chose comme le mécanisme de Higgs ; mais comme la théorie n'était pas invarlante de jauge, les pions ne seraient que des bosons de Godstone physiques. Cette théorie comportait un curieux résultat : c'est que le rapport des masses Al/p devait être égal à&. En tentant de comprendre ce résultat sans faire appel à la théorie des perturbations, je découvris certaines règles de somme. les " règles de somme des
su(2) su(?,)
".
su(2) su(2)
Sources et évolution de la physique quantique
284
fonctions spectrales " [23], qui s'avérèrent fécondes pour une série d'autres usages. Mais la théorie X n'est pas Invariante de jauge, et n'est donc pas renormalisable (241 de sorte que cela ne m'enthousiasma guère (251. Naturellement, SI j e n'insérais pas le terme de masse p Al dans le lagrangien, la théorie était invariante de Jauge et renormallsable, et les Ai avaient une masse. Mals alors il n'y aurait pas eu de pions e t les mésons p n'auraient pas de masse, ce qui était en contradiction manifeste (pour ne pas dire plus) avec l'observation. Durant l'automne 1967, alors que je conduisais pour me rendre à mon bureau au M.I.T., je réalisai soudain que l'étais en train d'appliquer des idées correctes à un faux problème. Ce n'est pas le méson p qul est sans masse : c'est le photon. E t son partenaire n'est pas le A l , mais le boson intermédiaire massif, celui que l'on suspecte depuis Yukawa d'être le médiateur des interactions falbles. Les interactions faibles et électromagnétiques pourraient alors être décrites [26] de manière unifiée en termes d'une symétrie de jauge exacte, mais spontanément brisée [naturellement, pas nécessairement x Su(2)). Et cett théorie serait renormalisable comme l'électrodynamique quantique car elle est invariante de jauge, comme l'électrodynamique quantique. II ne fut pas difficile de développer un modèle qui prit corps autour de ces idées. J'avais peu confiance alors en ma compréhension des Interactions fortes, aussi décidai-je de me concentrer sur les leptons. II y a deux leptons de type électronique lévogyres, le V,L et le e t , et un lepton de type électronique dextrogyre, le e R . Aussi démarrai-je avec le groupe U ( 2 )x U(i) : toutes les matrices unitaires 2 x 2 agissent sur les leptons lévogyres de type e, alors que toutes les matrices unitaires 1 X 1 agissent sur le lepton dextrogyre de type e. Cassant u(2) en transformations unimodulaires e t en transformations de phase, on peut voir que l e groupe était X X Mais alors, l'un des peut être identifié avec le nombre leptonique ordinaire, e t puisque le nombre leptonique se conserve visiblement et qu'aucune particule vectorlelle de masse nulle n'est couplée à ce nombre, je décidai de l'exclure du groupe. II me restait donc le groupe à quatre dans le groupe paramètres SU(2) x u(1).La brisure spontanée de su(2)X de l'invariance de Jauge ordinaire électromagnétique devrait donner des masses à trois des quatre bosons de jauge vectoriels : les bosons chargés W* et un boson neutre Que ]'appelai 2'. Le quatrième boson restait automatiquement sans masse et pouvait être identifié au photon. Connaissant l'intensité des courants charges des interactions faibles comme la désintégration beta dont le médiateur est le la masse du était alors '. détermlnée comme étant environ 40 GeV/ sine, où 8 est l'angle du mélange 7 - 2 Pour aller plus loin. il nous faut faire une hypothèse sur le mécanisme de brisure de su(2)x Le seul type de champ dans une théorie su(2) x renormalisable dont la valeur moyenne dans le vide donne à l'électron une masse est un doublet de spin zéro (@+,@O) et par simplicité j e supposal qu'il s'agissait la des seuls champs scalaires de la théorie. La masse du 2' fut alors déterminée comme environ égale à ûûGeV/sin28. Cela fixait l'intensité des interactions faibles courant neutre. En effet, comme en EDQ, une fois que l'on a choisi ta liste des champs de la théorie, tous les détails sont déterminés par les principes de symétrie et la renormallsation, et seulement quelques paramètres restent libres : les masses et la charge des leptons, la constante de couplage de Fermi de la désintegration bêta, l'angle de mélange 8 et la masse de la particule scalaire. (Il était d'une importance cruciale d'imposer la contrainte de la renormalisation : sinon, les interactions faibles recevraient des contributions des couplages invariants 3 quatre
su(2) su(2)
-
su(2)
su(2) u(i) v(i).
u(i)
u(1)
w*,
u(1).
su(2),
u(1)
w*
u(1)
Vers l'unijïcation des interactions
285
u(1)
fermions su(2) X ainsi que de l'échange du boson vectoriel, et la théorie aurait perdu beaucoup de son pouvoir de prédiction). Le caractère naturel de la théorie dans son ensemble fut bien démontré par le fait qu'en grande partie elle fut développee de manière indépendante par Salam en 1968.
[%'I
La question suivante f u t celle de la renormalisation. Les règles de Feynman pour les théories de Yang-Milk avec des symétries de jauge non brisées avaient été élaborées [28] par de Witt. Faddeev. Popov et d'autres. O n savait que de telles t h e r i e s étaient renormalisabies. Mais en 1967 je ne savais pas comment prouver que ce caractère renormalisable n'était pas détruit par la brisure spontanée de la symétrie. Je travaillai sur ce problème à diflérentes reprises durant plusieurs années, en partie en coilaboratlon avec mes étudiants [29], mais j e fis peu de progrb. Rétrospectivement, j e constate que la principale difficulté provenait de ce qu'en quantifiant les champs vectoriels j'adoptai une jauge que l'on connait maintenant sous le nom de Jauge de i'unitarité [30]. Cette jauge a quelques splendides avantages : elle falt apparaltre le vrai spectre des particules de la théorie. Mais elle présente l'inconvénient de rendre la renormalisation totalement obscure. Finalement, en 1971 't Hooft (311 montra dans un magnifique article comment on pouvait résoudre le problème. II inventa une jauge, comme la " jauge de Feynman " en EDQ, dans laquelle les règles de Feynman ne conduisent manifestement qu'à un nombre fini de divergences de type ultraviolet. II fut aussi nécessaire de montrer que ces lnflnis satisfaisaient essentiellement les mêmes contraintes que le iagrangien lui-même. de sorte qu'ils pouvaient être absorbés en redéfinissant les paramètres de la théorie. (C'était plausible, mais pas facile à prouver, car une théorle invariante de jauge ne peut être quantifiée qu'après avoir choisi une jauge spécifique, de sorte qu'il n'est pas évident que les divergences ultraviolettes satisfont les mêmes contraintes d'invariance de jauge que le lagrangien lui-même). La démonstration fut complétée ensuite [32] par Lee et Zinn-Justin, et par 't Hooft et Veitman. Plus récemment, Becchi. Rouet et Stora [33] ont inventé une méthode ingénieuse pour mener à bien cette sorte de démonstration, en utilisant une supersymétrie globale des théories de jauge qui est préservée même lorsqu'on choisit une jauge spécifique. Je dois admettre que, lorsque je lus pour la première fois i'artlcle de 't Hooft en 1971, je ne fus pas convaincu qu'il avait trouvé la voie pour prouver le caractère renormalisable. L e probleme ne venait pas de 't Hooft, mais de moi : j e n'étais t o u t simplement pas assez familiarisé avec le formalisme des Intégrales de chemin sur lequel était basé le travail de 't Hooft, et l'attendais une démonstration des règles de Feynman dans la jauge de 't Hooft à partir de la quantification canonique. Ceci avait déjà été effectué (pour une classe limitée de théories de jauge) dans un article de Ben Lee [34], et la lecture de cet article. me conduisit à admettre le caractère renormallsable de la théorie unifiée comme essentiellement démontré. A cette époque, beaucoup de physiciens théoriciens commençaient à être convaincus de l'approche générale que Salam et moi avions adoptée : c'est-à-dire, que les interactions faible e t électromagnétique sont gouvernées par un certain groupe de symétries locales de jauge exactes ; ce groupe est spontanément bris4 en U(i), en donnant une masse à tous les bosons vectoriels excepté au photon ; et la théorie est renormalisable. Que notre simple modèle, spécifique, était celui qu'avait choisi la nature n'était pas si clair. C'était, bien entendu, à l'expérience de décider. Ii était évident, même avant 1967, que la meilleure manière de tester la théorie
286
Sources et évolution de la physique quantique
était de chercher les interactions faibles de courant neutre, dont le médiateur serait le boson intermediaire neutre 2 '. Naturellement, la possibilité de courants neutre n'était pas nouvelle. II y avait eu des spéculations [35] sur de possibles courants neutres dès 1937 par Gamow et Teller, Kemmer, et Wentzel, ainsi qu'en 1958 par Bludman et LeiteLopes. Des tentatives vers une théorie unifiée faible e t électromagnétique avaient été menées au début des années 1960 par Glashow, Salam et Ward [36]et elles contenaient les courants neutres, ainsi que beaucoup des caractéristiques que Salam e t mol rencontrâmes en développant notre théorie en 1967-1968.Mais puisque i'une des prédictions de notre théorie était une valeur pour la masse du elle faisait une prédlctlon bien déterminée pour i'intensité des courants neutres. Plus important, nous avions maintenant une théorie quantique des champs d'ensemble des interactions faibles e t électromagnétiques qui était physiquement et mathématiquement satisfaisante au même sens que l'électrodynamique quantique - une théorie qui traitait les photons e t les bosons vecteurs intermediaires sur le même pied, qui était fondée sur un principe de symétrie exacte, et qui permettait de mener des calculs jusqu'au degré de précision désiré. Pour tester cette théorie, il devenait mintenant urgent de trancher la question de l'existence des courants neutres. A la fin de 1971, l'effectuai une étude des possibilités expérimentales [37]. Les résultats étalent saisissants. Des expériences antérieures avaient mis des limites supérieures sur les taux de processus courant neutre qui étaient plut8t basses et beaucoup de gens avaient l'impression que les courants neutres étaient pratiquement exclus. Mais je trouvai qu'en fait la théorie de 1967-1968 prédisait des taux tout à fait bas, assez bas pour avoir échappé à la detection jusqu'à ce jour. Par exemple, des expériences [38] quelques années auparavant avaient trouvé une limite supérieure de O, 12 f O, 06 pour le rapport d'un processus courant neutre - la diffusion élastique de neutrinos muoniques par des protons - au processus courant chargé correspondant - dans lequel un muon est produit. Je trouvai une prédlction pour ce rapport de O, 15 à O, 22. suivant la valeur de l'angle 8 du mélange - 7. Ainsi, il y avait de bonnes raisons de regarder d'un peu plus près. Comme tout le monde le sait, les courants neutres furent finalement découverts en 1973 [39]. Suivirent des années d'études expérimentales soigneuses sur les proprietes détaillées des courants neutres. Passer en revue ces expériences conduirait trop loin de mon sujet [40]. Aussi me limiterai-je à dire qu'elles ont confirmé la théorie de 19671968 avec une précision constamment améliorée en ce qui concerne les réactions courant neutre neutrino-nucléon e t neutrino-électron. Les réactions courant neutre électronnucléon, analysées par la remarquable expérience SLAC-Yale de l'an dernier [41],l'ont également confirmée. Tout cela é t a i t très satisfaisant. Mais je dois dire que je n'aurais pas été autrement surpris s'Il s'était avéré que la théorie correcte était basée sur un autre groupe de jauge spontanément brisé, avec des courants neutres très différents. Une brillante théorie SU(2) avait d'ailleurs été proposée en 1972 par Georgi et Glashow [42] : elle ne comportait pas de courants neutres du tout. Ce qui était important pour moi, c'était l'idée d'un groupe de symétrie exact spontanément brisé, qui relie les interactions faibles et électromagnétiques, e t permet à ces interactions d'être renormalisables. J'étais convaincu de l'intérêt de cette idée, ne serait-ce que parce qu'elle cadrait avec ma conception de la façon d'être de la nature. II me faut mentionner ici deux autres développements théoriques intéressants au tout
zo,
zo
287
Vers l’unijïcation des interactions
début des années 1970, avant la découverte des courants neutres. L’un est l’important travail de Glashow, lllopouios et Malan1 sur ie quark charmé (431. Leur travail apporta une solution à ce qui autrement aurait constitué un problème sérieux, celui des courants neutres avec changement de l’étrangeté. Je laisse ce sujet pour la conférence du Professeur Glashow*. L’autre développement théorique regarde sp5dfiquement les Interactl6ns fortes, mais il nous ramène à l’un des thèmes de mon exposé, le thème de la symétrie. En 1973,Politzer, Gross e t W i l u e k découvrirent (441une remarquable propriété des théories à ia Yang-Mills qu’ils appelèrent la “ liberté asymptotique ” la constante de couplage effective [45] décroit vers zéro lorsque l’énergie caractéristique d’un processus tend vers l’infini. II semblait que cela puisse expliquer le fait expérimental que le nucléon se comporte dans la diffuslon profondément Inélastique d‘un électron à haute énergle comme s’il se composait essentiellement de quarks libres [46]. Mais ii y avait un problème. Afin de donner une masse aux bosons vectoriels dans une théorie de jauge des interactions fortes, on voulait inclure des champs scalaires lnteragissant fortement, et ceux-ci en général détruisent la liberté asymptotique. Une autre difiiculté, l’une de celles qui me gênaient particulièrement, était que dans le cas d’une théorie unifiée des interactions faibles e t électromagnétiques, le couplage faible fondamental est du même ordre que la charge électronique e, de sorte que les effets des bosons vectoriels intermédiaires devraient introduire des violations de la conservation de la parité e t de l’étrangeté beaucoup trop grands, de i’ordre de 1/137, parmi les interactions fortes de ces scalaires entre eux et avec les quarks (471. Durant l’été 1973, il m’apparut (et indépendamment à Gross et à Wiluek) que l’on pouvait se débarrasser des champs scalaires interagissant fortement tous ensemble, en permettant à la symétrie de jauge des interactions fortes de demeurer non-bris6e - de sorte que les bosons vectoriels, ou I’ gluons ”, seraient sans masse et en s’appuyant sur i’augmentation des forces fortes avec l’accroissement de la distance pour expliquer pourquoi ni les quarks ni les gluons sans masse ne sont détectés au laboratoire [48]. Si on suppose qu’il n’y a pas de scalaires Interagissant fortement, qu’il existe trois ‘I couleurs” de quarks (comme l’indiquait un travail antérieur de plusieurs auteurs 1491) et que le groupe de jauge est su(3), alors on a h e théorie spécifique des interactions fortes, la théorie que l’on connaît généralement sous le nom de chromodynamique quantique
-
-
(COQ).
Les expériences ont depuis lors confirmé chaque jour davantage la CDQ comme ia théorie correcte des interactions fortes. Ce qui m’intéresse ici, C’est son impact sur notre compréhension des principes de symétrie. Une fois encore, les contraintes de l’invariance de jauge et de la renormalisation se sont avérées d’une énorme puissance. Ces pntraintes forcent le iagrangien à @tresi simple que les Interactions fortes en CDQ doivent conserver l’étrangeté, la conjugaison de charge et (à part quelques problèmes [50] concernant les instantons) la parité. On n’a pas à supposer i’existence de ces symétries comme des principes a priori ; il n’y a simplement pas moyen que le lagrangien soit suffisamment compliqué pour les violer. Avec une hypothèse supplémentaire, que les quarks u et d aient des masses relativement basses, les Interactions fortes doivent aussi satisfaire la symétrie approchée su(2) x de l’algèbre des courants, qui, lorsqu’elle se brise spontanément, nous donne I’isospin. Si la masse du quark s n’est pas non plus trop
su(2)
*
Conférence Nobel, ce même jour (NdT).
Sources et évolution de la physique quantique
288
grande, on obtient alors la " voie octuple " comme une Symétrie approchée des interactions fortes. Et la brisure de la symétrie X par les masses des quarks a juste la forme (3,3) (3,3) requise pour tenir compte des longueurs de diffuslon pion-pion [15]et des formules de masse de Cell-Mann-Okubo. En outre, les interactions faibles et électromagnétiques étant également décrites par une théorie de Jauge, les courants faibles sont nécessairement les courants associés avec ces symétries de l'interaction forte. En d'autres termes, presque l'ensemble du panorama des symétries approchées des interactions fortes, faibles et électromagnétiques qui nous intriguait tant dans les années 1950 et 1960 se trouvait alors expliqué comme une simple conséquence de l'invariance de jauge forte, faible et électromagnétique, et, de plus, de leur caractère renormalisable. La symétrie Interne est maintenant au point où était la symétrie de l'espace-temps à l'époque d'Einstein. Toutes les symétries internes approchées sont expllquées de manière dynamique. A un niveau fondamental, il n'y a pas de symétrie approchée ou partielle : seules des Symétries exactes gouvernent toutes les interactions. Je vais maintenant regarder un peu plus loin et faire quelques commentaires sur le possible développement futur des ldées de symétrie et de renormalisation.
+
su(3) su@)
Nous sommes encore confrontés à la question de savoir si les particules scalaires responsables de la brisure spontanée de la symétrie de jauge électrofaible x u(1) sont réellement élémentaires. SI elles le sont. les I' bosons de Higgs " de spin zéro se désintégrant semi-faiblement devraient être trouvés à des énergies comparables à celles nécessaires pour produire les bosons vecteurs intermédiaires. D'un autre côté, il se peut que ces scalaires soient composites [51]. Les bosons de Higgs seraient alors des états indistincts, de grandes largeurs, de très grandes masses, analogues à la probable augmentation de la section efficace de l'onde-s de la diffusion ?F - ?F. II devrait aussi probablement exister des particules scalaires d'un type assez différent, plus légères, se désintégrant plus lentement, connues comme des bosons pseudo-Goldstone [52].Et il se pourrait aussi qu'existe une nouvelle classe d'interactions " extra-fortes " [53]pour fournir la force de liaison extra-forte dans la mesure où la liberté asymptotique s'établirait non à quelques centaines de MeV comme en CDQ, mais à quelques centaines de GeV. Ces forces " extra fortes " s'exerceraient entre de%ouvelles familles de fermions et donneraient à ces fermions des masses de l'ordre de quelques centaines de GeV. Nous verrons. Des quatre types d'interactions (maintenant trois), seule la gravité a résisté à l'incorporation dans une théorie quantique des champs renormalisable. Cela peut juste signifier que nous ne sommes pas assez malins pour traiter mathématiquement la relativité générale. Mais il y a une autre possibilité qui me semble tout à fait plausible. La constante de gravité définit une unité d'énergie connue sous le nom d'énergie de Planck, environ 1 0 ' GeV. C'est l'énergie à laquelle la gravitation devient effectivement une interaction forte, de sorte qu'à cette énergie, on ne peut plus longtemps ignorer les divergences ultraviolettes. II se peut qu'existe tout un monde de physique nouvelle avec des degrés de liberté insoupçonnés à ces énergies énormes et que la relativité générale ne fournisse pas un cadre adéquat pour comprendre la physique des degrés de liberté à ces super-hautes énergies. Lorsque nous explorons la gravitation ou d'autres phénomenes ordinaires, avec des masses et des énergies de particules pas plus grandes qu'un TeV ou proches, nous ne pouvons découvrir qu'une théorie des champs " effective ",c'est-&dire, une théorie dans laquelle les degrés de liberté superlourds n'apparaissent pas explicitement, mais où les paramètres de couplage représentent implicitement des sommes sur
su(2)
Vers l'unification des interactions
289
ces degrés de liberté cachés. Pour voir SI cela a un sens, supposons que ce soit vrai, et demandons-nous quelles sortes d'interactions nous nous attendons à trouver sur cette base à l'énergie ordinaire. En " intégrant sur " les degrés de liberté des énergies superhautes dans une théorie fondamentale, nous rencontrons en générai une théorie de champ effectif très compliquée - si compliquée, en fait, qu'elle contient toutes les interactions permises par les principes de symétrie. Mals lorsque l'analyse dimensionnelle nous dit qu'une constante de couplage est une certaine puissance d'une certaine masse, cette masse est vraisemblablement une masse typiquement superlourde, telle que 1 0 ' GeV. La variété infinie d'interactions nonrenormalisables dans la théorie effective a des constantes de couplage dont la dimension est celle de puissances négatives de la masse, de sorte que leurs effets sont supprimés aux énergies ordinaires par des puissances de l'énergie divisée par ces masses superlourdes. Donc les seules interactions que nous pouvons détecter aux énergies ordinaires sont celles qui sont renormalisables au sens usuel, plus des interactions non-renormalisables produisant des effets qul. bien que ténus. sont d'une manière ou d'une autre suffisamment exotiques pour être vus. Une interaction très faible peut éventuellement être détectée si elle est cohérente et de longue portée, de sorte qu'elle peut s'additionner et avoir des effets macroscopiques. On a montré [54] que les seules particules dont l'échange pourrait produire de telles forces sont des particules sans masse de spin O, 1 ou 2. D'autre part, l'invariance de Lorentz à elle seule est capable de montrer que les interactions à longue portée produites par toute particule de masse zéro et de spin 2 doit obéir à la relativité générale [55]. Donc, suivant ce point de vue, nous ne serions pas trop surpris que la gravitation soit la seule interaction découverte Jusqu'ici qui ne semble pas décrite par une théorie des champs renormalisable : c'est presque la seule interaction superfaible qui pouvait avoir été détectée. Et nous ne serions pas surpris de trouver que la gravité est bien décrite par la relativité générale aux échelles macroscopiques, même si nous ne pensons pas que la 0 ' GeV. relativité générale puisse s'appliquer à 1 Des interactions effectives non-renormalisables peuvent aussi être détectées si elles violent par ailleurs des lois de conservation exactes. Les meilleurs candidats à la vioiation sont la conservation des baryons et des leptons. Une conséquence remarquable des symetries de Jauge et su(2) X v(1) des interactions fortes, faibles et électromagnétiques, est que toutes les interactions renormalisables entre les particules connues conservent automatiquement les nombres baryonique et leptonique. Donc, le fait que la matière ordinaire semble assez stable - que la désintégration du proton n'ait pas été observée - ne devrait pas nous conduire à la conclusion que les lois de conservation des baryons et des leptons sont des lois de conservation fondamentales. A la précision à laquelle elles ont été vérifiées, les conservations des leptons et des baryons peuvent être expliquées comme des conséquences dynamiques d'autres symétries, de la même manière que la conservation de l'étrangeté peut être expliquée dans la CDQ. Mais les particules superlourdes peuvent exister et elles peuvent avoir des propriétés de transformation inhabituelles suivant su(3)ou X Su(1). Dans ce cas, il n'y a aucune raison pour que ces interactions conservent le nombre baryonique ou ie nombre leptonique. Je doute qu'elles le fassent. En effet, le fait que l'Univers semble contenir un excès de baryons sur les antibaryons devrait nous conduire à soupçonner que des processus ne conservant pas le nombre baryonique aient effectivement eu lieu. SI les effets d'une toute petite non
su(3)
su(2)
290
Sources et éuolution de la physique quantique
conservation du nombre baryonique ou leptonique tels que la désintégration du proton ou les masses des neutrinos étaient découverts expérimentalement, il nous resterait alors des symétries de jauge au seul niveau des vraies symétries internes de la nature, une conclusion qul me paraitrait très satisfaisante. L'idée d'une nouvelle échelle de masses superlourdes est apparue d'une autre manière [56].Si une sorte de '' grande unification " des couplages de jauge forts et électrofaibles était possible, on s'attendrait à ce que toutes les constantes de couplage de jauge de et de sü(2) x ü(i)soient de grandeur comparable. (En partlculler, si et s U ( 2 ) x U(1) sont des sous-groupes d'un groupe simple plus grand, les rapports du carré des couplages sont fixés comme étant des nombres rationnels de l'ordre de l'unité 157)). Mais ceci semble entrer en contradiction avec le f a i t évident que les interactions fortes sont plus fortes que les interactions faibles et électromagnétiques. En 1974 Georgi, Quinn e t moi-même suggérions que l'échelle de la grande unification, à laquelle les couplages sont comparables, se trouve à une énergie énorme, et que la raison pour laquelle le couplage fort est si grand devant les couplages électrofaibles aux énergies ordinaires est que la CDQ est asymptotiquement libre, de sorte que sa constante de couplage effective monte lentement lorsque l'énergie tombe de l'échelle de l a grande unification aux valeurs ordinaires. La variation des couplages forts est très lente (en I/-), de sorte que l'échelle de la grande unification doit être énorme. Nous trouvions que pour une assez grande classe de théories l'échelle de grande unification se trouve être dans les parages de GeV, une énergie pas trop différente de l'énergie de Planck de 1 0' GeV. La vie moyenne du nucléon est très difficile à estimer avec précision, mais nous donnions une valeur représentative de ans, qui semble accessible en quelques années d'expériences. (Ces estimations ont été améliorées en des calculs plus détaillés par quelques auteurs Nous avons aussi calculé une valeur pour le paramètre de mélange sinZ0 d'environ 0,2, pas trop éloignée de la valeur actuelle de O, 23 f O, 01. Une tache importante pour les futures expériences sur les courants neutres sera d'améliorer la précision avec laquelle sin2 8 est connu, pour vérifier s'il est réellement en accord avec cette prédiction. Dans une théorie de grande unification, afin que les particules scalaires élémentaires soient disponibles pour produire une brisure spontanée de la symétrie de jauge électrofaible aux environs de quelques centaines de GeV, il est nécessaire que ces particules évitent d'acquérir les supermasses à partir de la brisure spontanée du groupe de grande unification. II n'y a rien d'impossible à cela, mais je n'ai pas été capable de trouver une raison quelconque pour que cela se produise. (Le problème peut être en rapport avec le vieux mystère de la raison pour laquelle les corrections quantiques ne produisent pas une énorme constante cosmologique ; dans les deux cas, on a affaire à un terme ' I superrenormalisable " anormalement petit dans le lagranglen effectif qui doit être ajusté a la valeur zéro ; dans le cas de la constante cosmologique, l'ajustement doit avoir la précision de la cinquantième décimale). Avec des scalaires élémentaires de masse nue zéro ou petite, les rapports énormes d'échelles de brisure de symétrie peuvent se produlre d'une manière tout à fait naturelle (59). D'un autre côté, s'Il n'y avait pas de scalaires élémentaires qui évitent d'acquérir des masses énormes lors de la brisure du groupe de jauge de grande unification, alors, comme je l'al déjà mentionné, il doit exister des forces extra-fortes pour lier les bosons de Higgs et de Goldstone composites qui sont associés à la brisure spontanée de X De telles forces peuvent apparaître de manière plutôt naturelle dans les théories de grande unification. Pour prendre un
su(3)
su(3)
I.%]).
su(2) u(1).
Vers iunzjication des interactions
291
su(3)
exemple, supposons que le grand groupe se brise, non pas en x s U ( 2 ) x V(l), mais en su(4) X X su(2)X u(i). Puisque su(4) est un groupe plus grand que sa constante de couplage augmente lorsque l'énergie décroft plus rapidement que le couplage CDQ, de sorte que ia force devient forte à une énergie beaucoup plus haute que les quelques centaines de GeV auxquels la force de la COQ devient forte. Les leptons et les quarks ordinaires seraient neutres sous su(4), de sorte qu'ils ne ressentlraient pas cette force, mais d'autres fermions pourraient porter les nombres quantiques de su(4) et acquérir ainsi des masses plutôt grandes. On peut même imaginer une suite de sous-groupes de taille grandissante du grand groupe de jauge, qul rempliralent le grand domaine d'énergie jusqu'à 10" ou 10" GeV avec des masses de particules qui seraient produites par ces Interactions chaque fols plus fortes. S'Il existe des scalaires élémentaires dont les valeurs moyennes dans le vide sont responsables des masses des leptons et des quarks ordinaires, ces masses peuvent être affectées à l'ordre a par les corrections radiatives affectant les bosons vectoriels superlourds du grand groupe de jauge, e t ilsera probablement impossible d'expliquer des valeurs comme m,/m,, sans une théorie de grande unification complète. D'un autre côté, si ces scalaires élémentaires n'existent pas, presque tous les détails de la théorie de grande unification sont oubliés par la théorie des champs effective qui décrit la physique aux énergies ordinaires. II devrait alors être possible de calculer les masses des quarks e t des leptons en termes exclusifs de processus ayant lieu aux énergies accessibles. Malheureusement, personne jusqu'ici n'a été capable d'expliquer comment pourrait se produire de cette manière quoi que ce soit qui ressemble au tableau des masses observé [60]. Mettons de côté toutes ces incertitudes et supposons qu'il existe une théorie vraiment à loi9 GeV, 2 fondamentale carctérisée par une échelle d'énergie de l'ordre de laquelle les interactions fortes, électrofaibles e t gravitationnelles sont toutes unifiées. Ce peut être une théorie quantique des champs renormalisable conventionnelle, mais pour l'Instant, si nous incluons la gravité, nous ne voyons pas comment c'est possible. (Je laisse le sujet de la supersymétrie e t de la supergravité pour l'exposé du Professeur Salam*). Mais si cette théorie n'est pas renormalisable, qu'est-ce qui détermine alors l'ensemble infini des constantes de couplage qui sont nécessaires pour absorber toutes les divergences ultraviolettes de ladite théorie ? Je pense que la réponse tient au fait que la théorie quantique des champs, qui naquit il y a juste cinquante ans du mariage de la mécanique quantique et de la relativité, est un très bel enfant. mais pas très robuste. Comme Landau e t Killén s'en rendirent compte il y a longtemps, la théorie quantique des champs à très hautes énergies est susceptible de toutes sortes de maladies - tachyons, fantemes. etc. - et elle a besoin d'un traltement spécial pour survivre. Une manière pour la théorie quantique des champs d'éviter ces maladies est d'être renormallsable e t asymptotiquement libre, mais il existe d'autres possibilités. Par exemple, m@meun ensemble infini de constantes de couplage peut approcher un point fixe qui ne soit pas zéro lorsque l'énergie à laquelle elles sont mesurées tend vers l'infini. Cependant exiger ce comportement impose tant de contraintes sur les couplages qu'il ne reste seulement qu'un nombre fini de paramètres libres [Si] - juste comme dans le cas des théories qui sont renormalisables au sens usuel. Ainsi, d'une maniere ou d'une autre, j e pense que la théorie quantique des champs est en train
su(3),
*
su(3)
su(4)
Conférence Nobel, ce même jour (NdT).
292
Sources et évolution de la physique quantique
de devenir très entêtée, refusant de nous permettre de décrire autre chose qu'un petit nombre de mondes possibles, parmi lesquels, espérons-le, se trouve le nôtre. Je suppose que ma tendance est l'optimisme quant au futur de l a physique. Et rien ne me rend plus optimiste que la découverte des symétries brisées. Dans le septième llvre de La République, Platon décrit des prisonniers qui sont enchaînés dans une caverne et qui ne voient que les ombres des choses extérieures projetées sur les parois de la caverne. Lorsqu'ils sont libérés de la caverne, au début les yeux leur font mal et pendant un moment ils pensent que les ombres qu'ils voyaient dans la caverne étalent plus réelles que les objets qu'ils voient maintenant. Mais finalement leur vision s'éclaircit et ils comprennent combien le monde réel est beau. Nous sommes dans une caverne de ce genre, prisonniers des limites qu'ont les expériences que nous pouvons faire. En particulier, nous ne pouvons étudier la matière qu'à des températures relativement basses, où il est probable que les symétries soient spontanément brisées, de sorte que la nature ne nous apparaît ni vraiment simple, ni unifiée. Nous n'avons pas été capables de sortir de la caverne, mais en regardant longuement et Intensément les ombres sur sa paroi, nous pouvons au moins distinguer les formes des symétries, qui, bien que brisées, sont les princlpes exacts qui gouvernent tous les phénomènes, les expressions de ia beauté du monde extérieur.
II ne m'a été possible de donner des références que d'une toute petite partie de la littérature sur le sujet discuté dans cette conférence. On peut trouver des références supplémentaires dans les revues suivantes :
Abers, E.S. et Lee, B.W., Gauge Theories (Physics Reports 9c No 1, 1973) Marciano, W.et Pagels, H., Quantum Chromodynamics (Physics Reports 36C No 31, 1978) Taylor, J.C., Gauge Theories o f Weak lntefactions (Cambridge Univ. Press, 1976).
Références de l'article 1 Tuve M.A.. Heydenberg N. et Hafstad L.R. Phys. Rev. 50,806 (1936); Breit G.. Condon E.V. et Present R.D. Phys. Rev. 50, 825 (1936) ; Breit G. e t Feenberg E. Phys. Rev. SO, 850
(1936). 2 Gell-Mann M. Phys. Rev. 92. 336 (1953); Nakano T. e t NlshlJirna K. Prog. Theor. Phys. 10, 581 (1955). 3 Lee T.D. et Yang C.N. Phys. Rev. 104. 254 (1956) : Wu C.S. et al. Phys. Rev. 105, 1413 (1957): Garwin R.. Lederman L. e t Weinrich M. Phys. Rev. 105,1415 (1957); Friedman J I. et Telegdl V.L. Phys. Rev. 105, 1681 (1957). 4 Gell-Mann M. Cal. Tech. Synchrotron Laboratory Report CTSL-20, non publié; Ne'eman Y. Nucl. Phys. 26. 222 (1961). 5 Fock V. 2. f. Physlk 39 ,226(1927); Weyl H. Z. f. Physik 56. 330 (1929). Le nom 'Invariance de Jauge" est basé sur une analogie avec les spéculations antérieures de Weyl H. dans Raum, Zeit, Materie. 3e éd. (Springer, 1920). Volr aussi London F. 2. f. Physik 42, 375 (1927). (Cette hldolre a et6 passée en revue par C.N. Yang dans un expose à Clty College. (1977)). 6 Yang C.N. et Mills R.L. Phys. Rev. 96, 191 (1954). 7 Goldstone J. Nuovo Ciment0 19. 154 (1961). 8 Goldstone J.. Salam A. et Weinberg S. Phys. Rev. 127, 965 (1962).
Vers l'unification des interactions
293
9 Higgs P.W. PhYs. Lett. 12, 132 (1964) ; 13. 508 (1964) ; PhYs. Rev. 145. 1156 (1966) ; Kibble T.W.B. Phys. Rev. 155. 1554 (1967) ; Gurainik G.S., Hagen C.R. et Kibble T.W.B. Phys. Rev. Lett. 13. 585 (1964) ; Englert F. et Brout R. Phys. Rev. Lett 13. 321 (1964) ; voir aussi Anderson P.W. Phys. Rev. 130. 439 (1963). 10 Adler S.L. Phys. Rev. Lett. 14, 1051 (1965) ; Phys. Rev. 140 B, 736 (1965) : Weisberger W.I. Phys. Rev. Lett. 14, 1047 (1965) : Phys. Rev. 143. 1302 (1966) ; 11 Gell-Mann M. Physlcs 1. 63 (1964). 12 Nambu Y. et Jona-Lasinio G. Phys. Rev. 122, 345 (1961) ; 124, 246 (1961) ; Nambu Y. et Lurie D. Phys. Rev. 125, 1429 (1962) : Nambu Y. et Shrauner E. Phys. Rev. 128, 862 (1962) ; voir aussi Gell-Mann M. et Levy M. Nuovo Ciment0 16, 705 (1960). 13 Goidberger M.L., Miyazawa H. et Oehme R. Phys. Rev. 99,986 (1955). 14 Goldberger M.L. et Treiman S.B. Phys. Rev. 111. 354 (1958). 15 Weinberg S . Phys. Rev. Lett. 16, 879 (1966) : 17. 336 (1966) : 17, 616 (1966) : 18, 188 (1967) : Phys. Rev. 166, 1568 (1967). 16 Oppenheimer J.R.. Phys. Rev. 35, 461 (1930) ; Waller I. Z. f. Physik 59. 168 (1930) ; ibid. 62, 673 (1930). 17 Feynman R.P. Rev. Mod. Phys. 20, 367 (1948) ; Phys. Rev. 74. 939, 1430 (1948) ; 76, 749. 769 (1949) ; 80, 440 (1950) : Schwinger J. Phys. Rev. 73, 146 (1948) : 74, 1439 (1948) : 75, 651 (1949) ; 76. 790 (1949) ; 82. 664, 914 (1951) : 91, 713 (1953) ; froc. Nat. Acad. Scl. 37. 452 (1951) : Tomonaga S. frog. Theor. Phys. (Japan) 1, 27 (1946) ; Koba Z.. Tati T. et Tomonaga S. lbid. 2. 101 (1947) ; Kanazawa S . et Tomonaga S. /bid. 3, 276 (1948) : Koba Z. et Tomonaga S. ibid. 3. 290 (1948). 18 Que les inflnis puissent être éliminés des théories quantiques des champs de cette manière avait
été déJà antérieurement suggéré var Weisskopf V.F. Kong. Dansk. Vld. Sel. Mat.-Fys. Medd. 15, (6) 1936, en partlcuiier p. 34 et pp 5-6; Kramers H. (non publié). 19 Dyson F.J. Phys. Rev. 75,486, 1736 (1949). 20 Weinberg S. Phys. Rev. 106. 1301 (1957). 21 Weinberg S. Phys. Rev. 118,838 (1960). 22 Salam A. Phys. Rev. 82. 217 (1951) : 84, 486 (1951). 23 Weinberg S . Phys. Rev. Lett. 18. 507 (1967). 24 Pour le caractère non-renormalisable des théories avec des symétries de jauge brisées de manière intrinsèque, voir Komar A. et Salam A. Nucl. Phys. 21,624 (1960) : Umezawa H. et Karnefuchi S. Nucl. Phys. 23, 399 (1961) ; Kamefuchi S . , O'Raifeartalgh L. et Salam A. Nucl. Phys. 28. 529 (1961) ; Salam A. Phys. Rev. 127. 331 (1932) : Veltman M. Nucl. Phys. B7, 637 (1968) : B21, 288 (1970) : Boulware D. Ann. Phys. (N.Y.) 56. 140 (1970). 25 On rend compte brièvement de ce travail en ref. 23, note en bas de page 7. 26 Weinberg S. Phys. Rev. Lett. IS,1264 (1967). 27 Salam A. dans Elementary Particle Physics (Symposium Nobel No. 8) édité par Svartholm. N. (Aimqvist and Wiksell. Stockholm, 1968). p.367. 28 de Witt B. Phys. Rev. Lett. 12. 742 (1964) : Phys. Rev. 162. 1195 (1967) : Faddeev L.D. et Popov V.N. Phys. Lett. B25, 29 (1967) ; voir aussi Feynman R.P., Acta. yhys. Pol. 24. 697 (1963) ; Mandelstam S. Phys. Rev. 175. 1580. 1604 (1968). 29 Voir Stuiier L.M.I.T., Thèse Ph. D. (1971) non-publiée. 30 J'ai mentionné l'utilisation de la Jauge d'unltarité dans Weinberg S. Phys. Rev. Lett. 27, 1688 (1971) et l'ai décrite plus en détail dans : Weinberg S . Phys. Rev. D7, 1068 (1973). 31 't Hooft G. N u d . Phys. B35, 167 (1971). 32 Lee B.W. et Zinn-Justin J. Phys. Rev. D5. 3121, 3137, 3155 (1972) : 't Hooft G. et Veitman M. Nucl. Phys. B44. 189 (1972) ; B50, 318 (1972) ; Restait encore le problème de possibles anomalies à la Adler-Bell-Jackiw, mais elles s'annulèrent très bien : voir Gross D.J e t Jackiw R. Phys. Rev. D6. 477 (1972) et Bouchiat C.. lllopouios J. et Meyer P. Phys. Lett. 38B. 519 (1972). 33 Beechi C..Rouet A. et Stora R. Comm. Math. Phys. 42. 127 (1975). 34 Lee B.W. Phys. Rev. D5, 823 (1972). 35 Gamow G. et Teller E. Phys. Rev. 51. 288 (1937) ; Kemmer N. Phys. Rev. 52, 906 (1937) : Wentzel G. Helv. Phys. Acta. 10. 108 (1937) ; Biudman S Nuovo CImento 9. 433 (1958) ; Leite-Lopes J. Nud. Phys. 8. 234 (1958). 36 Glashow S.L. Nucl. Phys. 22,519 (1961) : Salam A. et Ward J.C. Phys. Lett. 13, 168 (1964). 37 Weinberg S. Phys. Rev. D5, 1412 (1972). 38 Cundy D.C. et ai., Phys. Lett. 31B. 478 (1970).
294
Sources et évolution de la physique quantique
39 La premlère découverte des courants neutres publiée fut celle faite à la Chambre à Bulles Gargamelle au CERN : Hasert F.J. et al. Phys. Lett. 48B, 121, 138 (1973). Volr aussi M u w t P. Jour. de Physlque 11/12 T34 (1973). Des événements sans muons furent observés à peu prës au meme moment par le groupe HPWF au Fermllab. mals lorsque la publlcatlon de leur
40
41 42 43
44
artlde fut retardée, lis en profltèrent pour reconstrulre leur détecteur et ne trouvèrent plus alors le meme slgnal de courants neutres. Le groupe HPWF publla sa découverte des courants neutres dans Benvenutl A. et al. Phys. Rev. Lett. 32. 800 (1974). Pour une revue des données voir Baltay C. Proceedings of the 19ih Inlemational Conference on High E n m Physics. Tokyo. 1978. Pour les analyses théorlques. voir Abbott L.F. et Barnett R.M. Phys. Rev. D19, 3230 (1979) ; Langacker P., Klm J.E., Levine M., Wlllams H.H. et Sldhu D.P. Neutrino conference '79'; et les références antérleures qui y sont citées. Prexott C.Y. et al., Phys. Lett. 77B, 347 (1978). Glashow S.L. et Georgl H.L., Phys. Rev. Lett. 28, 1494 (1972). Volr aussi Schwlnger J. Annals of Physlcr (N.Y.) 2. 407 (1957). Glashow S.L.. IIIO~OUIOS J. et Malan1 L. Phys. Rev. D2. 1285 (1970). Cet artlcie avait été cité dans la ref. 37 comme apportant une x>lUtlOn possible au prObl&tW des courants neutres changeant l'étrangeté. Cependant, à l'époque, l'avals des doutes sur le modèle des quarks, de sorte que les calculs de la ref. 37 Incorporèrent les baryons dans la theorie en prenant le proton et le neutron sous forme d'un doublet SU(2). les particules étranges y étant tout simplement ignorées. Politzer H.D. Phys. Rev. Lett. 30, 1346 (1973) ; Gross D.J. et Wllczek F. Phys. Rev. Lett.
SO. 1343 (1973). 45 Les constantes de couplage effectives dépendant de I'énergle furent Introduites par Gell-Mann M. e t Low F.E. Phys. Rev. 95. 1300 (1954). 46 Bloom E.D. et al.. Phys. Rev. Lett. 23. 930 (1969) ; Breidenbach M. et al., Phys. Rev. Lett. a3.935 (1969). 47 Welnberg 5. Phys. Rev. D8. 605 (1973). 48 Gross D.J. et Wiluek F. Phys. Rev. D8. 3633 (1973) ; Weinberg S. Phys. Rev. Lett. 31, 494 (1973). Une Idée semblable fut proposée avant la découverte de la liberté asymptotique par Frltzsch H., Gell-Mann M. et Leutwyler H. Phys. Lett. 47B. 365 (1973). 49 Greenberg O.W. Phys. Rev. Lett. 13. 598 (1964) ; Han M.Y.et Nambu Y. Phys. Rev. 139B 1006 (1965) ; Bardeen W.A., Frltzsch H. et Gell-Mann M. dans Scale and Conformal Symmetry In Hadron Physlcs, ed. par Gatto R. (Wlley, 1973). p. 139; etc. SO 't Hooft G. Phys. Rev. Lett. 37, 8 (1976). 51 De tels mécanismes "dynamiQues" pour briser spontanément des symétries furent d'abord dlscut& par Nambu Y. et Jona-Laslnlo G. Phys. Rev. 122, 345 (1961) ; Schwinger J. Phys. Rev. 125, 397 (1962) ; 128. 2425 (1962) ; et dans le contexte des théories de Jauge modernes Dar Jacklw R. et Johnson K. Phys. Rev. D8. 2386 (1973) ; Cornwall J.M. et Norton R.E. Phys. Rev. D8, 3338 (1973). Les Impilcations de la brisure dYnamlQUede symétrle ont été considérées par Welnberg S. Phys. Rev. D13. 974 (1976) ; D19. 1277 (1979). Sussklnd L. Phys. Rev. D20. 2619 (1979). 52 Weinberg S. ref. 51. La posslblllté de pSeUdO-bosonS de Goldstone fut lndlquëe à I'orlgine dans un contexte dlfférent par Welnberg 5 . Phys. Rev. Lett. 29, 1698 (1972). 53 Welnberg S. ref. 51. Des modèles faisant lntervenlr de telles Interactions ont aussl été dlscutés par Sussklnd L. ref. 51. 54 Weinberg S. Phys. Rev. 135B. 1049 (1964). 55 Weinberg S. Phys. Lett. 9, 357 (1964) ; Phys. Rev. B138. 988 (1965) ; Lectures in Particles and Fle/ds Theory, ed. par Deser S. et Ford K. (PrentlceHall, 1965). p.988; et ref. 54. Le programme visant à dédulre la relativlté génerale de la mécanique quantique et de la relathrité restrelntc fut complété par Boulware D. et Deser S. Ann. Phys. 89. 173 (1975). J'al entendu que des idées semblables ont ëté développ6es par Feynman R. dans des cours non pUbllëS donnés
au Cal. Tech. 56 Georgi H.. Quinn H. et Weinberg S. Phys. Rev. Lett. 33. 451 (1974). 57 Un exemple de groupe de jauge simple pour les interactlons faibles et électromagnétlques (pour lequel sin' 8 = f ) fut donné par S. Welnberg Phys. Rev. DS, 1962 (1972). II y a de nombreux modèles SPéciii~uesd'lnteractlons faible. électromagnétl~ueet forte basés sur des groupes de Jauge slmples. en comptant ceux de Pati J.C. et Salam A. Phys. Rev. D10, 275 (1974) ; Georgl H. et Glashow S.L. Phys. Rev. Lett. 32, 438 (1974) ; Georgl H. dans ParWes and Fields (American lnstltute of Physlcs, 1975) ; Frltzsch H. .et Mlnkowskl P. Ann. Phys. 93, 193 (1975) ; Georgl H. et NanOpOUlOS D.V. Phys. Lett. B82, 392 (1979) ; Gtirsey F., Ramond
Vers l'unification des interactions
295
P. et Sikivie P. Phys. Lett. B60. 177 (1975) : GUrsey F. et Slkivle P. Phys. Rev. Lett. 36, 775 (1976) ; Ramond P. Nucl. Php. Bila, 214 (1976) : etc.: ils violent tous la conservation leptonique et baryoniQue. car ils ont les Quarks et les leptons dans les m h e s multiplets: voir Pati J.C. et Salam A. Phys. Rev. Lett. 31. 661 (1973) ; Phys. Rev. D8. 1240 (1973). 58 Buras A. Ellis J., Gaillard M.K. et Nanopoulos D.V. N u d Phys. B135, 66 (1978) ; R o n D. Nucl. Phys. B140, 1 (1978) : Marciano W.J. Phys. Rev. 0 2 0 . 274 (1979) ; Goldman T. et Ross D. CALT 68-704. dolt être publié; JarlskJog C. et Ynduraln F.J. Prétirage CERN. doit W e public Machacek M. Prdtirage Harvard HUTP-79/AOZI. doit l t r e publié dans Nuclear Physlcr. Weinberg article en Dréparation. La phénoménologie de la désintégration du nucléon a été dlxutet en termes généraux par Weinberg S. Phys. Rev. Lett. 43, 1566 (1979) ; Wliuek F. et Zee A. Phys. Rev. Lett. 43. 1571 (1979). 59 Glldener E. et Weinberg S. Phys. Rev. D13, 3333 (1976) :Weinberg S. Phys. Lett. 02B.387 (1979). En général, il devrait exister au moins une particule scalaire avec une masse physique de l'ordre de 10 GeV. Les premiers à considérer la brisure spontanée de symétrie dans des modèies possédant une masse scalalre nue égale a zéro furent Coleman S. et Weinberg S. Phys. Rev. D7. 1888 (1973). 60 Ce problème a récemment étë étudié par DlmopouloS S. et Susskind L. Nucl. Phys. B165. 237 (1979) ; Elchten E. et Lane K. Phys. Lett.. a publier; Weinberg S. non pUbllé. 61 Weinberg S. dans General Relarlvlty An Einstein Centenary Survey, éd. par Hawklng S.W. et Israel W. (Cambridge Unlv. Press, 1979), Chapitre 16.
-
296
6.4
Sources et évolution de la physique quantique
La super-unification
Les interactions fondamentales à l'œuvre dans la nature sont schématisées dans le tableau 8. Tableau 8
Les interactions fondamentales en physique Interaction
Intensité des constantes
Champs Champ sans masse graviton (spin 2)
Gravitationnelle
Champ avec masse
w+, w-, 20
Faible
(SP" 1) Champ sans masse photon (spin 1)
Electromagnétique
Forte
Constante qui dépend Champ sans masse gluons du transfert d'impulsion (spin 1) ?our la matière nucléaire 4r c -10
-+
La gravitation, négligeable à l'échelle atomique, joue un rôle primordial dans l'évolution des étoiles et de l'univers. Sa prédominance, lorsque le combustible de la fusion nucléaire est épuisé dans les masses stellaires, conduit à l'effondrement des étoiles, avec formation des naines blanches, des pulsars et des trous noirs - dans ces objets, la gravitation l'emporte halement sur la répulsion des électrons, puis des neutrons (répulsion due au principe de Pauli) et infléchit la lumière vers l'intérieur : rien ne sort donc des trous noirsg3. Les champs de ces interactions sont tous des champs de jauge - nous croyons que le champ de bosons faibles (avec brisure de symétrie) et le champ de gluons sont des champs de jauge au même titre que le champ de gravitation et celui des photons.
93 Voir S. Hawking, Une brève histoin du temps, Flammarion, Paris (1988) ;les artides fondamentaux sont ceux de J.R. Oppenheimer et G . Volkoff, îhys. Rev. 55,374 (1939) ; J.R.Oppenheimer et H. Snyder, Phys. Reu 58,455 (1939).
Tableau 9
(Gaiil&) est identique Lia force de gravitniion entre LOUS Ica corpa (Ncwton)
(la phydque dans l'espace-tempi) (Einatdn, Lorentz, Poincaré) : l'hcrgie n une marse
la gravitation (Einstein) ln matière modifie la métrique qui d&nil le champ
quantique
(?I
aux foreni magnétiques: la lumière est de nature
-
électromagnétique Supcrunificntion
Elcctrodynnmiquc
la Mécanique quantiquc
(dc Broglie, Schrodinger, Hciscnbcrg, Born, Dirnc, Pauli) rdgiî IC mondc microawpiquc
- quantiquc (Dirac, Hcisenberg, Pauli, - Tomonaga, Feynman,
(7)
3'
m Grnndc
unification (7)
R3. vi 3
La Intcrnctiona fniblcr (Fcnni, Feynman, Gell-Mann, Marchak-Sudnrahm) nfïcctcnt Icptons cl qucuka Chromodynamique quantique (t'Hooft, . fortes (Yuliawn) araocicnt Ics quarka
Bjorken, Polyakov, Pulitzer)
N
\O
u
298
Sources et évolution de la physique quantique
Le tableau 9 indique la tendance actuelle de la physique vers la construction d’une grande théorie qui unifie toutes les interactions - un héritage des efforts d’Einstein jusqu’à la fin de sa vie pour tenter d’unifier l’électromagnétisme et la gravitation. Ces tentatives d’unification rencontrèrent leur premier succès avec celui du modèie électrofaible de Weinberg, Salam et Glashow. L’équation e = g sin& montre qu’il ne s’agit là que d’une semi-unification,puisque deux constantes interviennent dans la théorie - la suggestion de 1958’* correspondrait à une vraie unification, puisque pour ûw = f, une seule constante e = g intervient. La grande unification, celle des interactions fortes avec les forces électrofaibles, a fait l’objet de plusieurs modèles, le plus suggestif étant le modèle SU(5) de Glashow, qui ne fait intervenir qu’une constante de couplage. Cette unification impose aux leptons et aux quarks d’apparaître comme des composantes de l’objet géométrique de l’espace des représentations : cela entraîne que le proton doit se désintégrer en positon et pion neutre, une désintégration non encore observée aujourd’hui, même si cette désintégration est supposée correspondre à une demi-vie de ans. Ce modèle implique également l’existence de bosom lepto-baryoniques de très grandes masses. Une autre approche est celle de la supersymétrie (voir l’article XiX ci-après). Beaucoup reste donc à faire dans ce domaine, ainsi que dans celui de la quantification de la gravitation, qui attend elle aussi une forme satisfaisante sinon définitive. La cosmologie et la physique des particules sont de plus en plus des source3 d’inspiration mutuelles : le modèle du Sig Bang par exemple suppose qu’aux très hautes énergies où baignait l’univers entre l’instant initial et secondes, une seule force était présente - c’est ce qu’implique la liberté asymptotique lorsqu’elle fait converger les quatre interactions pour des transferts de moment de l’ordre de la masse de Planck (10’9GeV/cZ). La création des photons, des leptons et des quarks libres s’accompagnerait d’une brisure de cette symétrie universelle, allant de pair avec l’établissement de la hiérarchie des interactions, avec l’expansion et le refroidissement de l’univers peuplé des photons émis dans l’explosion primordiale. Suivraient la génération des masses, le confinement des quarks, la formation des baryons, des mésons et des noyaux. Ainsi sont perçues par les physiciens d’aujourd’hui la naissance, l’évolution des structures de la matière, jusqu’à l’avènement du vivant. Les modèles qu’ils formulent pour imaginer le monde vivent, eux aussi : ils naissent, prennent corps, remplacent ceux qui les ont précédés, se transfigurent et meurent à leur tour.
cf réf. 77 p 259.
Article XIX
L’unification de toutes les interactions ? La supersymétrie et l’unification des interactions fondamentales
PIERRE FAYET Bulletin de la Soclété Française de Physique,
91 9 - 11 (1993)
où en sont les tentatives en vue d’une unification éventuelle des interactions fondamentales t Quelles sont les symétries profondes des lois de la Nature et y en aurait-il d’autres que celles que nous connaissons ? Qu’est ce que la ” supersymétrie ” et que pourrait-elle nous apprendre sur les lois fondamentales ? On peut présenter la supersymétrie comme une structure algébrique étendant celle du groupe de Lorentz, qui est à la base de la relativité. O u bien encore, sous une forme plus physique, comme une symétrie pouvant relier des particules de spin entier - ou bosons - et des particules de spin demi-entier - ou fermions. Encore faudralt-il savoir de quels bosons e t de quels fermions II s’agit, ce dont nous reparlerons par la suite. L’algèbre d e supersymétrie On sait depuis Einstein que les lois de la physique doivent s’exprimer de manière Invariante par rapport aux changements de coordonnées dans l’espace-temps. Ces transformations font intervenir la généralisation des rotations dans i’espace-temps à 4 dimensions, comprenant, en plus des rotations, les transformations de Lorentz. La relativité générale, où l’espace-temps peut être courbé, conduit à une description de la gravitation, liée aux déformations de cet espace. La supersymétrie est, au départ, une structure mathématique qui, sur le plan algébrique, étend et généralise l’invariance par relativité. Elle fait intervenir, comme toute symétrie continue, des genérateurs infinitésimaux. satisfaisant à certaines relations alg& briques. Revenops aux rotations, qui en général ne cornmutent pas entre elles. Dans l’espace a trois dimensions deux rotations infinitésimales autour de deux axes perpendiculaires et o y ) peuvent être combinées, mais le résultat dépend de l’ordre de ces opérations ; la différence de ces résultats s’exprime comme une rotation infinitésimale autour d’un axe o z , perpendiculaire aux deux premiers. L’invariance des lois physiques par rotation conduit à ia loi de conservation du moment cinétique ; de la même manière leur invariance par translation, dans l’espace ou
(oz
Sources et évolution de la physique quantique
300
dans le temps, entraîne la conservation de l'impulsion totale, ou de l'énergie totale. d'un système isolé. A chacune de ces grandeurs est associé, en mécanique quantique, un opérateur agissant dans l'espace des états utilise! pour représenter ie système considéré. Les opérateurs énergie H et impulsion P sont associés aux translations dans le temps ou dans l'espace, e t l'opérateur moment cinétique J aux rotations. Le fait que deux et o y ne commutent pas s'exprime par la relation '' de cornrotations autour de J,JL = ihJ,. où h est l'unité élémentaire de moment mutation " [Jz,Jg]= J,J, cinétique. Cette relation algébrique traduit la structure non-commutative du groupe des rotations. Elle se généralise à l'espace-temps à 4 dimenstons, OD l'on considère, en plus des rotations, les transformations de Lorentz élémentaires le long des trois axes. L'algèbre de supersymétrie constitue une généralisation supplémentaire de l'algèbre précédente, en faisant intervenir un nouvel opérateur constitué de quatre composantes Qu formant un " spineur ", porteur d'une demi-unité de moment cinétique élémentaire. Appliqué à un état de spin entier, cet opérateur le transforme en état de spin demientier, ce qui ouvre la possibilité d'accroître la symétrie d'une théorie en y établissant des relations entre bosons et fermions ; ou même de découvrlr que les bosons e t les fermions que l'on trouve dans la Nature pourraient être reliés par supersymétrie, s'interprétant alors comme états de spins differents des mêmes particules, un peu comme la symétrie électrofaible permet de considérer l'électron et son neutrino comme deux états de charges différentes de la même particule. Comme l'opérateur de moment cinétique J, le générateur de supersymétrie Q doit satisfaire à des relations algébriques. Ses quatre composantes Qu obéissent, non pas à des relations de commutation, mais à des relations d'anticommutation (car il s'agit d'un opérateur de spin 1/2. donc de type fermionique). Les anticommutateurs {Qu, = QuQaf QsQu s'expriment comme des combinaisons linéaires des quatre P).Ainsi, de même qu'en comcomposantes de l'opérateur énergie-impulsion Pp = (H, binant deux rotations élémentaires on engendre une rotation autour de l'axe perpendiculaire, en combinant deux transformations de supersymétrie, on engendre une translation dans l'espace-temps. L'invariance par supersymétrie est alors susceptible d'apparaître comme plus fondamentale que l'invariance des lois physiques par translation dans l'espace et le temps, qui en serait une conséquence.
oz
-
Qa}
Relier les bosons aux fermions, est-ce possible ? Cette structure algébrique a été introduite, dans les années 1971-1973,par trois groupes distincts (Gol'fand et Llkhtman, Volkov et Akulov en Union Soviétique, et Wess et Zumino en Europe Occidentale). Mais peut-elle servir à décrire le monde des particules e t des interactions que nous connaissons ? Quels sont les bosons et les fermions qui pourraient être reliés ? La supersymétrie doit-elle agir au niveau des constituants fondamentaux, comme les quarks e t les leptons, ou bien au niveau des particules composées : par exemple pour relier les protons et les neutrons (fermions de spin 1/2. formés de trois quarks) aux mésons (bosons de spin O, formés d'un quark et d'un antiquark) ? L'algèbre de supersymétrie requiert en principe que les bosons et les fermions qu'elle associe aient des masses égales. Or les masses des bosons Sont loin d'être égales à celles des fermions ! On peut cependant faire appel à la notion de symétrie brisée spontanément,
Vers I'uni$cation des interactions
301
'.
très fructueuse en phySiQUe C'est en s'appuyant sur celle-ci que les physiciens ont construit, au cours des années 1960, une théorie cohérente des interactions faibles et électromagnétiques, malgré les caractéristiques très différentes de ces interactlons. La symétrie électrofaible relie l'électron à son neutrino, et le quark d au quark u (tous deux constituants des protons, uud, et des neutrons, ddu). Elle associe au photon, médiateur de l'interaction électromagnétique, les agents responsables des interactions faibles, les bosons et 2. L'existence de ces derniers est une conséquence de la symétrie électrofaible, et ils ont été mis en évidence par la suite au CERN, en 1983. Cette associatlon entre particules de masses très différentes - O pour le photon, 80 et 91 GeV/c2 pour les et le - est rendue possible par la brisure spontanée de la symétrie électrofaible. Ce phénomène autorise la différenciation entre interactions faibles et électromagnétiques, et est aussi responsable de l'apparition des masses pour les particules. Son origine exacte n'est pas encore établie. O n croit qu'il est dO à des champs de spin O appelés '' champs de Higgs ", décrivant de nouvelles particules, les bosons de Higgs. Ceux-ci ne se sont toujours pas manifestés au LEP et leur masse doit être supérieure à 60 GeV/c2, dans le cas le plus simple. On sait que, malgré certaines difficultés, le phénomène de brisure spontanée peut aussi s'appliquer à la supersymétrie. Y aurait4 alors une supersymétrie entre bosons et fermlons, malgré leurs masses très différentes ? Encore faut-il identifier les particules susceptibles d'être ainsi associées. O n peut chercher à relier le photon, de spin 1, au neutrino, de spin 1/2 ; et en même temps l'électron (de spin 1/2) au boson intermédiaire chargé (de spin 1). Mais il existe trois neutrinos, pour un seul photon ! Et que faire du muon, e t des quarks ? Pourrait-on relier les agents médiateurs des interactions fortes, les gluons, de spin 1, aux quarks, de spin 1/2 ? Mais il y a un seul octet de gluons, neutres, pour six triplets de quarks, e t qui sont chargés ! Enfin relier les leptons aux hypothétiques bosons de Higgs se révèle aussi impossible. En résumé, on aurait espéré que la supersymétrie associe les bosons de spin 1 responsables des interactions - ou les bosons de Higgs, de spin O - aux leptons et aux quarks, de spin 1/2. Mais on n'a trouvé aucune'paire de particules connues qui soient directement Images l'une de l'autre. Faut-il donc abandonner cette idée séduisante comme sans rapport avec le monde réel ? Pas nécessairement. car il existe une solution si l'on accepte d'imaginer que chaque particule connue ait sa propre image par supersymétrie. qui nous serait actuellement inconnue. Cette idée a conduit à postuler l'existence d'hypothétiques superpartenaires, dont les spins diffèrent de ceux des particules connues par une demi-unité. Mais il faut alors introduire un grand nombre de nouveaux bosons et veiller à ce que les échanges de ceux-ci n'induisent pas de nouvelles interactions. non-observées. en plus des interactions fortes, électromagnétiques et faibles.
wt.w-
w
w-
*
II s'agit de symétries exactes des équations fondamentales, mais qui e; laissent pas Invariant l'état d'énergie minimum du Système considéré, dans notre cas l'état du vide , où aucune particule n'est présente. Un exemple simple de brisure spontanée de symétrie est celui d'une bille dans une bouteille. Ce système est invariant par rotation autour d'un axe vertical, mais la position d'équilibre de la bille au fond de la bouteille ne l'est pas. La symétrie (dans cet exemple, l'invariance par rotation), bien que toujours présente au niveau des équations régissant le système, ne l'est plus pour leurs solutions.
302
Sources et évolution de la physique quantique
Les superpartenairet e t le
"
M o d è l e Standard Supersymétrique
"
Le partenaire du photon est une partlcuie neutre de spin 1/2,qui ne peut s'identitier à aucun des neutrinos connus v,, up ou même U r ,et que j'ai appelée en 1976 neutrino du photon, par la suite contracté en " photino D e même les huit gluons responsables des interactions fortes sont associés à huit particules de spin 1/2, appelées I' gluinos ", et les W* et à des '' winos " et " zinos ", aussi de spin 1/2. Les leptons et des quarks sont associés à des partenaires de spin O. " sleptons " et " squarks " (volr table 1). Les échanges de ces derniers entre leptons e t quarks, susceptibles d'induire de nouvelles interactions, non-observées, peuvent être interdits grâce à une nouvelle loi de conservation, celle de l a R-parité ; faute de quoi le proton se désintégrerait en une très brève fraction de seconde, une véritable catastrophe ! Enfin la brisure de la symétrie électrofaible nécessite maintenant un système de bosons de Higgs plus étendu, incluant un boson de Higgs chargé (qui peut même apparaïtre comme relié au par deux transformations de supersymétrie). Tout cet ensemble constitue ce que l'on appelle maintenant le Modèle Standard Supersymétrique.
".
La R-parité peut se définir comme étant simplement +1 pour les particules ordinaires (y compris les bosons de Higgs) et -1 pour les nouveaux superpartenaires. souvent appelés aussi I' particules supersymétriques 'I. La conservation de la R-parité - ou sa non-conservation éventuelle - sont reliées à celles du nombre baryonique B et du nombre leptonique L. Elle implique que les nouvelles particules doivent être produites seconde, les produits en paires. La plupart se désintègrent, souvent en moins de de désintégration étant seuls observables. La loi de conservation, multiplicative, de la R-parité impose que parmi ceux-ci on trouve encore une (ou un nombre impair) de ces nouvelles particules. La plus légère doit donc être stable. Elle est aussl probablement neutre, sinon elle aurait conduit à des isotopes anormaux de l'hydrogène, qui n'ont pas été détectés. Ce pourrait être le photino, ou plus généralement un mélange de divers fermions neutres ; et un candidat possible pour constituer la fameuse matiëre sombre qui serait abondamment présente dans notre Univers, formant peut-être l a plus grande partie de ceiui-cl. La recherche des superpartenaires, entreprise dès la fin des années 1970, constitue à l'heure actuelle l'une des préoccupations essentielles de la physique des particules. Les expériences effectuées auprès de l'anneau de collision e+e- du LEP a Genève ont brillamment confirmé la validité du " modèle standard " avec trois types de neutrinos seulement e t donc trois familles de leptons e t de quarks, même si le sixième quark (le top), est trop lourd pour y avoir été détecté
-
'.
Mais aucun de ces superpartenaires ni d'ailleurs aucun boson de Higgs - n'a été trouvé au LEP dans les désintégrations de plusieurs millions de 2,pas plus qu'auprès des collisionneurs pp du CERN et de Chicago. L a plupart de ces nouvelles particules doivent donc être plus lourdes qu'une quarantaine de GeV/cZ, ou même sans doute une centaine pour les squarks e t les gluinos. O n compte beaucoup maintenant. après l'augmentation en cours de l'énergie du LEP, sur les projets de collisionneurs LHC (dans le tunnel du La découverte du quark top pourrait avoir lieu au collisionneur proton-antiproton de Fermilab à Chicago. au cours des prochaines années. Mais ceci dépend de la valeur de sa masse (de 100 à 200 GeV/cz).
Vers l'unification des interactions
LEP) e t
sSC (au Texas
303
*), qui permettront d'accéder à une nouvelle échelle d'énergie.
Table 1. Les particules et leurs images par supersymétrie
Particules
(R = t i )
Superpartenaires
(R= -1)
(hypothétiques)
fortes :
gluons spin 1
:
Constituants de la matière (fermions)
I
6 leptons
(
Y,,
up, u,
e, p , T
graviton (hypothétique)
spin 2
(neutrinos) (charge - 1)
gluinoa photino winos et zinos
spini/Z
quarks d , (us B
Bosons de Higgs (hypothétiques)
squarks
spin O
higpinos
spin 1/2
]
fermions
spin 3/2
gravilino
sleptons
(charge 2/3) b (charge -1/3)
]
I
bosons de spin O
fermions de spin 1 / 2
Les particules élémentaires connues se répartissent en deux grandes classes. Les messagers des quatre interactions fondamentales sont les gluons, le photon, /es bosons intermédiaires Wf et Z (de spin ï)>.ainsi que l'hypothétique graviton (de spin 2). Les gluons et le photon sont de masse nulle, tandis que ont près de LOO fois la masse du proton. Les constituants de la les Wf et matière comprennent six quarks et six leptons, de spin 1/2. Les quark8 ont des charges électriques fractionnaires, 2/3 ou -1/3. Contrairement aux leptons, Ils peuvent échanger des gluons et sont donc sensibles aux interactions fortes. En plus des quarks u et d (constituants des nucléons) il en existe trois autres. 8 , c et b. et la cohérence de la théorie nécessite un sixième quark, le top t, non encore observé". En outre, la différenciation entre interactions faibles et électromagnétiques, ainsi que l'existence des masses, sont attribuées à un mécanisme nécessitant de nouvelles particules. les bosons de Higgs. La supersymétrie conduit a associer aux particules précédentes d'hypothétiques superpartenaires, qui en d i a r e n t par le spin et la masse, telles que les squarks et les séiectrons, les gluinos et le photino. La plus légère, neutre et stable, serait-elle un constituant de la " matière sombre " de l'Univers I ~~
~~
Abandonné en novembre 1993 par suite d'un vote défavorable du Sénat des EtatsUnis (note des auteurs de l'ouvrage).
** La découverte du t o p a été annoncée au printemps 1994. Voir page 278 (note des auteurs de l'ouvrage).
304
Sources et évolution de la physique quantique
Mais si l'on n'a pas détecté les superpartenaires aujourd'hui, pourquoi les trouveraiton demain ? Ces particules, si elles existent, ne doivent pas en principe avoir des masses (80 GeV/c'), faute de quoi cette dernière se trouverait en très supérieures à celle du quelque sorte " aspirée " vers des valeurs beaucoup plus grandes. Ce type d'argument indique que les masses attendues sont de préférence de l'ordre de la centaine de GeV/c2, o u au plus du TeV/c' (1 TeV = 1 O00 GeV). II a été très utilisé, au début des années 1980,dans le cadre de la grande unification des interactions fortes, électromagnétiques et faibles. Ces théories rencontrent un grave problème, la masse du ayant tendance à y être aspirée par l'énergie d'unification de ces trois interactions. au moins lo1' fois supérieure ! Les théories supersymétriques sont susceptibles de faciliter la résolution de ce problème, tant que les masses des superpartenaires ne dépassent pas l'ordre du TeV/cz.
w
w
Supersymétrie e t unification Dans l'approche de la grande unification, les médiateurs des interactions fortes, électromagnétiques e t faibles (voir table 1) sont reliés, et le proton doit être tr& faiblement instable, se désintégrant par exemple en r o e + , par transformation en iepton d'un de ses quarks constituants. La grande unification permet aussi de relier les intensités de ces trois interactions. Mais les prédictions du modèle le pius simple, tant en ce qui concerne la durée de vie finie du proton que les relations entre intensités des interactions, ont été infirmées par les résultats expérimentaux. Ces prédictions sont modifiées, dans ie cadre des théories supersymétriques, par l'effet des superpartenaires e t des nouveaux bosons de Higgs. et sont alors parfaitement compatibles avec les observations (figure). Cecl peut titre considéré. de manière optimiste, à la fois comme un indice de l'existence des superpartenaires - et avec des masses pas trop élevées - et d'une unification entre GeV, ou un peu plus. les interactions, à une énergie de l'ordre de II s'agit là d'une énergie qui commence à se rapprocher de I"' énergie de Planck " -1
(GN:w,an. soit environ lo1' GeV), où l'interaction gravitationnelle, extrêmement faible aux énergies usuelles, devient une interaction de forte intensité. C'est là que les quatre types d'interactions pourraient se fondre en une interaction unique. A des énergies aussi énormes, les effets quantiques de l a gravitation sont essentiels. Or la mécanique quantique et la relativité générale - qui décrit ia gravitation - ne font pas bon ménage : dans les calculs apparaissent des quantités infinies, que l'on ne sait pas traiter de manière satisfaisante. II semble que l'on doive aiors quitter le cadre habituel de la théorie des champs décrivant des particules élémentaires ponctuelles, pour se représenter celles-ci comme des objets étendus tels que des cordes. L'espace pourrait alors ?tre doté de dimensions supplémentaires, très petites, e t les particules correspondraient aux divers états de vibration d'une corde minuscule ( X cm), leurs interactions résultant de processus de fusion ou de séparation entre cordes. La supersymétrie joue un r81e essentiel dans cette approche, dite des supercordes. II est très difficile de savoir si ces théories permettent de décrire les particules avec les symétries, les masses et les interactions que nous leur connaissons. Du moins imagine-t-on ainsi ce que pourrait être une " théorie ultime " unifiant toutes les interactions, à des énergies gigantesques qu'il n'est pas question d'atteindre directement. Mais les futurs accélérateurs LHC et SSC devraient permettre d'explorer l'échelle d'énergie du TeV, éclairant les mécanismes de
lo-''
Vers Vunification des interactions
305
la différenciation entre interactions et de l'origine des masses. Et on a bon espoir de découvrir aiors l'existence des superpartenaires, qui révèlerait la supersymétrie comme invariance fondamentale des lois de la physique. au delà de la relativité générale.
Lien entre les intensités des trois interactions 60
40
1 ai
20
O 1
ENERGIE (GeV)
102
mJ
io5 10'0 ENERGIE ( G e V )
10'6
%"TI
Les paramètres al, a2 et a3, qui déterminent les intensités des interactions électromagnétiques, faibles et fortes sont en fait des fonctions lentement variables de l'énergie, dont on peut extrapoler le comportement à très haute énergie à partir des mesures actuelles. Dans une théorie de grande unification ces paramètres doivent converger à une énergie très élevée, pour laquelle les trois types d'interactions viendraient se fondre en une interaction unique. Le modèle le plus simple est maintenant exclu. cette convergence ne se produisant pas (a). Mais l'effet des superpartenaires sur l'évolution de ces trois paramètres conduit à une convergence remarquable (b), qui pourrait indiquer à la fois'üne unification entre interactions (vers GeV ou un peu plus), et l'existence de ces superpartenaires à des énergies pas trop éloignées.
Bibliographie M. Jacob (North Holland/World Scientific, 1986). 2. P. Fayet, La Recherche 19 334 (1988) ; Introduction t o Supersymmetric Theories of Proc. of t h e Erice Particles and Interactions, in '' Properties of SUSY Particles Workshop, (1992), ed. by Cifarelli and Khoze (World Scientific, 1993) p . l . 1. Supersymmetry and Supergravity, A Reprint Volume of Physics Reports, ed.
".
306
Sources et éuolution de la physique quantique
Louis Armctrong et Niels Bohr, auz environs de 1955 (Source : Niels Bohr Archive, tous droi2J réservés)
Appendice
La physique nucléaire dans les années 30 aux Etats-Unis, en France, au Japon et au Brésil Les bouleversements politiques de l’Europe des années 1930 - le fascisme en Italie, le nazisme en Allemagne - provoquèrent l’émigration des gands talents en science, en technologie, en arts de l’Europe vers les Etats-Unis d’Amérique. Ce fut le cas de physiciens tels que Albert Einstein, Eugene P. Wigner, Leo Szilard, Edward Teller, Hans Albrecht Bethe, Enrico Fermi, Gian Carlo Wick, Emilio Segrè, Sergio de Benedetti ; de mathématiciens comme Hermann Weyl, John von Neumann, Paul Erdik, Claude Chevalley, des écrivains tels que Thomas Mann, Jacques Maritain, et tant d’autres, comme le biologiste Severo Ochoa, des ingénieurs, des peintres, des musiciens. Le transfert de connaissances est un processus historique fondamental et irréversible, générateur d’idées et de technologies nouvelles ; le transfert de technologie, tant prôné, n’est qu’un des produits du transfert de connaissances.
Le Brésil a bénéficié d’une petite partie de ce transfert : les physiciens Gleb Wataghin, Giuseppe Occhialini, Bernhard Gross, Guido Beck, David Bohm (en provenance des Etats-Unis dans l’après-guerre) ; les mathématiciens Luigi Fantappiè, Giacomo Albanese, Achille Bassi, suivis de Jean-Dieudonné, André Weil et des Portugais Antonio Monteiro, Pereira Gomes, Manuel Zaluar ; les chimistes Heinrich Rheinboldt, Heinrich Hauptmann, Hans Stammreich, Hans Zocher, Fritz Feigl ; des humanistes tels que l’historien Fernand Braudel, l’anthropologue Claude Lévy-Strauss,les écrivains Roger Bastide ainsi que Fortunat Strowski, Jacques Lambert, René Poirier ont contribué à développer les recherches aux Universités de Sa0 Paulo, de Rio et de Recife. Stefan Zweig mettra fin à ses jours à Petropolis en février 1942, au moment le plus tragique de la guerre. Des peintres comme Vieira da Silva et Arpad Szenes, l’écrivain Otto Maria Carpeaux, se sont établis à Rio à cette époque. Les rayons cosmiques furent l’objet de recherches menées par Wataghin qui, dans un article publié en 1940 avec Souza Santos et Paulus Pompeia, annoncèrent avoir détecté la production simultanée de particules pénétrantes dans le rayonnement cosmique à 800 m d’altitude, les “gerbes pénétrantes”’. Un ancien élève de Wataghin, Mario Schônberg, publia un article* dans les Rendiconti deli’Accademia dei Lincei, à Rome, où il proposa la représentation de la fonction impropre de Dirac par l’intégrale de Stieltjes. Avec Gamow’, Schônberg
*
’
P.A. Pompeia, M.D.de Souza Santos et G. Wataghin, Phys. Rev. 57, 61 (1940). M. Schonberg, Rendiconti Reale d. A c a à Nu. dei Lincei, 20, 81 (1937). G. Gamow et M. Schhberg, Phys. Rev. 5 8 , 1117 (1940) ; 69, 539 (1941).
308
Sources et évolution de la physique quantique
établit le rôle des neutrinos électroniques dans le processus de perte d’énergie des étoiles en contraction gravitationnelle (le processus Urca : Gamow comparait la perte d’énergie par les étoiles en contraction par émission de neutrinos à la perte de leur argent par les joueurs du Casino d’Urca, situé sur les flancs du Pain de Sucre à Rio de Janeiro). Dans les années 50, un bêtatron fut installé à l’Université de Sa6 Paulo : il permit le développement de recherches sur les réactions photonucléaires ; on y confirma le rôle des nombres magiques4 des noyaux sur les sections &caces de ces réactions jusqu’à 30 MeV. A la même époque, Oscar Sala, en collaboration avec l’université du Wisconsin, installa un accélérateur Van de Graaff et mit en route l’étude des réactions provoquéees par des ions. Nous avons évoqué la découverte des pions en 1947 et la nouvelle impulsion qu’elle donna au développement de la physique au Brésil. Le développement de la recherche aux Etats-Unis fut le résultat des activités des Universités - privées et des Etats de la Fédération -,des Instituts technologiques et des laboratoires d’entreprises industrielles. La tendance a toujours été dans ce pays d’éviter une planification centrale. Les fondations privées telles que la Rockefeller Foundation - qui a aidé la physique en Europe et en Amérique du Sud (Pauli, Heisenberg, Landau et tant d’autres scientifiques bénéficièrent de bourses d’étude Rockefeller), la Ford Foundation, la John Simon Guggenheim Memorial Foundation, eurent un rôle important pour le développement de l’enseignement supérieur et de la recherche scientifique. En 1950, après cinq années de débat au Congrès des Etats-Unis, fut créée la National Science Foundation (le National Research Council lié à la National Academy of Sciences fut instauré pendant la Première Guerre mondiale). En 1951, un Science Advisory Committee fut créé auprès du Président des Etats-Unis. La Commission de l’Energie Atomique, créée après la Deuxième Guerre mondiale, joua un rôle important dans le développement des laboratoires de recherche en physique nucléaire et en physique des hautes énergies. Elle fut récemment absorbée par le Department of Energy (Ministère de 1’Energie). Après l’invention du cyclotron, une quinzaine d’universités se dotèrent de ces accélérateurs- ce qui montre bien que les universités américaines constituaient un sol fertile pour l’accueil et la collaboration des physiciens immigrés d’Europe dans les années 1930. L’intervention de 1’Etat dans le financement des grands projets de recherche s’est avérée néanmoins indispensable, surtout après le succès du projet Manhattan. Des laboratoires nationaux se sont constitués grâce à la réunion, le cotuortium de plusieurs universités, tel que I’Associated Midwest Universities qui institua le National Brookhaven Laboratory. Un autre consortium, plus large, constitua le Fermi National Laboratoiy, à Batavia. Au Japon, la recherche en physique nucléaire débuta dans les années 1930, dans la ligne de la réforme Meiji de 1868 qui introduisit l’enseignement de la science occidentale dans les universités nationales. Dew laboratoires importants existaient à l’Institut de Recherche en Physique et Chimie Rikken à Tokyo, ceux de S. J. Goldemberg et J. Leite Lopes, Phys. Rev. 199, 1053 (1955).
Vers l’unification des interactions
309
Nishikawa et de Yoshio Nishina. Le laboratoire de Nishina, créé en 1931, possédait un groupe de physiciens tramillant dans les rayons cosmiques et des physiciens théoriciens. Nishina, bien connu pour son travail avec Oskar Klein sur la section efficace de l’effet Compton, passa un certain temps en Europe, à Cambridge, à Gottingen et à Copenhague, et attira les théoriciens S. Kikuchi, Sin-Itiro Tomonaga et Shoidii Sakata dans son laboratoire. Ce fut à l’université d’Os& que Hideki Yukawa eut l’idée des mésons comme les quanta des forces nucléaires et développa sa théorie avec Sakata et Taketani. La visite de Niels Bohr au Japon en 1937 exerça une infiuence positive sur la physique dans ces laboratoires. Mais, contrairement aux Etats-Unis, il n’y eut aucqne migration de scientifiques de l’extérieur vers le Japon. Dans les années 1950, après la tragédie des bombes atomiques, de nouvelles universités furent créées, ainsi que des instituts tels que l’Institut de Recherche en Physique Fondamentale à Kyoto (Yukawa) en 1953, I’Obsenatoire des Rayons Cosmiques sur le mont Norikura, l’Institut d’Etudes Nucléaires à Tokyo en 1955, doté de deux cyclotrons (1957, 1958) et d’un synchrotron à électrons (1961), dont l’énergie peut s’élever à 1,3 GeV. L’année 1971 fut celle de l’inauguration du KEK, le Laboratoire National de Physique des hautes energies, avec un synchrotron à protons de 12 GeV et un accélérateur à électrons de 2,5 GeV en 1982. En France, la tradition historique d’un gouvernement centralisateur a conduit à un développement de la recherche scientifique et technologique principalement concentré à Paris et dans la région parisienne. Le CNRS fut créé quelques mois avant le déclenchement de la Deuxième Guene mondiale, sous l’inspiration de scientifiques de prestige comme Jean Perrin, Irène Curie, Frédéric Joliot, Pierre Auger. Cette organisation stimule la recherche dans les universités, les grandes écoles (comme 1’Ecole polytechnique et 1’Ecole normale supérieure), et dans ses laboratoires propres répartis SUT tout le territoire (Marseille, Lyon, Grenoble, Strasbourg, Caen, Orsay, etc.). Le Commissariat à 1’Energie Atomique, créé en 1945, a, entre autres activités, un Centre d’Etudes Nucléaires à Saclay, un autre à Grenoble, équipés de divers accélérateurs de particules. Après les travaux de Pierre Weiss, Louis et Maurice de Broglie, Pierre Auger, Alexandre Proca, Eugène Bloch, Francis Perrin, toute une génération de chercheurs est apparue en France, avec Louis Néel, Louis Leprince-Ringuet, André Berthelot, Louis Michel, Maurice Lévy, Claude Bouchiat, Bernard d’Espagnat, Marcel Froissart, Philippe Meyer, Roland Omnès, Jacques Prentki ; André Lagarrigue et Bernard Grégory ; Charles Peyrou ; de la génération suivante on peut citer les expérimentateurs P. Musset, P. Darriuiat, R. Turlay, et les théoriciens P. Fayet, J. iliopoulos, C. Itzykson, M.Jacob, J.M. Lévy-Leblond, M.Le Bellac, J. Zinn-Justin, C. Zuber, entre autres. Témoins et acteurs du renouveau scientifique français après la Deuxième Guerre mondiale : les prix Nobel de physique Alfred Kastler et Louis Néel, PierreGilles de Gennes et Georges Charpak, ainsi que le prix Nobel de chimie Jean-Marie Lehn.
Bibliographie (Avec les éditiona l w plus récentes, quelques éditions originales) ~ Whistory of quantum L. ALLEN, P. FORMAN, J.L. HEILBRON et T.S. KUHN, S O U ~ for physics. A n inventory and report - The American Philosophical Society, Philadelphie (1967)
A. ASPECT et al., Le monde quantique - Points Sciences 1 Le Seuil (1985) J. P. BATON et G. COHEN-TANNOUDJI, L’horizon des Particules - NRF Essais 1 Gallimard (1989) B.BENSAUDEVINCENT, Langevin, Science et Vigilance - coll. Un savant, une époque 1 Belin (1987) M. BIEZUNSKI, Histoire de la Physique Moderne - coll. Histoire des Sciences / La Déeouverte (1993) N.BOBR, Physique Atomique et Connawsance Humaine - Folio Essais / Gallimard (1991) M.BORN, Structure Atomique de la Matière. Introduction à la physique quantique - Collection U / Armand Colin (1971) L.de BROGLIE, Louis de Broglie, Physicien et Penaeur (coniributioru de la plupart des créateurs de la physique moderne) - Les Savants et le Monde 1 Albin Michel (1953) M. BUNGE, Philosophie de la Physique - Science Ouverte / Le Seuil (1975) D. CASSIDY, Uncertainty (The life and science of Werner Heisenberg) - Freeman and Cie / New York (1992) G. COHEN-TANNOUDJI et M.SPIRO, La matière-espace-temps - Folio Essais 1 Gallimard (1990)
R. CREASE et C. MANN, The second creation: Makers of the Revolution in 20th-Century Physics - Collier Books, MC Millan Pub. Comp., New York (1988) M. CROZON, La matière première - Science Ouverte 1 Le Seuil (1987) P. DAVIES, Lu, forces de la nature - Sciences 1 Armand Colin (1988) P. A.M. DIRAC, Les Principes de la mécanique quantique - J. Gabay (1990) F. DYSON, Diaturbing the Universe: a life in science - Harper and Row (1979) A.EINSTEIN, Oeuvres choisies, 6 vol. - F. Balibar, O. Darrigal et B. Jech ed., Le Seuil / CNRS (1989) A. EINSTEIN, Comment j e vois le monde - Champs 1 Flammarion (1989) A. EINSTEIN, Concepfionr seieniifiquw - Champs 1 Flammarion (1990) A. EINSTEIN, M. BORN, Comapondance (1916-1955) -Science Ouverte 1 Le Seuil (1988) A.EINSTEIN, L. INFELD, L’évolution des idées en phyjique - Champs 1 Flammarion (1983)
L. FERMI, Atomes en famille - Gallimard (1955) R. FEYNMAN, La Nature de la Physique - Points Sciences 1 Le Seuil (1980) R. FEYNMAN, S. WEINBERG, Particules et lois de la physique - InterEditions (1989) G. GAMOW, l k n t e années qui ébranlèrent la physique - Dunod Paris (1968) S.HAWKING, Une brtve hktoire du temps - Champs 1 Flammarion (1991) S.HAWKlNG, Commencement du temps et fin de la physique P - Flammarion (1992) J.L. HEILBRON, Planck, une conscience déchirée - trad. N. Dhombres, coll. Un savant, une époque 1 Belin (1988) W.HEISENBERG, La Partie et le Tout. Le Monde de la physique atomique - Champs 1 Flammarion (1990) W.HEISENBERG, Physique et Philosophie - Albin Michel (1971) W.HEISENBERG, La Nature d a w la Phyjique Contempomhe - Gallimard (1970) W.HEISENBERG, LW Principes phya‘ques de la Théorie des quanta - J . Gabay (1990)
312
Sources et évolution de la physique quantique
B. HOFFMANN, A. Einatein, créateur et rebelle - Points Sciences / Le Seuil (1978) B. HOFFMANN, M. PATY, L’étmnge histoire des quantaa -Points Sciences /Le Seuil (1981) M. JAMMER, The conceptual development of quantum mechanics - McGraw-Hili, New York (1966) J. H. JEANS, Théorie du Rayonnement et des Quanta - Librairie Scientifique Albert Blanchard, Paris (1925) H. KRAGH, Dime: A scientific Biography - Cambridge University Press (1990) J. LABERRIGUE-FROLOW, La physique des particules élémentaires - Masson (1990) P. LANGEVIN, La Notion de ~ o r p w ~ ~ et i Cd’Atomes 9 -.Hermann (1934) S.L E STRAT, Epistémoiogie des sciences physiques - Nathan (1990) J. M. LEVY-LEBLOND et F. BALIBAR, Quantique, rudiments - InterEditions (1984) S.ORTOLZ, J.P. PEARABOD, Le Cantique des Quantiques - Sciences et Société / La Découverte (1984) A. PAIS, Albert Einstein. La vie et l’oeuvre (“Subtle is the Lord... ”) -Inter-Editions (1993) A. PAIS, Niels Bohr’s Times, in physics, philosophy and polity - Clarendon Press Oxford (1979) A. PAIS, Inward bound: of matter and forces in the physical world - Oxford University Press (1986) M. PATY, Einstein philosophe - Presses Universitaires de France (1993) J. PERRIN, Les Atomes - Gallimard (1970) M.PLANCK, Initiation d la physique - Champs / Flammarion M. PLANCK, L’image du monde dans la physique moderne - Gauthier (1963) P.RADVANYI et M. BORDRY, La Radioactivité artificielle - Points Sciences / Le Seuil (1984) A: REEVES, Patience dans l’azur - Science Ouverte 1 Le Seuil R. REID, Marie Curie - Points Scienees / Le Seuil (1983) SROZENTAL, Ed. Niels Bohr, his life and work 0s seen by his friends and colleagues - North Holland, Amsterdam (1967) A.SALAM, W. HEISENBERG, P.A.M. DIRAC, La Grande Unification - Science Ouverte 1 Le Seuil (1991) RSCHRODINGER, L’Esprit et la Matièrr - Le Seuil (1990) E.SCHRODINGER, Ma conception du monde - Mercure de France (1982) E.SCHRoDINGER, Qu’est ce que la vie ? - Christian Bourgois (1986) E. SCHRODINGER, Physique quantique et représentation du monde - Points Sciences 1 Le Seuil Q992) E.SCHRODINGER, Mémoires sur la mécanique ondulaioire - J. Garbay (1988) E.SEGRE, Lw Physiciens modernes et leurs découvertes - coll. Le temps des Sciences / Fayard (1990) S.TOMONAGA, Quantum Mechanics - 2 vol. North Holland Pub. (1962et 1966) B. VAN DER WAERDEN, Sources of quantum mechaniw - Dover, New York (1968) S.WEART, La grande aventure des atomistes fninçaw. Les savants au pouvoir - Fayard (1980) S.WEINBERG, Les 3 premières minutes de l’Univers - Points Sciences 1 Le Seuil (1978) V. WEZSSKOPF, La Révolution des Quanta - Questions de Science / Hachette (1989) V. WEISSKOPF, La physique au XJ? siècle - Editions Mondiales (1974) H. WEYL, Philosophy of mathematics and natuml sciences - Princeton Univ. P~ess(1949) ~
Index Abel 272 Albanese G. 307 d’Alembert 8 Anaxagore 1 Anaximandre 1,265 Anaximène 2 antimatière 3, 189-193 Anderson C. 192,244, 256 Aristarque de Samos 2 Aristote 2,4,6 Auger P. 309 Avicenne 4 Balmer-Bohr (formule) 57 Bartlett J. 244 baryon 263, 265 Bassi A. 307 BastideR. 307 Bauer E. 153-187 Beck G. 307 Becker H. 242 Becquerel H. 10, 11 Benedetti J.B. 5 Benedetti S. 307 Berthelot A. 309 bêta (désintégration) 241-243,257,262 Bethe H.A. 61,245,256,307 Bhabba H.J. 245 Bjorken J. 298 Blackett P. 192 Bloch E. 309 Bohm D. 307 Bohm-Aharanov (effet) 270 Bohr N. 17-19,57, 90-91,127, 133-152 241,242,244,309 Boltzmann L. 9 (constante) 16 Born M. 57,91,126-127,129-132 Bose (condensation) 61 BosoEinstein (statistique) 85-88 boson 258 boson intermédiaire 259, 275-278 Bothe W. 242 Bouchiat C. 309 Braudel F. 307 Breit G 244 de Broglie L. 89-90,92-98,189,309 de Broglie M. 309 bulles (chambres à) 256, 277 (note)
Buridan J. 5 Cabbibo N. (angle) 258 Carlsen F. 245 Carpeaux O.M. 307 Cartan E. 193 Cassen B. 244 centrifuge (force) 15-16 CERN 18,255,277 Chadwick J. 241,242 Chandrasekhar S. 61 charme 268-269 Charpak G. 256,309 Chevalley C. 307 Christenson J. 276 chromodynamique quantique 272 civilisations précolombiennes 7 Cockroft J. 255 complémentarité (principe) 127, 133-152 Compton A. 89 (effet) 89, 213-214 Condon E. 244 conjugaison de charge 3, 276 Conversi M. 256 Cooper (paires de) 62 Copernic N. 6 Coriolis (force) 15-16 couleur 61, 267,272 courants faibles neutres 277 Cronin J. 276 Crookes W. 10 CÜer P. 256 Curie I. 242, 309 Dalton J. 9 Dancoff S.M. 245 Darriulat P. 309 Démocrite 3 DescartesR. 5 Dieudonné J. 307 Dirac P.A.M. 2,60,91, 128, 190-193, 194208,209 (équation) 194-208 Doppler (effet) 14 Duhem P. 9 Dyson F. 275 Einstein A. 2, 13-17,28-40,89, 126, 189,209,275,297,307
Sources et évolution de la physique quantique
314
Ellis C.D. 241 électrodynamique quantique 219-240 Empédocle 3 Eotvos von R. 16 Epicure 3 Erathostène 1 E r d k P. 307 d’Espagnat B. 309 éther 13 étrangeté 262-263 Euler L. 8 exclusion (principe d’) 57-58, 296 Fantappiè L. 307 Faraday M. 298 Fayet P. 299-308,309 Feigi F. 307 Fermi E. 60-61, 81-84,242-243, 258,262, 298, 307
(statistique de Fermi-Dirac) 60, 81-84 (pression) 61 (interaction) 242-243,258,262, 298 FERMILAB 19, 255, 303 (note), 308 fermion 60, 81-84, 299 Feynman R.P. 210-217, 219-240, 258-259, 272,275,298
Fitch V. 276 Franck J. 19 Frohlich H. 245 Froissart M. 309 Galilée 2,4, 6, 13-14, 16, 298 (transformations) 13-14 Gamow G. 307-308 Gardner E. 257 Gay-Lussac L.J. 9 Geiger-Müller (compteur) 255 Gell-Mann M. 258, 261-269, 298 Gennes de P.G. 309 Gibbs J.W. 9 Glashow S 259,268,276, 297-298 gluons 272 Gomes P. 307 Gordon W. 190 Goudsmit S. 58, 78-80 graviton 303 Gregory B. 309 Gross B. 307 Hafstadt L.
244
Hahn O. 241 Hamilton W.R. 8 Hauptmann H. 307 Hawking S. 296 (note) Heisenberg W. 90-91, 112-125, 127, 243, 244, 262-263, 275,278, 308
Heitler W. 245 Héraciite 3 Hertz G. 19 Hertz H. 10 Heydenburg N. 244 Hilbert (espace de) 127 Higgs (boson de) 277,278,301,303 Hofstadter R. 18 Homère. 2 Hooft t’ G. 298 Hulthén L. 245 hypercharge 262-264 hypéron 263 Iliopoulos J. 268,309 incertitude/indétermination(relations) indiscernabilité 59 isospin 263, 272 Itzykson C. 309 Imnenko D. 243 Jacob M. 309 Jauch J.M. 245 jauge (transformations) 270-271 Jeans J. 16 Joliot F. 242, 309 Jordan P. 91 kaon 261
Kastler A. 309 KEK (laboratoire) 309 Kemmer N. 245 Kepler 6 Kerst D. 255 Kikuchi S. 309 Kirchhoff 16 Klein O. 190,258,309 Kobayashi-Maslcawa (matrice) 258 Kronig de R. 58-59 Kusaka S. 245 Lagarrigue A. 309 Lagrange 8 &bW.E. 210
127
Vers l’unification des interactions
Lambert J. 307 Landau L.D. 309 LandéK. 308 Laplace P.S. 8 Lattes C.M.G. 245, 256-257 Lawrence E.O. 255 Le Bellac 3. 309 Lederman L. 257, 269
Néel L. 309 Neumann von J. 307 neutrino 241-242, 257, 262 Newton I. 2, 6-8, 9, 13, 17,262, 298 Nishijina K. 262 Nishikawa 309 Nishina Y. 309 Nominalist- ( E a l e des) 5
I
Lee T.D. 258,276
Occhialini G. 192, 245,256, 307 Ochoa S. 307 Omnès Fi. 309 Oppenheimer J.R. 245, 256, 307 OresrneN. 4 Ostwald W. 9
Lehn J.M. 309 Leibnitz 7 Leite Lapes J. 259, 286 LEP (accélérateur) 255 Leprince Ringuet L. 309 Leucippe 3 Lévi-Strauss C. 307 Lévy M. 309 Lévy-Leblond J.M. 309 LHC (accélérateur) 255 Livingstone M.S. 255 Locke J. 8 London F. 153-187 Lorentz H.A. 14, 16, 18, 298 Lucrèce 3-4
Pais A. 126 Pancini E. 256 Parménide 3 Pauli W. 57-61, 03-77, 91, 191-193, 275,296, 298, 308
MachE. 8 Maiani L. 268 Majorana E. 243, 244 Manhattan (projet) 308 Mann T. 307 matrices (mécanique des) 90-91, 112-125 Maritain J. 307 Marshak R. 245,258 Maupertuis P.L.M. 8 Maxwell J.C. 2, 9, 270, 275, 298 Meitner L. 241 243-245 Meyer P. 309 Michel L. 258, 309 m&n
Michelson et Morley (exfirience) Mills R. 271,275 Minkowski H. 15 modèle standard 275-278 Méller C. 245 Monteiro A. 307 Muirhead G. 245, 256 muon 256-259 Musset P. 309 NagaokaH. 18 Neddermayer S . 192, 244,256
315
14
(matrices) 59 (neutrino) 241-242, 244 (Le principe d’exclusion) 65-79 Perrin J. 9, 255, 309 Perrin F. 309 Peyrou C. 309 Piccioni O. 256 pion 256259, 264-265 Philippon J. 4 Planck M. 9, 16-17, 19, 20-27 (constante) 17-19 (masse) 297 Platon 4,6 Poincaré H.
13-15,298
(transformations) Poirier R. 307 Poisson (équation) 16 Polyakov 298 Pompeia P.A. 307 Pontecorvo B. 259 Powell C. 245, 256 Prentki J. 309 Proca A. 309 Ptolémée C. 1 Pulitzer 298 Pythagore 2, 6 quark 265 Rayleigh J.W.S. 16
191
316
Sources et évolution de la physique quantique
R é F . 61 note 33 Thalès 2, 265 renormdisation 217-218 TEVATRON accélérateur 278, 303 note 3 Rheinboldt H. 307 Thomson J.J. 10, 18 Richter B. 269 Ting S. 268 Riemann B. (espace de) 16 Tiomno J. 258 RJKKEN Institut 309 Tomonaga S.I. 210,275,309 h n t g e n W. 10 top 268,278 Rosenbluth M. 258 Turlay R 276,309 Rosenfeld L. 245 "uve M. 244 Russel B. 1 Uhlenbeck G. 58, 78-80 Rutherford E. 18,41-57,242 Uhling (effet) 210 Rydberg J.R.(constante) 19 Rydberg-Ritz (principe de combinaison) 91 unification électrofaible 275-278,279-295 Urea (procédé) 308 Sakata S. 264265,309 Sakurai 258 Van de Graaff 255 SalaO. 308 Van der Waals (interactions) 272 Salam A. 218,255,276,297,298 Van der Waerden 193 saveur 267 Vieira d a Silva 307 Schonberg M. 307 Vinci de L. 5 Schrodinger E. 59,90-91,99-111,126-128, Voigt W. 14 188-189,210,298 Voltaire 8 (équation) 9%iii Waiton E. 255 Schwartz M. 257 Wataghin G. 307 Schwinger J. 210,245,275 Weil A. 307 Segrè E. 307 Weinberg S. 218,259,276-278,279-295, SERPUKHOV laboratoire 255 297-298 SLAC laboratoire 18, 268 Weiss P. 309 Sommerfeld A. 17,60, 193 Weisskopf V. 245 Souza Santos M.D. 307 Wentzel G. 249 SPEAR accélérateur 268 Weyl H. 1,193,261,271,307 spin (de l'électron) 78-80 Wheeler J.A. 215-216,258 SSC accélérateur 255 Wien W. 16 Stammreich H. 307 Wigner E. 193,244,263, 276, 307 Steinberger J. 257 Wick G.C. 307 Stoner (règle de) 57-58 Wilson C.T.E. (chambre de) 255 Stoney G. 10 Wu C.S. 276 Struwski F. 307 Sudarshan E.C.G. 258,298 Yang C.N. 258,264,271,276 superfluidité 62 Yukawa H. 243-245,246254,256,272,309 superposition (principe de) 126 supersymétrie 298,299-305 Zaiuar M. 307 superunification 296-298 Zeeman (effet anormai) 57 supraconductivité 62 Zénon 3 Szenes A. 307 Zinn-Justin J. 309 Szilard L. 307 Zocher H. 307 TaLetani 309 Zuber C. 309 Teller E. 307 Zweig S. 307