283 56 16MB
French Pages 236 [234] Year 2021
“title” — 2021/5/28 — 16:28 — page i — #1
Collection « Une Introduction à » dirigée par Michèle Leduc et Michel Le Bellac
L’Univers décrypté par les énigmes Cumrun Vafa
Traduction de Michel Le Bellac
EDP Sciences 17, avenue du Hoggar Parc d‘activités de Courtaboeuf, BP 112 91944 Les Ulis Cedex A, France
“Copyright” — 2021/6/28 — 20:25 — page ii — #1
Dans la même collection Vertigineuses symétries Anthony Zee, traduit par Michel Le Bellac Le temps des neurones – Les horloges du cerveau Dean Buonomano, traduit par Michel Le Bellac Voyage dans les mathématiques de l’espace-temps Stéphane Collion Les planètes et la vie Thérèse Encrenaz, James Lequeux et Fabienne Casoli Quantique : au-delà de l’étrange Philip Ball, traduit par Michel Le Bellac Un siècle de gravitation Ron Cowen, traduit par Michel Le Bellac Atomes, ions, molécules ultrafroids et technologies quantiques Robin Kaiser, Michèle Leduc et Hélène Perrin Retrouvez tous nos ouvrages et nos collections sur http://laboutique.edpsciences.fr Illustration de couverture : Œdipe et le sphinx. Reconstruction du médaillon d’un kylix attique à figures rouges (480-470 av. J.-C. Provenance : Vulci) par Juan José Moral. Translation from the English language edition of “Puzzles to Unravel the Universe” by Cumrun VAFA, ISBN : 9798642693636 ; © Vafa Cumrun. Imprimé en France ISBN (papier) : 978-2-7598-2594-3 – ISBN (ebook) : 978-2-7598-2595-0 © 2021, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc d’activités de Courtabœuf, 91944 Les Ulis Cedex A Tous droits de traduction, d’adaptation et de reproduction par tous procédés réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective, et d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code de la propriété intellectuelle). Des photocopies payantes peuvent être réalisées avec l’accord de l’éditeur. S’adresser au : Centre français d’exploitation du droit de copie, 3, rue Hautefeuille, 75006 Paris. Tél. : 01 43 26 95 35.
“Copyright” — 2021/6/28 — 17:46 — page iii — #2
À mon épouse bien-aimée et amie de toujours Afarin, à mes chers enfants, Farzan, Keyon et Neekon, qui ont été sources d’inspiration dans l’écriture de ce livre et à mes parents aimants, Simeen et Javad, qui ont nourri ma curiosité.
iii
Préface
L’intuition est un outil précieux, mais qui peut se révéler piégeux. Lui faire systématiquement confiance, c’est parfois prendre le risque de valdinguer dans les décors. Par exemple lorsqu’il s’agit d’évaluer un ordre de grandeur. Saisissezvous (pour voir) du globe terrestre et entourez-le d’un ruban comme si vous vouliez l’offrir dans un joli paquet-cadeau. Puis donnez à ce ruban initialement tendu un mètre de mou, ce qui aura pour effet de le détendre très légèrement. Question : sachant que le rayon de la Terre est de 6 400 kilomètres, de combien vous faudra-t-il surélever ce ruban au-dessus du sol, tout autour de la Terre, pour qu’il soit à nouveau tendu ? Posez donc ce problème à vos amis : je fais le pari que les chiffres qu’ils avanceront spontanément seront en général ridiculement petits (un millimètre par-ci, un micron par-là, un nanomètre parfois, l’idée générale étant qu’il n’y aurait même pas la place de glisser une feuille de papier à cigarette sous le ruban). Or la bonne réponse à la question est environ 16 centimètres, c’est-à-dire beaucoup plus que ce que l’intuition nous dicte, ce qui laisserait la possibilité à une souris, voire à un chat, de passer sous le ruban ! Hé oui, il faut une élévation de 16 centimètres (soit un mètre divisé par 2π) pour absorber un mètre de mou lorsque la circonférence du cercle entouré vaut 40 000 kilomètres ! Mais ce qui est encore plus incroyable, c’est que ce résultat ne dépend pas du rayon de la sphère choisie. En d’autres termes, la hauteur en question aurait été exactement la même si vous aviez tendu le ruban autour du Soleil, de Jupiter, d’un petit pois, d’un atome ou d’un simple point. L’étrange peut ainsi surgir sans crier gare, alors même que le calcul donnant la bonne solution du
problème est élémentaire. Il arrive aussi que notre intuition ne soit pas bien sûre d’elle-même, qu’elle s’embrouille ou hésite. Pour vous en rendre compte, considérez cette fois deux pots de peinture de même volume. Le premier contient de la peinture blanche, le second de la peinture verte, en quantités rigoureusement identiques. À l’aide d’une petite cuillère, prélevez un peu de peinture blanche dans le premier pot et reversez la dans le second (dont la quantité de peinture se trouvera ainsi légèrement augmentée tandis que celle du pot blanc aura légèrement diminué). Touillez ensuite vigoureusement afin que les deux couleurs se mélangent parfaitement : le vert du second pot devient ainsi un peu plus pâle. Prélevez maintenant, avec la même petite cuillère, un peu de ce mélange et reversez le dans le premier pot. Touillez afin de réaliser, là aussi, un mélange bien homogène : le blanc du premier pot a légèrement verdi. À l’issue de cette double opération, les quantités de peinture dans les deux pots sont bien sûr redevenues égales, mais qu’en est-il de leurs teneurs : la concentration de vert dans le pot blanc est-elle inférieure, égale ou supérieure à la concentration de blanc dans le pot vert ? Euh. . . La vérité est qu’elles sont égales. Ce résultat ne me semble guère intuitif, et j’ai pu vérifier autour de moi que ce sentiment était partagé. Échouant à trouver le raisonnement simple qui le ferait paraître naturel, j’ai dû me résoudre à poser deux ou trois équations pour l’établir. Ces deux exemples illustrent, chacun à sa façon, la vertu canonique des énigmes : en excitant notre intellect, elles ont le don de nous forcer à réfléchir, qui plus est de façon possiblement joyeuse. Car nous les devinons capables de nous offrir des surprises, voire de nous mener à des découvertes étranges. C’est bien connu, pour qui aime la réflexion, toute rencontre avec l’étrange a un parfum d’aubaine : elle advient comme une chance, une invitation merveilleuse à penser autrement, à s’arracher à ses routines. C’est pourquoi les énigmes méritent tant leur synonyme : elles sont bel et bien d’authentiques casse-têtes, au sens où elles détruisent les préjugés qui stagnent entre nos deux oreilles et ouvrent ensuite le spectre des conjectures. Mais ce n’est pas tout, comme le démontre magnifiquement ce livre de Cumrun Vafa. Les énigmes, notamment celles qui sont de nature mathématique, permettent d’aller encore plus loin : bien agencées, elles éclairent et aident à comprendre ce qui fonde les lois physiques, depuis celles qui furent découvertes par Archimède, Galilée et Newton, jusqu’aux avancées les plus récentes de la théorie des supercordes ou de la gravité quantique. Par exemple, notre histoire des deux pots de peinture donne corps à l’idée de loi de conservation, qui joue un rôle crucial dans tous les formalismes de la physique. Plus généralement, grâce aux énigmes et aux puzzles – et sans qu’on puisse toujours pressentir le moindre lien qu’ils pourraient avoir a priori avec le monde physique –, on peut en apprendre
vi
Préface
de belles sur les trous noirs, le boson de Higgs, le vide quantique, les mirages gravitationnels ou l’antimatière. Au fil des pages de ce livre déroutant, la physique se révèle comme l’exact contraire d’une bureaucratie des apparences : ses lois les plus fondamentales ne sont jamais directement déductibles du spectacle du monde. Elles procèdent plutôt d’un détour par les concepts, autrement dit par l’abstraction : la réalité empirique est en somme invitée à aller se faire voir ailleurs, puis, au retour d’une vaste galipette conceptuelle, à se révéler tel qu’elle est vraiment (ou pourrait être). Ainsi mise en scène, la physique, souvent jugée rébarbative, devient ludique. Elle en vient à ressembler à un véritable jeu, certes un peu spécial : il s’agit d’un jeu de l’esprit ayant, à la différence de beaucoup d’autres plus gratuits, le souci de rendre compte du réel. Étienne Klein, mars 2021
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
vii
Table des matières
Préface
v
Avant-propos 1
2
3
xiii
Introduction à la physique moderne 1.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Pensées anciennes . . . . . . . . . . . . . . . . . . . . . 1.3 La mécanique de Newton . . . . . . . . . . . . . . . . 1.4 Mécanique lagrangienne et mécanique hamiltonienne 1.5 L’électromagnétisme de Maxwell . . . . . . . . . . . . 1.6 La théorie de la relativité . . . . . . . . . . . . . . . . . 1.7 Mécanique quantique . . . . . . . . . . . . . . . . . . . 1.8 La théorie des champs quantiques . . . . . . . . . . . 1.9 La gravitation quantique . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
1 1 3 5 6 8 10 13 16 18
Symétries et lois de conservation 2.1 Introduction . . . . . . . . . . . . . . 2.2 Motivation pour les énigmes . . . . 2.3 Symétries . . . . . . . . . . . . . . . . 2.4 Le théorème de Noether . . . . . . . 2.5 Supersymétrie . . . . . . . . . . . . . 2.6 Quasi-cristaux et symétries . . . . . 2.7 Cordes et conservation de la charge 2.8 Brisure spontanée de symétrie . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
21 21 22 24 28 35 37 40 43
Brisure de symétrie 3.1 Introduction . . . . . . . . . . . . . . . . . . . 3.2 Mouvement de la Terre et brisure de symétrie 3.3 Brisure spontanée de symétrie . . . . . . . . . 3.4 Aimants et symétries spontanément brisées .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
45 45 47 48 52
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
3.5 3.6 3.7 3.8 3.9 3.10
. . . . . .
55 58 61 64 65 65
4
La puissance des mathématiques simples et abstraites 4.1 Lois et contraintes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4.2 Un aperçu sur les nombres complexes . . . . . . . . . . . . . . . . 4.3 Lentilles gravitationnelles . . . . . . . . . . . . . . . . . . . . . . .
69 69 71 78
5
Mathématiques contre-intuitives 5.1 Préliminaires . . . . . . . . . . . 5.2 Les paradoxes de l’infini . . . . 5.3 Séries analytiques . . . . . . . . 5.4 Le paradoxe du hall de Monty .
. . . .
85 85 89 92 96
. . . . . . . .
105 105 106 107 109 114 116 117 119
. . . . . . . . .
125 125 127 129 130 132 136 137 139 141
6
L’énigme du carré . . . . . . . . . . . . Brisure de symétrie et boson de Higgs La grande unification des forces . . . . Supraconductivité . . . . . . . . . . . . Rigidité . . . . . . . . . . . . . . . . . . Chiralité . . . . . . . . . . . . . . . . .
. . . .
. . . .
. . . .
. . . .
Intuition physique 6.1 Physique intuitive . . . . . . . . . . . . 6.2 Galilée . . . . . . . . . . . . . . . . . . 6.3 Isaac Newton . . . . . . . . . . . . . . 6.4 Intuition physique en mathématiques 6.5 L’« Euréka » d’Archimède . . . . . . . 6.6 Le théorème de Pythagore . . . . . . . 6.7 Théorie de la relativité restreinte . . . 6.8 Mécanique statistique . . . . . . . . . .
7
. . . . . .
. . . .
. . . . . . . .
Physique contre-intuitive 7.1 La portance revisitée . . . . . . . . . . . 7.2 Pourquoi le ciel nocturne est-il sombre ? 7.3 Équations de Maxwell . . . . . . . . . . 7.4 La théorie d’Einstein de la relativité . . 7.5 Paradoxes en physique quantique . . . 7.6 Indiscernabilité en physique quantique 7.7 Le paradoxe EPR . . . . . . . . . . . . . 7.8 Trous noirs . . . . . . . . . . . . . . . . . 7.9 Holographie . . . . . . . . . . . . . . . .
x
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
. . . . . .
. . . .
. . . . . . . .
. . . . . . . . .
Table des matières
8
9
Normalité en physique : analyse dimensionnelle 8.1 Un moment d’enseignement . . . . . . . . . . 8.2 Ordres de grandeur . . . . . . . . . . . . . . . 8.3 Analyse dimensionnelle . . . . . . . . . . . . 8.4 Rayonnement de charges accélérées . . . . . 8.5 Invariance d’échelle et invariance conforme . 8.6 Unités fondamentales . . . . . . . . . . . . . . 8.7 Trous noirs . . . . . . . . . . . . . . . . . . . . 8.8 Symétrie et nombres naturels . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
Anormalité et grands nombres 9.1 Nombres « anormaux » . . . . . . . . . . . . . . . . . 9.2 Nombres déraisonnables et système héliocentrique 9.3 Théorie des nombres . . . . . . . . . . . . . . . . . . 9.4 Composition de l’Univers . . . . . . . . . . . . . . . 9.5 La géométrie de l’espace-temps . . . . . . . . . . . . 9.6 D’autres questions . . . . . . . . . . . . . . . . . . . 9.7 Échelles de longueur . . . . . . . . . . . . . . . . . . 9.8 Échelles de temps . . . . . . . . . . . . . . . . . . . .
10 Science et religion 10.1 Questions fondamentales 10.2 Science contre religion . . 10.3 Science et religion . . . . . 10.4 L’origine de l’Univers . . . 10.5 Einstein et la religion . . . 10.6 Feynman et la religion . . 10.7 Hawking et la religion . . 10.8 Pascal et la religion . . . . 10.9 Causalité et Dieu . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
143 143 143 144 145 146 148 152 153
. . . . . . . .
155 155 159 160 161 161 164 165 165
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
167 168 169 170 171 172 173 174 176 177
11 Dualités 11.1 Deux exemples mathématiques . . . . . . 11.2 Dualité en mécanique quantique . . . . . 11.3 Théorie de Maxwell . . . . . . . . . . . . . 11.4 La dualité en théorie des cordes . . . . . . 11.5 La T-dualité . . . . . . . . . . . . . . . . . 11.6 Variétés de Calabi-Yau et symétries miroir 11.7 Autres dualités : géométrie et forces . . . 11.8 Dualité et trous noirs . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
181 182 184 185 188 189 191 195 198
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
xi
11.9 Holographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 11.10 La loi du demi-cercle de Wigner . . . . . . . . . . . . . . . . . . . 200 12 En résumé 12.1 Symétries et leur brisure . . . . . . 12.2 Symétrie de jauge . . . . . . . . . . 12.3 Mathématiques intuitives . . . . . 12.4 Mathématiques contre-intuitives . 12.5 Physique intuitive et non intuitive 12.6 Normalité . . . . . . . . . . . . . . 12.7 Physique et religion . . . . . . . . . 12.8 Dualités . . . . . . . . . . . . . . . . Index
xii
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
203 204 206 208 209 211 212 213 214 215
Table des matières
Avant-propos
Une motivation inscrite dans nos gènes nous pousse à essayer de comprendre « comment les choses marchent ». Nous espérons identifier autour de nous des schémas qui nous aident à anticiper ce qui va se passer. Donner une formulation quantitative à ces schémas a conduit l’humanité à développer progressivement les mathématiques. Il n’est donc pas surprenant que les mathématiques soient le langage naturel pour décrire la façon dont la nature fonctionne. De fait, les mathématiques sont la colonne vertébrale de la physique, dont l’objectif est de décrire comment l’Univers fonctionne à son niveau le plus fondamental. Plus notre connaissance des lois de la nature s’approfondit et plus nous avons besoin de notions avancées de mathématiques, de sorte qu’aujourd’hui la physique a acquis la réputation d’être devenue impénétrable pour les non-initiés en raison de sa complexité mathématique. Cependant cette perception ignore la simplicité des lois physiques et l’élégance des mathématiques lorsqu’elle saisissent l’essence profonde de la réalité physique. En tant que physicien passionné par les mathématiques, je peux témoigner directement du fait que, sous la formidable complexité apparente de la machinerie mathématique, se dissimulent des pépites de vérités simples et profondes. Ces vérités sont ce que nombre de scientifiques s’efforcent de cristalliser lorsque le brouillard s’est levé et que les lois de la nature ont émergé. Ces pépites sont une sorte de « résumé exécutif » que chérissent les scientifiques et qui leur servent de leçons à emporter extraites des découvertes des lois de la nature. Heureusement, ces idées centrales peuvent souvent être illustrées par des énigmes mathématiques simples. Ces énigmes sont si simples qu’elles ne
nécessitent pas de connaissances préalables en physique ou en mathématiques pour que l’on puisse les aborder et en apprécier la signification. Les énigmes mathématiques de ce type sont non seulement amusantes à résoudre, mais elles sont profondément satisfaisantes parce qu’elles saisissent une signification plus fondamentale de la réalité physique, et ce ne sont pas uniquement des énigmes. Mon objectif dans ce livre est d’embarquer le lecteur dans un voyage qui lui fera décrypter de nombreuses facettes des lois de l’Univers à travers ces énigmes. Le thème central de ce livre est l’idée que, sous la réalité physique, il n’existe pas d’idée singulière qui chapeaute l’ensemble, mais plutôt une collection de concepts parfois contradictoires qui, une fois rassemblés, fixent le cadre de la réalité physique. Apprécier la façon dont ces pensées contradictoires s’imbriquent mutuellement et œuvrent en harmonie vers un objectif commun est le thème central de ce livre. J’espère faire la démonstration de la façon dont ces concepts fonctionnent en m’appuyant sur une collection des principes les plus importants de la nature par l’intermédiaire du prisme des énigmes. Après un bref résumé de l’histoire des sciences et des interactions entre physique et mathématiques au cours des siècles, j’aborde successivement les sujets essentiels. Chaque section commence par évoquer un sujet vu sous un angle particulier et examine ensuite l’importance de le voir sous l’angle opposé. Et cela se répète en passant de la physique aux mathématiques et réciproquement. Tout cela est présenté en distillant des énigmes amusantes. Le premier sujet que j’aborderai est la symétrie. D’un côté j’expliquerai ce que signifie préserver une symétrie en mathématiques et en physique, et de l’autre je discuterai l’importance de briser ces symétries. L’énigme suivante : déterminer le plus court chemin permettant de relier quatre villes situées aux coins d’un carré donne un exemple parfait de ce phénomène. Tandis que les symétries expliquent l’origine des lois de conservation comme celle de l’énergie, nous verrons pourquoi la brisure de symétrie est essentielle à notre existence même. Nous expliquerons pourquoi cette brisure est reliée à la découverte récente du boson de Higgs et également pourquoi nos propres yeux et leur position sur nos visages sont la manifestation d’une brisure de symétrie. Les idées intuitives aussi bien que les idées non intuitives sont importantes en physique comme en mathématiques. Les idées intuitives, comme la continuité qui est manifeste dans des aspects variés des lois physiques, et les abstractions non intuitives, comme celle qui consiste à considérer le temps comme une quatrième dimension, sont indispensables à une compréhension en profondeur de la réalité. Nous montrerons que l’idée de continuité, aussi simple soit-elle, conduit à des conclusions fondamentales. Afin d’illustrer cette idée, nous donnons l’exemple de l’énigme suivante : pourquoi existe-t-il toujours sur l’Équateur deux points diamétralement opposés à la même température ? Nous
xiv
Avant-propos
montrons également que la continuité des lois de la physique explique pourquoi la théorie de la relativité générale d’Albert Einstein prédit qu’il y a toujours un nombre impair d’images gravitationnelles d’une étoile. Nous passons ensuite à la notion de paramètre naturel : comment faire une estimation sur un coin de serviette de la façon dont la nature fonctionne en utilisant une information minimale ? Nous donnons comme exemple une estimation simple de la contraction nécessaire pour que le Soleil se transforme en trou noir. Nous passons ensuite à l’idée contraire et discutons comment des nombres, qui sont anormalement grands ou anormalement petits de manière inattendue, ou non naturelle, font irruption dans des lois de la physique d’une façon difficile à anticiper. En particulier, pourquoi la répulsion électrostatique entre deux protons est-elle plus grande que leur attraction gravitationnelle par un facteur un suivi de 36 zéros ? Nous illustrons l’apparition en physique de nombres qui sont grands de manière inattendue par le problème ancien du troupeau d’Archimède, dont la solution implique un nombre comportant près d’un million de chiffres ! Je m’aventure aussi dans la discussion de problèmes liés aux relations entre science et religion mais, contrairement aux discussions usuelles, même ce sujet est formulé en termes d’énigmes amusantes. Un exemple d’énigme est celui qui implique un rectangle composé de rectangles plus petits. Chaque côté de ces rectangles est mesuré par un nombre entier, ce qui implique la même propriété pour le plus grand rectangle. Finalement je discute certains des développements les plus excitants de la physique fondamentale moderne dans le contexte de la théorie des cordes. La théorie des cordes a émergé récemment comme une théorie quantique englobant toutes les forces fondamentales. Je me focaliserai sur l’idée de dualité dans la théorie des cordes, idée qui a fasciné les théoriciens des cordes depuis une vingtaine d’années et a joué un rôle clé dans son développement. Je discuterai par exemple la façon dont la dualité permet de mieux comprendre les trous noirs et la nature de l’espace et du temps. Une énigme illustrant la dualité est celle des deux fourmis sur une tige rigide, lorsque chacune de ces fourmis a pour objectif d’éviter le plus longtemps possible de tomber depuis les bords de la tige. Il s’avère que l’idée de dualité est emblématique de l’approche utilisée dans ce livre : c’est l’idée selon laquelle deux principes contradictoires peuvent se fondre harmonieusement dans une façon cohérente et efficace de prédire comment la nature fonctionne. Rien ne peut dépasser l’atout de posséder deux principes contradictoires qui fonctionnent en harmonie, ce qui explique pourquoi la dualité est devenue un outil si puissant dans notre décryptage des secrets les plus dissimulés de l’Univers. J’espère que vous allez trouver la lecture du livre et la résolution des énigmes à la fois intéressantes et instructives. Je serais heureux si vous pouvez y trouver
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
xv
une façon nouvelle d’envisager les lois fondamentales de notre Univers et de comprendre comment les lois mathématiques s’y insèrent, tout en appréciant le pouvoir des énigmes à nous défier et à nous informer, et parfois même nous surprendre ! Et même si vous n’avez pas été comme moi un passionné d’énigmes mathématiques dès votre enfance, il n’est pas trop tard pour vous y mettre ! J’ai eu la chance d’embarquer quelques étudiants de première année du Harvard College dans ce voyage à la découverte des mystères de l’Univers, décryptés grâce à des énigmes mathématiques, en m’appuyant sur un séminaire que j’avais organisé à cette fin. Le présent ouvrage est le résultat de ce cours et il s’est enrichi grâce aux retours et aux suggestions des étudiants qui le suivaient. Au départ, le livre a été développé à partir de notes prises par trois étudiants, Tony Feng, Kewei Li et Weiming Zhao, notes qui on été revues en profondeur par Steve Nadis. Quelques figures ont été ajoutées par Xiaotian Yin. J’ai également bénéficié des encouragements de plusieurs collègues, en particulier Yaotian Fu et Brian Greene, au cours de la finalisation du livre. Je leur en suis profondément reconnaissant. Je suis certain qu’il y a plusieurs manières d’améliorer ce livre. Je serais heureux de recevoir des suggestions en ce sens sur ma page web, www.cumrunvafa.org. Enfin, et ce n’est pas le moins important, c’est mon épouse Afarin qui m’a suggéré de développer mon cours et d’en faire un livre, qui n’existerait tout simplement pas sans son enthousiasme pour le projet. Je lui en suis profondément reconnaissant. Remerciements du traducteur. Je remercie Jean Ilioppoulos pour sa relecture du chapitre 11.
xvi
Avant-propos
1 Introduction à la physique moderne 1.1
Généralités
Nombre des aspects fondamentaux de la physique possèdent une base mathématique sous-jacente qui est simple mais peut être dissimulée par la complexité du formalisme, exprimé d’une part dans un langage qui n’est pas familier et d’autre part dans des équations intimidantes. C’est aussi vrai de beaucoup d’idées mathématiques abstraites : elles impliquent souvent des concepts simples qui peuvent néanmoins être obscurcis par le cadre dans lequel ils sont présentés. Les idées profondes en physique et en mathématiques partagent souvent un tronc commun, ce qui après tout n’est pas si étonnant étant donné la proximité des deux disciplines. Ce qui est plus surprenant, c’est que certaines de ces idées peuvent émerger de la solution d’énigmes. Ce livre traite d’énigmes et de leurs relations avec la physique et les mathématiques. Alors que les énigmes peuvent être fascinantes et divertissantes par elles-mêmes, nous allons voir comment elles peuvent servir de pont entre les deux disciplines et révéler les liens communs qu’elles partagent. Il n’est en rien nécessaire de posséder une connaissance approfondie des mathématiques et de la physique pour résoudre les énigmes proposées dans ce livre et je ne suppose absolument pas que le lecteur soit un expert de l’un ou l’autre domaine. Mais une bonne motivation, ainsi qu’un minimum de familiarité avec ces sujets, aidera certainement le lecteur à apprécier ce livre, dont le public visé est celui des étudiants de licence ou même des lycéens de terminale, ainsi que toute personne intéressée par les développements de la science moderne. Bien que la physique et les mathématiques soient étroitement imbriquées, les deux disciplines possèdent des cultures et des philosophies très différentes.
Les mathématiques posent comme point de départ des axiomes fondamentaux et en tirent des déductions logiques énoncées par exemple sous forme de théorèmes. Les lois physiques, au contraire, plutôt que d’être déduites d’une manière logique et hiérachisée, ont été développées afin d’expliquer la façon dont fonctionnent divers aspects de la nature et comment les lois de la nature s’articulent entre elles. La physique met l’accent sur les relations entre ces lois, plutôt que sur leur dépendance logique. Il n’en reste pas moins que la cohérence logique entre les différentes idées est un ingrédient indispensable des lois physiques. En mathématiques, il est essentiel d’être parfaitement clair sur ce que sont vos axiomes de départ et vos hypothèses. Au contraire, en physique, ainsi que nous le verrons ultérieurement, les axiomes ou principes fondamentaux peuvent être modifiés en fonction de nouvelles données expérimentales ou de nouvelles idées théoriques. L’histoire montre que des progrès importants en physique peuvent survenir lorsque que ce qui était auparavant considéré comme la conséquence d’une loi physique antérieure se révèle en fait comme étant un principe directeur de plein droit. Par conséquent, un bon physicien devrait toujours être ouvert à de possibles révisions ou « réaménagements » des fondements, car le nouveau principe s’avère souvent être plus fondamental et avoir un domaine de validité et d’application plus vaste que le principe original dont on pensait qu’il était issu. Le principe de conservation de l’impulsion en donne une bonne illustration. Ce principe était à l’origine considéré comme une conséquence des lois de Newton de la mécanique, mais on a compris, plus de deux siècles après que ces lois eurent été énoncées dans les Principia Mathematica, que les lois de conservation étaient plus fondamentales que les lois de la mécanique, parce qu’elles ont pour origine des symétries de la nature. C’est pour cette raison que les physiciens s’efforcent d’adopter une attitude flexible en ce qui concerne les principes les plus fondamentaux, qui ont vocation à évoluer. Plutôt que d’accorder une trop grande valeur à un ordre hiérarchique des idées de base, les physiciens sont disposés à réorganiser leurs structures à tout instant, ce qui est contraire à la façon dont les mathématiciens envisagent leur discipline. Un théorème mathématique, une fois démontré, est considéré comme valable pour l’éternité, à l’inverse des principes fondamentaux de la physique qui peuvent être révisés en fonction de nouvelles données expérimentales. Il y a d’autres différences de principe. Si l’on veut expliquer des phénomènes complexes en physique, il est souvent nécessaire de recourir à des approximations, ce que détestent les mathématiciens. Par exemple la question de savoir si l’espace est « continu », ne contient aucun « vide » de quelle que sorte que ce soit, ou est au contraire fabriqué d’un ensemble discret de points qui sont très proches l’un de l’autre, peut parfaitement être indifférente à des physiciens
2
Chapitre 1. Introduction à la physique moderne
qui se focalisent sur des données expérimentales obtenues sur des échelles de distance bien plus grandes que la distance entre les points. Pour les mathématiciens, au contraire, la continuité stricte d’un espace ou son caractère discret est une donnée clé plutôt qu’un détail sans importance. L’objectif dans ce chapitre est de brosser un tableau du paysage de la physique. Ce sera une revue succincte, qui n’entrera pas dans les détails : l’objectif ici n’est pas d’être exhaustif, étant donné que la tâche correspondante ne pourrait en aucun cas être menée à bien en un seul chapitre, ou même un seul livre. Au contraire, nous avons l’intention de mentionner quelques exemples historiques qui peuvent contribuer à nous donner une idée de l’endroit où nous en sommes aujourd’hui dans notre quête de la compréhension des lois fondamentales de la physique.
1.2
Pensées anciennes
Les Grecs avaient des idées un peu farfelues quand ils tentaient d’expliquer ce qui se passait autour d’eux dans le monde. Ils étaient tombés amoureux des mathématiques élégantes et certains penseurs comme Platon croyaient que la vérité de notre monde se trouvait dans la géométrie. Ils voyaient de la beauté dans la géométrie euclidienne et les solides platoniciens, dont ils pensaient qu’ils pouvaient décrire l’Univers dans son ensemble. Alors que l’essentiel de leurs travaux mathématiques était très en avance sur leur temps, le moins que l’on puisse dire est que leur physique n’était pas au même niveau. Aristote, par exemple, pensait que les cailloux tombent vers le bas parce qu’ils aiment reposer sur la terre ferme. Parmi tous les états possibles, affirmait-il, ils préfèrent celui où ils reposent sur un sol ferme. C’est pourquoi, poursuivait-il, les cailloux tombent de plus en plus vite au cours de leur chute parce qu’ils sont heureux de rejoindre le plus rapidement possible leur emplacement de prédilection. En dépit de leur description inadéquate des phénomènes physiques, l’aspiration fondamentale des Grecs de l’Antiquité à décrire le monde grâce à des mathématiques élégantes reste vitale pour la science d’aujourd’hui. Certaines de leurs idées, comme celle de la matière composée d’atomes individuels, proposée par Leucippe et Démocrite parmi d’autres, ont résisté à l’épreuve du temps. Non seulement certains Grecs anciens pensaient que la Terre était une sphère, mais ils ont été capables de mesurer sa circonférence aux environs de 230 avant J.C. Ératosthène, en particulier, s’appuya sur des idées simples de trigonométrie et le fait que la longueur de l’ombre d’un bâton change lorsque l’on s’éloigne de l’Équateur pour estimer le rayon de la Terre. Son estimation ne s’écartait de pas plus de 15 % de la valeur admise aujourd’hui. L’idée de base dont il s’est
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
3
F IGURE 1.1. Le rayon de la Terre a été mesuré par Ératosthène de Cyrène aux environs de 230 avant J.C.
inspiré est la suivante : si l’on s’éloigne d’une distance h de l’Équateur, la longueur à midi de l’ombre d’un bâton de longueur l planté verticalement croît de 0 à s (figure 1.1). On en déduit le rayon de la Terre à partir de la simple formule de géométrie valable pour h ≪ R R∼h
l . s
L’idée d’appliquer des notions de géométrie pure pour en déduire des propriétés intéressantes de la nature a persisté longtemps après les Grecs. Autour de l’année 1000 de notre ère, Ibn Muadh et Ibn Al-Haytham ont déterminé l’épaisseur de l’atmosphère terrestre et donné une estimation d’environ 80 km, à moins de 20 % de la valeur admise aujourd’hui. Muadh et d’autres savants musulmans ont utilisé l’angle sous lequel on observe le Soleil couchant pour effectuer cette estimation à l’aide de formules simples de trigonométrie. Leur approche est plutôt simple : selon eux, la raison pour laquelle le ciel ne s’obscurcit pas immédiatement après le coucher du Soleil est que les couches supérieures de l’atmosphère peuvent encore recevoir de la lumière solaire, même après le coucher du Soleil. De façon plus quantitative, le temps t nécessaire, exprimé en heures, pour que la nuit tombe complètement, ou plus exactement la fraction t/24, est relié à la hauteur h de l’atmosphère et au rayon R de la Terre par 1 (voir la figure 1.2) 1 2 1
2πt 24
2
≃
h . R
N.d.T. AC = Rθ et AB ≃ ( AC/2)θ avec θ = 2πt/24.
4
Chapitre 1. Introduction à la physique moderne
F IGURE 1.2. La hauteur de l’atmosphère a été mesurée par Ibn Muadh et Ibn Al-Haytham au XIe siècle.
Mais les applications vraiment fondamentales des mathématiques à la physique ont dû attendre encore quelques siècles. Les travaux de Sir Isaac Newton dans la seconde moité du XVIIe siècle marquent le véritable point de départ de ces applications. 1.3
La mécanique de Newton
Newton a été, sans contestation possible, un des grands pionniers de la physique moderne. Sa seconde loi du mouvement est résumée dans une des plus célèbres lois de la physique, laquelle s’exprime sous la forme d’une équation différentielle pour le mouvement d’une particule, reliant sa position 2 dépendant du temps x(t), sa masse m et la force F qui lui est appliquée 2
N.d.T. Pour un objet se déplaçant sur une droite, cas où il suffit d’un seul nombre pour caractériser sa position. En général position, accélération et force sont des vecteurs de l’espace à trois dimensions et l’équation devient ~a = ~F/m.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
5
a :=
F d2 x = . 2 dt m
Alors que la force F et la masse m sont des quantités physiquement intuitives, l’accélération a fait appel aux mathématiques, étant définie comme la dérivée seconde de la position par rapport au temps. À mesure que la physique devenait plus quantitative, les mathématiques devenaient de plus en plus imbriquées avec la physique. De fait, Newton a dû inventer un domaine entier des mathématiques, l’analyse, afin de formuler sa seconde loi dans des termes mathématiquement précis. C’est juste un des nombreux exemples où l’exigence d’une formulation quantitative des lois de la physique a suscité le développement de nouvelles branches des mathématiques. Inversement, les mathématiques ont conduit à des nouvelles intuitions en physique. Au cours de ce livre, nous allons assister à de nombreux allers-retours entre mathématiques et physique et à leurs échanges réciproques.
1.4
Mécanique lagrangienne et mécanique hamiltonienne
L’exploration ultérieure des mathématiques introduites par Newton et qui sous-tendaient sa mécanique, examinée dans différents contextes physiques, a conduit à des reformulations de la mécanique de Newton, tout en y ajoutant des mathématiques nouvelles. À la fin des années 1700, Joseph-Louis Lagrange suggéra une nouvelle approche de la mécanique, que l’on a appelée par la suite « l’approche lagrangienne », qui reproduisait les résultats physiques de Newton mais était fondée sur un principe, le principe de moindre action, qui se substituait au concept de force. L’action, notée S, est une intégrale qui peut être définie pour n’importe quel chemin que pourrait suivre une particule entre un point de départ et un point d’arrivée en un intervalle de temps donné, entre deux instants t1 et t2 . Cette action est donnée par l’intégrale sur le temps t de la différence entre l’énergie cinétique K et l’énergie potentielle V de la particule (figure 1.3) S=
Z t2 t1
(K − V )dt .
Cette nouvelle façon de voir les choses a rendu plus simple l’étude de la mécanique de systèmes soumis à des contraintes, par exemple une boule qui descend une colline de topologie donnée ou une toupie qui tourne sur différentes sortes de surfaces. Afin de formaliser la mécanique lagrangienne, Euler et Lagrange ont développé un domaine entier de nouvelles mathématiques appelé calcul
6
Chapitre 1. Introduction à la physique moderne
F IGURE 1.3. La formulation lagrangienne de la mécanique examine tous les chemins possibles que pourrait suivre une particule depuis un point de départ jusqu’à un point d’arrivée. Le chemin physique, celui que la particule suit effectivement, est le chemin qui minimise une quantité appelée action.
des variations, qui a pour objectif de minimiser ou de maximiser 3 une intégrale le long de chemins variés, ce qui donne une solution obéissant au principe de moindre action sous la forme d’équations dites d’Euler-Lagrange. Remarquons que ce problème est plus complexe que celui de trouver les minima d’une fonction dépendant d’un nombre fini de variables, parce qu’il y a a priori une infinité de chemins possibles reliant point de départ et point d’arrivée. Intuitivement, le problème est équivalent à la détermination du minimum d’une fonction, l’action, dépendant d’une infinité de variables, l’espace de tous les chemins possibles. Les physiciens pouvaient maintenant déduire du calcul des variations le chemin de longueur minimale. La remise à jour de la mécanique classique 4 , rendue possible par les idées de Lagrange et d’Euler, a dressé la scène pour les développements futurs de la physique du XXe siècle, en particulier la mécanique quantique, pour laquelle le formalisme lagrangien était bien mieux adapté que celui de Newton. En introduisant une reformulation alternative supplémentaire de la mécanique classique, Hamilton a transformé les équations différentielles du second ordre de Newton ou d’Euler-Lagrange en équations différentielles du premier ordre au prix d’un doublement du nombre de variables. Hamilton considérait à la fois la position x(t) et l’impulsion p(t) = mv(t), le produit de la masse par la vitesse v(t), comme des variables fondamentales, contrairement à ce qui avait été la tradition jusque-là. La mécanique hamiltonienne, selon la nouvelle 3
N.d.T. Ce que l’on appelle aussi extrémiser. En général le chemin physique correspond à un minimum de l’action, mais il peut arriver que ce soit un maximum. 4
N.d.T. Mécanique classique est souvent utilisé par les physiciens comme un équivalent de mécanique newtonienne, par opposition à mécanique quantique.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
7
terminologie, a marqué le passage à la notion moderne de dédoublement de l’espace des variables dynamiques, que l’on a appelé espace de phase, défini par la donnée de la position et de l’impulsion. La mécanique hamiltonienne s’est révélée utile dans le passage vers la mécanique quantique, ainsi que nous le verrons par la suite. Les formulations lagrangienne et hamiltonienne de la mécanique sont considérées aujourd’hui comme plus fondamentales et plus générales que celle de Newton, ce qui leur confère un domaine d’application plus vaste. C’est une illustration du fait que les axiomes de la physique ne sont pas immuables, pas plus que son cadre sous-jacent. Les deux peuvent se modifier au cours du temps. 1.5
L’électromagnétisme de Maxwell
Lorsque Maxwell développa sa théorie de l’électromagnétisme, il s’est appuyé sur plusieurs lois sans relation évidente, qui avaient déjà été comprises et énoncées par Michael Faraday et d’autres. En s’efforçant d’unifier ces différentes lois, Maxwell découvrit une incohérence mathématique entre les différentes équations, incohérence à laquelle il décida de remédier en ajoutant aux équations de l’électromagnétisme un terme mathématiquement nouveau, aujourd’hui appelé terme de Maxwell. Ce terme était difficile à mettre en évidence expérimentalement, mais Maxwell remarqua qu’il impliquait l’existence d’ondes formées de champs électriques et de champs magnétiques se propageant à une vitesse qui, selon ses nouvelles équations, était proche de la vitesse de la lumière, laquelle avait été mesurée avec une bonne précision. Cette remarque conduisit Maxwell à postuler que la lumière n’est pas autre chose qu’une onde 5 électromagnétique ! Cette observation fondamentale de Maxwell donne un exemple de la puissance de la logique mathématique pour prédire des phénomènes physiques nouveaux. La correction de Maxwell trouve sa source dans des considérations mathématiques, plutôt que physiques. La découverte d’une simple incohérence mathématique lui a permis de conclure que la lumière était faite de perturbations électriques et magnétiques se propageant dans l’espace, un triomphe de l’esprit humain ! C’est un exemple parmi de nombreux autres montrant que des principes mathématiques peuvent parfois être suffisants pour motiver des nouvelles lois physiques.
5
Les physiciens postulèrent ensuite que ces ondes devaient se propager dans un milieu qu’ils appelèrent l’éther lumineux. Voir A Guide to the Scientific Knowledge of Things Familiar par Brewer, comme ouvrage représentatif de la façon de penser à l’époque. Quelques années plus tard, les expériences de Michelson et Morley ont montré que l’hypothèse de l’éther était superflue.
8
Chapitre 1. Introduction à la physique moderne
Les équations de Maxwell dans le vide ont la forme suivante
~ ∂2 F ~ 2F ~, = c2 ∇ ∂t2 ~ représente soit le champ électrique ~E, soit le champ magnétique ~B, c la où F vitesse de la lumière dans le vide, environ 300 000 kilomètres par seconde et ∇2 le laplacien 6 . Les ondes électromagnétiques qui se propagent à la vitesse de la lumière sont solution de ces équations. Mais ce n’était pas la fin de l’histoire, car ces équations posaient des questions additionnelles. Si vous utilisez ces équations, vous trouvez effectivement comme solutions des ondes qui se propagent à la vitesse c. Mais comment cette vitesse est-elle mesurée ? Est-ce que nous parlons de la vitesse par rapport à la Terre ? Ou par rapport au Soleil ? Et à quelle sorte d’observateur faisons-nous référence pour la mesure, des observateurs immobiles par rapport à la Terre ou en mouvement par rapport à celle-ci ? En particulier, si un observateur se déplace à une vitesse constante en valeur absolue et en direction par rapport à un référentiel d’inertie, un référentiel (ou système d’axes) où les lois de Newton sont valables, alors ces lois sont encore valables pour cet observateur. Mais alors la vitesse de la lumière mesurée par un tel observateur en mouvement ne devrait-elle pas être différente de celle mesurée par un observateur immobile ? La première réaction des physiciens de la fin du XIXe siècle fut de considérer que la vitesse de la lumière ne pouvait pas être identique dans tous les référentiels d’inertie, car cela contredisait la loi d’addition des vitesses de la mécanique newtonienne 7 . Autrement dit, les lois de Maxwell violaient une des symétries de base de la mécanique newtonienne, l’invariance galiléenne, qui vous dit comment les vitesses changent lorsque vous passez d’un référentiel d’inertie à un autre, et donc que vous changez le repère par rapport auquel vous mesurez la vitesse. L’intuition géniale de Maxwell semblait, au premier abord, conduire à une contradiction. C’est alors qu’Hendrik Lorentz entra en piste, en fournissant une manière mathématique de mettre en évidence pour les équations de Maxwell des symétries différentes de celles que l’on aurait attendues de la mécanique newtonienne. Les lois de transformation de Lorentz nous enseignent la façon dont les champs électriques et magnétiques ainsi que les trois coordonnées de position ( x, y, z) et le temps t changent lorsque l’on passe d’un référentiel d’inertie à un autre. 6 7
N.d.T. ∇2 = ∑3i=1 ∂2 /∂x2i , où xi représente une des trois coordonnées d’espace.
N.d.T. Si vous vous trouvez dans un train en mouvement et que vous lancez une balle vers l’avant du train avec une certaine vitesse, pour un observateur sur le quai de la gare la vitesse de cette balle sera égale à la vitesse que vous mesurez plus la vitesse du train.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
9
La conséquence de ces nouvelles lois de transformation était que les lois de Maxwell conservaient la même forme et donc la même vitesse de la lumière dans tous les référentiels d’inertie. Autrement dit, cette invariance de la vitesse de la lumière conduisait aux transformations de Lorentz, qui se substituaient aux transformations de Galilée de la physique newtonienne. Mais ces transformations avaient des conséquences physiques bizarres, par exemple la contraction de Lorentz, le fait que les longueurs semblaient se contracter lorsque l’on passait d’un référentiel d’inertie à un autre. En particulier, Lorentz remarqua que si l’on voulait que les équations de Maxwell soient valables indépendamment du référentiel d’inertie, alors les longueurs devaient se contracter. Lorentz s’expliquait difficilement ces propriétés et essayait sans succès d’en rendre compte en invoquant des forces électriques ou d’autres hypothèses. Bien que sa théorie ait magnifiquement fonctionné mathématiquement, Lorentz n’était pas capable d’en donner une image physique cohérente et pensait qu’elle s’appliquait uniquement à l’électromagnétisme. Il fallut attendre Albert Einstein pour une interprétation correcte des résultats de Lorentz et Einstein s’inspira de ces travaux pour développer sa propre théorie de la relativité restreinte. 1.6
La théorie de la relativité
C’est donc à ce point qu’Einstein entra en piste, en affirmant que les phénomènes mis au jour par Lorentz et d’autres n’étaient pas spécifiques à l’électromagnétisme mais avaient une portée générale en physique. Une des conséquences les plus spectaculaires de ces idées fut la découverte d’une formule compacte, sans doute une des formules les plus célèbres de l’histoire des sciences, celle qui relie l’énergie E d’un objet au repos, sa masse m et la vitesse de la lumière c E = mc2 . La théorie d’Einstein nous dit que les notions d’espace et de temps, qui avaient jusqu’alors été considérées comme absolues, dépendaient de la vitesse de l’observateur. De plus Einstein découvrit que les transformations de Lorentz étaient des transformations physiques de l’espace et du temps, reliant de façon fondamentale l’espace et le temps, et non une astuce mathématique dont on avait besoin pour rendre les équations de Maxwell cohérentes. Cette hypothèse fut d’abord reçue avec un certain scepticisme par la communauté des physiciens et des philosophes des sciences, mais elle finit par s’imposer et elle n’est plus contestée aujourd’hui. La théorie de la relativité restreinte d’Einstein implique des transformations linéaires de l’espace et du temps lorsque l’on passe d’un référentiel d’inertie à un autre. Vue sous l’angle des mathématiques, cette théorie est plutôt simple et même pour certains experts quelque peu ennuyeuse car
10
Chapitre 1. Introduction à la physique moderne
F IGURE 1.4. Géométries non euclidiennes. On ne fait pas l’hypothèse du cinquième postulat d’Euclide, ce qui fait que la somme des angles d’un triangle n’est pas nécessairement égale à 180o .
elle utilise uniquement l’algèbre linéaire 8 . Ceci illustre le fait que des idées physiques profondes n’ont pas nécessairement pour traduction des mathématiques sophistiquées. Elles viennent du fait que ces mathématiques doivent démontrer leur cohérence interne. Einstein ne s’arrêta pas en si bon chemin et se lança dans un réexamen de la théorie de Newton de la gravitation. Bernhard Riemann avait introduit quelques décennies avant Einstein une nouvelle forme de géométrie baptisée d’après son nom géométrie riemannienne. Cette géométrie fait l’impasse sur le cinquième postulat d’Euclide et en conséquence des nouveaux phénomènes mathématiques sont possibles : ainsi la somme des angles d’un triangle n’est pas égale à 180o si le triangle est dessiné sur une surface courbe (voir la figure 1.4). Friedrich Gauss, qui avait été le professeur de Riemann, avait soupçonné que de tels phénomènes soient possibles dans le monde réel et soient même observables. Selon certains de ses contemporains, il est remarquable que Gauss ait proposé que notre Univers soit courbe. C’est peut-être une légende, mais quoiqu’il en soit, selon le récit d’un de ses contemporains, il tenta de mettre en évidence la courbure de l’espace en mesurant les trois angles d’un triangle dont les sommets étaient ceux de trois montagnes en supposant que des rayons lumineux formaient les arêtes d’un triangle (figure 1.5) et en comparant la somme des trois angles à la valeur euclidienne de 180o . Ses mesures confirmèrent la valeur euclidienne de 180o dans la limite des erreurs expérimentales, ce qui suggérait que, si notre Univers était courbe, sa courbure était trop petite pour être observée. Il n’est sans doute pas si surprenant que Riemann ait également pensé que sa géométrie pouvait avoir des applications physiques, et il spécula même qu’elle pourrait être utilisée pour unifier les théories de l’électricité et du magnétisme 8
N.d.T. Ceci est exact tant que l’on considère uniquement des mouvements uniformes. Mais l’utilisation de référentiels accélérés, par exemple des référentiels en rotation, rend les choses bien plus complexes.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
11
F IGURE 1.5. Selon une légende dont la véracité n’est pas attestée, Gauss tenta de mettre en évidence la courbure de l’espace en mesurant les trois angles d’un triangle dont les sommets sont ceux de trois montagnes. Aussi intéressante qu’ait été cette idée, aucune courbure non euclidienne ne put être observée.
avec celle de la gravitation. Cependant, pour que cette courbure devienne une réalité physique, il fallut attendre la reformulation par Einstein des lois de la gravitation newtonienne dans sa théorie de la relativité générale, dont les équations présentaient une certaine ressemblance avec celles de Maxwell. En particulier, les interactions gravitationnelles, tout comme les interactions électromagnétiques, ne pouvaient pas se propager à une vitesse plus grande que celle de la lumière, alors qu’elles étaient instantanées dans la théorie de Newton. La relativité générale est une théorie géométrique de la gravitation. Les objets en chute libre suivent des géodésiques de l’espace-temps, c’est-à-dire des courbes qui choisissent le chemin le plus court 9 entre deux points de l’espace-temps parmi l’infinité de chemins possibles. Les géodésiques généralisent la notion de ligne droite de l’espace euclidien où la ligne droite est le chemin le plus court d’un point à un autre. Ces chemins apparaissent «courbes», comme si l’objet accélérait, exactement comme la distance la plus courte entre deux points sur la surface d’une sphère est donnée par une courbe, l’arc de grand cercle passant par les deux points. C’est une donnée bien connue des navigateurs et des pilotes d’avion dans le cas de la sphère terrestre. En nous fondant sur la théorie de la relativité générale, largement confirmée aujourd’hui, nous savons que l’Univers est en fait courbe. Nous savons aussi que Gauss était sur la bonne piste, mais qu’il tentait de mesurer une courbure trop faible pour être observable. Riemann et Gauss étaient des mathématiciens, mais une partie des mathématiques intéressantes qu’ils ont découvertes a fait son chemin en physique par l’intermédiaire de la théorie de la relativité générale 9
N.d.T. En fait, ainsi que nous l’avons noté à propos de la mécanique lagrangienne, il s’agit du chemin qui extrémise la distance, le chemin le plus court ou le plus long. En relativité générale, il s’agit le plus souvent du chemin le plus long pour la distance dans l’espace-temps.
12
Chapitre 1. Introduction à la physique moderne
d’Einstein. Nous observons ici un autre exemple de l’assistance mutuelle que s’apportent la physique et les mathématiques, en faisant avancer de concert les deux domaines. Au contraire de la relativité restreinte dont les mathématiques sont presque triviales, les mathématiques de la relativité générale sont complexes et profondes. Mais, aussi radicales qu’aient été les idées de la relativité générale, l’apparition presque simultanée de la mécanique quantique fut encore plus mystérieuse et déconcertante pour les scientifiques. Einstein lui-même ne se sentit jamais vraiment à l’aise avec ce domaine qu’il avait pourtant contribué à initier. 1.7
Mécanique quantique
La mécanique quantique a introduit en physique l’idée a priori surprenante de la nécessité de faire appel au hasard et aux probabilités. Pour certains physiciens, c’était un pas en arrière, car cela impliquait que l’on ne pouvait plus prédire avec certitude la manière dont la nature se comportait. Les systèmes physiques étaient soumis à des fluctuations aléatoires, ce qui impliquait que le hasard, plutôt que la certitude, devenait la règle. C’est pour cette raison qu’Einstein avait émis l’objection : « Dieu ne joue pas aux dés avec l’Univers. » La mécanique quantique est très contre-intuitive, même pour ceux des physiciens d’aujourd’hui qui la pratiquent quotidiennement. Tout le monde connaît la célèbre citation de Richard Feynman : « Je pense que l’on peut affirmer sans prendre de risque que personne ne comprend la mécanique quantique ! » Néanmoins la communauté des physiciens a adopté la mécanique quantique pour la bonne et simple raison qu’elle a été jusqu’à aujourd’hui en accord parfait avec les données expérimentales 10 . Le choc entre la mécanique quantique et les principes établis de la physique classique a conduit à des énigmes intéressantes. Dans les années 1920, les physiciens observèrent que les électrons semblaient posséder un degré de liberté supplémentaire, s’ajoutant aux degrés de liberté de position et d’impulsion et indépendant de ceux-ci, qui définissait un trait spécifique que l’on a appelé spin 11 . Bien que l’on ait pu trouver à ce spin quelques ressemblances avec un mouvement de rotation classique, il présentait aussi des différences frappantes.
10
N.d.T. Un mot sur l’attitude d’Einstein vis-à-vis de la mécanique quantique, qu’il maîtrisait parfaitement. Einstein n’a jamais contesté l’utilité pratique et les succès expérimentaux de la mécanique quantique, mais les fondements de la théorie allaient à l’encontre de son intuition physique.
11
N.d.T. En anglais to spin signifie tourner.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
13
Erwin Schrödinger avait déjà écrit une équation, l’équation de Schrödinger, qui décrivait les phénomènes quantiques lorsque les vitesses en jeu étaient très faibles par rapport à celle de la lumière, mais Paul Dirac voulait combiner la relativité restreinte et la mécanique quantique pour rendre compte de phénomènes où l’approximation des faibles vitesses n’était pas valable. Ce faisant, Dirac a observé qu’il avait besoin d’un nouveau degré de liberté, expliquant ainsi l’origine du spin. Les mathématiques se sont à nouveau impliquées, afin de réconcilier deux domaines de la physique et cela, comme je vais le montrer, a ouvert de nouveaux boulevards pour la physique. Pour mieux comprendre la situation, commençons par écrire l’équation 12 de Schrödinger non relativiste pour une particule de masse m pˆ 2 + Vˆ . Eˆ = 2m Cependant Dirac voulait une une équation compatible avec la relativité restreinte et ayant la même forme que la célèbre relation d’Einstein reliant énergie E, masse m et impulsion ~p, écrite ci-dessous pour des opérateurs Eˆ 2 = pˆ 2 c2 + m2 c4 . La relation familière E = mc2 n’est valable que pour une particule d’impulsion nulle, ~p = 0. Afin d’aboutir à un résultat analogue à l’équation de Schrödinger, Dirac estima que son équation devait s’exprimer en fonction de E et non E2 , et qu’il devait d’une certaine façon prendre une racine carrée, sans bien sûr le faire littéralement. Il se rendit compte qu’il devait utiliser des matrices 4 × 4, αk et β telles que Eˆ =
3
∑ αk pˆ k c + βmc2 , k =1
où les pˆ k sont les composantes d’espace de l’opérateur impulsion. Avec un choix adéquat de ces matrices, il s’avère que le carré de cette équation redonne la relation d’Einstein. De plus, les degrés de liberté de spin de l’électron sont décrits par ces matrices. Une idée mathématique a ainsi permis à Dirac d’expliquer avec succès l’origine du spin de l’électron, une nouvelle illustration du fait que les mathématiques abstraites peuvent illuminer la physique. L’équation de Dirac est l’un des énoncés les plus célèbres non seulement de la physique, mais aussi des mathématiques, et elle a inspiré des chercheurs dans les deux disciplines. 12
Tous les termes de cette équation sont des opérateurs. Eˆ est l’opérateur énergie i¯h∂/∂t, où t est le temps et h¯ la constante de Planck qui relie énergie E et fréquence ω, E = h¯ ω, pˆ est l’opérateur ~ , et la masse m est un nombre. Enfin Vˆ est l’opérateur énergie potentielle. impulsion −i¯h∇
14
Chapitre 1. Introduction à la physique moderne
F IGURE 1.6. L’équation de Dirac possède des solutions d’énergie positive et d’énergie négative. Dirac tenta de se débarrasser des solutions d’énergie négative en postulant que tous les états d’énergie négative étaient occupés en formant une « mer de Dirac » d’électrons. Lorsqu’un des électrons de la mer saute dans un état d’énergie positive, il laisse derrière lui un « trou », une particule de charge positive et de masse égale à celle de l’électron.
Cependant Wolfgang Pauli fit très vite observer à Dirac que son équation autorisait des états d’énergie arbitrairement négatives. Dirac reconnut que c’était là un problème majeur de son équation, qui devait absolument être résolu 13 . Dirac essaya faire disparaître ces états catastrophiques grâce au principe de Pauli, qui nous dit que deux électrons ne peuvent pas occuper le même état quantique. En s’inspirant de la théorie des électrons dans les solides, Dirac suggéra que tous les états d’énergie négative étaient déjà occupés (voir la figure 1.6). L’ensemble des particules d’énergie négative forme ce que l’on appelle la « mer de Dirac ». Ainsi aucune particule ne peut être placée dans un état d’énergie négative puisqu’un tel état est déjà occupé, et le problème est résolu ! Toujours en s’inspirant de la théorie des électrons dans les solides, des physiciens firent cependant remarquer qu’un phénomène étrange était possible : une particule de la mer de Dirac pouvait être expulsée depuis cette mer vers un état d’énergie plus élevée, en laissant derrière elle un trou de charge positive, une charge égale en valeur absolue mais de signe opposé à celui de la charge de l’électron. Dirac commença par essayer de balayer l’objection sous le tapis en affirmant que la particule de charge positive était tout simplement un proton. Mais d’autres physiciens firent remarquer que la particule de charge positive avait nécessairement la même masse que l’électron si l’on suivait strictement l’équation de Dirac, alors que la masse du proton est environ deux mille fois 13
Pour un exposé élémentaire de ce sujet, on se reportera à The Strangest Man: The Hidden Life of Paul Dirac, par Graham Farmelo.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
15
celle de l’électron. Au bout du compte, Dirac dut accepter que son équation impliquait l’existence d’une particule de charge positive et de masse égale à celle de l’électron, qui fut baptisée ultérieurement l’antiparticule de l’électron, ou positron. Mais à l’époque on ne connaissait pas de telle particule, ce qui jeta un doute sérieux sur la théorie de Dirac. Même Dirac évitait de mentionner cet aspect de sa théorie jusqu’au moment où, quelques années plus tard, Carl Anderson découvrit une preuve expérimentale de ce positron en examinant des traces de rayons cosmiques dans une chambre de Wilson. Il devint clair que le positron avait exactement les mêmes propriétés que l’électron, mis à part le signe de sa charge. Une fois de plus, l’élégance mathématique a permis de prédire une nouvelle physique, à laquelle on avait peine à croire au premier abord, mais qui fut finalement confirmée par l’expérience 14 . Dans sa formulation originale, la mécanique quantique était limitée aux phénomènes non relativistes, et il a fallu la reformuler pour pouvoir l’appliquer par exemple aux équations de Maxwell du champ électromagnétique et aux interactions relativistes de ce champ avec des électrons. Cette reformulation est due à Richard Feynman et d’autres, qui se sont appuyés principalement sur l’approche de la mécanique mise au point par Lagrange et Euler. C’est le sujet que nous abordons maintenant.
1.8
La théorie des champs quantiques
Dans l’image classique que nous avons introduite précédemment, les particules prennent des chemins qui minimisent (ou en général extrémisent) l’action. La théorie des champs quantiques s’appuie sur une image plus complexe, développée au départ par Richard Feynman pour la mécanique quantique non relativiste, dans laquelle une particule ne suit pas un seul chemin : elle suit tous les chemins possibles, et à chaque chemin est associé un facteur de phase, un nombre complexe de module unité. La probabilité que la particule aille d’un point initial donné à un point final donné se calcule en prenant le carré de la 14
N.d.T. La présentation historique dans le texte de l’équation de Dirac est incontestablement exacte. Toutefois, nous savons aujourd’hui que les arguments de Dirac étaient loin d’être convaincants. En fait, il ne peut pas exister, contrairement à ce que pensait Dirac, de généralisation relativiste de l’équation à une particule de Schrödinger. De plus, le spin n’a pas pour origine la relativité d’Einstein : il existe une généralisation de l’équation de Schrödinger compatible avec la relativité galiléenne, qui inclut le spin et prédit même le facteur gyromagnétique correct. Enfin la mer de Dirac n’a plus qu’un intérêt historique et on utilise aujourd’hui le champ de Dirac quantifié. En résumé, l’équation de Dirac est une équation pour un champ classique, l’analogue pour les électrons du champ électromagnétique, et non une équation d’onde. Ce champ est ensuite quantifié par des méthodes standard.
16
Chapitre 1. Introduction à la physique moderne
somme de toutes ces facteurs de phase. Nous allons maintenant concrétiser ces idées en les formulant dans un langage mathématique un peu plus technique, que le lecteur peut choisir d’omettre en passant directement à la section 1.9. La formulation de la mécanique en termes d’intégrales de chemin due à Feynman, appliquée par exemple à une particule non relativiste se déplaçant sur une droite avec une énergie cinétique K et une énergie potentielle V, postule qu’entre un point initial ( x1 , t1 ) et un point final ( x2 , t2 ) la particule suit des chemins dont le « poids statistique » (les guillemets soulignent que ce n’est pas une probabilité donnée par un nombre réel positif, mais une « amplitude de probabilité », donnée par un nombre complexe) est donné par une exponentielle de l’action Z t Z 2 i (K − V )dt , D X (t) exp h¯ t1 où h¯ est la constante de Planck déjà introduite et D X (t) symbolise une intégrale sur tous les chemins possibles entre ( x1 , t1 ) et ( x2 , t2 ). Cette intégrale est un nombre complexe dont le carré donne la probabilité que la particule aille du point ( x1 , t1 ) au point ( x2 , t2 ). La limite classique correspond à h¯ → 0. Dans cette limite, une méthode dite de la phase stationnaire permet d’évaluer l’intégrale et de montrer que les chemins dominants sont précisément ceux qui extrémisent l’action, c’est-à-dire les chemins suivis par une particule classique. La reformulation par Feynman de la mécanique quantique – en fait strictement équivalente à l’équation de Schrödinger – a produit une théorie semblable à la reformulation par Lagrange et Euler de la mécanique classique qui utilise le principe de moindre action. Le formalisme d’Euler-Lagrange est facilement transposable à la mécanique quantique, contrairement à la formulation initiale de Newton, et c’est la raison pour laquelle on le considère aujourd’hui comme plus fondamental. Il faut remarquer que la reformulation mathématique de la mécanique quantique en termes d’intégrale de chemin implique une intégrale dépendant d’un nombre infini de variables : l’espace de tous les chemins possibles est de dimension infinie. Néanmoins on peut donner un sens mathématique précis à ces intégrales de chemin. Mais Feynman ne s’est pas arrêté à l’intégrale de chemin pour une particule. Il l’a généralisée au cas de l’électromagnétisme de Maxwell, en intégrant cette fois sur tous les champs électromagnétiques possibles, ce qui correspond à intégrer sur l’espace des fonctions continues sur R4 . La complexité mathématique de cette intégration est sans commune mesure avec celle sur les espaces de chemins. Ce qui précède est un bref aperçu du cadre mathématique qui sous-tend la théorie des champs quantiques, laquelle est encore en cours de développement plus de soixante-dix ans après son introduction par Feynman et d’autres. Bien
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
17
que sa formulation mathématique ne soit pas aujourd’hui pleinement rigoureuse, les physiciens ont mis au point toute une batterie d’outils de calcul et de techniques d’approximation qui donnent des résultats en accord fantastique avec les données expérimentales.
1.9
La gravitation quantique
Dans leurs premières tentatives de traiter la gravitation quantique en s’appuyant sur les idées de Feynman, les physiciens n’ont pas été capables de réconcilier la théorie de la gravitation classique, la relativité générale, avec la théorie des champs quantiques. L’espoir était de construire une théorie unifiée de la gravitation quantique, une théorie capable de décrire la gravitation au niveau de particules quantiques individuelles. En utilisant les techniques développées pour les théories des champs quantiques, on constate que les probabilités de processus physiques impliquant les aspects quantiques de la gravitation, par exemple la collision de deux quanta d’ondes gravitationnelles (autrement dit la collision de deux gravitons), peuvent devenir infiniment grandes. C’est un problème sérieux, car une probabilité doit être inférieure ou égale à un, et en tout cas pas infinie. On fait donc face à un résultat auquel on ne peut attribuer aucune signification. On doit aussi souligner que même si l’on disposait d’une théorie cohérente de la gravitation quantique, la confirmation d’une telle théorie dépasserait de plusieurs ordres de grandeur nos capacités expérimentales, car il faudrait disposer d’énergies qu’il n’est simplement pas concevable d’obtenir avec une machine construite sur la Terre ou même dans l’espace. Certains physiciens étaient réticents à l’idée de travailler sur la gravitation quantique, étant donné le peu d’espoir de la confirmer un jour par l’expérience, et aussi parce que toutes les tentatives de fusionner la mécanique quantique et la gravitation semblaient conduire à des résultats sans aucune signification, et donc à une impasse. Cependant, en se référant aux exemples de Maxwell, Dirac et autres, nombre de physiciens savaient que, loin d’être une complication insoluble, une contradiction apparente peut contenir en germe une percée permettant à la physique d’aller de l’avant. C’est pourquoi les physiciens ont continué à essayer de trouver une solution à cette incohérence dans l’espoir de construire une théorie unifiée qui fonctionne. Une solution possible a émergé de façon tout à fait inattendue. À la fin des années 1960, les physiciens étaient mystifiés par les résultats expérimentaux impliquant les collisions de particules subatomiques appelées hadrons. Ils considéraient deux types de processus. Dans le premier, un hadron émettait une particule qui était ensuite absorbée par la seconde. Dans le second type de processus,
18
Chapitre 1. Introduction à la physique moderne
F IGURE 1.7. Diagramme pour les deux types de processus a priori inéquivalents. La théorie des cordes montre que les deux processus ont en fait la même topologie.
les deux hadrons fusionnaient avant de se séparer à nouveau (voir la figure 1.7). Bien que les deux types de processus fussent en apparence totalement différents, ils conduisaient au même résultat. Les physiciens n’avaient aucune idée de l’origine de ce phénomène, mais ils soupçonnaient qu’une nouvelle symétrie devait être à l’œuvre. Par la suite, les chercheurs ont découvert quelle était cette symétrie : deux processus physiques en apparence différents peuvent être vus comme un seul et même processus lorsque les particules ponctuelles du point de vue initial sont remplacées par des objets non ponctuels, étirés et vibrants, appelés cordes (voir la figure 1.7). Les cordes ont d’abord été introduites comme des objets mathématiques sans justification physique, mais l’idée a ensuite prospéré et s’est révélée fructueuse. Ceci a été en fait le point de départ de la théorie des cordes, une théorie où les hadrons ont été remplacés par des cordes jouant le rôle de blocs de base dans la construction de la nature. Ainsi la symétrie évoquée ci-dessus s’avère posséder une interprétation géométrique : à mesure que les cordes se déplacent, elles forment des tubes qui se joignent ou se divisent et elles dessinent des surfaces. Les deux voies de la collision de hadrons correspondent au même diagramme si on les dessine avec des cordes, et c’est ce qui sous-tend la symétrie.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
19
Au bout du compte, on s’aperçut que les cordes ne fournissaient pas une bonne description des hadrons, mais qu’elles donnaient une bonne description de la gravitation quantique. L’état de plus basse énergie possède des propriétés, une masse nulle et un spin 2, en accord avec ce que l’on attend d’un graviton, qui est le quantum d’excitation élémentaire de la gravitation, juste comme le photon, de masse nulle et de spin 1, est le quantum d’excitation élémentaire de l’électromagnétisme. Proposée à l’origine comme théorie des hadrons, la théorie des cordes s’est retrouvée en position de candidat numéro un pour la théorie quantique de la gravitation. Si nous envisageons les gravitons comme des cordes minuscules plutôt que comme des particules ponctuelles, alors plusieurs des difficultés et des contradictions relevées précédemment disparaissent. La théorie des cordes implique un recours massif à des mathématiques modernes et sophistiquées. Le domaine a été grandement influencé et en fait façonné par les mathématiques. Inversement, la physique sous forme de théorie des cordes a eu un impact important sur les mathématiques pures. On considère que la théorie des cordes est aujourd’hui le candidat le mieux placé pour une théorie quantique de la gravitation. De plus, comme sous-produit, elle semble unifier toutes les autres forces dans un cadre unique, car ces forces ne sont que la manifestation du fait que les cordes se fondent et se divisent. C’est là où en est arrivée la physique fondamentale d’aujourd’hui. Nous sommes en possession d’une théorie qui est mathématiquement riche, ce que nous discuterons ultérieurement, mais qui n’a pas encore été vérifiée expérimentalement et ne le sera probablement pas dans un futur proche en raison des dimensions minuscules des cordes.
20
Chapitre 1. Introduction à la physique moderne
2 Symétries et lois de conservation 2.1
Introduction
Les symétries attirent le regard et sont vraisemblablement rassurantes pour nos sens, comme si elles renforçaient l’idée qu’il existe une structure sous-jacente et un ordre sous-jacent universels dans notre monde. Nous nous sommes depuis longtemps émerveillés en contemplant l’imbrication des cristaux hexagonaux dans les flocons de neige, souvent cités en exemple de la beauté de la nature. Dans une veine analogue, les visages humains qui semblent les plus symétriques sont souvent considérés comme les plus attrayants. La symétrie a également exercé une influence profonde et assez évidente sur l’architecture, que l’on peut observer de façon spectaculaire par exemple quand on découvre pour la première fois le Taj Mahal, une des sept merveilles du monde moderne. De façon inattendue, les symétries ont aussi joué un rôle étonnamment puissant dans les lois et les rouages de la physique, un rôle qui va bien au-delà de la simple question esthétique. Pour un physicien, une symétrie n’est pas simplement une propriété d’un objet comme un hexagone ou un octogone réguliers, qui reflète une construction et une structure interne parfaitement équilibrées. La signification d’une symétrie est qu’un certain type d’opération appliqué à un objet le laisse absolument identique à lui même. Comme exemple de telles opérations, on peut citer la rotation de 120o dans un plan d’un triangle équilatéral ou celle de 90o d’un carré autour de leur centre respectif. Les rotations par un angle quelconque d’un cercle ou d’une sphère autour de leur centre sont des exemples de symétries continues, car de telles rotations laissent invariants le cercle ou la sphère quel que soit l’angle de rotation. Au contraire, un pentagone
régulier n’est invariant que pour des rotations par un multiple de 72o autour de son centre, ce qui est un exemple de symétrie discrète. Cependant l’influence des symétries va encore bien au-delà de ces considérations d’invariance, comme le souligne un théorème démontré il y a plus d’un siècle par la mathématicienne allemande Emmy Noether. Noether a montré qu’à chaque symétrie continue de la nature on pouvait associer une loi de conservation correspondante. En utilisant ce théorème, on peut déduire des principes importants de la physique comme la conservation de l’énergie, de l’impulsion ou du moment angulaire (ou cinétique), qui sont donc de pures conséquences mathématiques de symétries, ainsi que nous le verrons ultérieurement.
2.2
Motivation pour les énigmes
Les énigmes, ainsi que nous l’avons mentionné précédemment, peuvent se révéler des outils efficaces pour mettre au jour des échanges réciproques subtils entre les mathématiques et la physique. Elles sont particulièrement utiles pour illustrer le lien entre symétries et lois de conservation ; j’espère que les exemples suivants vont vous en convaincre.
Énigme. La tâche que nous nous fixons est la suivante : étant donné un échiquier de 64 cases, nous souhaitons le recouvrir avec des dominos qui couvrent chacun deux cases adjacentes. Le problème est que nous disposons seulement de 31 dominos, ce qui va laisser deux cases non recouvertes (voir la figure 2.1). Est-il possible de s’arranger pour que les dominos recouvrent toutes les cases à l’exception de deux cases diagonalement opposées sur l’échiquier ?
F IGURE 2.1. Recouvrir un échiquier avec 31 dominos en recouvrant toutes les cases, à l’exception de deux cases diagonalement opposées aux deux coins de l’échiquier.
22
Chapitre 2. Symétries et lois de conservation
Solution. Lorsque vous posez un domino sur l’échiquier, il recouvre une case blanche et une case noire. Comme les deux cases diagonalement opposées aux deux coins de l’échiquier ont la même couleur, le problème ne peut pas être résolu. Il est instructif de reformuler cette solution en termes de loi de conservation. Soit Nblanc et Nnoir le nombre de cases blanches et noires qui ne sont pas recouvertes à une certaine étape du processus. À mesure que vous posez chaque domino sur l’échiquier, les nombres Nblanc et Nnoir changent, mais la quantité ∆ = Nblanc − Nnoir ne change pas parce que chaque domino recouvre exactement une case blanche et un case noire. Autrement dit, ∆ est une quantité conservée dans le processus de recouvrement. Elle reste constante et ne varie pas au cours du temps. En supposant que vous ayez réussi à accomplir la tâche qui vous était assignée, vous auriez terminé l’opération avec un résulat ∆ = 2. Mais vous êtes partis de la situation ∆ = 32 − 32 = 0, et comme ce nombre est une quantité conservée, vous ne pouvez pas obtenir en fin de parcours ∆ = 2. ll n’y a donc pas de solution au problème posé. Énigme. Supposez que vous disposiez d’une grille 4 × 6, soit 24 cases, avec une entrée au coin supérieur droit et une sortie sur le carré le plus à gauche de la seconde ligne (voir la figure 2.2). Est-il possible de voyager sur cette grille en vous déplaçant uniquement horizontalement et verticalement d’une case à l’autre en passant par toutes les cases une fois et une seule ?
F IGURE 2.2. Voyager sur une grille de 24 cases en passant par toutes les cases une fois et une seule.
Solution. Comme ci-dessus, il n’y a pas de solution. Imaginez de colorier les cases alternativement en noir et blanc comme pour un échiquier, de sorte que deux cases adjacentes n’aient jamais la même couleur. Alors les cases d’entrée et de sortie ont la même couleur, mais chaque étape du voyage fait passer d’une case à une case de couleur différente. Le nombre d’étapes est pair et la dernière étape devrait être noire si la case d’entrée est blanche. Il est donc impossible que la case de départ et celle d’arrivée soient de la même couleur si l’on passe par chaque case une fois et une seule (voir la figure 2.3). L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
23
F IGURE 2.3. La grille avec des cases colorées en noir et blanc. Les cases d’entrée et de sortie sont blanches.
Nous voyons donc qu’une symétrie, dans ce cas la symétrie entre les cases coloriées différemment, est un invariant puissant. Cependant, le coloriage ne contrôle pas complètement la faisabilité des problèmes d’entrée-sortie sur une grille. En effet, considérons la grille de la figure 2.4 où la case d’entrée et celle de sortie sont respectivement la plus à droite et la plus à gauche de la seconde rangée.
F IGURE 2.4. Une autre grille.
Nous ne pouvons pas conclure directement à la non-faisabilité de ce problème d’entrée-sortie en utilisant comme ci-dessus des nombres modulo 2 (ou pair/impair) bien qu’il soit clair, si l’on essaie différentes solutions, que le problème est impossible.
2.3
Symétries
Une symétrie, nous l’avons vu, peut être caractérisée comme une opération qui laisse un système invariant, ou identique à lui-même. Ainsi que l’illustre la figure 2.5, un triangle isocèle possède une symétrie de réflexion par rapport à l’une de ses hauteurs. Le concept de symétrie est donc intimement relié à celui d’invariance. Ce dernier terme, que l’on peut utiliser de façon pratiquement interchangeable avec
24
Chapitre 2. Symétries et lois de conservation
F IGURE 2.5. Un triangle isocèle possède une symétrie de réflexion par rapport à l’une de ses hauteurs.
celui de symétrie, se réfère à une transformation qui laisse invariant ou identique à lui-même un objet ou une configuration initiale. Le concept de symétrie est omniprésent en physique et l’on pourrait considérer que les symétries sont automatiquement réalisées dans les lois de la nature, comme des principes intrinsèques et inviolables. Mais on se doit d’être prudent. Par exemple, on pourrait être tenté de supposer que les lois de la physique sont invariantes par symétrie de réflexion. On pourrait donc supposer que, si un processus physique se passe dans notre monde, alors l’image de ce processus dans un miroir devrait être un processus physiquement possible. C’est vrai dans certains cas, mais on peut prouver que c’est faux dans d’autres situations. Il existe par exemple des particules possédant la propriété dite de chiralité : leur spin, leur mouvement de rotation propre, est orienté soit dans leur direction de propagation 1 (chiralité droite), soit dans la direction opposée (chiralité gauche). Mais l’image dans un miroir d’une telle particule aurait une chiralité opposée, car le sens de rotation change dans la réflexion par un miroir, et une particule de chiralité opposée à la chiralité initiale est a priori une particule différente de la particule initiale. Dans le cas du neutrino, la particule de chiralité opposée est un antineutrino : le neutrino est de chiralité gauche, l’antineutrino de chiralité droite. Dans le cas des électrons, les électrons de chiralité gauche ont avec les autres particules des interactions différentes des électrons de chiralité droite. En
1
N.d.T. La règle du tire-bouchon permet d’associer une direction à un sens de rotation. Le tirebouchon que l’on tourne dans un sens avance dans une certaine direction, et il avance dans la direction opposée si on le tourne dans l’autre sens. Cette règle n’est manifestement pas invariante par parité : pour un tire-bouchon parallèle au miroir, le sens de rotation change quand on regarde le tire-bouchon dans un miroir, mais la direction reste la même !
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
25
conséquence, la physique n’est pas invariante par une réflexion dans un miroir 2 , qui est souvent appelée l’opération parité.
Énigme. Considérons les cœurs dans un jeu de cartes. Comment doit-on les arranger de telle sorte que, si nous alternons entre prendre la première carte, la poser sur la table et mettre la carte suivante sous le jeu, en commençant par mettre la première carte sous le jeu, alors les cœurs sortent exactement dans l’ordre [1 (=As), 2, 3 . . . , 10, Valet, Dame, Roi] ? Solution. Il existe plusieurs solutions, mais une approche très simple est la suivante. On dispose sur une table les cœurs dans l’ordre [As, 2, 3 . . . , 10, Valet, Dame, Roi] et on inverse les opérations comme si on jouait le film à l’envers, en alternant entre prendre la carte sur la table et la placer sur le dessus du jeu de cartes et prendre la carte du dessous du jeu et la placer sur le dessus, jusqu’au moment où le jeu a été reconstitué. Qu’est-ce que cette énigme peut bien avoir à faire avec une symétrie ? C’est un exemple de la symétrie par renversement du sens du temps (ou simplement renversement du temps), qui est la version temporelle de la symétrie de réflexion d’espace déjà discutée. Le renversement du temps est une symétrie de certains processus physiques. Dans l’exemple ci-dessus, même si nous inversions le sens du temps et que les choses se passaient en remontant le temps, nous récupérerions le jeu de cartes sous une forme telle que si nous revenons au sens normal d’écoulement du temps, alors les événements se déroulent exactement comme nous le souhaitons 3 . Une autre symétrie que nous avons brièvement introduite au chapitre précédent est la symétrie entre matière et antimatière, par exemple un électron et un positron, deux particules qui diffèrent uniquement par le signe de leur charge. On appelle cette symétrie la conjugaison de charge. Il s’avère que les opérations parité, renversement du temps et conjugaison de charge ne sont pas, si elles sont prises séparément, des symétries de la nature. Mais c’est un résultat très 2
N.d.T. Jusqu’en 1957, la plupart des physiciens auraient parié que la parité était une symétrie de la nature. Ce sont la travaux des théoriciens C. N. Yang et T. T. Wu et de l’expérimentatrice C. S. Wu qui ont apporté la preuve de la non-invariance par parité. 3
N.d.T. En résumé, un processus physique est invariant par renversement du temps si le film de ce processus projeté à l’envers représente un processus physiquement possible. Les processus de la vie courante sont régis par les interactions électromagnétiques, qui sont invariantes par renversement du temps. Pourtant la plupart des événements de la vie courante ne sont pas invariants par renversement du temps. Le film d’un verre que l’on laisse tomber et qui se casse semble absurde si on le projette à l’envers. En fait le processus est invariant à l’échelle microscopique, mais nous le regardons avec une certaine résolution qui efface les détails microscopiques. En d’autres termes nous le regardons avec une certaine granulation (coarse graining), et c’est là la source de cette non-invariance.
26
Chapitre 2. Symétries et lois de conservation
F IGURE 2.6. Déplacer une ligne droite le long d’elle-même génère la même ligne droite.
profond de la relativité restreinte combinée à la théorie des champs quantiques que le produit de ces trois opérations est une symétrie de la nature. Autrement dit, si nous nous donnons n’importe quel processus physique et considérons son image dans un miroir, transformons toutes les particules en antiparticules et vice-versa, et finalement inversons le sens du temps, alors nous obtenons un processus physiquement possible 4 . La physique présente des symétries continues qui sont encore plus puissantes que les symétries discrètes. Considérons par exemple les translations. Soit une ligne droite (figure 2.6). Cette ligne droite présente une symérie de translation : si nous la déplaçons le long d’elle-même, nous générons la même ligne droite. En d’autres termes, la ligne droite est invariante par translation. Bien sûr, si nous voulions que cette translation soit une symétrie d’un système physique concret, il serait nécessaire de déplacer l’ensemble du système sur la ligne pour que la physique reste inchangée. La translation dans le temps est une autre symétrie. Si nous effectuons une expérience aujourd’hui et la recommençons demain, les résultats seront identiques pourvu que l’Univers ne change pas entre aujourd’hui et demain. Les rotations sont un autre exemple de symétrie continue. Cet exemple est parfaitement illustré par la sphère, qui est invariante par toute rotation autour de n’importe lequel de ses axes (voir la figure 2.7). Alors que les notions de symétrie de translation et de rotation dans l’espace ordinaire sont familières pour la plupart d’entre nous, d’autres symétries peuvent être beaucoup plus subtiles et dissimulées. Les transformations de Lorentz, par exemple, sont des transformations qui mélangent l’espace et le temps. Ces transformations mutuelles des coordonnées d’espace et de temps conduisent à une symétrie spécifique qui est celle la théorie de la relativité restreinte d’Einstein 5 . 4
On pourrait argumenter que le renversement du temps n’est pas une symétrie exacte en physique en raison du Big Bang qui marque de façon incontestable l’origine des temps, et donc un sens du temps bien défini. Cependant, cet énoncé par lui-même ne nous dit pas que le renversement du temps n’est pas une symétrie, parce que la version de l’Univers obtenue par renversement du temps de notre Univers, un Univers qui se contracte, serait aussi un Univers physiquement possible. 5
Pour le lecteur mathématicien : le groupe des rotations d’espace est noté SO(3), et ce groupe laisse invariante la combinaison ( x2 + y2 + z2 ) des trois coordonnées ( x, y, z) d’un point M dans l’espace. Cette combinaison est la distance (au carré) entre l’origine et le point, distance qui est
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
27
F IGURE 2.7. Faire tourner une sphère autour d’un de ses axes est une symétrie.
2.4
Le théorème de Noether
Il existe une relation intime entre symétries continues et lois de conservation. La loi de conservation d’une quantité physique est la propriété selon laquelle cette quantité est constante au cours du temps, elle reste invariable. Par exemple, si nous disposons de dix boules parfaitement indestructibles que nous sommes les seuls à posséder et que ces propriétés ne souffrent pas d’exception, alors nous avons une loi de conservation du nombre des boules en notre possession. Il s’avère que chaque symétrie continue en physique implique l’existence dans la nature d’une loi de conservation. Ce résultat est la conséquence du théorème de Noether, publié en 1918. Ce théorème énonce qu’à toute symétrie continue est associée une loi de conservation. En plus de considérations esthétiques que nous avons discutées précédemment dans ce chapitre, les symétries jouent un rôle quantitatif décisif en physique. La symétrie de translation, par exemple, implique l’idée que, toutes choses étant égales par ailleurs, des expériences effectuées dans des lieux différents doivent donner des résultats identiques. Cette idée apparemment banale a une conséquence fondamentale : elle implique la loi de conservation de l’impulsion. Rappelons que l’impulsion d’une particule est le produit de sa masse par sa vitesse. Ce résultat est plutôt étonnant, étant donné que la loi de conservation de l’impulsion représente, pour un système physique, un énoncé bien plus invariante par rotation. Le groupe de Lorentz est noté SO(3, 1), et ce groupe laisse invariante la combinaison (c2 t2 − x2 − y2 − z2 ), où c est la vitesse de la lumière, tandis que (t, x, y, z) sont les coordonnées de temps et d’espace d’un événement. La combinaison (c2 t2 − x2 − y2 − z2 ) est invariante par transformation de Lorentz et représente une distance (au carré) dans l’espacetemps. C’est cette « distance » que l’on doit extrémiser dans une formulation à la Euler-Lagrange.
28
Chapitre 2. Symétries et lois de conservation
complexe que le simple énoncé de l’indépendance des résultats expérimentaux par rapport au lieu où l’expérience est effectuée. Ces énoncés peuvent à leur tour être utilisés pour reformuler la mécanique de Newton. Considérons par exemple la loi de conservation de l’impulsion pour deux particules 1 et 2 que l’on suppose isolées de toute influence extérieure. L’impulsion totale (~p1 + ~p2 ) est conservée et doit donc être indépendante du temps. En d’autres termes, sa dérivée par rapport au temps doit s’annuler, et la conservation de l’impulsion s’écrit sous forme d’une équation différentielle : d (~p1 + ~p2 ) = 0 . dt Nous pouvons maintenant définir la force ~Fi sur la particule i par :
~Fi = d~pi . dt Cela revient à la seconde loi de Newton puisque :
~Fi = d~pi = m d~vi = m~ai , dt dt et de plus nous démontrons la troisième loi de Newton puisque la somme des forces sur les particules 1 et 2 est nulle : ~F12 = −~F21 , où ~Fij est la force exercée par la particule i sur la particule j. Les deux forces sont donc égales et opposées. Nous avons mentionné précédemment le fait que la physique pouvait être confrontée au problème suivant. Il n’est pas toujours évident de répondre à la question : entre deux énoncés équivalents, lequel est le plus fondamental ? Le consensus actuel est que la loi de conservation de l’impulsion est plus fondamentale que la troisième loi de Newton car cette conservation est la conséquence d’un principe de symétrie dont le domaine d’applicabilité est plus vaste : par exemple le principe tient compte de l’impulsion du champ électromagnétique et pas uniquement de celle des particules. Nous commençons à appréhender la relation intime entre symétries continues et lois de conservation. Les trois symétries continues que nous avons introduites ci-dessus impliquent les trois lois de conservation suivantes : • la symétrie de translation de temps implique la loi de conservation de l’énergie ; • la symétrie de translation d’espace suivant un axe implique la loi de conservation de l’impulsion suivant cet axe ; • la symétrie de rotation autour d’un axe implique la loi de conservation du moment angulaire suivant cet axe.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
29
F IGURE 2.8. Nous prélevons une certaine quantité de peinture verte dans le premier pot, à gauche, et le versons dans le second pot, à droite. Ensuite, après avoir mélangé, nous prélevons dans le pot de droite la même quantité de peinture et la versons dans le pot de gauche.
Énigme. Nous possédons deux pots de peinture, le premier contenant de la peinture verte et le second de la peinture blanche. Nous supposons que les deux pots ont même volume et contiennent la même quantité de peinture. Nous prélevons une certaine quantité de peinture verte dans le premier pot et nous la versons dans le second en mélangeant. Ensuite nous prélevons la même quantité de peinture mélangée et la versons dans le premier pot (figure 2.8). La concentration de peinture verte dans le second pot est-elle plus grande ou plus petite que la concentration de peinture blanche dans le premier ? Solution. Les concentrations sont identiques ! Comme les volumes de peinture sont égaux au départ, nous avons finalement le même volume de peinture dans les deux pots. Par conséquent, à la fin du processus, tout volume de peinture verte prélevée depuis le pot de peinture verte ne peut qu’avoir été remplacé par un volume identique de peinture blanche, ce qui découle de la conservation des volumes de peinture. La quantité de peinture verte manquante dans le pot de peinture verte doit donc être égale à la quantité de peinture blanche manquante dans le pot de peinture blanche. Nous terminons donc avec la même concentration dans les deux pots. C’est une illustation simple mais instructive de la puissance des lois de conservation. L’idée qui sous-tend cette énigme peut aussi être illustrée par un jeu de cartes. Formons un paquet de 10 cartes rouges et un paquet de 10 cartes noires. Enlevons trois cartes rouges du premier paquet mélangeons-les avec celles du second paquet. Battons soigneusement les 13 cartes de ce second paquet, prenons-y trois cartes au hasard et remettons-les dans le premier paquet. En utilisant la notion de conservation du nombre de cartes rouges et de cartes noires, convainquezvous qu’il doit y avoir autant de cartes noires dans le paquet de cartes initialement rouges que de cartes rouges dans le paquet de cartes initialement noires. Énigme. Un carte numérotée est extraite d’un jeu de 40 cartes où l’on a conservé uniquement les cartes 1(= As), 2, 3, . . . , 10. Quelle est la façon la plus rapide de déterminer quelle carte a été extraite si l’on examine les cartes restantes ? 30
Chapitre 2. Symétries et lois de conservation
Solution. Si l’on fait la somme des nombres inscrits sur les cartes, on trouve 220. Le chiffre des unités de cette somme est donc 0. Une manière efficace d’identifier la carte extraite est d’ajouter les valeurs des cartes restantes modulo 10, c’està-dire en conservant uniquement le chiffre des unités. Si la somme est 3, par exemple, alors vous savez immédiatement que c’est un 7 qui manque. Si c’est 9, alors c’est un 1 (As) qui manque. Un autre coup d’œil rapide au jeu va vous révéler la couleur de la carte manquante. Le principe clé qui est à l’œuvre ici est à nouveau une loi de conservation, qui dans ce cas est liée au chiffre des unités de la somme des valeurs des cartes. Cet exemple rappelle une des applications les plus connues de la loi de la conservation de l’énergie à un problème de physique très intrigant dans les années 1930, qui a conduit à la prédiction par Pauli d’une particule élémentaire, le neutrino. Les physiciens étaient confrontés à un processus physique, une désintégration radioactive, qui semblait ne pas conserver l’énergie. La somme des énergies, énergie cinétique et énergie de masse, des particules finales n’était pas égale à l’énergie de la particule radioactive initiale. Pauli proposa l’hypothèse suivante : l’énergie manquante était celle d’une particule invisible qui fut baptisée un peu plus tard neutrino par Enrico Fermi 6 . Cette particule devait avoir des interactions très faibles de telle sorte qu’elle échappait à toute tentative de détection et emportait l’énergie manquante sans se faire remarquer. Pauli fit le pari que les interactions du neutrino étaient si faibles qu’il ne serait jamais détecté, mais il perdit son pari, car le neutrino fut mis en évidence expérimentalement en 1956. Énigme. Vous disposez de 10 boîtes, chacune contenant 10 poids. Neuf de ces boîtes contiennent des poids de 1 kg, mais la dixième est défectueuse et contient uniquement des poids de 0,9 kg. Vous disposez d’une balance qui peut peser ensemble jusqu’à 10 boîtes avec leurs poids. Comment détecter la boîte défectueuse en une seule pesée ? Solution. Étiquetez les boîtes de 1 à 10, et prenez n poids dans la boîte numéro n. Vous pouvez déterminer la boîte défectueuse en observant la différence entre le poids mesuré et celui qui aurait été mesuré si une boîte n’avait pas été défectueuse, ce qui aurait donné le résultat 1 + 2 + . . . + 10 = 55 kg. Si la boîte n est défectueuse, vous trouverez (55 − 0, 1 × n) kg. Énigme. Considérons une grille infinie, un jeu de dames infini, situé dans le premier quadrant, ou quadrant en haut à droite, avec des coordonnées cartésiennes ordinaires ( figure 2.9). 6
N.d.T. En fait Pauli baptisa sa particule hypothétique neutron. Cependant le véritable neutron, le partenaire électriquement neutre du proton dans les noyaux atomiques, fut découvert quelques mois plus tard et Fermi proposa neutrino ou « petit neutron ».
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
31
F IGURE 2.9. Une grille infinie avec quelques pions sur des cases et les règles de substitution suivantes : chaque pion peut être remplacé par deux pions, l’un situé directement au-dessus et l’autre directement sur sa droite, mais seulement lorsque ces deux cases sont vides.
Nous allons placer des pions sur certaines de ces cases et énoncer des règles pour les changements possibles. Chaque pion peut être remplacé par deux pions, l’un situé directement au-dessus et l’autre directement sur sa droite, mais seulement lorsque ces deux cases sont vides. Supposons que nous partions de trois pions sur trois cases dans le coin inférieur gauche du damier, comme on le voit sur la figure 2.8. Votre tâche est d’utiliser les règles énoncées ci-dessus pour le remplacement des pions afin qu’il ne reste auncun pion sur les cases initiales. Est-ce possible ?
Solution. Ce n’est pas possible. Pour le voir, attribuons un nombre à chaque case du damier de sorte que la valeur du nombre attribué à une case soit égale à la somme des nombres attribués aux cases immédiatement au-dessus de cette case et à sa droite. Pour être concret, attribuons le nombre 1 à la première case du coin inférieur gauche. Attribuons ensuite le nombre 1/2 aux cases immédiatement au-dessus et à droite. Ces deux cases vont former ce que nous appellerons la première diagonale. La diagonale suivante est faite de trois cases auxquelles nous attribuons le nombre 1/4. La diagonale suivante est faite de quatre cases auxquelles nous attribuons le nombre 1/8, et ainsi de suite. Chaque fois que nous nous déplaçons vers la diagonale suivante, le nombre attribué est divisé par deux. On additionne maintenant les valeurs des nombres attribués à toutes les cases occupées. Remarquons que l’opération qui consiste à remplacer un pion par deux pions, l’un situé directement au-dessus et l’autre directement à droite, 32
Chapitre 2. Symétries et lois de conservation
préserve la valeur de la somme : c’est une loi de conservation. La valeur initiale de cette somme est 1 + 1/2 + 1/2 = 2. Si toutes les cases étaient occupées, la somme serait donnée par 7
[1 + 1/2 + 1/4 + 1/8 + . . .] × [1 + 1/2 + 1/4 + 1/8 + . . .] = 4. Pour obtenir ce résultat, nous avons d’abord sommé sur les colonnes verticales. Comme la somme sur les trois premières cases vaut 2, cela veut dire que si vous deviez réussir à déplacer les pions de sorte que les trois premières cases soient vides, la valeur totale des cases occupées serait encore de 2. Mais cela ne peut être réalisé que si toutes les autres cases du damier sont remplies parce que la valeur totale attribuée à l’ensemble des cases, en incluant les trois premières, est de 4. La tâche proposée est donc impossible en un nombre fini d’opérations, et donc en un temps fini.
Énigme. Supposons que nous ayons un nombre impair de soldats dans un champ de bataille, qui soient tous différents. On ordonne à chacun des soldats de surveiller le soldat qui est son plus proche voisin. Montrez qu’au moins un des soldats n’est pas surveillé. Solution. Prenons parmi les N soldats les deux soldats qui sont les plus proches. Ils n’ont pas d’autre possibilité que de se surveiller mutuellement. Ensuite, considérez uniquement les ( N − 2) soldats restants, et formez la paire dont la distance est minimale, et ainsi de suite. À la fin du processus, comme le nombre de soldats est impair, vous allez immanquablement tomber sur un soldat qui n’est pas surveillé. Mais attention ! N’y aurait-il pas une faille dans cet argument ? Que se passet-il si un soldat est le plus proche d’un autre soldat qui a déjà été utilisé pour former une paire ? Disons qu’il reste n soldats non appariés la première fois où cela se passe. Alors un des soldats ne pourra pas surveiller l’un quelconque de ces n soldats parce qu’il surveille déjà un des soldats dans une paire formée auparavant. Par conséquent, il y a au plus (n − 1) soldats surveillant les n autres. Autrement dit, au moins un soldat ne sera pas surveillé. Énigme. Pouvez-vous tracer les diagrammes de la figure 2.10 sans d’une part lever votre crayon, et d’autre part sans repasser deux fois sur la même arête ? Solution. On peut le faire pour le diagramme de gauche mais non pour celui de droite. Si l’on doit dessiner un graphe sans lever le crayon, il faut qu’à chaque sommet du graphe soit attaché un nombre pair d’arêtes, à l’exception du premier et du dernier sommet s’ils sont distincts. La raison en est que l’on doit 7
N.d.T. Nous avons utilisé la série géométrique ∑nN=0 x n = (1 − x N +1 )/(1 − x ), avec x = 1/2 et N → ∞.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
33
F IGURE 2.10. Tracez ces figures sans lever le crayon et sans repasser sur une ligne.
F IGURE 2.11. Un jeu où deux joueurs placent à tour de rôle sur un plateau des pions qui ne se chevauchent pas.
entrer et sortir de chaque sommet intermédiaire le même nombre de fois. Un nombre de fois impair voudrait dire que le sommet était soit un point de départ, soit un point d’arrivée du crayon, plutôt qu’un point intermédiaire. Une façon plus abstraite de le dire est que le nombre modulo 2 de lignes sortant de tous les vertex intermédiaires doit être zéro. En outre, il y a au plus deux sommets associés à des nombres impairs, et ceux-ci peuvent uniquement correspondre au début et à la fin de votre dessin. Il est alors évident de déterminer les sommets de départ et d’arrivée du dessin dans le cas du diagramme de gauche. Le diagramme de droite possède 3 sommets auxquels sont attachées 3 lignes et donc, conformément à ce que nous venons d’énoncer, il n’est pas possible de dessiner ce diagramme sans lever le crayon.
Énigme. On dispose d’un plateau rectangulaire sur lequel on place des pions avec les règles suivantes (voir la figure 2.11). 1. Le centre de chaque pion doit être situé à l’intérieur des limites du plateau. 2. Les pions ne doivent pas se recouvrir. Les deux joueurs placent alternativement leurs pions. On suppose que le nombre de pions à leur disposition est illimité. Le dernier joueur à placer un pion sur le plateau a gagné. Quelle est la stratégie gagnante ?
Solution. La stratégie gagnante consiste, pour le premier joueur, à placer son premier pion au centre du plateau (voir la figure 2.12). Il faut remarquer que, pour 34
Chapitre 2. Symétries et lois de conservation
F IGURE 2.12. La stratégie gagnante. (1) = vos pions. (2) = ceux de votre adversaire.
chaque point sur le plateau, son symétrique par rapport au centre est aussi un point du plateau. Cela veut dire que, quelle que soit la position où votre adversaire place le centre de son pion, vous pouvez toujours répliquer en posant votre pion au point symétrique. En raison de la symétrie du plateau, si le placement de votre adversaire est légal, le vôtre le sera aussi.
Énigme. Vous devez jouer simultanément avec deux grand maîtres d’échecs. Le problème est que vous ne jouez pas très bien. Cependant votre objectif est de gagner au moins une partie ou d’obtenir le nul sur les deux parties. Un des grand maîtres joue les blancs sur le premier échiquier et vous jouez les blancs sur le second. Solution. La stratégie consiste à répéter les coups du grand maître sur le second échiquier. Quoi que le grand maître joue avec les blancs sur le premier échiquier, vous le jouez sur le second, et quoi que le second grand maître réponde avec les noirs à votre coup, ce sera votre réponse avec les noirs sur le premier échiquier. De cette façon, par symétrie, les deux parties seront identiques et par conséquent leurs résultats seront identiques. Mais vous vous trouvez des côtés opposés de l’échiquier dans les deux parties, et si vous en perdez une, vous gagnez l’autre. Et si l’une des parties est nulle, l’autre l’est aussi. 2.5
Supersymétrie
Il existe des symétries plus abstraites en physique fondamentale. Un exemple très important est la supersymétrie. Une des conséquences de cette symétrie, si on fait l’hypothèse qu’elle est réalisée dans la nature, est que chaque particule possède un double appelé son superpartenaire. En fait le superpartenaire n’est pas exactement un double, car son spin est différent, toutes choses étant égales par ailleurs. Le sélectron, par exemple, est le superpartenaire hypothétique de
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
35
l’électron. Il a la même masse 8 et la même charge mais, à la différence de l’électron, il ne possède pas de spin. D’un point de vue plus technique, – le lecteur peut omettre ce passage en première lecture et passer directement à la section suivante –, on peut étendre la dimension de l’espace dans les théories supersymétriques en ajoutant des coordonnées. Le nouvel espace est appelé superespace. Un exemple simple en est le superespace de coordonnées (t, x, y, z, θ ). Les coordonnées additionnelles θ sont cependant différentes des coordonnées ordinaires (t, x, y, z), car ce sont des exemples de ce que l’on appelle des coordonnées (ou variables) de Grassmann, aussi appelés coordonnées fermioniques. À la différence des coordonnées ordinaires qui commutent, par exemple xy = yx, les coordonnées de Grassmann anticommutent. Si θ et α sont deux coordonnées de Grassmann, alors αθ = −θα. Prenant α = θ, on constate que θ 2 = 0. Les coordonnées de Grassmann correspondent à des directions supplémentaires et la supersymétrie est liée à l’invariance par translation le long de ces directions. Nous posons les conditions suivantes sur les variables θ θ · θ = 0, (2.1) 2 ∂ = 0, (2.2) ∂θ 2 ∂ ∂ = − θ. (2.3) θ ∂θ ∂θ La supersymétrie conduit à une symétrie qui est une sorte de racine carrée d’une translation dans l’espace ordinaire. Pour le voir, considérons une fonction f ( x). Pour une valeur de ε petite, nous pouvons appliquer la formule de Taylor qui fait intervenir la dérivée f ′ ( x) de f ( x) par rapport à x f ( x + ε) ≃ f ( x ) + ε f ′ ( x ) . Ce résultat peut être interprété en disant que ∂/∂x est le générateur des translations suivant x, l’opération qui fait passer de x à x + ε dans l’argument de f , et qui est donc une translation de ε. La racine carrée de ce générateur est alors un opérateur Dθ tel que Dθ2 = ∂/∂x. C’est a priori difficile à imaginer, mais c’est précisément ce que permet la supersymétrie. En effet, considérons la combinaison ∂ ∂ +θ . ∂θ ∂x On peut calculer le carré de cette opération ∂2 ∂ ∂ ∂ ∂2 + θ . θ Dθ2 = 2 + θ 2 2 + ∂θ ∂x ∂x ∂θ ∂θ Dθ =
8
N.d.T. Lorsque la supersymétrie n’est pas brisée.
36
Chapitre 2. Symétries et lois de conservation
Si nous nous souvenons des règles pour les variables anticommutantes, presque tous les termes de l’équation précédente s’annulent et Dθ2 se simplifie en ∂/∂x : Dθ est bien la racine carrée du générateur ∂/∂x des translations suivant x. Si nous considérons une fonction de ( x, θ ), nous pouvons écrire son développement de Taylor en fonction de θ sous la forme f ( x, θ ) = f ( x) + θg( x).
(2.4)
En effet il n’y a pas de termes d’ordre supérieur puisque θ 2 = 0 ! Une fonction sur le superespace peut être vue comme une paire de fonctions de x, f et g. Ceci est l’analogue de la propriété pour une particule de posséder un superpartenaire. Au premier abord, la notion de supersymétrie peut sembler étrange, mais c’est un ingrédient essentiel de la théorie des cordes et de certaines théories des champs quantiques. La supersymétrie rend la théorie quantique en un certain sens plus proche de la théorie classique en réduisant les fluctuations quantiques, responsables de l’apparition de quantités infinies dans les calculs. Mais il n’y a aujourd’hui aucune indication expérimentale en faveur de l’existence de superpartenaires comme les sélectrons, et en général aucune autre indication en faveur de la supersymétrie. Les chercheurs espèrent pourtant que de telles indications émergeront bientôt dans les expériences menées auprès de grands collisionneurs. 2.6
Quasi-cristaux et symétries
Nous discutons dans cette section une symétrie d’un type nouveau, la symétrie d’un quasi-cristal. Pour introduire le sujet, nous rappelons qu’il existe des symétries simples et évidentes dans le plan, par exemple nous avons vu qu’un carré est invariant par une rotation de 90o = 2π/4 autour de son centre. Cette symétrie est notée Z/4. Plus généralement, une symétrie par rotation de 2π/n sera notée Z/n. Ainsi nous avons la symétrie Z/2 pour le rectangle, Z/3 pour le triangle équilatéral, Z/4 pour le carré, Z/6 pour l’hexagone 9 (voir la figure 2.13). 9
Il existe un argument mathématique simple selon lequel seuls ces angles peuvent correspondre à des symétries de rotation de pavages du plan. Les matrices associées aux rotations d’ordre 2, 3, 4 et 6 sont celles dont la trace est égale à un entier. En effet, toute transformation d’un réseau ∼ Z2 peut être écrite avec des entrées entières car on peut considérer la rotation comme agissant sur certains des vecteurs qui sous-tendent le réseau et qui doit donc appliquer les vecteurs sur des combinaisons entières d’autres vecteurs. Par conséquent ces matrices doivent avoir une trace entière. Au contraire, des rotations de Z/5 donneraient une trace de 2 cos(2π/5) qui n’est pas un entier, contrairement à 2 cos(2π/n ) pour n = 2, 3, 4, 6, qui est un entier. La notation Z/n vient de ce que le groupe des rotations d’angle 2π/n n’est autre que le groupe des entiers positifs modulo n, [0, 1, · · · , n − 1], où p + n ≡ p.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
37
F IGURE 2.13. On peut construire des pavages avec des motifs symétriques périodiques associés à des symétries d’ordre 2, 3, 4 ou 6.
F IGURE 2.14. Des cristaux présentant une quasi-symétrie. Source : Inductiveload sur Wikipedia.
Il existe aussi des cristaux présentant des quasi-symétries. Ils sont appelés quasi-cristaux, et on peut les générer à l’aide des pavages de Penrose 10 . Les pavages sont formés d’objets à cinq côtés qui possèdent virtuellement une symétrie Z/5, mais le cristal ne peut pas avoir globalement une telle symétrie. C’est un quasi-cristal, qui n’est pas périodique au sens strict du terme, mais est presque périodique (voir la figure 2.14). Les quasi-cristaux sont donc des objets presque périodiques, mais pas tout à fait. Chaque élément du pavage semble localement symétrique, mais il n’y a pas de symétrie globale, bien que ces structures soient quasi-périodiques. Il vaut la peine d’observer qu’un attaché de recherches à Harvard, Peter Lu, et un physicien de Princeton, Paul Steinhardt, ont découvert que de nombreuses mosquées construites il y a plusieurs siècles sont décorées avec des motifs quasicristallins, ce qui montre que l’idée de Penrose était dans l’air environ 1200 ans avant que ce dernier, qui a donné son nom à ce type de pavage, ait commencé à examiner ces figures d’un point de vue mathématique dans les années 1970. Ainsi des civilisations anciennes ont également apprécié la beauté de ces structures presque symétriques. Mais les motivations des architectes de l’époque étaient fort différentes des nôtres. Il n’essayaient pas de modéliser la physique 10
N.d.T. Prix Nobel de physique en 2020 pour ses travaux sur les singularités gravitationnelles.
38
Chapitre 2. Symétries et lois de conservation
F IGURE 2.15. Déterminer la longueur du segment de droite EF .
F IGURE 2.16. Solution de l’énigme de la figure 2.15.
ou la nature en s’appuyant sur des principes de symétrie, mais ils s’efforçaient de créer des effets subtils agréables à l’œil. Nombre de solides dans la nature ont des formes cristallines et présentent des symétries telles que celles que nous avons brièvement introduites 11 . Il est intéressant de remarquer que la nature fabrique des quasi-cristaux et que l’on peut admirer leurs quasi-symétries subtiles. Dan Schechtman a reçu le prix Nobel de chimie en 2011 pour sa découverte des quasi-cristaux dans le monde naturel 12 .
Énigme. Quelle est la longueur du segment de droite EF sur la figure 2.15 ? E est au centre du carré de côté 5 unités. Solution. L’astuce consiste à convertir le diagramme de la figure 2.15 en un diagramme symétrique (voir la figure 2.16). On constate alors que EF est√la moitié de la diagonale d’un carré de côté 7 unités, et par conséquent EF = 7/ 2 d’après le théorème de Pythagore. Mais nous pouvons aussi revenir aux sources : en effet, la symétrisation ci-dessus est exactement celle utilisée dans la démonstration la plus simple du théorème de Pythagore. Considérons un triangle 11
N.d.T. Le raisonnement que nous avons suivi pour montrer que le nombre de symétries dans le plan est limité peut être généralisé aux pavages de l’espace à trois dimensions, et l’on montre qu’il n’y a que 15 motifs cristallins symétriques possibles.
12
Voir www.nobelprize.org/prizes/chemistry/2011/summary.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
39
rectangle de côtés a, b et c, ce dernier côté étant l’hypothénuse. Le triangle est inscrit dans un carré de côté ( a + b), dont l’aire est ( a + b)2 . Ce carré est formé de quatre triangles d’aire ab/2 et d’un carré d’aire c2 . Ceci conduit à
( a + b)2 − 4( ab/2) = a2 + b2 = c2 , ce qui est probablement le résultat le plus célèbre de géométrie et peut-être même le plus important.
2.7
Cordes et conservation de la charge
La charge de l’électron est −1 si l’on prend comme unité de charge celle du proton, que l’on choisit comme charge élémentaire. La charge électrique possède deux propriétés de base. 1. Toutes les charges électriques sont des multiples entiers, ≥ 0 ou ≤ 0, de la charge élémentaire. Les valeurs de cette charge forment un ensemble discret, et non un ensemble continu. 2. La charge électrique est conservée. Quelle pourrait bien être l’origine de ces deux propriétés ? Dans la théorie des cordes, où les particules sont remplacées par des objets unidimensionnels étendus appelés cordes 13 , on considère souvent la situation suivante : nous avons une corde enroulée sur un cylindre infini, où la circonférence du cylindre joue le rôle d’une dimension supplémentaire. En effet, la théorie des cordes ne se contente pas de trois dimensions d’espace, mais les dimensions supplémentaires sont supposées minuscules, ce que nous préciserons en discutant les dualités. Une telle boucle est caractérisée par son nombre d’enlacements 14 , qui compte le nombre de fois où la corde s’enroule autour du cylindre (voir la figure 2.17). Ceci fournit une explication possible au caractère discret de la charge électrique. Si la charge est interprétée comme le nombre d’enlacements des cordes autour du cylindre, alors elle prend uniquement des valeurs discrètes. Quelles conclusions tirer de cette image de cordes pour la conservation de la charge ? La façon dont deux cordes interagissent est fondée sur la concaténation, ce qui 13
N.d.T. De ce point de vue, la traduction de « string » par « ficelle », qui évoque un objet fin, serait plus appropriée que « cordes », mais ce dernier terme s’est imposé dans la littérature scientifique de langue française.
14
N.d.T. En anglais, winding number.
40
Chapitre 2. Symétries et lois de conservation
(A) Addition de plusieurs cordes :
(B) Annihilation de deux cordes : F IGURE 2.17. Particules chargées comme des cordes enroulées. (A) Addition de cordes multiples. (B) Annihilation de deux cordes.
veut dire que lorsque deux cordes se touchent, deux cordes initialement séparées vont se connecter. L’addition des charges qui est impliquée dans la concaténation peut être plus subtile dans certaines situations, ainsi que les énigmes suivantes le montrent.
Énigme. Imaginez que vous avez un tableau suspendu par une ficelle à deux clous plantés dans un mur. Comment pouvez-vous enrouler la ficelle autour des clous afin que le tableau ne tombe pas, mais qu’il tombe aussitôt qu’un seul des deux clous est enlevé ? Généralisation : vous avez maintenant 100 clous dans le mur, et le tableau tombe dès que vous enlevez un clou (voir la figure 2.18). Solution. Dans l’exemple précédent, celui de l’enroulement d’une corde autour d’un cylindre, nous étions en présence d’une loi de conservation impliquant une opération d’addition. Cette opération, comme l’addition elle-même, est commutative : x + y = y + x. Les nombres entiers, positifs, négatifs et nul, munis de l’opération d’addition forment ce que l’on appelle un groupe commutatif 15 , ou encore un groupe abélien. Cependant, pour des ficelles qui s’enroulent autour 15
N.d.T. Un groupe G est un ensemble d’éléments muni d’une loi de composition notée [·]. Si g et g′ appartiennent à G, alors g · g′ doit appartenir à G. De plus ( g · g′ ) · g′′ = g · ( g′ · g′′ ). Enfin il existe un élément neutre I (pour identité) tel que g · I = I · g = g, et tout élément a un inverse : quel que soit g, il existe g−1 tel que g−1 · g = g · g−1 = I. Si g · g′ = g′ · g quels que soient g et g′ , alors le groupe est commutatif ou abélien. Afin de simplifier les notations, on écrit simplement gg′ au lieu de g · g′ .
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
41
F IGURE 2.18. Suspendre un tableau à l’aide d’une ficelle avec deux clous dans le mur.
de deux clous, l’ordre des opérations n’est pas indifférent. En d’autres termes, l’enroulement de ficelles autour de deux clous conduit à un groupe non abélien : si g et g′ sont deux enroulements, en général gg′ 6= g′ g (voir la note 15). La notion de loi de conservation continue à exister, mais elle est plus subtile que la simple addition de deux nombres d’enlacements. Pour résoudre l’énigme, nous allons exploiter ce caractère non abélien. Voici l’idée de base. Si nous enroulons la ficelle autour d’un clou dans le sens des aiguilles d’une montre, nous appelons l’opération α ; si nous l’enroulons autour du même clou mais dans le sens inverse des aiguilles d’une montre, nous appelons l’opération α−1 . Le produit αα−1 = I, où I est l’opération identité, ce qui veut dire qu’il n’y a aucun enroulement de la ficelle autour du clou : si nous faisons faire un tour à la ficelle autour du clou dans un sens et que nous lui faisons faire ensuite un tour en sens inverse, cela est équivalent à ne rien faire, donc à l’opération identité. Passons maintenant au second clou et notons β l’enroulement par un tour autour du second clou dans le sens des aiguilles d’une montre, β−1 l’opération inverse. La non-commutativité entre en jeu si, par exemple, vous enroulez la ficelle par un tour autour du premier clou dans le sens des aiguilles d’une montre et ensuite autour du second clou dans le même sens. Ensuite vous déroulez autour du premier clou (opération α−1 ) puis du second (opération β−1 ) (voir la figure 2.19). Au contraire du premier cas de figure avec un seul clou, le tableau ne va pas tomber parce que l’ordre des opérations est important 16 .
16
Ce probème se généralise au cas de N clous, par exemple N = 100, où la configuration de N enroulements implique la quantité α N [ α N −1 [· · · α3 [ α2 , α1 ] · · · ].
42
Chapitre 2. Symétries et lois de conservation
F IGURE 2.19. Solution pour la suspension du tableau.
Donnons un forme mathématique à ces idées. L’opération que nous venons de discuter est représentée par la quantité
[α, β] = β−1 α−1 βα où βα est l’opération où l’on applique d’abord α et ensuite β : l’ordre des opérations se lit de la droite vers la gauche. Cette quantité est le commutateur de α et de β, et il est non trivial parce qu’il n’est pas égal à l’opération identité. Non trivial veut dire que si nous enroulons la ficelle en suivant ces prescriptions, le tableau ne va pas tomber, et ce résultat est intimement relié au fait que les opérations ne sont pas commutatives. Autrement dit, leur commutateur n’est pas nul. Enlever un des deux clous est équivalent à faire α = I ou β = I, auquel cas le produit des opérations est trivial et le tableau tombe. 2.8
Brisure spontanée de symétrie
Jusqu’à présent nous avons examiné les symétries et quelques-unes de leurs applications importantes. Notre sujet suivant est celui de la brisure spontanée de symétrie. Dans ce cas, l’application des symétries peut conduire à des résultats inattendus. Commençons par définir ce qu’une brisure spontanée de symétrie n’est pas. Vous pourriez par exemple penser que la symétrie entre le haut et le bas est brisée sur la Terre, puisque la physique suivant ces deux directions semble très différente : spontanément, les objets tombent et ne montent pas. En raison du champ de gravitation de la Terre, toutes les directions ne sont pas équivalentes comme elles le seraient dans une situation parfaitement symétrique par rotation. Mais cela n’est pas un exemple de symétrie spontanément brisée, parce
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
43
que c’est la conséquence du champ de gravitation terrestre, lequel est un effet environnemental imposé de l’extérieur et non un changement spontané. La brisure spontanée de symétrie que nous allons examiner dans le prochain chapitre est quelque chose de différent, et qui s’avère être un ingrédient essentiel de la physique. Elle explique la raison de notre existence, parce qu’elle explique pourquoi des objets massifs existent. En l’absence de masse, nous filerions tous à la vitesse de la lumière !
44
Chapitre 2. Symétries et lois de conservation
3 Brisure de symétrie 3.1
Introduction
Au chapitre précédent, nous avons illustré la puissance de la symétrie dans la résolution d’énigmes, dans l’étude de la physique, du monde naturel et de l’Univers qui nous entourent. Nous avons observé que les symétries continues sont équivalentes à des lois de conservation et ces lois de conservation, vous l’avez noté, sont extrêmement utiles. Une stratégie de base, que nous avons rencontrée par exemple dans le cas des pots de peinture, consiste à remarquer que, si le compte n’y est pas, alors nous savons que nous avons raté quelque chose et nous pouvons essayer de le détecter en comptant soigneusement ce que nous avons pris en compte et ce que nous avons oublié. Par exemple, en considérant un ensemble de particules chargées en mouvement dans un champ électromagnétique, nous pourrions constater que la somme des impulsions des particules n’est pas constante dans le temps, en contradiction apparente avec la loi de conservation de l’impulsion. Mais nous avons oublié l’impulsion du champ électromagnétique et, en ajoutant cette impulsion au bilan, la conservation de l’impulsion est bien respectée ! Dans ce chapitre nous examinons la situation où les symétries sont brisées. Vous serez surpris de constater que dans certains cas les symétries brisées sont plus intéressantes et ont plus de conséquences que celles qui ne le sont pas ! Un exemple est l’asymétrie entre matière et antimatière. Le Big Bang, en principe, aurait dû créer une quantité égale de matière et d’antimatière. Dans ces conditions, les particules de matière et d’antimatière auraient finalement été en contact et se seraient annihilées en produisant de l’énergie. Mais, en quelque sorte, la symétrie entre matière et antimatière s’est trouvée brisée de très peu,
avec au bout du compte environ un miliardième de matière de plus que d’antimatière. En conséquence, la matière l’a emporté après annihilation et c’est ce à quoi nous devons notre existence même. Un autre exemple, moins directement crucial pour notre présence dans le cosmos, est inspiré par le cas d’un crayon en équilibre sur sa pointe. C’est bien sûr une configuration instable et le crayon va finalement tomber. Mais lorsque le crayon est vertical, la configuration est parfaitement symétrique pour les rotations autour de son axe et il pourrait tomber suivant n’importe quelle direction : aucune direction n’est privilégiée. Lorsque le crayon se décide à basculer, cette superbe symétrie de rotation autour du crayon – jusqu’au moment de la chute – est spontanément brisée. Alors qu’avant le basculement le crayon aurait pu choisir n’importe quelle direction entre 0 et 360o , après ce basculement une direction a été privilégiée, par exemple 257o . Voici un exemple plus mathématique : considérons une fonction dérivable f ( x) de la variable x et supposons de plus qu’il s’agit d’une fonction paire : f ( x) = f (− x). La fonction f ( x) présente donc une symétrie de réflexion. Notre tâche est de déterminer les points tels que d f ( x)/dx = 0, les points critiques de f ( x). En utilisant la symétrie, nous pouvons trouver immédiatement une des solutions d f (− x) d f ( x) d f ( x) = =− . dx x dx dx − x −x
Par conséquent à x = 0 nous avons d f ( x) /dx |x =0 = −d f ( x)/dx|x =0 . Cette égalité ne peut être correcte que si d f ( x)/dx |x =0 = 0. Supposons que nous ayons au contraire posé la question : quels sont les minima locaux de f ( x), en supposant qu’il en existe au moins un ? En raison de la symétrie de réflexion, nous trouvons bien sûr x = 0. Mais il peut y avoir d’autres minima. Une des deux situations possibles est décrite sur la figure 3.1, et suivant le cas, le minimum global peut ou non être à x = 0. Si le minimum global ne se trouve pas à x = 0, nous sommes en présence d’une situation qui va nous conduire à une symétrie spontanément brisée. Si un système physique doit choisir un minimum global, par exemple parce que la courbe f ( x) représente l’énergie en fonction de x et que le système cherche à minimiser son énergie, alors il doit choisir entre les deux minima et la symétrie sera brisée.
46
Chapitre 3. Brisure de symétrie
F IGURE 3.1. Un minimum d’une fonction paire peut respecter la symétrie de réflexion (figure du haut), ou au contraire la violer (figure du bas). Plus précisément le symétrique du minimum de gauche est le minimum de droite.
3.2
Mouvement de la Terre et brisure de symétrie
Avoir recours à des symétries pour expliquer des phénomènes physiques est une stratégie qui remonte aux Grecs anciens et même plus loin dans le temps. Ainsi que nous l’avons vu au chapitre 1, les anciens Grecs (ou au moins certains d’entre eux) s’étaient convaincus que la Terre était une sphère. De plus ils savaient qu’elle tournait autour d’un axe, parce que la nuit les étoiles semblaient tourner autour de l’Étoile Polaire. Mais ils pensaient que cette rotation des étoiles était fort improbable, et ils postulèrent correctement que c’était la Terre qui tournait et que les étoiles étaient fixes. Ils pensaient aussi, mais cette fois ils se trompaient, que le centre de la Terre ne se déplaçait pas dans un mouvement de translation, à partir du raisonnement suivant : si le centre de la Terre était en mouvement de translation, la position relative des étoiles dans le ciel se modifierait, en contradiction avec l’observation. Le fait que le centre de la Terre soit immobile leur posait problème, et ils en cherchaient une explication. Ils connaissaient la symétrie de rotation des sphères. Par des considérations de symétrie, ils voulaient mettre la Terre au centre de l’Univers. Leur argument était le suivant : comme le centre de la Terre est au centre de l’Univers, il n’y a pas de direction privilégiée dans laquelle la Terre pourrait se mouvoir. Si la Terre bougeait, alors la symétrie de rotation serait brisée. Si l’on voulait préserver la symétrie de rotation, il valait mieux que la Terre soit immobile. Cet argument leur permettait de conclure : le centre de la Terre est fixe au centre de l’Univers.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
47
Mais Aristote contesta cette conclusion. Il développa l’argument suivant : si une personne (ultérieurement on a souvent choisi un âne) se trouve au centre d’un cercle et que de la nourriture est répartie régulièrement le long du cercle, un âne affamé va choisir une direction pour se déplacer et rejoindre un point sur le cercle afin de ne pas mourir de faim ! Ce mouvement, et en particulier le choix d’une direction à partir du centre du cercle, va nécessairement briser la symétrie circulaire qui prévalait au départ. Dans la vie réelle et dans le monde physique, on doit faire des choix tels que des situations au départ symétriques deviennent asymétriques. Certes les symétries sont un phénomène merveilleux et satisfaisant pour l’esprit, la source d’une grande beauté et en un sens quelque chose de presque magique. Mais est-ce un principe qui doit primer sur tous les autres quand il s’agit de ne pas mourir de faim ? Aristote argumenta de façon brillante que l’on ne doit pas préserver les symétries à n’importe quel prix. Les choix optimaux ne sont pas toujours les plus symétriques et les symétries peuvent être spontanément brisées ! 3.3
Brisure spontanée de symétrie
Nous allons maintenant explorer plus en profondeur la notion de symétrie spontanément brisée. La raison pour le qualificatif « spontané » est que le point de départ est une situation symétrique, et pourtant la solution de certains problèmes nous force inexorablement à adopter un résultat asymétrique. Revenons à l’exemple de la figure 3.2, où nous sommes au centre d’un cercle et des baguettes de pain sont réparties régulièrement sur la circonférence du cercle. Nous pourrions forcer la brisure de symétrie en mettant par exemple des baguettes plus grosses suivant une certaine direction. Dans ce cas la direction privilégiée serait évidente : nous nous dirigerions suivant la direction où il y a davantage de pain ! Ce ne serait pas une symétrie spontanément brisée, parce que c’est l’environnement qui a forcé la rupture de la symétrie. Le point de départ était déjà asymétrique.
F IGURE 3.2. Aristote a donné le premier exemple d’une symétrie spontanément brisée. Une personne est au centre d’un cercle et des baguettes de pain sont réparties régulièrement sur la circonférence du cercle.
48
Chapitre 3. Brisure de symétrie
F IGURE 3.3. Pour un bol symétrique par rotation autour d’un axe vertical avec son fond au centre, le point d’équilibre de la bille est au centre. Ce n’est pas le cas si le fond du bol n’est pas au centre, comme dans le cas du culot d’une bouteille de vin.
On ne manque pas d’exemples de symétries brisées dans le monde naturel. L’évolution nous a façonnés, de même que notre environnement a façonné l’évolution. Nous vivons sur une planète où le haut et le bas sont ne sont pas équivalents en raison de la gravitation terrestre qui pointe dans une direction particulière, vers le bas. Il n’y a pas de symétrie d’échange entre le haut et le bas, en d’autres termes les objets tombent vers le bas, pas vers le haut. Étant donné l’absence de symétrie entre le haut et le bas, il n’est pas surprenant que nos pieds soient morphologiquement différents de nos têtes. Au contraire, si nous nous tenons debout sur un sol plat, la situation est symétrique pour des rotations autour d’un axe vertical passant par le centre du corps. Pourtant l’évolution a rompu cette symétrie dans l’anatomie humaine. Nos yeux, par exemple, permettent de regarder dans des directions spécifiques vers l’avant, et non tout autour de nos têtes. D’une certaine façon, la nature a trouvé plus efficace, plus économe en énergie et autres ressources, de placer deux yeux orientés vers l’avant. Dans le contexte de l’exemple d’Aristote, nos yeux sont orientés vers l’avant, et nous nous dirigeons donc vers la baguette de pain ! Et même si nos yeux présentent une symétrie droite-gauche, ce n’est pas le cas pour d’autres organes. Le cœur est situé à gauche, le foie à droite, la plupart des personnes sont droitières mais certaines autres gauchères. Il semble donc que pour la Nature la symétrie ne soit pas toujours la meilleure solution possible. Cependant, en physique moderne, nous commençons à voir la brisure spontanée de symétrie à l’œuvre dans de nombreuses situations, et nous continuerons à examiner son rôle important dans la suite de ce chapitre. Supposons qu’une bille se trouve dans un bol dont le fond est situé à son centre ; on peut imaginer par exemple que le bol a la forme d’une demi-sphère. Quel sera le point d’équilibre de la bille ? Il est clair que ce sera le fond du bol, un point situé sur l’axe de symétrie. On pourrait être tenté de dire que cela découle de considérations de symétrie. Supposons au contraire que le bol ait la forme du culot d’une bouteille de vin, avec une bosse au centre et une gouttière
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
49
F IGURE 3.4. Si la symétrie est brisée « à la main » par une petite inclinaison du bol, on verra apparaître un point préférentiel où la bille va se stabiliser.
faisant le tour de cette bosse (une autre façon de se représenter cette topographie est de penser à un chapeau mexicain). Au lieu d’un minimum local sur l’axe de symétrie, le bol présente un maximum, une bosse, et une bille posée sur le sommet de cette bosse serait en équilibre instable, tout comme le crayon discuté ci-dessus. Tous les points correspondant à un minimum sont maintenant situés sur un cercle. La symétrie de rotation autour d’un axe vertical est toujours respectée, mais il y a désormais toute une famille de minima où la bille se trouve à l’équilibre, et aucun de ces minima n’est situé au centre, sur l’axe de symétrie. Dans notre cas, la symétrie exige qu’il y ait tout un ensemble de points d’équilibre. Choisir une possibilité dans cet ensemble revient à briser la symétrie, à privilégier une direction horizontale. Une petite modification des conditions externes, par exemple une légère inclinaison du bol, détruirait la symétrie (voir la figure 3.4). Remarquez aussi que les solutions asymétriques ne sont pas « gelées », dans le sens où secouer légèrement le bol va faire bouger la bille le long du cercle. Autrement dit, si nous devions incliner légèrement le bol, la bille pourrait se déplacer vers une tout autre position. Se rendre compte d’une symétrie sous-jacente peut dépendre de notre perspective. Un âne situé sur la circonférence d’un cercle, près d’un endroit où se trouve de la nourriture, peut ne pas remarquer la symétrie de rotation, à la différence d’un âne situé au centre du cercle. C’est aussi vrai du point de vue d’un observateur situé en un point d’équilibre de la bille ( voir la figure 3.5). On peut être induit en erreur et penser que la situation n’est pas symétrique si l’on se trouve en un point « asymétrique ». Il peut aussi arriver que le point de vue opposé soit vrai : il se peut que nous puissions briser la symétrie « à la main », mais que la symétrie reste suffisamment efficace pour nous guider vers une solution. Par exemple, supposez que vous vouliez déterminer la position du centre de masse d’un rectangle. La méthode brutale consiste à effectuer un calcul d’intégrale, mais il est plus rapide et plus élégant d’utiliser les symétries, qui nous disent que la position de ce centre de masse est tout simplement le centre du rectangle. Il est souvent utile
50
Chapitre 3. Brisure de symétrie
F IGURE 3.5. Si l’on adopte le point de vue d’un observateur situé à un endroit « asymétrique », il est difficile de se rendre compte de l’existence de la symétrie de rotation du bol.
dans des problèmes de physique d’utiliser des coordonnées dont l’origine est située au centre de masse. Mais que faire si la forme de l’objet n’a pas de symétrie ? Peut-on encore utiliser la symétrie pour déterminer la position d’un centre de masse ?
Énigme. Quelle est la position du centre de masse de l’objet dessiné sur la figure 3.6 ? On suppose que l’objet de forme L n’a aucune symétrie particulière.
F IGURE 3.6. Pouvez-vous déterminer la position du centre de masse de cet objet ayant la forme d’un L asymétrique ?
Solution. Le centre de masse est situé sur chacun des segments de droite en pointillés reliant les centres de deux rectangles, où nous avons divisé les branches du L de deux façons différentes (voir la figure 3.7). Par conséquent le centre de masse se trouve au point d’intersection de ces deux segments. La leçon de cet
F IGURE 3.7. On détermine le centre de masse en divisant les deux branches du L de deux manières différentes.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
51
exemple est que l’on peut exploiter des symétries, même si la situation n’est pas a priori symétrique. En généralisant cette méthode, nous pouvons déterminer le centre de masse de figures formées de rectangles comme celle dessinée sur la figure 3.8.
F IGURE 3.8. Détermination du centre de masse d’une figure formée de rectangles.
3.4
Aimants et symétries spontanément brisées
Considérons un système physique formé de particules possédant un degré de liberté appelé spin. En chimie cela pourrait être le spin des électrons. Ce spin est associé à un mouvement de rotation mais, nous l’avons vu, il est possible d’associer une direction, et donc une flèche, à ce mouvement de rotation, en utilisant la règle du tire-bouchon : voir la note 1 du chapitre 2. Dans la suite de ce chapitre, nous allons représenter le spin par une flèche et la situation la plus simple est celle où cette flèche peut prendre seulement deux orientations, par exemple vers le haut ou vers le bas. Supposons en outre que, lorsque deux particules sont voisines, elles ont tendance à orienter leurs spins dans la même direction, les deux vers le haut ou les deux vers le bas. C’est la conséquence du fait que l’énergie de la configuration avec les deux spins dans la même direction est plus basse que celle où les deux spins ont des orientations opposées 1 . Dans un matériau ferromagnétique, les spins de certains électrons dans chaque atome sont tous orientés dans la même direction, ce qui produit un aimant macroscopique, car à chaque spin est associé un moment magnétique : chaque spin est un aimant en miniature. Ces matériaux perdent leur aimantation au-dessus d’une certaine température, la température de Curie, parce que l’agitation thermique 1
N.d.T. Cette propriété dépend du matériau. Dans un matériau ferromagnétique, les spins parallèles ont une énergie plus basse, mais il existe des matériaux antiferromagnétiques où c’est l’inverse : l’énergie est la plus basse pour des spins antiparallèles. Les forces entre deux spins ne découlent pas des interactions magnétiques entre ces spins mais de la symétrisation de la fonction d’onde spatiale des deux électrons portant les spins.
52
Chapitre 3. Brisure de symétrie
tend à détruire l’alignement des spins et les orientations deviennent aléatoires : le matériau devient paramagnétique. Si l’on considère deux spins voisins, les configurations où les deux spins sont parallèles ont une énergie E(↑↑) inférieure à celle où les deux spins sont antiparallèles, E(↑↓) E(↑↑) < E(↑↓) . Imaginons de tels spins situés aux nœuds d’un réseau carré sur un plan (voir la figure 3.9). Le modèle de ferromagnétisme que nous décrivons ici est appelé modèle d’Ising. Dans ce modèle, seuls les spins plus proches voisins interagissent.
F IGURE 3.9. Le modèle d’Ising implique des spins orientés vers le haut ou vers le bas, disposés aux nœuds d’un réseau carré. Les spins plus proches voisins ont tendance à s’aligner afin de minimiser l’énergie totale du système.
À chaque paire de plus proches voisins est associée une énergie et nous sommons sur toutes ces paires pour obtenir l’énergie totale. Il existe à l’évidence deux configurations d’énergie minimale, celle où les spins pointent tous vers le haut et celle où ils pointent tous vers le bas. En l’absence de toute influence externe, le système se retrouverait dans une de ces deux configurations. Supposons que le réseau soit en contact thermique avec un réservoir de chaleur à la température absolue T. L’agitation thermique aura tendance à retourner des spins et on verra apparaître des configurations où les spins de certaines paires de spins voisins ne sont pas parallèles. En fait la physique statistique nous enseigne que la probabilité p( E) d’une configuration d’énergie E est proportionnelle à exp(− E/kB T ) : c’est la loi de Boltzmann. Dans cette équation, kB est la constante de Boltzmann, une constante qui permet de traduire énergies en températures et vice-versa. Les deux configurations d’énergie la plus basse ont la plus grande probabilité, mais d’autres configurations ont une probabilité non nulle. Il est commode d’attribuer aux spins pointant vers le haut la valeur +1 et aux spins pointant vers le bas la valeur −1. Appelons hSi la valeur moyenne du spin, obtenue pour une configuration donnée en additionnant les valeurs +1 et −1 des N spins du réseau, en faisant ensuite la moyenne sur les configurations avec la loi de probabilité p( E) et en divisant par le nombre total de spins N. Quelle est la valeur de hSi ?
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
53
On doit avoir hSi = 0 ! En effet, à chaque configuration de spins possible vous pouvez associer de façon biunivoque la configuration où tous les spins ont la valeur opposée : vous remplacez tous les +1 par des −1 et tous les −1 par des +1. Cela veut dire que, si pour la configuration initiale vous obtenez une certaine valeur moyenne du spin, à la configuration associée correspondra la valeur opposée. Les deux configurations ont la même énergie, et donc la même probabilité. Au bout du compte, vous allez obtenir hSi = 0. Un moment de réflexion vous permet de conclure que ce résultat a pour origine la symétrie Z/2 du problème ; rappelons que Z/2 est le groupe multiplicatif à deux éléments +1 et −1. Est-ce compatible avec notre modèle d’aimant ? L’aimantation, nous l’avons dit, résulte de l’alignement de tous les spins du réseau dans la même direction, et donc hSi 6= 0 si l’aimantation est non nulle. Mais nous venons juste de conclure que hSi = 0 ! Comment peut-il se faire que des aimants existent ? À très basse température, lorsque T → 0, on peut négliger l’agitation thermique et le système se stabilise sur un des deux états de plus basse énergie, tous les spins alignés vers le haut ou tous les spins alignés vers le bas. Il y a donc deux états fondamentaux. Mais comment le système peut-il choisir entre ces deux états si nous voulons former un aimant ? En fait il faut au départ briser la symétrie de façon infinitésimale, en plongeant par exemple le réseau dans un champ magnétique infinitésimal. Les spins ont alors tendance à s’orienter dans le sens du champ magnétique, ce qui favorise une des configurations, celle où tous les spins sont orientés dans la direction du champ. On peut ensuite supprimer le champ magnétique, mais pour passer de la configuration « tous les spins en bas » à la configuration « tous les spins en haut », on doit franchir une barrière énergétique très grande, correspondant au renversement de tous les spins. Grâce à cette brisure de symétrie infinitésimale, et à une température suffisamment basse, le système va se trouver dans un état aimanté. La symétrie hSi → −hSi, ou symétrie Z/2, a été spontanénent brisée 2 . C’est cette brisure de symétrie qui permet le ferromagnétisme et l’existence d’aimants est donc liée à cette brisure ! Nous savons que l’aimantation est présente à basse température, mais qu’elle s’annule au-dessus de la température de Curie. La température de Curie 2
N.d.T. Pour être mathématiquement rigoureux, il faut prendre d’abord la limite du réseau infini, N → ∞, et ensuite celle du champ magnétique nul, B → 0. Les deux limites ne commutent pas ! Si on prend d’abord B → 0, alors l’aimantation est nulle. Dans un système fini (N grand mais fini) et si B = 0, il existe toujours une probabilité, faible mais non nulle, de renversement de tous les spins. Un autre façon√de briser la symétrie est d’orienter dans le même √ sens les spins du bord du réseau, soit environ N spins. La fraction des spins orientés, ∼ 1/ N, tend vers zéro lorsque N → ∞.
54
Chapitre 3. Brisure de symétrie
est un exemple de ce que l’on appelle un point critique, et à ce point l’aimant subit une transition de phase (voir la figure 3.10).
F IGURE 3.10. La valeur absolue du spin moyen hS i est non nulle en dessous de la températurede Curie Tc .
Ce qui précède pourrait rappeler au lecteur l’exemple de la bille dans le culot d’une bouteille de vin. La configuration symétrique, celle où la bille est en équilibre au sommet de la bosse centrale, possède une énergie plus grande que celle où la bille se trouve au fond du culot et où la symétrie a été brisée. De même le ferromagnétisme ne peut exister qu’en raison d’une brisure de symétrie mais, à la différence de la bille dans le culot d’une bouteille où c’est une symétrie continue qui est brisée, une symétrie de rotation, le ferromagnétisme du modèle d’Ising repose sur la brisure d’une symétrie discrète, la symétrie Z/2. Cependant il existe aussi un modèle de ferromagnétisme, le modèle de Heisenberg, où c’est une symétrie continue qui est brisée, correspondant à un potentiel du type dessiné sur la figure 3.3.
3.5
L’énigme du carré
Énigme. Quatre villes sont situées aux sommets d’un carré. La distance entre deux villes adjacentes est de 100 km. Votre tâche est de concevoir un système d’autoroutes qui connecte toutes les villes entre elles en construisant le moins possible de kilomètres d’autoroutes. On n’exige pas que le chemin entre deux villes soit le plus court possible et l’ordre dans lequel les villes sont connectées est indifférent. Il suffit de s’assurer que les autoroutes connectent deux villes, quelles qu’elles soient. Tout ce que l’on vous demande est de concevoir L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
55
la solution la plus économique. Voyez-vous quelque chose de particulier dans la solution 3 ?
F IGURE 3.11. Pour un trajet optimal entre trois points, si nous déplaçons la jonction de trois routes par un vecteur infinitésimal ~δ, alors la longueur totale du trajet ne doit pas changer. Plus exactement, la modification du trajet doit être d’ordre ~δ 2 .
Solution. Tout d’abord il est facile de voir que les trajets entre villes doivent être des segments de droite. Comme la ligne droite est le plus court chemin d’un point à un autre, tout trajet où une route tortueuse remplace une ligne droite sera plus long. Ensuite nous pouvons observer que si un sommet dans le graphe des trajets possède trois arêtes, alors l’angle entre les trois arêtes entrant dans ce sommet doit être de 120o , ainsi que nous allons le montrer. En effet, soit un point O mobile relié à trois points fixés A, B, C par des droites situées dans un même plan (voir la figure 3.11). Nous voulons déterminer le point O tel que la somme des distances d = OA + OB + OC de O aux trois points fixés soit −−→ minimale. Déplaçons le point O vers O′ de ~δ, OO′ = ~δ, avec δ petit par rapport aux autres distances et calculons par exemple O′ A au premier ordre en δ
−−→ −−→ −→ −→ −→ −→ (O′ A)2 = (O′ O + OA)2 = (OA − ~δ)2 ≃ (OA)2 − 2~δ · OA , ce qui donne, en prenant la racine carrée
−→ OA ~ · δ = OA − ~δ ·~e A , O A = OA − OA ′
3
Ainsi que nous le verrons ultérieurement, ce problème est lié au point de Fermat-Torricelli dans un triangle.
56
Chapitre 3. Brisure de symétrie
−→ où ~e A = OA/OA est le vecteur unitaire (de longueur unité) allant de O vers A, ce que l’on peut vérifier en prenant le carré de cette équation. Revenant au problème initial, nous voyons que si nous voulons minimiser la distance d, il faut que ~δ · (~e A +~eB +~eC ) = 0 , et comme ~δ est arbitraire, cela implique que (~e A +~eB +~eC ) = 0. Cette condition assure que la modification de d est du second ordre en ~δ. La conséquence en est que les angles entre les trois vecteur unitaires doit être de 120o . En effet, si l’on prend le carré de la relation ~e A +~eB = −~eC on obtient ~e A ·~eB = −1/2. Que se passe-t-il si un sommet est de degré 4, ce qui veut dire que quatre routes convergent en un point ? Prenez deux sommets adjacents et le sommet central. Nous pouvons considérer la situation comme un cas particulier de celle de l’argument précédent, où un des points est déplacé de façon à coïncider avec un sommet du triangle. Cependant, ainsi que nous l’avons vu, on peut toujours faire mieux si l’angle n’est pas de 120o . Mais il est impossible d’avoir quatre angles de 120o pour une jonction de quatre arêtes. Il en est de même pour une jonction de plus de quatre arêtes. La conclusion de ce raisonnement est que la seule possibilité est celle dessinée sur la figure 3.12.
F IGURE 3.12. Il y a deux trajets optimaux, mais aucun n’a la symétrie du carré. Les arêtes qui se rencontrent en un point à l’intérieur du carré font un angle 120◦ .
Remarquez la brisure spontanée de la symétrie, car les solutions ne vérifient pas la symétrie de rotation par des angles de 90o qui est celle du carré, même si certaines symétries par réflexion sont préservées. Comme la symétrie originale du carré a été brisée, la solution n’est pas unique. Chaque solution se déduit de l’autre solution par une rotation de 90o , à savoir la symétrie de rotation originale. Cela rappelle le modèle d’Ising, où chaque solution d’énergie minimale se déduit de l’autre solution par la symétrie Z/2. Une analogie physique de cette énigme est la suivante. Lorsque des bulles de savon se forment, elles minimisent l’aire de la bulle. Un cadre carré rigide plongé dans une eau savonneuse formera des bulles à des angles de 120o .
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
57
F IGURE 3.13. Trajets optimaux √ quand on remplace le carré par un rectangle. On obtient facilement la distance minimale dmin = 2(l 3 + L ).
Autre énigme. Nous avons le même dispositif que précédemment, mais les villes sont disposées aux sommets d’un rectangle : la hauteur du rectangle n’est pas égale à sa largeur. Quelle(s) serai(en)t la(les) solution(s) de distance minimale ? Qu’est-ce qui est différent entre cette énigme et la précédente ? Soution. Imaginons que la largeur du rectangle soit grande par rapport à sa hauteur. La solution semble alors différente : une ligne droite de gauche à droite qui se divise à chaque extrémité pour relier les deux villes. À mesure que nous diminuons la largeur jusqu’à la rendre presque égale à la hauteur, nous avons encore une solution unique. Lorsque largeur et hauteur deviennent exactement égales, nous observons une brisure de symétrie comme précédemment. Si nous diminuons encore la largeur de sorte qu’elle devient plus petite que la hauteur, alors nous récupérons une solution unique. L’origine des deux solutions de la première énigme, celle avec un carré, apparaît avec évidence. Le dispositif a une certaine « instabilité » avec deux solutions qui sont interchangées lorsque l’on passe du carré au rectangle en augmentant la largeur. 3.6
Brisure de symétrie et boson de Higgs
Qu’est-ce que la particule de Higgs et qu’a-t-elle à voir avec la brisure de symétrie ? Nous allons commencer cette discussion par des considérations un peu
58
Chapitre 3. Brisure de symétrie
techniques que certains lecteurs préfèreront omettre. Ceux d’entre-vous qui sont familiers avec l’opérateur laplacien ∇2 en trois dimensions ne seront pas surpris qu’il en existe aussi un dans l’espace à quatre dimensions, noté , (le signe (−) relatif entre la partie temps et espace est lié à la forme de la « distance » dans l’espace-temps : voir la note 5 du chapitre 2)
:=
3 ∂2 1 ∂2 1 ∂2 − − ∇2 , = ∑ c2 ∂t2 i=1 ∂x2i c2 ∂t2
où c est la vitesse de la lumière et ∇2 le laplacien. Les solutions de ce type d’équations sont des ondes se propageant à la vitesse de la lumière. Revenons au cas unidimensionnel pour simplifier ∂2 1 ∂2 − 2 φ(t, x) = 0 , c2 ∂t2 ∂x ce que nous pouvons récrire 1 ∂ 1 ∂ ∂ ∂ + − φ(t, x) = 0 . c ∂t ∂x c ∂t ∂x La solution la plus générale de cette équation pour φ est de la forme φ(t, x) = f ( x + ct) + g( x − ct) , où f et g sont des fonctions arbitraires. f ( x + ct) décrit une onde se propageant vers la gauche et g( x − ct) une onde se propageant vers la droite, toutes deux à la vitesse de la lumière. Et la particule de Higgs dans tout cela ? Au tout début de l’Univers, juste après le Big Bang, toutes les particules étaient de masse nulle et voyageaient à la vitesse de la lumière. On peut les considérer comme des ondes dont la propagation est régie par la version quadridimensionnelle du laplacien : φ = 0. Mais la théorie nous dit que, lorsque l’Univers s’est refroidi pendant une minuscule fraction de seconde, il est passé par une transition de phase analogue à une transition de phase magnétique, et une quantité hφi appelée valeur moyenne sur le vide du champ de Higgs a rempli tout l’espace. On peut penser à la transition de phase magnétique du modèle d’Ising : lorsque la température est très élevée, la valeur moyenne du spin hSi est nulle, mais hSi 6= 0 lorsque la température est en dessous du point de Curie. Les particules, y compris le boson de Higgs lui-même, ont acquis une masse grâce à un terme supplémentaire αi hφi. L’équation d’onde vérifiée par le champ Φi associé à la particule (i ) devient
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
59
( + (αi hφi)2 )Φi = 0 où αi dépend de la particule et mi = αi hφi est sa masse. Nous l’avons vu, hφi est l’analogue du spin moyen hSi, ou encore de la position de la bille au fond du culot de la bouteille de vin. Dans ce dernier cas, le seul point entièrement symétrique, celui qui est invariant par rotation, est le point φ = 0. Autrement dit, la symétrie est respectée seulement si hφi = 0. Cette situation correspond à des températures extrêmement élevées, celles qui régnaient au tout début du Big Bang. À ces températures, la valeur moyenne du champ de Higgs du vide est nulle et toutes les particules sont de masse nulle. Cette situation correspond à celle de la bille dans un bol de forme hémisphérique, sans aucune bosse au centre. Cependant, à mesure que l’Univers se refroidissait, il s’est produit une transition de phase : au lieu d’être nul en moyenne, la valeur moyenne de φ est devenue différente de zéro, hφi 6= 0 (voir la figure 3.14). La masse d’une particule (i) dépend à la fois de la force de son interaction avec le champ de Higgs, représentée par αi qui dépend de la particule, ainsi que de la valeur moyenne sur le vide hφi du champ de Higgs, dont l’analogue est la distance au centre du minimum du potentiel V (φ).
F IGURE 3.14. Le champ de Higgs est soumis à un potentiel V (φ) qui ressemble à une demi-sphère avec une bosse au centre. La brisure de symétrie oblige le champ à se trouver à un minimum du potentiel.
Revenons à la bille au fond du culot de la bouteille. Si l’on pousse légèrement la bille vers le sommet de la bosse et qu’on la lâche, elle va retomber et ensuite osciller. De même, on peut essayer de perturber légèrement le champ de Higgs et observer l’onde ainsi produite. Mais la mécanique quantique nous apprend que les particules ont un aspect ondulatoire. Ainsi, lorsque nous créons une onde avec un champ de Higgs, une particule lui sera associée que nous devrions pouvoir observer. C’est le boson de Higgs, qui a été observé en 2012 au collisionneur LHC du CERN à Genève. Comment devons-nous apprécier tout cela ? Le champ de Higgs, nous l’avons dit, est comme un océan invisible qui remplit tout l’espace avec une
60
Chapitre 3. Brisure de symétrie
valeur non nulle de hφi depuis que la température de l’Univers est devenue suffisamment basse. L’interaction des particules avec ce champ de Higgs est ce qui leur donne une masse. Comment être certain que cet océan existe réellement si l’on ne peut pas le voir directement ? Eh bien, vous pourriez tenter de « pincer » cet océan de façon telle que le champ de Higgs franchisse la bosse et retombe. Un manière de le faire serait de créer une collision de deux particules de très grande énergie, ce qui comprimerait une fraction minuscule de cet océan au point de collision : cela produirait une onde du champ de Higgs donnant naissance à une particule. Au Grand Collisionneur de protons au CERN, ou LHC, c’est exactement ce qui se produit : deux protons sont lancés l’un contre l’autre avec une énergie suffisante pour produire une particule de Higgs. C’est ce qui a été observé. Cette découverte capitale, annoncée au monde entier le 4 juillet 2012, a confirmé une prédiction faite presque 50 années auparavant. Les idées des théoriciens sur l’origine de la masse ont été finalement confirmées, et le dernier ingrédient du Modèle standard des particules, que l’on attendait mais qui n’avait pas encore été observé, fut enfin mis en évidence. Ce fut une partie d’un processus d’apprentisssage de longue haleine où les physiciens ont été progressivement amenés à reconnaître la puissance de la brisure de symétrie. La Terre est en mouvement, en dépit des arguments donnés il y a deux mille ans par des logiciens grecs qui avaient conclu, à partir d’arguments de symétrie, qu’elle devait être immobile. Nous avons pris conscience aujourd’hui de l’importance de la brisure de symétrie. En raison de cette brisure de symétrie, l’Univers n’est pas peuplé de particules de masse nulle volant à la vitesse de la lumière et qui ne pourraient jamais être ralenties pour former des étoiles, des planètes, des galaxies ou des trous noirs, ni aucun des ces objets extraordinaires que nous apercevons dans l’Univers, y compris nous-mêmes. 3.7
La grande unification des forces
Si nous nous trouvons plongés dans un environnement de brisure de symétrie, il est tout à fait possible que nous ne puissions pas imaginer qu’une symétrie se cache au coin de la rue. Si nous habitions par exemple le fond d’une vallée dont la forme soit semblable à celle du potentiel de Higgs, ou du culot de bouteille de la figure 3.3, il se pourrait que nous soyons tout à fait incapables d’apprécier l’existence d’une symétrie de rotation. C’est ce qui se passe lorsque nous envisageons la question des forces, ou interactions 4 . En plus de la gravitation, on 4
N.d.T. Nous utiliserons « forces » et « interactions » de façon interchangable. « Forces fortes » n’est pas très heureux en français, « interactions fortes » est préférable.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
61
connaît trois autres types d’interactions : les interactions électromagnétiques, les interactions fortes et les interactions faibles. Les forces électromagnétiques sont familières : ce sont elles qui sont à la base des phénomènes électriques et magnétiques, de la chimie, etc. Les interactions fortes qui lient les quarks dans les protons et les neutrons ne sont pas aussi faciles à appréhender. Les interactions faibles, responsables de la radioactivité β, sont aussi largement absentes de la vie de tous les jours, à moins de subir une scintigraphie ou d’aller se promener à l’intérieur d’une centrale nucléaire. Les constituants des protons et des neutrons, les quarks, sont soumis aux trois types de forces 5 . Les forces ont des intensités différentes, ce que l’on peut quantifier de la façon suivante. Nous fixons une échelle de distance typique de la physique des particules, par exemple 10−18 m. À cette distance correspond une énergie d’environ 1 TeV (téra-électron volt, soit 1012 eV) : en effet, si nous considérons un photon de longueur d’onde 10−18 m, son énergie sera de 1 TeV. Cette énergie n’a pas été choisie au hasard : elle correspond en ordre de grandeur à l’énergie des protons dans l’accélérateur le plus puissant au monde, le LHC 6 . Nous plaçons deux quarks à cette distance de référence de 10−18 m et calculons le rapport des trois types de forces s’exerçant entre ces quarks. Nous pouvons caractériser l’intensité de chacune des forces par une constante de couplage g2i . Le résultat de cette comparaison est 2 2 2 gfort ≫ gem ∼ gfaible .
La constante de couplage gem n’est autre que la charge e de l’électron. Ainsi ces interactions donnent l’impression d’être très différentes, au moins en ce qui concerne leurs intensités respectives. Cependant, si nous continuons à descendre l’échelle de distance, les constantes de couplage se modifient. Les charges semblent même converger vers une valeur unique à une distance de l’ordre de 10−31 m, ce qui correspond à une énergie de 1016 GeV, appelée MGUT , l’échelle de grande unification (voir la figure 3.15).
5
N.d.T. On rappelle que les protons et les neutrons sont formés de trois quarks. Les interactions gravitationnelles entre particules sont complètement négligeables par rapport aux trois autres interactions. 6
N.d.T. Il existe une relation entre pouvoir de résolution en distance et énergie des photons utilisés pour l’exploration. Un microscope ordinaire utilise des photons optiques, dont la longueur d’onde est de l’ordre du micromètre et l’énergie de 1 eV. Pour une meilleure résolution, il faut utiliser des longueurs d’onde plus petites, donc des énergies plus grandes. Ainsi un accélérateur de 1 TeV peut (en principe !) explorer des distances de l’ordre de 10−18 m.
62
Chapitre 3. Brisure de symétrie
F IGURE 3.15. La grande unification des forces : à des échelles de distance très petites, qui correspondent à des énergies très grandes, les constantes de couplage des trois forces deviennent égales, ce qui suggère une unification des forces. On a porté en ordonnées la quantité sans dimension g2 /(h ¯ c) où g est la constante de couplage, la généralisation de la charge électrique e aux deux autres interactions.
Ceci est appelé la grande unification des forces. En d’autres termes, à très haute énergie, la symétrie entre les forces est restaurée, alors qu’elle apparaît brisée à plus basse énergie. À très haute énergie, on observe l’unification des forces 7 !
7
Chacune des trois interactions est associée à un groupe de symétrie. Les interactions fortes sont associées à des rotations complexes dans un espace à trois dimensions, formant un groupe noté SU (3), les interactions faibles à des rotations complexes dans un espace à deux dimensions, formant un groupe noté SU (2), et les interactions électromagnétiques aux transformations de phase, un groupe noté U (1). En fait il y a un mélange des groupes SU (2) et U (1), qui unifie les interactions électromagnétiques et faibles en interactions électrofaibles, et le groupe de symétrie des interactions électrofaibles est SU (2) × U (1). Cependant, si nous nous plaçons à des distances de l’ordre de 10−31 m, les trois forces se rassemblent en un groupe unique. Le modèle le plus simple est dû à Georgi et Glashow, où le groupe d’unification est le groupe SU (5), le groupe des rotations dans un espace complexe à 5 dimensions. Le groupe SU (5) contient le groupe des interactions à basse énergie, qui est le produit des groupes SU (3), SU (2) et U (1) SU (5) ⊃ SU (3) × SU (2) × U (1) .
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
63
3.8
Supraconductivité
La supraconductivité fournit un autre exemple de brisure de symétrie. La supraconductivité est la propriété que possèdent certains matériaux, métaux ou alliages, de perdre toute résistance électrique en dessous d’une certaine température. Cela veut dire que si l’on établit un courant électrique dans un anneau fait d’un matériau supraconducteur, alors ce courant ne va jamais disparaître même si la source de courant est supprimée. Il se trouve que l’explication de cet effet est fondée sur le même potentiel que celui illustré par le culot de la bouteille de vin, que nous avons vu à l’œuvre dans le mécanisme de Higgs. L’analogue du champ de Higgs dans la supraconductivité est un nombre complexe ρ, dont la valeur absolue |ρ| est proportionnelle à la densité des électrons supraconducteurs 8 . On peut écrire ρ sous une forme module et phase ρ = |ρ| exp(iφ) , et |ρ| = A au minumum du potentiel. Le courant, dans un anneau supraconducteur, se présente sous forme d’unités discrètes, ou de quanta, que l’on peut voir comme le nombre d’enlacements au fond du puits de potentiel (voir la figure 3.16). La phase φ s’enroule n fois autour du potentiel à mesure que l’on tourne autour de la boucle circulaire paramétrée par l’angle θ de sorte que (n désigne un nombre entier) φ = nθ. Cette relation est nécessaire car le paramètre ρ doit avoir une valeur unique en un point donné : en particulier ρ doit retrouver la même valeur après un tour complet, θ → θ + 2π ρ(θ ) = ρ(θ + 2π ) . On montre que l’intensité I du courant doit être proportionnelle à n, I ∝ n. L’intensité du courant est donc proportionnelle au nombre d’enlacements de la phase. Ce nombre est entier, et sauter d’une valeur entière à une autre coûterait énormément d’énergie, tout comme le saut d’une aimantation +1 à une aimantation −1 dans le modèle d’Ising : c’est pourquoi, une fois le courant établi, il persiste pratiquement indéfiniment. Le courant I est stable parce qu’il apparaît sous forme quantifiée, sous forme de multiples entiers d’une quantité de base. Comme le courant s’enroule autour du fond du puits de potentiel ainsi qu’on le voit sur la figure 3.16, il faudrait passer au-dessus de la bosse de potentiel pour modifier le nombre d’enlacements, et 8
N.d.T. Dans un supraconducteur, une partie des électrons se groupe par paires, appelées paires de Cooper, et ce sont les électrons supraconducteurs, responsables de la supraconductivité.
64
Chapitre 3. Brisure de symétrie
F IGURE 3.16. La supraconductivité dans un anneau peut être vue comme conséquence du nombre d’enlacements de la phase d’un champ à mesure que nous tournons autour de la boucle circulaire au fond de son potentiel. Le courant est proportionnel au nombre d’enlacements de la phase et cette situation est extrêmement stable en raison de la barrière de potentiel.
cela coûterait de l’énergie. Réduire le nombre d’enlacements par exemple d’une unité coûte de l’énergie, et c’est la raison pour laquelle le courant, une fois établi dans l’anneau, tend à conserver sa valeur initiale. 3.9
Rigidité
Encore une autre exemple ? Si vous poussez une extrémité d’un objet solide, alors l’autre extrémité bouge. Vous trouvez sans doute cette observation banale ? En fait elle est tout à fait surprenante. D’une certaine façon, vous avez réussi à transporter une force d’un point à un autre. Que se passe-t-il ? Quelle est la physique sous-jacente qui le permet ? Les objets sont des cristaux. Le fait que les atomes aux nœuds de ces cristaux aient des positions fixes brise la symétrie de translation. Cette brisure de la symétrie de translation a comme conséquence la rigidité de l’objet. Une perspective générale est que nombre de phénomènes physiques, des plus banals aux plus sophistiqués, sont la conséquence d’un brisure de symétrie. 3.10
Chiralité
Une des propriétés qui nous échappe, si nous voulons nous placer du point de vue de la symétrie brisée, est la propriété de chiralité. Certaines particules ont une chiralité, un sens de rotation, ou une direction de leur spin, associé à leur mouvement de translation. Ainsi que nous l’avons expliqué, cela brise la symétrie de parité, la symétrie par rapport aux réflexions dans un miroir. Mais cela ressemble à une symétrie brisée « à la main », une brisure imposée de l’extérieur et qui n’est pas spontanée. Une solution plus élégante serait telle que la symétrie de parité ait existé au départ et qu’elle ait été spontanément brisée de
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
65
façon naturelle. Les théoriciens espèrent que dans une théorie complète comme la théorie des cordes, la chiralité émergera d’une symétrie spontanément brisée, ce qui serait plus élégant que d’imposer une brisure sans avoir vraiment une bonne raison pour le faire. Cette discussion rappelle l’énigme fondée sur les quatre villes disposées aux quatre coins d’un carré, lorsque les autoroutes ont déjà été construites. L’asymétrie dans la solution est due aux contraintes budgétaires, qui imposent de retenir seulement une des deux solutions : de même en physique, la contrainte d’énergie la plus basse impose de retenir seulement une solution.
Énigme 9 . On vous donne trois couteaux de longueur L et trois verres équidistants posés sur une table, formant un triangle équilatéral dont les côtés sont juste un peu plus grands que L (voir la figure 3.17). Trouver une configuration des couteaux et de verres capable de supporter une bouteille lourde.
F IGURE 3.17. Dans cette géométrie de couteaux et de verres, quelle configuration des verres et des couteaux sera capable de supporter une bouteille lourde ?
Solution. La solution doit briser la symétrie. Nous pouvons poser la bouteille sur la région triangulaire formée par les couteaux comme sur la figure 3.18. Cela engendre une chiralité, brisant la symétrie originale entre les trois verres. Énigme. Soit un étang circulaire de rayon R. Un canard se trouve au centre de l’étang. Un renard, qui ne sait pas nager, est assis au bord de l’étang et voudrait bien attraper ce canard pour son déjeuner. Le canard essaie de concevoir une stratégie pour atteindre le bord de l’étang, d’où il va pouvoir s’envoler et éviter d’être pris par le renard. Le renard se déplace x fois plus vite que le canard, avec 9
Partagée avec Brian Greene.
66
Chapitre 3. Brisure de symétrie
F IGURE 3.18. La géométrie des couteaux (les trois verres ne sont pas dessinés) supportant la bouteille brise la symétrie et introduit une chiralité.
x > 1. Est-ce que le canard va pouvoir s’échapper ? Et si oui, quelle stratégie doit-il adopter ?
Solution. La vitesse angulaire du renard qui court le long de la rive de l’étang avec une vitesse v est v/R. Soit r1 le rayon du cercle où le canard peut maintenir en nageant une vitesse angulaire plus grande que celle du renard. On a donc r1 < R/x. Cela veut dire que si le canard tourne sur le cercle de rayon r1 , il peut se déplacer de sorte que le renard se trouve à un certain moment sur le côté opposé de l’étang par rapport à sa position. Soit r2 le rayon tel que le canard peut s’échapper en ligne droite vers la rive en supposant que le renard est sur le point oppposé de la rive. Le canard doit parcourir une distance ( R − r2 ) tandis que le renard doit parcourir une distance πR. On doit donc avoir πR πR =⇒ r2 > R − . x x Si l’intersection des régions r1 et r2 est non vide, alors le canard peut s’échapper. Sinon le renard va l’attraper. La condition pour cette transition est R − r2
(π + 1), quelle que soit la façon dont le canard brise a symétrie, il sera attrapé. Finalement il ne nous reste qu’un intervalle limité pour x, 1 < x < (π + 1), où la brisure de symétrie peut sauver le canard !
68
Chapitre 3. Brisure de symétrie
4 La puissance des mathématiques simples et abstraites 4.1
Lois et contraintes
Dans la résolution des problèmes de physique, on est généralement confronté à deux types de données. On doit d’abord tenir compte des contraintes auxquelles est soumis le problème, ce que l’on appelle souvent des conditions aux limites. Cela inclut des facteurs imposés par l’environnement qui, à première vue, ne semblent pas vraiment de caractère fondamental. Considérons par exemple une boule de pétanque qui accélère sur un plan incliné. Sans rien connaître des lois de la physique, nous savons que la contrainte suivante nous est imposée : la boule doit se trouver quelque part sur ce plan incliné. C’est un exemple de contrainte dictée par l’environnement. De telles contraintes sont considérées comme un peu secondaires lorsque l’on veut décrire le mouvement et elles sont reléguées au chapitre « cinématique ». Ensuite il y a les lois physiques, telles que celles formulées par Newton ou Einstein, qui semblent de nature bien plus fondamentale. La « dynamique », par opposition à la cinématique, aborde la question des forces qui influencent le mouvement des objets et fait partie des lois physiques. Une partie de cette section va se focaliser sur ce qui semble à première vue le sujet un peu ennuyeux des contraintes en physique, mais nous espérons que la suite de ce chapitre va vous montrer que ce n’est pas nécessairement le cas. Certaines des idées que nous allons aborder peuvent se manifester de manière très profonde. Nous allons constater, à un niveau très fondamental, que la
distinction entre lois et contraintes s’estompe et que nombre de résultats que nous attribuons aux principes physiques émergent en fait de contraintes. D’un point de vue mathématique, nous allons considérer que la topologie joue un rôle analogue à celui de contraintes. La topologie décrit les aspects globaux et qualitatifs d’un espace, son aspect général, par opposition à la géométrie qui elle se plonge dans les détails de cet espace, par exemple les distances, les formes précises des objets, etc. La continuité, qui est un concept de base en topologie, est naturellement liée au fait que les lois de la physique sont continues. Si l’on modifie de très peu les données d’un problème, alors typiquement sa solution ne va pas changer de manière radicale 1 .
Énigme. 117 joueurs participent à un tournoi par élimination directe. Comment doit-on organiser le tournoi de sorte que l’on désigne le vainqueur avec un nombre minimum de parties ? Quel organigramme, au contraire, conduirait au nombre maximum de parties ? Solution. Il ne faut pas tomber dans le piège qui consisterait à établir un organigramme. Ce serait effroyablement compliqué et parfaitement inutile. La réponse est immédiate : il faut toujours 116 parties. La raison en est simple : chaque partie élimine un joueur et on doit en éliminer 116. Autrement dit, il faut toujours jouer 116 parties. C’est à la fois le nombre minimum et le nombre maximum de parties. Toute question sur l’organigramme du tournoi est nulle et non avenue. Ainsi ne vous laissez pas induire en erreur : ce sont les contraintes qui régissent le problème. Il est inutile d’essayer d’établir un organigramme qui associe les joueurs par paires, car la formulation originale de l’énigme est la solution. Énigme. Il y a 64 équipes dans un tournoi par double élimination : chaque équipe doit perdre deux fois pour être éliminée. Combien de parties faudra-t-il pour désigner le vainqueur ? Solution. Dans chaque partie il y a exactement un perdant. Chaque équipe doit perdre deux fois pour être éliminée. Il y a donc 63 équipes qui ont perdu deux fois et le vainqueur, soit perd une fois, soit ne perd jamais. Il peut donc y avoir soit 2 × 63 = 126, soit 2 × 63 + 1 = 127 parties. La formulation même de l’énigme permet, une fois de plus, de nous restreindre à un petit nombre de solutions. Énigme. Un tablette de chocolat se présente sous la forme d’une grille de 5 × 20 carrés (voir la figure 4.1). Deux joueurs coupent alternativement la tablette le long de ses bords, suivant une ligne horizontale ou verticale. Les coupes 1
Le chaos fait exception à cette règle : une modification infinitésimale des conditions initiales d’un problème dynamique peut générer une solution radicalement différente de la solution initiale.
70
Chapitre 4. La puissance des mathématiques simples et abstraites
F IGURE 4.1. Quelle stratégie pour gagner au jeu de la tablette de chocolat ? Le jeu implique deux joueurs qui découpent alternativement la tablette le long de ses bords et le dernier joueur à effectuer la dernière coupe possible l’emporte.
multiples, par exemple celles qui consisteraient à mettre des carrés les uns sur les autres ou celles où le couteau pourrait glisser le long de plus d’un morceau, sont interdites. Le dernier joueur capable d’effectuer une découpe conforme aux règles gagne. Quelle est la stratégie gagnante ?
Solution. Le premier joueur l’emporte toujours. Au départ il y a un morceau unique, à l’arrivée il y en a 100. Chaque découpe augmente le nombre de morceaux par exactement une unité. Le nombre de morceaux va de 1 à 99, et il y aura donc au total 99 découpes. C’est un nombre impair, de sorte que le premier joueur, quoiqu’il arrive, est celui qui effectuera la 99e découpe. Il est totalement inutile d’essayer de se représenter le déroulement du jeu. Les conditions originales, les contraintes, nous donnent la solution. 4.2
Un aperçu sur les nombres complexes
Avant d’aborder les énigmes suivantes, nous avons besoin de quelques notions de mathématiques sur les nombres complexes, que nous exposons ci-dessous. Les nombres complexes forment un ensemble noté C, que l’on peut se représenter comme l’ensemble des points du plan. En coordonnées polaires (r, θ ), où r = OM est la distance d’un point M du plan à l’origine O des coordonnées et θ l’angle entre l’axe horizontal et la direction de OM, tout nombre z ∈ C s’écrit comme (voir la figure 4.2), avec i2 = −1 z = r(cos θ + i sin θ ) = re iθ . Cette seconde représentation de z est appelée représentation en module (r) et phase (θ). Le complexe conjugué de z, z∗ , est z∗ = r(cos θ − i sin θ ) = re−iθ .
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
71
F IGURE 4.2. Le plan complexe.
z∗ est représenté dans le plan par le point symétrique de z par rapport à l’axe horizontal. Étant donné deux nombres complexes z1 = r1 exp(iθ1 ) et z2 = r2 exp(iθ2 ), leur produit est donné par z 1 z 2 = r 1 r 2 ei ( θ1 + θ2 ) . On remarque que zz∗ = r2 , et |z| = r n’est autre que le module de z. Démontrons maintenant un théorème sur les nombres complexes. La raison pour laquelle nous discutons ce théorème est que non seulement il illustre la puissance des arguments topologiques en mathématiques, mais qu’en plus il se transpose à des exemples physiques que nous allons rencontrer dans la suite de ce chapitre.
Le théorème fondamental de l’algèbre. Soit un polynôme f (z) de degré n en z dont les coefficients ai ∈ C et l’équation f (z) = 0 f ( z ) = z n + a n − 1 z n − 1 + · · · + a1 z + a0 = 0 a i ∈ C . Si n ≥ 1, alors cette équation possède une solution dans C. Une conséquence simple est qu’un polynôme de degré n dont les coefficients sont dans C possède exactement n racines, les solutions de f (z) = 0, pourvu que chaque solution soit comptée avec sa multiplicité 2 . Ce théorème fondamental explique l’ubiquité des nombres complexes, parce que le théorème n’est pas vrai pour les nombres réels : si l’on prend les coefficients ai ∈ R, alors l’équation f ( x) = 0 n’a pas en général de solution dans x ∈ R, où R est l’ensemble des 2
N.d.T. Une solution a est dite de multiplicité p si, au voisinage de z = a, f (z) ∝ (z − a) p .
72
Chapitre 4. La puissance des mathématiques simples et abstraites
nombres réels. Comment allons-nous démontrer ce théorème ? Supposons que f (z) = 0 n’ait aucune solution. Nous allons montrer que cette hypothèse conduit à une contradiction. Si f (z) n’avait pas de racines alors on pourrait construire la fonction f ( z) , g( z) = | f (z)| p où | f (z)| est le module de f (z), | f (z)| = f (z) f ∗ (z). Comme le numérateur de la fraction ci-dessus n’est jamais nul par hypothèse, la fonction g(z) est définie et continue ∀z ∈ C. La fonction g(z) a été construite de sorte que son module est l’unité : | g(z)| = 1 ∀z ∈ C. Autrement dit, les points représentatifs de g(z) se trouvent sur le cercle unité. Par conséquent, lorsque nous faisons varier z, nous avons une application g
du plan complexe tout entier sur le cercle de rayon unité, C → S1 : voir la note 5 du présent chapitre. Considérons un cercle du plan complexe de rayon suffisamment grand pour que le terme en zn l’emporte sur tous les autres termes : f (z) ≃ zn . Dans ces conditions, g(z) ≃ zn /|z|n = exp(inθ ). La conclusion est que pour des cercles de rayon suffisamment grand, la fonction g est une application d’un très grand cercle sur un cercle de rayon unité et que g enlace le cercle unité n fois, parce que lorsque θ varie entre 0 et 2π, g varie de 1 à exp(2iπn) (voir la figure 4.3).
F IGURE 4.3. Le théorème fondamental de l’algèbre peut être démontré en utilisant un argument topologique simple fondé sur la conservation du nombre d’enlacements.
Observons que l’application g est continue. Comme elle s’enroule n fois autour du cercle unité pour des très grands cercles (|z| → ∞) et que g varie continûment dans le plan complexe, le nombre d’enlacements, qui est un entier, ne peut pas varier car il devrait sauter d’une unité au moins de façon discontinue. Par conséquent il doit rester égal à n lorsque l’on diminue le rayon du cercle jusqu’au moment où ce rayon devient proche de zéro : z ≃ 0. Mais dans ces conditions g(z) ≃ g(0) = a0 . Quand le rayon du cercle s’est rétréci le nombre d’enlacements de g(z) s’annule, ce qui correspond à un point unique g(0) sur le
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
73
cercle et à n = 0. Par conséquent, l’hypothèse que f (z) n’avait pas de racines, jointe à la continuité de f (z), conduit à une contradiction. Nous devons donc admettre que f (z) = 0 a au moins une solution. En fait, nous savons que f (z) = 0 possède n solutions, et qu’à chaque solution correspond un enlacement qui permet au nombre n d’enlacements de varier d’une unité. Le nombre d’enlacements saute d’une unité à chaque solution de f (z) = 0, car le dénominateur dans la définition de g(z) s’annule, une autre façon de voir que f (z) = 0 possède n solutions. Pour compléter la démonstration, supposons que la solution z = a soit la solution de module maximum. Nous pouvons alors définir la fonction f (z) = f (z)/(z − a) qui est un polynôme de degré (n − 1) et répéter le raisonnement précédent pour f (z). Lorsque la racine z = a est de multiplicité p, on divise f (z) par (z − a) p . Cela permet de démontrer par récurrence que f (z) possède en fait n racines.
Énigme. Considérons la température T le long de l’Équateur sur la sphère terrestre. On suppose que T est une fonction continue de la position sur l’Équateur. Montrer qu’à tout instant il existe au moins deux points diagonalement opposés sur l’Équateur qui ont exactement la même température. Vous n’avez besoin d’aucune connaissance en géographie ou en thermodynamique. Solution. Soit θ la longitude d’un point sur l’Équateur. On définit la fonction T˜ (θ ) = T (θ ) − T (θ + π ) , qui est la différence de température entre un point sur l’Équateur et le point diamétralement opposé. Si T˜ (θ ) = 0 pour une valeur de θ, alors nous avons trouvé une solution. Sinon, observons que la fonction T˜ (θ ) vérifie T˜ (θ + π ) = − T˜ (θ ), de sorte que si pour une valeur θ = θ0 T˜ (θ0 ) 6= 0 (par exemple T˜ (θ0 ) > 0), alors cette fonction est négative pour θ = θ0 + π. Par conséquent T˜ (θ ) doit s’annuler entre θ0 et θ0 + π en raison de la continuité de la fonction T (θ ) et parce que T˜ (θ0 ) et T˜ (θ0 + π ) sont de signe opposé (voir la figure 4.4). Cet énoncé est très surprenant. Pourtant il est la simple conséquence de considérations de topologie et de continuité élémentaires.
Énigme. Un moine gravit une montagne de sa base au sommet entre 8 h 00 du matin et 8 h 00 du soir. Le jour suivant il descend de 9 h 00 du matin à 7 h 00 du soir. Montrez qu’il y a un instant où il se trouve exactement au même point à exactement la même heure que le jour précédent. Solution. Si vous dessinez le graphe donnant l’altitude du moine en fonction du temps pour sa montée et sa descente, vous constatez que les trajets doivent se croiser quelque part (voir la figure 4.5). Si les graphes ne se coupent pas, cela veut dire que le moine n’est pas redescendu et qu’il est urgent d’envoyer les 74
Chapitre 4. La puissance des mathématiques simples et abstraites
F IGURE 4.4. La différence de température T˜ entre un point sur l’Équateur et le point diamétralement opposé change de signe quand nous allons du point initial au point diamétralement opposé. La température du point et celle du point diamétralement opposé sont les mêmes lorsque T˜ s’annule.
F IGURE 4.5. Le moine va se trouver à la même altitude qu’au jour précédent à un certain point, ainsi qu’on peut le voir par continuité de la courbe donnant l’altitude en fonction du temps.
secours ! Une autre façon de raisonner est d’imaginer qu’un deuxième moine refait exactement le trajet du premier moine le jour précédent, et il est clair qu’ils vont se croiser car l’un monte et l’autre descend.
Énigme. On généralise l’énigme sur les températures équatoriales : est-ce que l’on peut trouver sur la Terre un point où la température et la pression soient identiques à celles du point aux antipodes, juste maintenant ? Solution. La réponse est à nouveau positive. L’argument est un peu plus complexe que celui sur l’Équateur ; il repose sur la continuité et le fait que le nombre d’enlacements ne peut pas changer continûment. Considérons la fonction à valeur vectorielle formée du couple ( T, P), ~f (~x) = ( T (~x), P(~x)), où T est la L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
75
température, P la pression et ~x désigne un point sur la surface de la Terre. Considérons la fonction ~g(~x) = ~f (~x) − ~f (−~x). Cette fonction s’annule si température et pression sont égales au point ~x et au point antipodal −~x. Supposons que cela n’arrive jamais et montrons que cette hypothèse conduit à une contradiction. Si ~g(~x ) ne s’annule jamais, alors nous pouvons diviser par sa norme et définir le vecteur de module unité
~g(~x ) =
~f (~x) − ~f (−~x) . ||~f (~x) − ~f (−~x)||
Cette expression définit une application de la sphère sur le cercle unité parce que ||~g (~x)|| = 1. Considérons une foliation de cercles le long de parallèles (voir la figure 4.6). Comme ~g est une fonction continue, l’image des cercles se contractant au pôle Nord doit se contracter en un point, donc le nombre d’enlacements est nul. Par conséquent, en raison de la continuité, le nombre d’enlacements doit rester nul y compris le nombre d’enlacements du cercle correspondant à l’Équateur.
F IGURE 4.6. Lorsque nous nous déplaçons du point A vers le point B sur l’Équateur, la fonction (normalisée) ~g(~x ) passe d’un point sur le cercle au point diamétralement opposé. Le nombre d’enlacements de ~g(~x ) lorsque l’on passe de A à B est (n + 1/2).
Mais examinons l’image de l’Équateur par ~g(~x). L’image du demi-cercle entre les points A et B est une ligne dont le nombre d’enlacements est de la forme (n + 1/2), où n est un entier. Le facteur 1/2 vient de ce que ~g(~x) = −~g(−~x), et donc les images de A et de B sur le cercle doivent être diamétralement opposées. Si nous revenons ensuite de B vers A, nous obtenons exactement l’opposé de la première partie. Par conséquent l’image de l’Équateur lui-même possède un nombre d’enlacements 2(n + 1/2) = 2n + 1, et comme c’est un nombre impair, il ne peut pas être nul. Nous arrivons à une contradiction car la continuité nous donnait zéro. Ce qui précède est un copié-collé de notre démonstration antérieure du théorème fondamental de l’algèbre : la division par ||~g || n’est pas
76
Chapitre 4. La puissance des mathématiques simples et abstraites
autorisée et ~g doit avoir un zéro. Les contraintes, dans ce cas la géométrie de la sphère et la continuité, sont suffisantes pour obtenir la réponse.
Énigme. Étant donné un courbe fermée dans un plan et un point quelconque sur cette courbe, est-il possible de tracer une droite passant par ce point qui divise l’aire délimitée par la courbe en deux parties dont les aires sont égales ? Voir la figure 4.7.
F IGURE 4.7. Est-ce que vous pouvez diviser la surface en deux parties de même aire en traçant une droite passant par un point sur la courbe ?
Solution. La réponse est positive. Pour le montrer, on calcule la différence entre les aires sur le côté droit de la droite et le côté gauche en fonction de l’angle θ que fait la droite avec la courbe. Pour θ = 180o , cette fonction change de signe puisque la droite devient la gauche et vice-versa. Il en résulte que si la fonction est positive sur un des côtés de la droite et négative de l’autre côté, nous savons par continuité qu’il doit y avoir un angle pour lequel la fonction est nulle. C’est précisément pour cet angle que les deux aires sont égales. Énigme. Étant donné deux courbes fermées, est-il possible de tracer une droite qui divise simultanément l’aire délimitée par chacune des deux courbes en deux aires égales ? Voir la figure 4.8.
F IGURE 4.8. Est-ce que vous pouvez diviser simultanément les surfaces délimitées par chacune des deux courbes en deux parties de même aire en traçant une droite qui les traverse ?
Solution. La réponse est à nouveau positive. Prenons un point sur une des deux courbes, traçons une droite passant par ce point et contraignons cette droite L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
77
à diviser la surface délimitée par cette première courbe en deux parties d’aire égale. C’est possible d’après l’énigme précédente. Déplaçons le point sur la première courbe en maintenant la division en deux aires égales. Nous considérons ensuite la différence entre les deux aires de chaque côté de la droite pour la surface délimitée par la seconde courbe. Quand nous atteignons le point antipodal sur la première courbe, c’est-à-dire le point qui est exactement à l’opposé de celui dont nous sommes partis, cette différence va à nouveau changer de signe, passant de positive à négative ou vice-versa. En raison de la continuité, il doit exister un point intermédiaire où cette différence s’annule, un point où les aires délimitées par les deux courbes et la droite sont égales ( voir la figure 4.8).
Énigme. Cette énigme utilise le fait qu’il existe des intervalles arbitrairement grands entre nombres entiers où l’on ne trouve pas de nombre premier. Rappelons qu’un nombre premier est un entier qui n’est divisible que par lui-même et un. Pour se convaincre de la propriété énoncée ci-dessus, notez que la série k! + 2, k! + 3, · · · , k! + k
k! = k × (k − 1) × (k − 2) · · · × 2 × 1 ,
donne (k − 1) entiers successifs qui ne sont pas premiers : en effet, (k! + n), n ≤ k, est divisible par n parce que n divise à la fois k! et n. Montrez que vous pouvez trouver un entier N tel qu’il y ait exactement 13 nombres premiers entre N et N + 1000.
Solution. L’argument repose sur l’idée simple de continuité discrète, que nous allons expliquer. Soit p( N ) le nombre de nombres premiers entre N et N + 1000. On remarque qu’entre 1 et 1001 il y a plus de 13 nombres premiers, et donc que p(1) > 13. Observons aussi que p( N + 1) diffère de p( N ) d’au plus une unité. Comme nous savons que pour M suffisamment grand nous avons p( M ) = 0, en raison de l’intervalle arbitrairement grand entre nombres premiers, p( M ) décroît de 13 à 0 lorsque nous atteignons M. Par continuité discrète, il en découle que p( N ) = 13 quelque part entre 1 et N, ce que nous voulions montrer. 4.3
Lentilles gravitationnelles
Einstein nous a fourni une explication géométrique de la gravitation. Au lieu de penser la gravitation comme une force attractive entre objets massifs, ce qui était l’idée de Newton, Einstein a fondé la gravitation sur la notion de courbure. La présence de masses, nous dit-il, oblige littéralement l’étoffe de l’espace-temps à se courber et à se déformer. La courbure de l’espace-temps affecte la trajectoire des objets environnants et rend compte de ce que nous appelons la gravitation. Pour rendre plus concrète cette idée, considérons deux points sur une sphère. Il existe un trajet le plus court, ou trajet géodésique, sur la sphère entre ces
78
Chapitre 4. La puissance des mathématiques simples et abstraites
F IGURE 4.9. En général il existe un unique chemin le plus court entre deux points sur une sphère, mais une infinité de tels chemins si les deux points sont antipodaux.
deux points (voir la figure 4.9). Bien que ce trajet ne soit pas une ligne droite au sens de la géométrie euclidienne, c’est le plus court chemin sur la sphère. Pour déterminer ce chemin, nous l’avons vu, on trace sur la sphère le grand cercle qui passe par ces deux points. Mais il y a des exceptions : le chemin géodésique n’est pas unique si les deux points sont aux antipodes, cas où il existe une infinité de chemins géodésiques. Pour trouver dans tous les cas le chemin géodésique, on part du point initial et on continue suivant une direction fixe avec comme objectif le point d’arrivée, et dans tous les cas ce chemin sera un grand cercle. Sur d’autres surfaces les possibilités peuvent être multiples. Par exemple sur un tore il y a deux plus courts chemins entre deux points diamétralement opposés sur une section droite du tore (voir la figure 4.10).
F IGURE 4.10. Sur un tore il y a deux plus courts chemins entre deux points diamétralement opposés sur une section droite du tore.
La théorie d’Einstein prédit que la lumière suit toujours une géodésique de l’espace-temps 3 . La courbure de l’espace-temps implique que ces géodésiques ne sont pas des droites dans l’espace euclidien (ou plus exactement dans l’espace de Minkowski). La théorie nous dit que le Soleil, en tant qu’objet massif, doit courber les rayons lumineux. Cette prédiction de la relativité générale 3
N.d.T. Ainsi que nous l’avons vu, une géodésique peut aussi correspondre à un trajet de distance maximale. C’est le plus souvent le cas en relativité générale, où la distance est donnée par la métrique de l’espace-temps : voir la note 5 du chapitre 2.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
79
fut la seconde prédiction expérimentalement vérifiée de la théorie d’Einstein, la première ayant été l’avance du périhélie de Mercure. La courbure des rayons lumineux fut observée en 1919 par Arthur Eddington et ses collaborateurs au cours d’une éclipse de Soleil. Mais cela pose une question intéressante : est-il possible dans certaines situations physiques d’observer des géodésiques multiples et donc des images multiples d’un seul objet ? En effet, une géodésique est un minimum (ou un maximum) local : une petite déformation du trajet autour de la géodésique doit toujours donner un trajet plus long (ou plus court si la géodésique correspond à un maximum de la distance.) Rien ne s’oppose donc en principe à l’existence de plusieurs géodésiques entre deux points. Même s’il était conscient de la possibilité théorique d’images multiples, Einstein ne pensait pas probable qu’elles puissent être observées. Mais en 1979 des astronomes de l’Université de l’Arizona observèrent le premier exemple de lentille gravitationnelle : ils observèrent deux images du même quasar, connu sous le nom de Quasar jumeau ou Quasar double, grâce à un effet de lentille gravitationnelle dû à une galaxie située entre ce quasar et la Terre. Depuis les exemples de telles images se sont multipliés. Nous allons montrer dans la section suivante que l’effet de lentille gravitationnelle doit en principe toujours donner un nombre impair d’images. Mais il peut arriver que certains trajets de la lumière soient bloqués pour des raisons diverses, et c’est ce qui s’est passé pour cette première observation. Les astronomes peuvent alors voir un nombre pair d’images. De façon générale, en supposant qu’aucun rayon lumineux n’est bloqué, le nombre d’images est toujours impair. Si le nombre d’images est (2n + 1), où n est un entier, alors n images sont inversées : leur orientation est inversée. Pour justifier l’énoncé ci-dessus, il semble que nous ayons besoin d’une connaissance détaillée et approfondie de la théorie de la relativité générale d’Einstein, qui est bâtie sur un arsenal mathématique assez impressionnant de géométrie différentielle et d’équations aux dérivées partielles. Cependant, nous allons le montrer, nous aurons seulement besoin de savoir que la théorie d’Einstein respecte la continuité 4 . Avant de passer au vif du sujet, nous devons introduire un peu de mathématiques que le lecteur novice peut omettre en pref
mière lecture. Soit f une application d’un espace X sur un espace Y, X → Y, en nous restreignant à des applications continues entre des espaces eux-mêmes continus. Introduisons la notion de degré de l’application, notion qui joue une rôle clé dans l’argument qui va suivre. 4
N.d.T. On exclut les situations de gravitation très intense (trous noirs, etc.) qui peuvent conduire à des singularités.
80
Chapitre 4. La puissance des mathématiques simples et abstraites
f
Une définition un peu cavalière du degré de l’application X → Y est le nombre de points (ou pré-images) de X qui sont appliqués sur un point (ou image) de Y. En termes plus rigoureux, nous pourrions définir le degré sous la forme suivante : pour y ∈ Y, le degré de y est le nombre de valeurs de f −1 (y). Exemple : l’application 5 de S1 → S1 définie par θ → nθ, n entier, est de degré n. Cependant des complications peuvent survenir. Considérons une applicaf
tion entre deux cercles concentriques, S1 → S1 , qui applique le cercle extérieur sur le cercle intérieur, sauf que ce cercle extérieur a été un peu déformé : c’est toujours une courbe fermée, mais il présente un petit pli, comme sur la figure 4.11. Les lignes radiales définissent une application de la courbe extérieure vers le cercle intérieur. Aux endroits d’intersection des lignes radiales et des plis, l’application est 3 → 1 plutôt que bijective, 1 → 1. Mais on peut revenir à une application de degré 1 si l’on prend en compte le fait que les pré-images ont des orientations différentes, car on peut leur associer un signe, + ou −, ainsi qu’on le voit sur la figure 4.11, où un signe − est associé au point du milieu sur la ligne radiale tandis qu’un signe + est associé aux deux autres points. Ce signe est associé au sens de parcours suivi par le point et son image : le sens de parcours du point du milieu est inverse de celui de son image, et il est identique pour les deux autres points. Deux pré-images de signe opposé s’annulent et l’application reste de degré 1.
F IGURE 4.11. L’application est définie comme une application de la courbe en pointillés sur le cercle en trait plein en suivant des lignes radiales. Une application de degré 1 peut présenter une forme non standard qui se referme sur elle-même, ce qui donne naissance à plusieurs pré-images, trois dans le cas de la figure. Pour intégrer ce phénomène, nous devons prendre en compte également l’orientation de la pré-image.
Il reste cependant un problème : il existe des points tels que le nombre de pré-images est pair lorsque deux pré-images de signe opposé fusionnent et sont sur le point de s’annuler. Cela ne peut se passer que pour un ensemble discret 5
Une sphère de dimension n est notée S n : S1 désigne donc un cercle, S2 une sphère ordinaire à deux dimensions comme la sphère terrestre, etc.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
81
F IGURE 4.12. Le degré de l’application qui régit le trajet de la lumière depuis une étoile (ou une galaxie) jusqu’à un observateur terrestre est toujours égal à 1. Sur la figure de gauche, en l’absence de matière sur le trajet, le degré est à l’évidence 1. Quand on ajoute de la matière sur le trajet entre l’étoile et l’observateur, l’application change mais son degré reste égal à 1. Il ne peut pas sauter d’une unité en raison de la continuité. Par conséquent le nombre d’images, en tenant compte de l’orientation, est toujours égal à 1.
de points et nous pouvons l’éviter par une petite perturbation autour du point considéré 6 . Revenons maintenant au problème des rayons lumineux. Rappelons que nous supposons que rien ne vient bloquer le trajet de la lumière entre son émission quelque part dans l’espace et sa détection sur la Terre. Nous allons reformuler le problème en le transformant en un problème de comptage du degré d’une application. Soit une étoile (ou une galaxie) dont nous observons l’image sur la Terre. Dessinons une sphère de très grand rayon dont le centre est l’étoile et passant par l’observateur. Dessinons aussi une sphère toujours centrée sur l’étoile et juste assez grande pour contenir l’étoile (voir la figure 4.12). Considérons l’application de la petite sphère sur la grande sphère obtenue en traçant le chemin des rayons lumineux. Cette application existe parce que nous avons supposé qu’aucun rayon lumineux n’est bloqué, de sorte que tout rayon peut partir à l’infini et rencontrer la grande sphère en un point, et elle est continue parce que les lois de la relativité générale sont continues. Nous sommes particulièrement intéressés par le degré de cette application. Imaginons que nous supprimons graduellement toutes les masses entre l’étoile et l’observateur. Dans ces conditions, les chemins lumineux sont des droites, et l’application devient l’application identité S2 → S2 , qui a degré 1 (la figure de gauche de 4.12). Imaginons ensuite 6
f
La définition générale du degré est la suivante : si f est une application, X → Y, nous associons un signe ± aux multiplicités de la façon suivante. Dans un voisinage du point considéré, f induit f
une application R n → R n . Le signe associé à l’un quelconque de ces points est celui du jacobien de la transformation.
82
Chapitre 4. La puissance des mathématiques simples et abstraites
que nous « rallumons » graduellement les masses. En raison de la continuité des lois de la physique quand on change continûment les paramètres, le degré de l’application va rester égal à 1. Comme le degré final est 1, cela veut dire qu’il doit y avoir un nombre pair de pré-images. Cela veut aussi dire que si nous comptons les pré-images avec un signe + pour les images correctement orientées et − pour les images renversées, nous devons obtenir 1. Le nombre de pré-images est de la forme (2n + 1), avec n images d’orientation négative. Remarquez que nous n’avons pas utilisé autre chose que la continuité des équations d’Einstein ! La leçon de cet exercice est la suivante : des problèmes de physique apparemment difficiles peuvent être résolus en invoquant un minimum de physique, ou même pas de physique du tout. Nous devons nous demander si des énoncés de physique ne sont pas avant tout une conséquence de la topologie, qui est ici considérée comme une contrainte, et certains énoncés ne sont pas fondés sur les détails des lois physiques.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
83
5 Mathématiques contre-intuitives 5.1
Préliminaires
Pour le meilleur et pour le pire, nous avons nos habitudes. Les expériences qui nous ont marqué inspirent notre comportement et donnent des couleurs à nos perceptions. Parfois cette expérience est source de sagesse, mais il peut aussi arriver que nous véhiculions des idées erronées. Quand il s’agit d’un problème de mathématiques, il est possible que nous l’abordions avec des idées préconçues sur ce que doit être la solution. Bien que l’intuition soit souvent utile, elle peut parfois nous égarer. Un simple raisonnement mathématique peut suffire à nous remettre sur le droit chemin. L’exemple suivant montre ce qui peut arriver quand notre intuition déraille.
Une blague. Un mathématicien, un physicien et un ingénieur essayent de démontrer que tous les nombres impairs sont des nombres premiers. Le mathématicien : « 3 est impair et premier. 5 est impair et premier. 7 est impair et premier. Par récurrence, tous les nombres impairs sont premiers ». Le physicien : « 3 est impair et premier. 5 est impair et premier. 7 est impair et premier. 9 est impair mais n’est pas premier : c’est une erreur expérimentale. 11 est impair et premier. 13 est impair et premier, etc. ». L’ingénieur : « 3 est impair et premier. 5 est impair et premier. 7 est impair et premier. 9, qui est 10 ± 1 est impair, est aussi premier, etc. ». Énigme. Imaginons qu’un géant ait enroulé une ceinture serrée autour de l’Équateur. On ouvre la ceinture, on la rallonge d’un mètre et on la remet en place. À quelle hauteur au-dessus de la Terre se trouve la ceinture ? Est-ce que vous
pouvez glisser un journal ou même un gros livre entre la ceinture et la surface de la Terre ? Ou un gratte-ciel ?
Solution. L’idée la plus naïve est que la ceinture va se soulever de façon infime et que vous ne pourrez même pas glisser une feuille de papier à cigarettes. Cette idée fortement suggérée par l’intuition est fausse. Si l’on imagine soulever la ceinture rallongée d’un mètre de façon uniforme au-dessus de la Terre, la nouvelle circonférence sera (2πR + 1) mètres, où R est le rayon de la Terre. Le rayon du cercle formé par la ceinture est (2πR + 1)/2π = R + 1/2π, qui se trouve être de 16 cm plus grand que R. Bien que 16 cm soit petit, c’est très grand par rapport à ce que l’on attend intuitivement et on peut largement glisser un journal et même un gros livre entre la ceinture et la surface. La surprise sera encore plus grande lorsque nous considérons la situation où l’on ajoute toujours un mètre à la ceinture, mais on ne la soulève pas de la même façon dans toutes les directions. Quelle serait la plus grande extension possible ? L’idée la plus naïve serait de prendre un point de la ceinture et de le soulever autant que c’est possible. Cela permettrait de soulever un point de la ceinture d’un demi-mètre en pliant en deux le mètre supplémentaire. Il se trouve cependant que soulever en un seul point conduit à une hauteur bien plus grande au-dessus de la surface. Obtenir le résultat exige un petit calcul de trigonométrie que le lecteur peut choisir d’omettre. Supposons que la ceinture s’écarte de la surface sur une ouverture angulaire 2θ (voir la figure 5.1). Comme on peut le
F IGURE 5.1. La ceinture est soulevée en un point conduit à une altitude de 121 mètres au-dessus de la surface, bien que nous ayons seulement allongé la ceinture d’un mètre.
86
Chapitre 5. Mathématiques contre-intuitives
voir sur la figure, le mètre supplémentaire de la ceinture est égal à ε = 2R tan θ − 2Rθ, et la hauteur au-dessus de la surface est h = R/ cos θ − R. Comme l’angle θ est petit on peut utiliser des approximations du type tan θ ≃ θ + θ 3 /3, ce qui permet d’éliminer l’angle θ et de trouver une relation entre ε et h 1 h = R1/3 2
3ε 2
2/3
.
On remarque que dh/dε ∝ ε−1/3 → ∞ lorsque ε → 0. Autrement dit, le rapport de la longueur gagnée h à la longueur ajoutée ε explose lorsque la longueur ajoutée tend vers zéro. Si R est égal au rayon de la Terre et ε = 1 mètre, alors h = 121 m, ce qui est vraiment contre-intuitif. La statue de la Liberté passerait largement en dessous de la ceinture ! Nous pouvons essayer de rendre ce résultat plus intuitif par l’argument suivant : rappelons d’abord le résultat bien connu selon lequel le cercle est la courbe de longueur donnée qui délimite la surface la plus grande. Ainsi, si nous déformons légèrement un cercle, son aire va très peu changer. Plus exactement la modification de l’aire sera du second ordre dans la modification. Ce que nous avons fait dans la solution précédente est de prendre l’aire entre la ceinture et le rayon terrestre de la première solution et de la placer dans un coin étroit de la ceinture. C’est la raison pour laquelle nous avons obtenu une altitude aussi importante.
Énigme. Choisissons n points quelconques sur un cercle et joignons-les par des segments de droite. Cela divise l’intérieur du cercle en plusieurs régions. La question est : combien de régions différentes obtenons-nous pour une valeur de n donnée ? Par exemple nous obtenons 2 régions pour n = 2, 4 pour n = 3, etc. Existe-t-il une formule générale ? Solution. Pour les 5 premières valeurs de n nous obtenons 2, 4, 8 et 16, ce qui suggère la réponse 2n−1 . On pourrait même être tenté par le raisonnement suivant : chaque nouveau point crée des lignes supplémentaires qui divisent toute région pré-existante en deux, et le nombre de régions doit doubler chaque fois que nous ajoutons un point. Il y a malheureusement une difficulté de taille avec ce raisonnement, c’est qu’il est faux. Pour n = 6, il y a 31 régions, pas 32. De même pour n = 7 nous L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
87
obtenons 57 régions au lieu de 64. Le résultat général, exprimé en termes de coefficients du binôme Cnk est Cnk =
1 + Cn2 + Cn4
n! . k!(n − k)!
Essayons d’interpréter ces trois termes. Si n = 0, il n’y a aucune ligne et une seule région. Pour chaque ligne additionnelle, nous obtenons une nouvelle région, ce qui explique Cn2 parce qu’il y a autant de lignes que de paires de points. Cependant, à chaque groupe de 4 points correspond un point d’intersection additionnel qui ajoute une région, ce qui explique le facteur Cn4 . Vous pouvez vérifier qu’il n’y a pas d’autres pathologies. Nous avions initialement été induits en erreur et piégés par la solution « évidente » 2n−1 , parce qu’elle est tellement simple et qu’elle marche jusqu’à n = 5. Juste en visualisant ce schéma, et aussi parce que vérifier devient de plus en plus difficile lorsque n augmente, nous avons été tentés de croire que ce schéma serait indéfiniment valable. En d’autres termes, l’expérimentation est importante mais, si elle est limitée, elle risque de nous induire en erreur. C’est une bonne leçon, en particulier pour les physiciens ! On peut se demander s’il existe une autre explication au fait que nous nous sommes égarés sur une fausse piste. Soit l’identité valable pour n pair 1 + Cn2 + Cn4 + Cn6 + · · · + Cnn = 2n−1 . Pour n impair, le dernier terme est Cnn−1 . On peut prouver ce résultat grâce au développement du binôme de (1 + 1)n = 2n et de (1 − 1)n = 0. Jusqu’à n = 5, la formule ci-dessus est en accord avec la réponse au problème de division du cercle, et cela explique le résultat 2n−1 valable jusqu’à n < 6. Mais pour n ≥ 6 le résultat exact dévie de notre anticipation naïve. Finalement, non seulement nous avons trouvé la solution au problème, mais en plus nous avons pu comprendre l’endroit où nous nous étions initialement trompés.
Énigme. Combien de régions distinctes obtenez-vous dans le plan en traçant n ≤ 3 droites quelconques ? Question suivante : combien de régions distinctes obtenez-vous dans l’espace à trois dimensions en considérant n ≤ 4 plans ? Plus généralement, considérez n ≤ (d + 1) hyperplans de dimension (d − 1) dans un espace de dimension d. Solution. La réponse est min( d,n )
∑
Cni .
i =0
88
Chapitre 5. Mathématiques contre-intuitives
Essayons de développer une intuition de ce résultat pour des petites valeurs de d. Si d = 2, un hyperplan n’est pas autre chose qu’une droite. Une droite divise le plan R2 en 2 régions, 2 droites en 4 régions, mais 3 droites en 7 régions, et non 8. Si d = 3, un hyperplan est un plan ordinaire. Un plan divise R3 en 2 régions, 2 plans en 4 régions, 3 plans en 8 régions, mais 4 plans en 15 régions, et non 16. À la limite d → ∞, c’est juste 2n , ∀n. Pour d fini, ce sera 2n seulement si n ≤ 2. C’est un exemple de situation que l’on rencontre souvent en physique. Il arrive souvent que des expressions se simplifient dans certaines limites. Dans le cas ci-dessus, la simplification a lieu pour d → ∞.
5.2
Les paradoxes de l’infini
L’infini est un concept qui à la fois a intrigué et semé la confusion dans l’histoire de l’humanité. Le philosophe de la Grèce antique Zénon d’Élée a énoncé un certain nombre de paradoxes dont au moins neuf nous sont parvenus et semblent conduire à des résultats absurdes. Mais plus de 2400 années après Zénon d’Élée, la notion d’infini recèle encore bien des mystères. Il est bien connu que l’ensemble des nombres entiers positifs, N, est infini. Entre deux entiers quelconques on trouve une infinité de nombres rationnels qui s’expriment comme le quotient p/q de deux nombres entiers. L’ensemble des nombres rationnels est désigné par Q. Intuitivement, nous aurions tendance à penser qu’il y a bien plus de nombres dans Q que dans N. Mais notre intuition nous joue un tour, car on peut établir une correspondance biunivoque, une bijection, entre les nombres de Q et ceux de N, ce qui montre que les deux ensembles ont le même nombre d’éléments. Le nombre total d’éléments de Q, ou cardinalité de Q, est égal à celui de N. Pour le montrer, imaginons que nous représentions les nombres rationnels p/q, où p et q sont premiers entre eux, sur un réseau et que nous « enroulions » en spirale les nombres entiers autour de ce réseau, p en abscisses et q en ordonnées, comme indiqué sur la figure 5.2. Nous voyons que si nous commençons à compter les points du réseau, en éliminant les points qui ne sont pas définis, soit parce que q = 0, soit parce que p/q n’est pas une fraction irréductible, nous obtenons une bijection entre Q et N. Considérons maintenant l’ensemble des nombres réels R et l’ensemble des points du plan, R2 . Ces ensembles ont manifestement un nombre infini d’éléments, mais on pourrait penser que le second en a plus que le premier. Pourtant ils ont la même cardinalité. Une façon de définir une bijection est de prendre le développement décimal d’un nombre réel x, 0 < x < 1, x = 0, x1 x2 x3 · · · , de L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
89
F IGURE 5.2. Il y autant d’entiers positifs que de nombres rationnels. Nous pouvons le voir en enroulant en spirale les entiers positifs et en associant un entier positif à chaque paire d’entiers.
former une paire y = 0, x1 x3 x5 · · · et une seconde paire z = 0, x2 x4 x6 · · · . À chaque x ∈ R on associe de façon biunivoque une paire (y, z) ∈ R2 . Ce n’est pas encore une démonstration complète parce que nous avons seulement prouvé la bijection entre les points d’un segment de droite [0, 1] et ceux d’un carré de côté unité, mais il est facile de compléter la preuve. On montre qu’il y plus de nombres réels que de nombres entiers 1 , mais y a-t-il des ensembles de cardinalité intermédiaire ? Cette question est liée à l’hypothèse du continu, qui affirme qu’il n’y a aucun ensemble de ce type. Cette hypothèse ne peut être prouvée, et on ne peut pas non plus prouver qu’elle est fausse. Autrement dit, nous pouvons ajouter l’hypothèse du continu comme axiome supplémentaire sans rencontrer de contradiction. Nous pouvons aussi prendre l’hypothèse inverse. Il existe un théorème fondamental de logique mathématique, le théorème d’incomplétude de Gödel. Ce théorème affirme qu’il existe toujours des énoncés dont il est impossible de prouver qu’ils sont vrais ou qu’ils sont faux à l’intérieur d’un système d’axiomes donné. Un physicien pourrait s’inquiéter de ce que les lois de l’Univers que l’on peut découvrir ne soient jamais complètes. Il est possible, selon le théorème d’incomplétude de Gödel, que ni la réalité physique, ni la validité de certains phénomènes physiques, ne puissent être établies en partant d’un système d’axiomes donné. Mais ce n’est pas un sujet d’actualité en physique, bien qu’il puisse le devenir un jour lorsque nos théories seront plus mûres et qu’elles nous conduiront aux frontières de la vérité ! 1
N.d.T. Supposons que nous ayons rangé les nombres rationnels dans l’intervalle [0, 1], x1 , x2 , · · · , x q , · · · , ce qui est possible en raison de la bijection entre Q et N. Écrivons le déveq q q q loppement décimal de x q , x q = 0, x1 x2 · · · xq · · · . Le nombre 0, x11 x22 · · · xq · · · ne fait pas partie de notre rangement des nombres rationnels et il y a donc plus de nombres réels que de nombres rationnels.
90
Chapitre 5. Mathématiques contre-intuitives
Le problème de l’hôtel de Hilbert. Un exemple fameux qui fait appel à la notion d’infini est le problème théorique de l’hôtel de Hilbert. Énigme. Un hôtel possède un nombre infini de chambres numérotées par un entier : 1, 2, 3, · · · . Un voyageur demande une chambre, mais on lui dit que toutes les chambres sont occupées. Est-ce que le voyageur peut proposer une solution ? Et que se passe-t-il si un nombre infini de voyageurs numérotés 1, 2, 3, · · · , se présente ? Existe-t-il une solution pour tous les loger ? Solution. Si un seul voyageur se présente, il suggère que chaque occupant change de chambre, l’occupant de la chambre n prenant la chambre (n + 1). Cela libère la chambre 1. Si un nombre infini de voyageurs arrive, chaque occupant de la chambre n est déplacé à la chambre 2n, ce qui libère un nombre infini de chambres de numéro impair. Ce type de paradoxe a une application amusante en physique. Rappelezvous l’exemple de la « mer de Dirac », où un nombre infini d’électrons occupe les états d’énergie négative. Il est concevable que tous les électrons changent de niveau simultanément en passant dans le niveau d’énergie immédiatement supérieur (voir la figure 5.3). En mécanique quantique, on peut effectivement créer des électrons en déplaçant vers le haut l’ensemble des niveaux d’énergie. De même, si tous les électrons se déplacent vers le bas par un niveau d’énergie, il nous reste un « trou » chargé positivement, un positron. Il faut prendre au sérieux les pathologies, ou plus exactement les paradoxes, mathématiques, qui
F IGURE 5.3. Après un changement des niveaux d’énergie vers le haut, les états de la mer de Dirac se déplacent vers le haut et un électron est créé dans le processus !
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
91
ne sont pas obligatoirement sans signification car ils peuvent éventuellement modéliser la réalité !
Énigme. Mathématiques contre-intuitives. Supposez que vous devez prendre chaque jour deux types de pilules, A et B, une de chaque type. Les pilules ne peuvent pas être distinguées à l’œil nu. Un jour vous mélangez accidentellement deux pilules B et une pilule A. Comment allez-vous prendre votre traitement sans perdre de pilule ? Solution. Prenez une pilule A et mettez-la avec les trois pilules douteuses. Ensuite divisez chaque pilule en deux, en séparant avec soin les moitiés en deux tas distincts. Vous avez alors deux tas, chacun avec la dose correcte. Énigme. Vous assistez à une fête et il y a en tout cinq couples. Chaque personne serre la main 2 uniquement aux personnes qu’elle ne connaît pas. Il se trouve que chaque personne autre que votre partenaire a serré un nombre différent de mains. Combien de mains votre partenaire a-t-il serrées ? Solution. Chaque personne serre au maximum 8 mains (elle se connaît ainsi que son(sa) partenaire). Il y a 9 possibilités pour le nombre de poignées de main et 10 personnes en tout, et votre partenaire doit avoir serré le même nombre de mains qu’un autre participant de la fête. Une personne des 4 autres couples doit avoir serré 8 mains et une autre 0 main. La personne qui a serré 8 mains l’a fait avec tous les invités, sauf son(sa) partenaire. Ainsi cette personne doit être en couple avec celle qui n’a serré aucune main. De la même façon nous pouvons former les paires (7,1), (6,2) et (5,3). Toutes les personnes citées ci-dessus ont serré un nombre de mains différent. Cela laisse une possibilité unique : vous et votre partenaire avez serré 4 mains. 5.3
Séries analytiques
Les mathématiciens sont intéressés par le problème suivant : est-il possible de donner un sens à l’énigme énoncée ci-dessous, qui se présente aussi en physique ? Comme introduction, essayons de prouver que 1 + 2 + 22 + 23 + 24 + · · · = −1. Soit x = 1 + 2 + 22 + 23 + 24 + · · · . Il est facile de voir que si vous multipliez la série par 2 et que vous ajoutez 1, alors vous retrouvez la même série. Autrement 2
N.d.T. La version anglaise de ce livre a été écrite avant la pandémie du COVID-19. Serrer des mains est bien sûr fortement déconseillé aujourd’hui.
92
Chapitre 5. Mathématiques contre-intuitives
dit vous avez 2x + 1 = 1, dont la solution est x = −1. Ce résultat contre-intuitif est pourtant, en un certain sens, correct. Nous pouvons en effet être mathématiquement plus précis en utilisant la notion de prolongement analytique. Rappelons la série géométrique infinie 3 ∞ 1 ∑ xn = 1 − x . n =0 Le membre de gauche de cette équation n’a de sens que pour | x| < 1, mais nous pouvons utiliser le membre de droite pour donner un sens à la série infinie même si | x| > 1. Cette procédure est appelé le prolongement analytique du membre de gauche de la série. Comme autre exemple, prenons la somme de tous les entiers strictement positifs 1 1+2+3+4+··· = − . 12 Le fait que ceci soit négatif et fini est à nouveau contre-intuitif. Nous pouvons définir un prolongement analytique, appelé fonction ζ (s) de Riemann, définie comme suit ∞ 1 ζ ( s) = ∑ s . n n =1 Cette fonction est définie dans le plan complexe en s lorsque la partie réelle de s est plus grande que 1 (Re s > 1), mais elle peut être prolongée en une fonction unique dans le plan complexe en s, exactement comme dans le cas de la série géométrique ci-dessus. Il se trouve que ce prolongement analytique obéit à ζ (−1) = −1/12. Cela « justifie » la valeur que nous avons attribuée à la somme des entiers strictement positifs. À nouveau cette équation pointe le bout de son nez en physique, en fait dans la détermination du nombre de dimensions d de l’espace-temps dans lequel vit la corde bosonique, qui est donnée par l’équation
( d − 2) 3
1 ∞ n 2 n∑ =1
!
= −1 =⇒ d = 26.
N.d.T. Rappelons l’identité N
∑ n =0
xn =
1 − x N +1 , 1−x
ce qui démontre l’identité du texte principal lorsque | x | < 1 et N → ∞.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
93
C’est l’origine de la dimension 26 de l’espace-temps dans la théorie des cordes bosoniques 4 . En physique, les singularités peuvent surgir sans crier gare, et parfois nous ne sommes pas bien équipés pour les traiter. Mais nous pouvons les contourner et trouver que l’on peut leur donner une signification en des points bien identifiés. C’est dans ces conditions que l’analyse complexe est utile aux physiciens théoriciens. Quand nous rencontrons ces séries divergentes, nous essayons de procéder par prolongement analytique, ce qui veut dire que nous voyons apparaître des fonctions comme la fonction ζ, qui font sens même dans les régions où on ne s’attendrait pas à ce que ce soit le cas. Parfois la façon de prolonger analytiquement peut ne pas être unique, mais si plusieurs méthodes convergent vers le même résultat, il y a une chance que celui-ci soit correct et utilisable dans une théorie physique.
Énigme. Soit un objet familier, une feuille de papier à lettres. Vous disposez d’une paire de ciseaux et vous voulez découper cette feuille de sorte qu’elle reste d’un seul tenant, mais que votre corps puisse passer au travers. Est-ce possible ? 4
Remarque technique sur les supercordes et les groupes. Les supercordes fermioniques vivent dans un espace-temps de dimension d = 10. C’est une valeur particulière parce que cela veut dire que d − 2 = 8. Nous verrons ultérieurement pourquoi cette valeur de 8 joue un rôle spécial. Une notion qui s’est révélée cruciale en physique est celle de groupe, étroitement reliée à celle de symétrie. Examinons d’abord les groupes discrets, par exemple les réflexions, ou les rotations d’un angle de 2π/n. Par exemple les rotations de π/2 autour de son centre qui laissent un carré invariant forment un groupe. De la même façon, les symétries d’un polygone régulier forment un groupe. Existe-t-il des symétries analogues en dimension 3 ? Le groupe SO(3) est formé des matrices réelles 3 × 3 de déterminant +1 qui obéissent à M T M = MM T = I, où M T désigne la matrice transposée et I l’opération identité. Ces matrices ont la propriété de préserver la longueur, et plus généralement le produit scalaire. Pour deux vecteurs v et w de R 3 , le produit scalaire est donné par
hv, wi = v T w = v1 w1 + v2 w2 + v3 w3 , où les vi et wi sont les composantes de deux vecteurs. Si M ∈ SO(3), alors
h Mv, Mwi = v T M T Mw = v T w, ce qui montre l’invariance du produit scalaire. De la même façon, on peut considérer les rotations dans un espace à 8 dimensions et le groupe SO(8) correspondant. Le nombre 8 est ici tout à fait particulier : en effet, on observe un phénomène qui ne se produit dans aucune autre dimension. En dimension d, il existe des spineurs, généralisant ceux de Dirac, dont la dimension est 2d/2−1 lorsque d est pair. Le groupe SO(d) agit sur sur des vecteurs de dimension d. En général, 2d/2−1 6= d, mais si d = 8 quelque chose de particulier se produit : 2d/2−1 = d ! Cette coïncidence est directement liée au fait que les théoriciens des supercordes pensent que le monde est de dimension d − 2 = 8, ce qui explique le résultat d = 10 pour la dimension de l’espace-temps. C’est relié de façon intime à l’existence de la supersymétrie dans les supercordes.
94
Chapitre 5. Mathématiques contre-intuitives
F IGURE 5.4. Découpage d’une feuille de papier.
Solution. Vous pourriez supposer que la feuille est de dimension limitée et qu’il n’y a pas de moyen de la rendre suffisamment grande. Pourtant on peut y arriver, ainsi que vous pouvez le voir, en coupant la feuille le long des lignes indiquées sur la figure 5.4. Ceux d’entre vous qui ont trouvé ce résultat surprenant, contraire à leur intuition, ont pu être induits en erreur en oubliant que l’aire et le périmètre sont des choses différentes, dont les échelles ne correspondent pas. C’est analogue à la façon dont certains d’entre vous auront pu être piégés par le problème de la ceinture autour de l’Équateur. Énigme. 100 pièces de monnaie sont dispersées dans une pièce obscure. 90 montrent le côté pile et 10 le côté face. Il est impossible de distinguer (par la vue ou toucher) le côté de la pièce. Comment allez-vous rassembler les pièces en deux tas qui contiennent le même nombre de face ? Solution. Il n’est pas nécessaire que les tas contiennent le même nombre de pièces ! Prenez 10 pièces au hasard pour faire un tas et ensuite retournez les pièces dans ce tas. Le nombre de face dans ce tas de 10 pièces est maintenant égal au nombre de face dans l’autre tas de 90 pièces. Vous êtes peut-être surpris que ce problème qui semblait difficile ait une solution aussi simple. Pour voir que la solution est correcte, supposons que nous ayons N face dans le tas de 10 pièces. Comme il y a initialement un total de 10 face, il doit y avoir (10 − N ) face dans le tas de 90 pièces. Quand vous retournez les 10 pièces du petit tas, les N face dans ce tas deviennent des pile, et donc (10 − N ) pile deviennent des face. C’est exactement le nombre de face du grand tas. Des mathématiques élémentaires confirment la solution. L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
95
F IGURE 5.5. La corne de Gabriel : un volume fini mais une aire infinie.
Énigme. Soit la courbe y = 1/x, pour x allant de x = 1 jusqu’à x = +∞. Si vous faites tourner cette courbe autour de l’axe Ox vous obtenez une surface appelée « corne de Gabriel » (voir la figure 5.5). Quel volume d’eau pouvez vous verser dans le vase formé par cette corne ? De quelle quantité de peinture avez-vous besoin pour la peindre ? Solution. Il est impossible de peindre la surface car son aire A est infinie. En effet cette aire se calcule par p Z ∞ 2π 1 + (dy/dx)2 A= dx = +∞ , x 1 tandis que le volume V du vase formé par la corne est fini Z ∞ π
dx = π . x2 Ce résultat contre-intuitif nous interroge sur ce que nous entendons par « peindre » quelque chose. Physiquement, cela veut dire recouvrir avec une épaisseur de peinture fine et positive, mais mathématiquement l’épaisseur tend vers zéro. Ainsi le volume et l’aire ne peuvent pas vraiment être comparés. Ce sont comme des pommes et des oranges. V=
5.4
1
Le paradoxe du hall de Monty
Énigme. Vous participez à un jeu où votre hôtesse a placé un bijou dans une de trois boîtes fermées. On vous demande de choisir une des boîtes. Une fois ce choix effectué, mais sans avoir ouvert la boîte que vous avez choisie, l’hôtesse ouvre une des deux boîtes que vous n’avez pas choisies, et elle sait que le bijou ne s’y trouve pas. Elle vous donne alors l’option de modifier votre choix. Avezvous intérêt à le faire ou non ? Solution. Votre intérêt est de modifier votre choix. En effet, votre probabilité initiale d’un choix correct était 1/3. La probabilité d’un choix correct après modification est 1 − 1/3 = 2/3. Nombre de personnes trouvent ce résultat contreintuitif, parce qu’il semble a priori que la probabilité d’un choix correct soit 96
Chapitre 5. Mathématiques contre-intuitives
de 1/2. Une part de cette intuition a pour source la psychologie : nous sommes réticents à faire confiance au jeu et nous résistons naturellement au changement. Une partie de cette réaction vient évidemment d’une application erronée de la théorie des probabilités. Pour rendre la situation plus intuitive, supposons que nous ayons 100 boîtes au lieu de 3. L’hôtesse ouvre 98 boîtes dont elle sait qu’elles sont vides après votre choix initial. Est-ce que vous n’allez pas changer en faveur de la boîte qui reste ? Dans ce cas il devrait être évident, même sans calcul, que vous avez intérêt à changer. Après tout, il est très peu probable que votre choix initial, une boîte parmi 100, ait une probabilité de plus de 1/100 ! Voici un exemple absurde de la façon dont la psychologie, et une application erronée de la théorie des probabilités, peut nous induire grossièrement en erreur. Alors que l’on construisait le grand accélérateur du CERN, le LHC, quelqu’un affirma que le LHC avait une probabilité de 50 % de détruire la Terre en créant un trou noir qui avalerait toute notre planète, voire même tout le Système solaire. L’argument était fondé sur le raisonnement suivant : soit le LHC va détruire la Terre, soit il ne le fera pas, et donc chacune des deux possibilités a une probabilité de 50 % 5 .
Énigme. Pouvez-vous tracer dans le plan une courbe où on ne peut pas inscrire de carré ? On pense que c’est impossible, d’après la conjecture de Toeplitz, mais la réponse n’est pas connue avec certitude. Otto Toeplitz énonça ce problème en 1911 et prouva la conjecture dans le cas particulier où la courbe est continue par morceaux. Autrement dit, dans le cas d’une courbe continue fermée sans auto-intersections, nous pouvons toujours inscrire un carré. Au premier abord, cet énoncé est surprenant, mais on peut argumenter ainsi : il est possible de choisir le premier sommet du carré sur la courbe et ensuite de décider de la longueur du carré et de l’orientation de l’angle nécessaires pour intégrer les trois autres sommets. Il y a suffisamment de degrés de liberté pour que la conjecture soit satisfaite (voir les figures 5.6 et 5.7). Les énigmes logiques sont souvent contre-intuitives. Voici un exemple. Énigme. On annonce à un condamné à mort qu’il sera exécuté la semaine prochaine entre lundi et vendredi. On lui annonce aussi qu’il ne sera pas informé à l’avance du jour de son exécution, mais qu’il le sera seulement à 10h00 le matin même de son exécution. Le condamné en conclut qu’il ne sera pas exécuté. Quel était son raisonnement ? 5
Walter L. Wagner est suppposé avoir tenu ce raisonnement sur The Daily Show. Wagner a attaqué en justice, Sancho vs US Department of Energy et al., plainte qui a été rejetée, apparemment pour une raison de vote. Voir http://www.nytimes/com/2008/03/29/science/29collider.html
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
97
(a)
(b)
F IGURE 5.6. (a) On choisit un point sur la courbe et on trace deux droites perpendiculaires. (b) On fait trourner les deux segments de droite jusqu’au moment où ils sont de même longueur.
(c)
(d)
F IGURE 5.7. (c) On complète le carré défini par les deux segments de droite. Malheureusement le sommet du carré ne se trouve pas sur la courbe. (d) On répète le processus pour les quatre points sur la courbe, et on finit par trouver un carré inscrit dans la courbe. Ceci montre la conjecture de Toeplitz pour une courbe continue fermée sans intersections.
Solution. S’il devait être exécuté le vendredi, alors il devrait être capable de le déduire le jeudi, parce que c’est le dernier jour où il pourrait être exécuté. Comme cela va à l’encontre de ce qui lui a été promis, il sait qu’il ne sera pas exécuté le vendredi. En reprenant le raisonnement, il sait qu’il ne sera pas non plus exécuté le jeudi. Et par récurrence aucun des autres jours de la semaine, tant que la promesse est respectée. Satisfait de ce raisonnement, le condamné était persuadé qu’il n’allait pas mourir. Cependant il fut exécuté le mardi et il ne l’avait pas su un jour à l’avance. 98
Chapitre 5. Mathématiques contre-intuitives
Il n’aurait pas pu prédire le jour de son exécution. Les conditions qu’on lui avait promises avaient été respectées, et le condamné eut une fin imprévue, bien qu’attendue. Voici un autre exemple : considérons les nombres complexes. On ne peut pas trouver de solution réelle à l’équation x2 = −1, et les mathématiciens sortent de leur chapeau un nouveau nombre, i, tel que i2 = −1 par définition. Nous pouvons définir les nombres complexes comme des paires de nombres réels avec la règle de multiplication
( x1 , y1 ) × ( x2 , y2 ) = ( x1 x2 − y1 y2 , x1 y2 + x2 y1 ) . Si l’on essaie de résoudre ( x, y) × ( x, y) = (−1, 0), on trouve x = 0, y = 1, soit dans la notation introduite précédemment, r = 1, θ = π/2. Cela ressemble à une arnaque, mais il se trouve que bien des constructions mathématiques sont très contre-intuitives. La construction du zéro, des nombres négatifs ou des nombres fractionnaires et des nombres réels a une histoire assez semblable. Les nombres complexes sont fondamentaux en physique moderne, tout particulièrement en mécanique quantique 6 . Voici encore un exemple. Les surfaces dites orientables sont dessinées dans un espace à trois dimensions, et elles sont topologiquement équivalentes à des sphères à g trous. Dans le cas d’une surface orientable, soit un système de coordonnées ( x, y) sur la surface et une coordonnée z perpendiculaire à la surface, orientée par la règle du tire-bouchon. Si vous promenez ce sytème d’axes partout sur la surface et revenez à votre point de départ, l’orientation du système d’axes ne change pas. Au contraire, dans le cas d’une surface non orientable, il peut arriver que l’orientation des axes soit inversée. L’exemple le plus simple de surface non orientable est le ruban de Möbius, que vous obtenez de la façon suivante : découpez un ruban de papier rectangulaire et collez les deux extrémités du ruban (voir la figure 5.8). Si vous ne tordez pas le ruban, vous obtenez un cylindre. Mais si vous le tordez de 180o avant de coller, vous obtenez un ruban de Möbius. Si vous faites le tour du ruban de Möbius en promenant un système d’axes, il est facile de voir que l’orientation du système d’axes a changé lorsque vous revenez au point de départ. Certaines surfaces non orientables ne peuvent même pas être plongées dans un espace à trois dimensions. Une de ces surfaces est la bouteille de Klein. Imaginez que vous construisez un tore en enroulant un ruban de papier rectangulaire suivant sa petite dimension pour 6
Comment se fait-il que les nombres complexes interviennent en physique ? Quel est le sens d’un nombre complexe de pommes ou d’oranges ? Le résultat physique final est toujours exprimé sous forme de nombres réels, même en mécanique quantique. Mais les nombres complexes sont un intermédiaire indispensable dans les calculs.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
99
F IGURE 5.8. Le ruban de Möbius. Pour obtenir cet objet, on découpe un ruban de papier et on colle les deux extrémités du ruban après avoir effectué une torsion de 180o . Si l’on trace un système d’axes sur un point de la ligne pointillée et que l’on lui fait faire un tour complet du ruban pour revenir au point de départ, on constate que l’orientation du système d’axes est inversée. Le ruban de Möbius est une surface non orientable.
en faire un cylindre, et que vous ajustez ensuite les bords du cylindre (voir la figure 5.9). Dans la seconde étape, au lieu de coller, nous pouvons faire la chose suivante : nous inversons l’orientation des bords avant de les coller. Au lieu d’un tore, nous obtenons alors une bouteille de Klein. Une leçon importante est que de tels objets ne peuvent pas toujours être plongés sans auto-intersection dans un espace à trois dimensions (voir la figure 5.10). Pratiquer ces objets pendant quelque temps aide à se représenter ce qui se passe dans des dimensions plus élevées. Par exemple, si vous avez un plan de dimension 7 et un autre de dimension 8 dans un espace à 10 dimensions, leur intersection sera en général un espace à 5 dimensions. Vous pouvez raisonner en vous inspirant des dimensions plus basses. En dimension 2, deux droites se coupent en général en un point, de dimension zéro : 1 + 1 − 2 = 0. En dimension 3, une droite de dimension 1 et un plan de dimension 2 se coupent aussi en un point : 1 + 2 − 3 = 0. De même deux plans en dimension 3 se coupent suivant une droite : 2 + 2 − 3 = 1. Par analogie, nous en déduisons la réponse à la question de départ : 7 + 8 − 10 = 5. La leçon de ce qui précède est qu’en appliquant notre raisonnement à des objets familiers, nous pouvons parfois en
100
Chapitre 5. Mathématiques contre-intuitives
F IGURE 5.9. Selon la façon dont on colle les deux côtés opposés d’un rectangle on obtient un tore (figure de gauche) ou une bouteille de Klein (figure de droite).
F IGURE 5.10. Une bouteille de Klein plongée, autant que faire se peut, dans un espace à trois dimensions. Alors que ce plongement est problématique en raison de l’autocroisement, cette bouteille est un objet mathématique parfaitement bien défini.
déduire la réponse à des questions sur des objets qui le sont moins. Mais, en fin de parcours, il faut bien évidemment confirmer ce raisonnement par une démonstration rigoureuse.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
101
Énigme. En réponse à une question, vrai ou faux ?, Alice a une chance sur 10 de donner la bonne réponse et Bob 7 chances sur 10. Qui allez-vous choisir pour vous aider à répondre ? Solution. La bonne stratégie est évidemment de sélectionner Alice et de choisir la réponse opposée, ce qui vous donne la bonne réponse dans 9 cas sur 10. Énigme. Un groupe de personnes sur un île possède des yeux dont les couleurs sont assorties. Elles maîtrisent parfaitement la logique et si elles peuvent déduire une conclusion de façon logique, elles vont l’appliquer immédiatement. Personne ne connaît la couleur de ses propres yeux. La vie sur l’île étant très inconfortable, tous les insulaires ne demandent qu’à la quitter. Chaque soir à minuit un ferry accoste sur l’île. Tous les insulaires qui ont été capables de déterminer la couleur de leurs yeux quittent l’île et les autres restent. Chaque individu peut voir tous les autres à tout instant et garde le décompte du nombre d’individus qu’il voit avec la couleur de leurs yeux, en dehors d’eux-mêmes, mais les insulaires ne peuvent pas communiquer entre eux. Chaque individu sur l’île est parfaitement au courant de ces règles. Sur l’île il y a 100 individus aux yeux bleus, 100 aux yeux noirs et une jeune femme gourou qui se trouve avoir les yeux verts. Ainsi chaque individu aux yeux bleus peut voir 100 individus aux yeux noirs et 99 aux yeux bleus (et un aux yeux verts), mais cela ne lui donne pas la couleur de ses propres yeux. Avec l’information dont il dispose, il pourrait y avoir 101 individus aux yeux noirs et 99 aux yeux bleus. Ou 100 paires d’yeux noirs, 99 paires de bleus et il pourrait avoir lui-même des yeux noisettes. On permet au gourou de parler et une fois à midi, un seul jour de leur séjour sans fin sur l’île. Debout face aux insulaires elle annonce : « Je vois des yeux bleus ». Qui quitte l’île et quelle nuit ? Solution. Au 100e jour, 100 individus aux yeux bleus vont quitter l’île ! Si vous considérez le cas où il y a un seul individu aux yeux bleus, il est clair qu’il va quitter l’île la première nuit parce qu’il sait que c’est de lui et seulement de lui que le gourou a parlé. Il regarde autour de lui et comme il ne voit personne d’autre avec des yeux bleus, il quitte l’île. S’il y a deux personnes avec des yeux bleus, ils vont se regarder l’un l’autre. Ils vont alors se dire : « Si je n’ai pas les yeux bleus, alors cet individu est la seule personne aux yeux bleus. Et si c’est la seule personne aux yeux bleus, alors il va partir ce soir ». Ils attendent et constatent qu’aucun des deux ne quitte l’île. Chacun des deux peut alors conclure qu’il a les yeux bleus et quitte l’île le deuxième soir. La récurrence peut continuer jusqu’à 99 individus, lorsque ceux-ci auront apppris qu’ils ont des yeux bleus. Ils attendront donc 99 jours, verront que le reste des insulaires n’est pas parti, et le 100e soir ils vont tous quitter l’île. 102
Chapitre 5. Mathématiques contre-intuitives
Énigme. Ce problème d’anniversaires est un classique de probabilités non intuitives. Dans un groupe de n personnes, quelle est la probabilité que deux d’entre elles aient la même date d’anniversaire ? Solution. Pour n = 23, la probabilité est d’environ 50 %. Pour n = 50, elle est d’environ 97 %. C’est une probabilité élevée de façon surprenante. En effet, la probabilité que deux personnes n’aient pas la même date d’anniversaire est 365 × (364) × · · · × (365 − n + 1) (365)n et la probabilité que deux personnes aient une même date est donc de 1−
365 × (364) × · · · × (365 − n + 1) . (365)n
Les probabilités sont souvent contre-intuitives. Mais la situation n’est pas désespérée : de nombreux problèmes tels que celui que nous venons de traiter deviennent familiers, et avec un peu de temps et de pratique, nous pouvons améliorer notre intuition. Développer l’intuition est tout aussi crucial en physique qu’en mathématiques. C’est exactement ce à quoi nous allons nous atteler.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
103
6 Intuition physique 6.1
Physique intuitive
Après notre incursion dans les mathématiques contre-intuitives, revenons à l’intuition en physique. Une bonne partie de l’intuition physique est innée, mais on peut aussi la cultiver. Les physiciennes et les physiciens adoreraient développer leur intuition jusqu’au au point où elles (ils) seraient capables de répondre rapidement à des questions de physique sans avoir recours à des calculs sophistiqués, lesquels serviraient uniquement à raffiner et rendre quantitatifs les résultats intuitifs. Richard Feynman était célèbre pour son intuition rapide et brillante. Mais cette intuition n’était pas innée. Il en avait acquis l’essentiel à partir de calculs mathématiques détaillés qu’il avait effectués. Une fois ces calculs effectués, il revenait sur ses pas et se demandait s’il aurait pu prévoir le résultat sans même écrire une seule ligne de calcul. Dans bien des cas, il arrivait à trouver des explications intuitives simples pour des résultats qui avaient à l’origine exigé un investissement important en calculs difficiles. Ainsi l’intuition ne lui est pas venue gratuitement. Mais la fois suivante où il rencontrait un problème analogue, il n’avait pas à fournir un effort aussi important dans des calculs. Il pouvait utiliser son intuition pour « deviner » les réponses à des questions non triviales. Il est important de garder à l’esprit que physique intuitive n’est pas équivalent à physique triviale. La physique n’apparaît triviale que si vous regardez le problème sous le bon angle. C’est ce qui peut aussi se passer avec des énigmes intéressantes. Il peut arriver que vous passiez beaucoup de temps sur la solution d’une énigme, sans avoir la moindre idée de la façon d’aborder le
problème. Celui-ci vous semble impossible, jusqu’au moment où votre cerveau s’illumine et vous met sur une nouvelle piste, laquelle rend soudainement le problème bien plus accessible. La réorientation mentale exigée pour résoudre l’énigme est souvent non triviale, bien que la solution, une fois effectué le basculement nécessaire, soit parfois très simple. C’est pourquoi résoudre des énigmes est en pratique très utile pour aborder des problèmes de physique, et réciproquement. Les stratégies fructueuses dans un domaine peuvent se révéler efficaces dans l’autre et vice-versa. 6.2
Galilée
Au moment où Galileo di Vincenzo Bonaulti de Galilei étudiait les lois du mouvement, il y avait déjà eu maintes discussions philosophiques sur le sujet. Aristote, par exemple, avait avancé l’idée que les objets lourds en chute libre accéléraient plus vite que les objets légers. C’est une notion facile à acquérir intuitivement, car elle semble conforme à notre expérience quotidienne. Selon la légende, Galilée réfuta cette proposition grâce à la fameuse expérience de la Tour penchée de Pise, en montrant que des objets lâchés simultanément du sommet de la tour tombaient au même instant sur le sol, qu’ils soient lourds ou légers. Nombre de personnes trouvaient ce résultat surprenant. De façon générale, à cette époque, la méthode expérimentale n’avait pas le vent en poupe. On avait plutôt tendance à considérer que les faits se produisaient pour une « raison ». Il ne fallait pas se salir les mains en effectuant des expériences afin de rechercher la vérité. Ultérieurement, Galilée confirma son résultat par un raisonnement abstrait, et sa logique était si élégante que le résultat de ses expériences devenait évident. L’argument était en gros le suivant : supposons que nous prenions deux objets de même forme et de même masse (voir la figure 6.1a). Les deux objets sont lâchés de la même hauteur. Lequel arrive le premier sur le sol ? Il est évident qu’ils arrivent simultanément, puisqu’ils sont identiques. C’est une conséquence de la symétrie de translation dans un plan horizontal. Maintenant, prenons un troisième objet identique et lâchons-le à côté des deux premiers et simultanément avec les deux premiers objets (voir la figure 6.1b). Il est à nouveau clair
F IGURE 6.1. Chute libre de blocs cubiques.
106
Chapitre 6. Intuition physique
qu’ils vont atterrir au même instant. Il est aussi évident que l’on ne change rien si on déplace les objets horizontalement avant de les lâcher. Imaginons maintenant que nous rapprochions les deux objets de droite, suffisamment près pour que l’on puisse considérer qu’ils forment un seul et même objet. Cet objet unique, dont la taille vaut deux fois celle des objets originaux, va tomber exactement de la même façon que son voisin de gauche qui est deux fois moins lourd (voir la figure 6.1c). Ainsi un objet de masse m et un objet de masse double, 2m, vont tomber exactement de la même façon. Avec ce raisonnement, le résultat semble évident. Ce niveau d’évidence est rarement atteint et c’est pourquoi notre intuition physique doit être raffinée pour donner les résultats corrects. Notre intuition originale selon laquelle les objets lourds tombaient plus vite que les objets légers était peut-être ancrée dans des préconceptions psychologiques. Il est possible que nous prêtions davantage d’attention aux objets lourds parce que leur impact sur le sol est plus important. Et si nous faisons plus attention aux objets lourds, c’est peut-être la raison pour laquelle nous supposons qu’ils tomberont plus vite.
6.3
Isaac Newton
La légende veut que les idées de Sir Isaac Newton sur la gravitation eurent comme catalyseur la chute d’une pomme dans le jardin de sa mère. Dans certaines versions de l’histoire, il observa la chute de la pomme ; dans d’autres, il la reçut sur la tête. Quoi qu’il en soit, cette histoire de la chute d’une pomme lui fit grosse impression. Mais, pourrait-on se demander, qu’est-ce que la chute d’une pomme peut bien avoir à faire avec le mouvement des planètes régi par la gravitation ? Voici ce qu’en dit Newton dans son livre Philosophiae Naturalis Principia Mathematica. Il se demanda : pourquoi les planètes ne tombent-elles pas comme les pommes ? Pour se faire la main sur ce problème, il commença par le modifier. Supposons qu’il y ait une montagne très haute au Pôle nord et que nous tirions un boulet de canon comme sur la figure 6.2. Il finira par retomber sur le sol, évidemment. Supposez que vous augmentiez la dose de poudre. Il va encore retomber sur le sol, quoique nettement plus loin. Mais si vous forcez encore la dose, il va être propulsé sur une distance comparable aux dimensions de la Terre, en retombant peut-être à l’Équateur. Encore un effort et il va retomber au Pôle sud. Finalement, avec de plus en plus de poudre, il va rater la Terre et en faire le tour 1 . 1
Nous ignorons la résistance de l’air dans cette discussion.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
107
F IGURE 6.2. Un boulet de canon avec une vitesse initiale suffisamment grande se comporte presque comme une Lune.
Nous sommes maintenant prêts à comparer la Lune et un boulet de canon dans notre expérience de pensée, et la raison pour laquelle la Lune ne tombe pas devient évidente : en l’absence de la Terre, la Lune continuerait tout droit dans l’espace. Mais, en raison de l’attraction gravitationnelle de la Terre, la Lune dévie de cette ligne droite. Elle tombe perpétuellement sur la Terre, mais elle la manque continuellement parce que la Terre est ronde. Si la Terre était plate en s’étendant à l’infini, avec le même champ de gravitation que le champ terrestre, la Lune finirait par tomber. C’est ce que nous a expliqué l’exemple du boulet de canon : en augmentant la vitesse initiale, nous avons terminé par un boulet de canon en orbite autour de la Terre. Donc, en fait, la Lune est en chute perpétuelle sur la Terre, mais elle continue à la manquer malgré ses efforts pour tomber ! La rotondité de la Terre est ce qui empêche la Lune de s’en approcher. Maintenant vous avez une bonne intuition de la raison pour laquelle lancer un objet avec une vitesse critique peut l’envoyer sur une orbite circulaire. S’il part trop lentement, il va finir par tomber. S’il part trop vite, il va s’échapper dans l’espace. Entre les deux il pourra choisir une orbite elliptique. Mais nous ne pouvons pas conclure de la discussion précédente que l’orbite sera périodique, qu’elle va se refermer sur elle-même. Seul un calcul précis nous permet d’arriver à cette conclusion 2 . À l’origine, le problème de la chute de la Lune n’était pas intuitif. Mais après un changement de point de vue, il nous a semblé faire sens, peut-être même au point de devenir évident.
Énigme. Un camion qui roule lentement à 10 km/h est heurté par une mouche qui se déplace en sens inverse du camion à une vitesse de 20 km/h. Sans utiliser une seule équation, que pensez-vous de la vitesse du camion après la collision ? 2
N.d.T. Seules les forces en 1/r2 , comme la force de gravitation ou la force de Coulomb, et les forces en r, ou forces harmoniques, conduisent à des orbites fermées.
108
Chapitre 6. Intuition physique
Solution. Notre intuition physique nous dit que la vitesse du camion sera pratiquement inchangée. Il va sans dire que des calculs précis fondés sur la loi de conservation de l’impulsion confirment cette intuition. 6.4
Intuition physique en mathématiques
L’intuition physique peut aussi servir à déduire des vérités mathématiques. Nous allons en donner quelques exemples dans cette section 3 . Revisitons le théorème de Torricelli auquel nous avons fait allusion au chapitre 3, lorsque nous avons déterminé le système d’autoroutes le plus économique pour relier quatre villes situées aux sommets d’un carré. Supposons que nous ayons trois points quelconques sur un plan et que nous cherchions le trajet qui minimise la somme des distances entre ces points et un quatrième point. Voici un moyen de s’en convaincre fondé sur la physique. Nous avons montré mathématiquement que les trajets doivent former un graphe tripode, un ensemble de droites qui se rencontrent à un sommet avec trois angles de 120o entre les droites. Imaginons que nous perçons un trou dans un plan, par exemple une table, aux trois points qui nous intéressent, et que nous attachons trois boules identiques aux extrémités de ficelles de longueur fixée, reliées à un sommet commun (voir la figure 6.3). En supposant que les masses des trois boules sont égales à m, l’énergie potentielle du système global est −mg multiplié par la somme des longueurs des ficelles qui pendent sous la table (g est l’accélération de la pesanteur terrestre, g ≃ 9, 81 m/s2 ). À l’équilibre, l’énergie potentielle est minimale, et donc la somme des longueurs des ficelles qui pendent sous la table est maximale. À l’inverse, la somme des longueurs des ficelles sur la table est minimisée, parce que la longueur totale des ficelles est fixe, et cela correspond à la solution de notre problème initial de minimisation de la somme des distances. En appliquant les conditions d’équilibre, nous constatons que les tensions au sommet doivent s’équilibrer, et comme ces tensions sont identiques puisque les trois masses sont identiques, les angles entre les ficelles doivent être de 120o . Cet exemple montre qu’introduire de la physique dans ce qui était à l’origine un problème de mathématiques peut nous donner l’intuition de solutions simples, alors que le problème mathématique semblait complexe.
Énigme. Imaginons un graphe de données, un ensemble de points de coordonnées ( xi , yi ). Supposons que nous voulons trouver le meilleur ajustement 3
Plusieurs exemples discutés dans cette section sont empruntés au beau livre de Mark Levi, The Mathematical Mechanics : Using Physical Reasoning to Solve Problems. Le lecteur qui souhaite davantage d’illustrations de la façon dont l’intuition physique peut influencer les mathématiques est encouragé à consulter ce livre.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
109
F IGURE 6.3. Les ficelles attachées aux trois masses identiques se stabilisent en un point qui minimise la longueur totale des ficelles sur la table. Il est facile de voir que les angles doivent être de 120o si l’on veut équilibrer les trois forces de même intensité en déplaçant le point de jonction commun dans des directions différentes.
possible, ce qui veut dire que nous voulons minimiser la somme des carrés de la distance verticale des points à une droite : c’est la méthode des moindres carrés. Nous pouvons trouver une analogie physique en imaginant que les points sont des clous sur une table, l’axe horizontal étant Ox et l’axe vertical Oy (voir la figure 6.4). Les clous sont attachés à des ressorts eux-mêmes attachés à des anneaux coulissant sur une tige rectiligne. Les ressorts sont contraints par des tubes à se mouvoir verticalement. La somme des distances au carré entre les clous et la tige représente l’énergie potentielle des ressorts, et trouver le meilleur ajustement est équivalent à trouver la configuration de la tige qui minimise l’énergie potentielle des ressorts (voir la figure 6.4).
F IGURE 6.4. La droite du meilleur ajustement peut être réalisée physiquement par la tige lorsque celle-ci, reliée aux points de données par des ressorts, s’arrête à sa position d’équilibre.
Donnons maintenant la solution physique. Nous savons qu’à l’équilibre les forces et les couples doivent s’annuler. Si la position d’un point sur la tige est donnée par y = mx + b, alors la force sur le ressort i est proportionnelle à
110
Chapitre 6. Intuition physique
yi − (mxi + b) en raison de la loi de Hooke, et l’équilibre des forces nous dit que
∑ [yi − (mxi + b)] = 0 . i
Examinons maintenant le couple sur la tige. Chaque ressort exerce un couple xi Fi , et notre seconde condition d’équilibre est
∑ xi Fi =⇒ ∑ xi [yi − (mxi + b)] = 0 . i
i
Sans surprise, on retrouve les mêmes conditions que pour le cas de la régression linéaire de la méthode des moindres carrés. Il est possible que le modèle ci-dessus ne vous impressionne pas. Tout ce que nous avons fait est de traduire la question de mathématiques en problème de physique et de résoudre ce problème à nouveau avec des mathématiques. Qu’est-ce que nous avons gagné avec ces allers-retours ? La modélisation physique nous a mis sur la voie d’une nouvelle question qui sinon n’aurait pas été apparente. Pour un physicien, ce n’est pas très naturel d’avoir à contraindre le mouvement des ressorts strictement dans la direction verticale. Que se passeraitil si nous relâchions cette contrainte et permettions aux ressorts de s’orienter dans n’importe quelle direction, comme dans la figure 6.5 ? Après tout, ce serait naturel de rechercher la configuration qui minimise la distance au carré, plutôt que juste la distance verticale.
F IGURE 6.5. On ne contraint pas les ressorts à rester en position verticale. La position d’équilibre correspond alors à la meilleure droite d’ajustement lorsque les incertitudes sur x et y sont du même ordre.
De fait, ce serait la chose correcte à faire si les incertitudes sur x et sur y étaient d’importance égale. La régression ordinaire suppose que l’incertitude sur y est beaucoup plus grande que celle sur x. Ainsi, l’intuition physique permet de reformuler des problèmes de mathématiques d’une façon qui peut se révéler utile et même donner de nouvelles perspectives.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
111
F IGURE 6.6. Est-ce que les trois médianes d’un triangle se coupent en un même point ?
Énigme. Étant donné un triangle, on trace deux médianes qui se coupent en un certain point. Est-ce que la troisième médiane passe aussi par ce point ? Voir la figure 6.6. Solution. Supposons le triangle de masse négligeable. Nous importons de la physique dans le problème en supposant que des masses identiques sont attachées à chaque sommet du triangle. Si nous trouvons par essai et erreur le centre de masse de ce système de trois masses, alors nous pouvons le placer en équilibre sur une tige triangulaire posée directement sous le centre de masse (voir la figure 6.7).
F IGURE 6.7. Les médianes doivent passer par le centre de masse dans ce modèle physique.
Considérons deux médianes quelconques. Le centre de masse doit se trouver à leur intersection parce que pour chaque médiane les couples dus aux masses correpondant aux deux autres sommets vont s’équilibrer, de sorte que chaque médiane doit passer par le centre de masse. Comme le système possède un seul centre de masse, la troisième médiane doit aussi passer par lui.
Énigme. Étant donné un triangle avec des rapports de longueurs données sur la figure 6.8, quel est le rapport des longueurs des segments de droite formant le côté inférieur du triangle ? 112
Chapitre 6. Intuition physique
F IGURE 6.8. Déterminer un rapport de longueurs.
F IGURE 6.9. La solution physique.
Solution. Nous plaçons un point d’appui au point d’intersection des lignes qui divisent les côtés suivant les proportions 2:1 et 3:1, ainsi que de la ligne qui divise le côté inférieur dans un rapport qui est à déterminer. En examinant la figure 6.8, nous pouvons en conclure que nous devons attacher des poids inégaux de 1, 2 et 3 kg aux trois sommets, le sommet 1 étant celui du haut, 2 celui de gauche et 3 celui de droite. Cette configuration équilibre les forces et les couples, ce qui fait du point d’intersection le centre de masse. On en déduit que le rapport des segments de droite du côté inférieur doit être 3:2 (voir la figure 6.9). Énigme. Considérons l’ensemble des nombres naturels positifs. L’inégalité
√ a+b ≥ ab , 2 nous dit que la moyenne arithmétique est supérieure ou égale à la moyenne harmonique et elle peut se récrire a+b 2 ≥ . 1 1 2 + a b L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
113
Montrer l’inégalité suivante (dont l’inégalité ci-dessus est un cas particulier avec a = d, b = c) 1 1 1 ≥ + . 1 1 1 1 1 1 + + + a+b c+d a c b d
Solution. Utilisons la physique pour montrer cette inégalité sans avoir à effectuer de calculs compliqués. Ce que nous avons fait dans la figure 6.10 est de traduire le problème en un problème de circuits électriques où a, b, c et d sont des résistances. Le côté gauche de l’inégalité représente la résistance du circuit avec l’interrupteur ouvert. Le membre de droite représente la résistance lorsque l’interrupteur est fermé. La résistance d’un circuit diminue chaque fois qu’un fil est ajouté à un circuit, et c’est ce qui explique l’inégalité. En se fondant sur notre connaissance physique des circuits électriques, nous savons que l’inégalité est valable sans avoir à nous lancer dans des calculs compliqués. La physique nous fournit une visualisation qui nous aide à résoudre un problème au départ purement algébrique.
F IGURE 6.10. La solution physique.
6.5
L’« Euréka » d’Archimède
Le principe d’Archimède énonce que tout objet, totalement ou partiellement immergé dans un liquide, subit de la part de celui-ci une poussée vers le haut, la poussée d’Archimède, égale au poids du liquide déplacé. On peut trouver ce principe contre-intuitif, mais on peut l’expliquer de sorte qu’il apparaisse comme presque évident. Supposons que nous ayons un objet, disons une couronne, immergée dans un seau d’eau. Maintenant, imaginez une sorte de « chirurgie » qui enlève la couronne et remette l’eau en place, comme sur la figure 6.11. L’eau qui reste ne peut pas savoir si elle entoure la couronne ou de l’eau, et elle agit exactement comme si c’était de l’eau. Mais lorsque la couronne est remplacée par de l’eau, le système est homogène et à l’équilibre. Autrement dit, l’eau ne va pas bouger. Cela implique que la force nette exercée
114
Chapitre 6. Intuition physique
F IGURE 6.11. Comme l’eau qui reste ne peut pas savoir ce qu’elle entoure, couronne ou eau, elle exerce une poussée vers le haut comme si cet objet était de l’eau, et cette poussée est égale au poids déplacé par l’eau.
par le reste de l’eau sur la partie qui a remplacé la couronne doit être égale à cette dernière, de sorte qu’elle ne tombe pas. Lorsque nous remettons la couronne, le reste de l’eau ne peut absolument pas savoir ce qu’il entoure. Par conséquent, la couronne subit la même poussée vers le haut que la partie de l’eau déplacée, et la couronne subit donc une réduction effective de son poids égale au poids de l’eau déplacée. Il existe tout un folklore sur la façon dont Archimède a découvert son principe. On raconte par exemple qu’il en eut l’idée en essayant de déterminer si une couronne était contrefaite. La véracité de cette légende fait débat. D’après elle, il voulait simplement mesurer la densité de la couronne. Comme le poids est facile à mesurer, il reste juste à mesurer le volume de la couronne, ce que l’on peut faire en immergeant la couronne dans un seau et en observant le volume d’eau déplacée, simplement grâce à l’élévation du niveau de l’eau dans le seau. Il est possible que la conservation du volume n’ait pas été connue avant Archimède, et que cette observation lui ait effectivement permis de calculer le volume, et donc la densité, d’un objet en l’immergeant dans un liquide. La poussée d’Archimède n’intervient pas dans cette mesure. Mais, quelles que soient les légendes, c’est bien Archimède qui a découvert le principe qui porte son nom !
Énigme. Remplissez une boîte avec des haricots d’une certaine sorte et enterrez profondément une balle de ping-pong dans les haricots. Secouez la boîte et observez ce qui se passe pour la balle. Pouvez-vous expliquer ce que vous voyez ? Solution. La balle de ping-pong remonte à la surface pour exactement la raison pour laquelle des objets peu denses flottent à la surface de l’eau. Dans notre cas, l’ « eau » est faite de haricots, qui jouent le rôle des molécules d’eau. La balle de ping-pong est moins dense que les haricots, et subit donc une poussée vers le haut.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
115
6.6
Le théorème de Pythagore
Comme autre exemple de la façon dont la physique peut suggérer des mathématiques nouvelles, donnons une preuve du théorème de Pythagore en utilisant la physique. Considérons un récipient rempli d’eau ayant la forme d’un triangle rectangle dont les côtés ont pour longueurs a, b, c (voir la figure 6.12). Il semble intuitivement évident que ce récipient sera en équilibre. Nous allons maintenant explorer ce que cet énoncé veut dire en termes de forces et de couples. La force exercée par l’eau sur les parois du récipient est une force de pression, qui est approximativement constante si le récipient est suffisamment petit, et cette force est égale à la pression multipliée par l’aire de la paroi, qui est égale au produit d’un côté par la hauteur. Sans perte de généralité, nous pouvons supposer que la hauteur est normalisée à 1.
F IGURE 6.12. Un récipient ayant la forme d’un triangle rectangle rempli d’eau peut être utilisé pour démontrer le théorème de Pythagore.
Le fait que la somme des forces s’annule revient tout simplement à dire que les trois vecteurs forment un triangle, à savoir le triangle rectangle dont nous sommes partis. Examinons maintenant les couples. Nous devons d’abord fixer un axe par rapport auquel nous définissons les couples. Imaginons que nous placions un axe vertical passant par le sommet où les côtés b et c se joignent. Le couple global autour de cet axe doit être nul, car dans le cas contraire le triangle se mettrait à tourner. Rappelons que le couple est le produit de la force par le bras de levier. Par conséquent le couple sur le côté de longueur b est b × (b/2). Le couple sur le côté de longueur a est a × ( a/2) et il a la même direction que le précédent, pointant dans la même direction des aiguilles d’une montre 4 , et le 4
N.d.T. Un couple autour d’un axe est assocé à un sens de rotation, lequel est en correspondance bijective avec une orientation le long de l’axe en utilisant la règle du tire-bouchon.
116
Chapitre 6. Intuition physique
couple sur l’hypothénuse de longueur c est −c × (c/2), le signe (−) étant associé au fait que ce couple est de sens opposé aux deux précédents. Comme la somme des trois couples doit être nulle, nous en déduisons le théorème de Pythagore a2 + b 2 = c 2 . Nous pouvons déduire d’autres résultats mathématiques de cette configuration de triangles. Imaginons que nous faisons passer l’axe vertical par le sommet correspondant à l’angle droit. Si a < b, le couple relativement à cet axe est a2 /2 − b2 /2 + c∆ = 0, où ∆ est la distance entre le milieu de l’hypothénuse et le point où la hauteur rencontre l’hypothénuse. Essayez de démontrer cette égalité par de la géométrie pure, sans faire intervenir la physique ! De plus, pour compléter cet exemple, vous pouvez aussi démontrer des résultats plus généraux comme la loi des cosinus, en considérant un triangle quelconque. On peut cependant se demander si nous avons bien là une démonstration du théorème de Pythagore. La question est de savoir si notre définition du couple ne présupposait pas le théorème ! Mais, quoi qu’il en soit, c’est une façon intéressante d’envisager le théorème de Pythagore revêtu des habits de la physique.
Énigme. Une table ronde est posée sur trois pieds répartis régulièrement autour de sa circonférence. Vous voulez renverser la table en exerçant une force verticale quelque part sur la circonférence. La question est la suivante : à quel point le long de la circonférence devez-vous appuyer pour renverser la table avec le minimum d’effort ? Aucun calcul n’est nécessaire 5 . Solution. Il est évident par symétrie que vous devez appuyer à mi-distance entre deux pieds. Bien sûr la mécanique newtonienne conduirait à ce résultat. Mais si nous arrivions à un résultat différent, nous pourrions commencer à remettre en question nos hypothèses de départ. De plus, si nous voulons des détails supplémentaires, par exemple si nous voulons savoir quelle est la force nécessaire pour renverser la table, nous devons nous engager dans des calculs plus précis, qui devraient confirmer notre intuition sur l’emplacement où nous devons appliquer la force. Il peut arriver que notre intuition soit en conflit avec les mathématiques, auquel cas l’intuition doit être corrigée. Mais il peut aussi arriver que nous ayons fait une erreur de calcul que l’intuition nous permet de corriger. 6.7
Théorie de la relativité restreinte
L’intuition, de façon surprenante, peut nous suggérer des conclusions contreintuitives. Einstein, par exemple, utilisait des expériences de pensée intuitives 5
Ce problème est cité dans les cours de Feynman.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
117
pour justifier la théorie de la relativité restreinte, laquelle a parfois une allure de casse-tête avec sa contraction des longueurs, sa dilatation du temps et sa célèbre formule E = mc2 . La théorie de la relativité restreinte repose sur une hypothèse très contreintuitive : la vitesse de la lumière est toujours la même, quelle que soit la vitesse par rapport à la source de lumière de l’observateur qui mesure cette vitesse. Une fois ce principe accepté, le reste de la théorie en découle de manière intuitive. C’est une expérience de pensée qui a conduit Einstein à la notion de dilatation du temps. Imaginez que vous êtes assis dans un train se déplaçant en ligne droite à une grande vitesse ~v par rapport au sol. C’est une conséquence de la relativité restreinte que si vous partez d’une ville A, allez jusqu’à une ville B, faites un demi-tour instantané et revenez en A, alors votre montre ne sera plus synchronisée avec celle d’un voyageur qui est resté immobile en gare dans la ville A. Pourquoi ? Imaginez un système de deux miroirs dans un wagon du train, l’un au plancher et l’autre au plafond, séparés par une distance L (voir la figure 6.13). On peut prendre comme battement d’une horloge le temps mis par la lumière, par exemple une impulsion laser très brève, pour faire l’aller-retour entre les deux miroirs. Pour le passager du train, la lumière voyage verticalement, et le temps de battement est ∆τ = 2L/c, où c est la vitesse de la lumière. Au contraire, pour le voyageur sur le quai de la gare, la lumière voyage en diagonale. Soit ∆t la durée d’un battement de l’horloge pour l’observateur immobile, c’est-à-dire la durée que cet observateur attribue à un aller-retour de l’impulsion laser. Pendant le temps ∆t, le train avance de v∆t, et la lumière doit parcourir un trajet 2L′ > 2L. La durée d’un battement d’horloge sera donc plus longue pour un observateur immobile sur le quai. On obtient aisément une relation explicite entre les durées de battement, ∆τ pour un observateur du train et ∆t pour un
F IGURE 6.13. Le temps ralentit pour un observateur assis dans train en mouvement si on le compare au temps mesuré par un observateur immobile sur le quai de la gare.
118
Chapitre 6. Intuition physique
observateur du quai. D’après le théorème de Pythagore, la distance 2L′ parcourue par la lumière pour un observateur du quai est
(2L′ )2 = (2L)2 + v2 ∆t2 > (2L)2 . Mais la longueur 2L′ est par définition la distance c∆t parcourue par la lumière pendant un battement d’horloge. En combinant ce résultat avec l’équation précédente, on déduit ∆τ ∆t = √ > ∆τ. 1 − v2 /c2 En d’autres termes, les horloges du train retardent par rapport à celles du quai de la gare. La partie contre-intuitive de cet argument est que la vitesse de la lumière est la même pour tous les observateurs, alors que l’intuition nous dirait le contraire : si assis dans le train vous lancez une balle vers l’avant avec une vitesse w, la vitesse de la balle par rapport au sol sera v + w. Mais cette « loi d’addition des vitesses » n’est qu’une approximation valable pour des faibles vitesses. Si l’on accepte que la vitesse de la lumière est la même pour tous les observateurs, alors la suite de l’argument est assez évidente. Il faut remarquer que le résultat est symétrique : un observateur du quai de la gare trouve aussi que les horloges du train retardent ! En fait il faut observer que, dans notre exemple, les observateurs du train et du quai mesurent deux quantités différentes : pour l’observateur du train, le point de départ et le point d’arrivée de l’impulsion laser sont les mêmes, mais pas pour l’observateur du quai, car pendant l’aller-retour de l’impulsion laser le train a avancé ! L’intervalle de temps mesuré par l’observateur du train entre deux événements se passant au même point d’espace est appelé intervalle de temps propre, alors que l’observateur du quai mesure la durée entre deux événements en deux points d’espace différents. Autrement dit, dans le cas du train, c’est la même horloge qui mesure la durée de l’aller-retour, alors que ce sont deux horloges différentes dans le cas du quai. 6.8
Mécanique statistique
L’objectif de la mécanique statistique est de décrire le comportement de systèmes formés d’un grand nombre de particules qu’il est impossible de suivre individuellement. La notion fondamentale en mécanique statistique est celle d’entropie, notée S, et définie par S = ln Ω
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
119
où Ω est le nombre de configurations possibles des particules compatibles avec des contraintes macroscopiques. Par exemple nous pouvons essayer de compter le nombre de configurations compatibles avec le fait que le système soit contenu dans une enceinte de volume déterminé V et que son énergie totale soit E. Il faut donc répartir cette énergie entre les différentes particules et distribuer celles-ci dans le volume. Ce nombre de configurations est Ω et l’entropie est son logarithme. L’hypothèse de base est que toutes ces configurations ont la même probabilité. Cette hypothèse est la plus naturelle que l’on puisse faire : en l’absence d’autre information, il n’y a aucune raison pour qu’une configuration particulière soit plus probable qu’une autre. Cependant cette simple hypothèse a des conséquences surprenantes.
Énigme. J’ai choisi un nombre entre 1 et 1000. Vous essayez de deviner ce nombre et je vais vous dire s’il est plus petit, plus grand ou égal au nombre que j’ai choisi. Essayez de deviner le nombre avec le nombre minimum d’essais. Solution. Vous êtes peut-être déjà familier de la recherche binaire, qui consiste à toujours essayer de diviser l’ensemble de départ en deux sous-ensembles identiques. Cette approche est la meilleure posssible car elle revient à maximiser l’entropie du système 6 . Fondamentalement, ce que vous cherchez à faire est de gagner le plus d’information possible à chaque essai. Diviser l’ensemble en deux sous-ensembles identiques est le mieux que vous puissiez faire, car cela vous permet d’éliminer la moitié des possibilités en un seul essai. Toute autre division vous conduirait à conserver plus de la moitié des possibilités. Il s’agit donc d’optimiser le pire scénario. Énigme. On vous donne 12 pièces de monnaie, mais l’une d’entre elles est contrefaite et vous ne savez pas si elle est plus lourde ou plus légère que les autres. Vous disposez d’une balance qui vous permet de vérifier si deux pièces ont le même poids ou des poids différents. Quel est le nombre minimum de pesées que vous devez effectuer pour déterminer quelle est la pièce contrefaite et si elle est plus lourde ou plus légère que les autres ? Que se passe-t-il pour 500 pièces ? Solution. À nouveau nous allons utiliser une approche qui consiste à diviser en groupes égaux comme dans la précédente énigme. Il y a en tout 24 possibilités, étant donné que la pièce contrefaite peut être plus lourde ou plus légère que 6
À chaque étape, vous divisez le domaine N = N1 + N2 en deux parties, N1 et N2 . La meilleure question à poser pour minimiser les possibilités restantes est de maximiser l’entropie des possibilités, c’est-à-dire −(p1 ln N1 + p2 ln N2 ), où pi = Ni /N est la probabilité d’atterrir dans le sous-ensemble (i ). De façon équivalente, on peut maximiser l’entropie de Shannon −(p1 log p1 + p2 log p2 ), où log est le logarithme en base 2. Ce raisonnement conduit à choisir N1 = N2 = N/2, ou p1 = p2 = 1/2. L’entropie de Shannon est alors maximale et égale à 1.
120
Chapitre 6. Intuition physique
les autres : 12 × 2 = 24. Chaque fois que nous comparons deux groupes de pièces sur la balance, il y a trois possibilités : le premier groupe pourrait être plus léger, plus lourd, ou les deux groupes pourraient avoir le même poids. ll nous faut donc mettre au point une stratégie telle que nous puissions diviser l’ensemble, autant que faire se peut, en trois groupes identiques. Le mieux que nous pouvons faire est 24 → 8 + 8 + 8 8 → 3+3+2 3 → 1+1+1
ou
2 → 1+ 1+ 0.
Cela nous fournit un guide pour la façon de procéder. Le mieux que nous pouvons faire pour identifier la pièce contrefaite serait de la déterminer en trois pesées, parce que 33 = 27 ≥ 24. Pour obtenir la seconde répartition, 24 → 8 + 8 + 8, vous pouvez aisément vous convaincre que vous pouvez diviser les 12 pièces en trois groupes de 4. Ensuite vous pesez deux de ces groupes. Si le premier groupe est plus lourd que le second, vous savez que soit l’une des 4 pièces du premier groupe est plus lourde que la moyenne, soit qu’une pièce du second groupe est plus légère que la moyenne, ce qui donne 8 possibilités. Un résultat analogue est valable si le premier groupe est plus léger. Si les deux premiers groupes ont le même poids, alors vous savez que la pièce contrefaite se trouve dans le troisième groupe, qui pourrait contenir une pièce contrefaite plus lourde ou plus légère, à nouveau 8 possibilités. Les pesées suivantes sont à effectuer suivant ce même raisonnement. Pour 500 pièces, le processus est analogue. La réponse pour la stratégie optimale est 7 pesées. Il y a 1000 possibilités dans ce cas. Chaque pesée de groupes de pièces a trois résultats possibles, et divise donc l’espace des possibilités en trois parties. Par conséquent, il faut au minimum 7 pesées pour isoler chaque possibilité, parce que 36 < 1000 < 37 . Vous aimeriez à chaque étape diviser les possibilités en trois groupes identiques, dans la mesure où cela est réalisable. Il peut arriver qu’il n’y ait pas de procédure exacte. Ainsi nous n’avons pas prouvé que la tâche peut être accomplie en juste 7 étapes, mais nous avons montré qu’il est impossible de l’accomplir en moins de 7 étapes.
Énigme. Vous avez 100 bouteilles de jus de fruit, dont une est avariée. Vos amis sont prêts à vous aider à trouver la bouteille avariée, mais les effets ne se feront ressentir que 24 heures plus tard, et vous lancez votre fête dans 25 heures. Quel est le nombre minimum d’amis que vous devez enrôler pour isoler la bouteille avariée ? Solution. Il suffit de 7 amis. Numérotez les bouteilles avec une numérotation binaire. Cela vous demandera au maximum 7 chiffres, car 27 = 128 > 100. L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
121
L’ami numéro n, n = 0, . . . , 6 boit uniquement les bouteilles dont le ne chiffre binaire du numéro est 1. Vous pouvez en déduire quelle était la bouteille avariée en trouvant son numéro écrit en binaire : pour ce faire, vous attribuez un 1 à chaque ami qui a attrapé une gastro-entérite et un 0 dans les autres cas. Il faut évidemment trouver des amis prêts à se sacrifier et à attraper une gastroentérite !
Énigme. Supposez que nous jouons au jeu suivant : nous voulons lancer une balle vers un mur de sorte qu’en rebondissant sur le mur elle atteigne un objet fixé au plafond. On ne tient pas compte de la gravitation, de sorte que la trajectoire de la balle est rectiligne entre deux impacts (voir la figure 6.14). Quel point du mur faut-il viser ?
F IGURE 6.14. Vous pouvez utiliser un miroir sur le mur pour viser un objet.
Solution. On peut fixer un miroir au mur et viser l’image de l’objet dans le miroir. Énigme. Une championne de natation assise sur une plage voit un nageur en train de se noyer à quelques dizaines de mètres du rivage (voir la figure 6.15). La championne peut courir sur la plage à la vitesse v1 et nager à la vitesse v2 , avec v1 > v2 même s’il s’agit d’une championne de natation ! Quel trajet doit suivre la championne si elle veut se porter au secours du nageur le plus vite possible ?
Solution. La championne de natation court plus vite sur le sable qu’elle ne nage dans la mer, et aller en ligne droite n’est manifestement pas optimal. Pour déterminer le point où elle doit commencer à nager, la championne doit déterminer les angles θ1 et θ2 de la figure 6.15 qui définissent son trajet, d’abord sur la plage et ensuite dans la mer. La réponse à cette question est donnée par la loi de 122
Chapitre 6. Intuition physique
F IGURE 6.15. Quel trajet doit suivre la championne de natation pour se porter au secours du nageur en difficulté aussi vite que possible ?
Snell-Descartes 7
sin θ1 v = 1. sin θ2 v2
La loi de Snell-Descartes décrit la façon dont la lumière, ou tout autre type d’onde, change de direction quand elle passe d’un milieu où la vitesse de propagation est v1 à un milieu où la vitesse de propagation est v2 . Cette loi, qui détermine le trajet de la lumière se propageant dans des milieux différents avec des vitesses différentes, est celle qui minimise le temps de trajet entre le point de départ et celui d’arrivée. Mais c’est précisément ce que nous recherchons pour le trajet suivi par la championne. Nous pourrions utiliser un calcul analytique pour trouver le minimum de (l1 /v1 + l2 /v2 ), où l1 et l2 désignent respectivement les longueurs des trajets sur la plage et dans la mer. Mais, au lieu de nous lancer dans ce calcul, nous allons concevoir un dispositif mécanique qui nous permettra de résoudre le problème sans mathématiques compliquées. Soit une table où l’on a percé deux trous représentant les positions de départ de la championne et du nageur. Suspendons une masse proportionnelle à 1/v1 à la position initiale de la championne et une masse proportionnelle à 1/v2 à la position initiale du nageur. Ces deux masses sont attachées à des ficelles, ce qui est représenté sur la figure 6.16. Une tige est placée à la position 7
N.d.T. La loi de Snell-Descartes est en général écrite sous la fome n1 sin θ1 = n2 sin θ2 , où n1 et n2 sont les indices de réfraction des milieux 1 et 2, mais cette équation est équivalente à celle du texte car l’indice de réfraction est lié à la vitesse v par n = c/v, où c est la vitesse de la lumière dans le vide et v sa vitesse dans le milieu.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
123
F IGURE 6.16. Une analogie mécanique pour déterminer le meilleur trajet possible.
du rivage. Un anneau attaché aux deux ficelles coulisse librement sur la tige : les deux ficelles relient donc les masses et l’anneau. Nous pouvons identifier la solution à notre problème de départ en déterminant le minimum d’énergie potentielle, et donc la configuration d’équilibre, du système mécanique analogue. Comme la longueur totale des ficelles est fixée, pour minimiser l’énergie potentielle il faut jouer sur les longueurs des ficelles sous la table, qui sont sous tension en raison des masses qui y sont supendues. Rappelons que l’énergie potentielle d’une masse m dans le champ de pesanteur terrestre est mgh, où g est l’accélération de la pesanteur et h la hauteur au-dessus du plancher. La longueur de chacune des deux ficelles est fixe. Par conséquent, l’énergie potentielle est minimale lorsque g(m1 l1 + m2 l2 ) passe par un minimum, c’est-à-dire lorsque l1 /v1 + l2 /v2 est minimum. Cela donne le trajet optimal pour la championne. Déterminons-le géométriquement. Soit T1 et T2 les tensions de chacune des ficelles, donc m1 g et m2 g, qui sont proportionnelles respectivement à 1/v1 et 1/v2 . À l’équilibre, la somme des forces sur la tige doit être nulle, sinon l’anneau se mettrait à glisser sur la tige, ce qui implique T1 sin θ1 = T2 sin θ2 et montre que sin θ1 / sin θ2 = v1 /v2 . La loi de Snell-Descartes minimise le temps de parcours, une information importante pour le nageur en difficulté. Le lien entre les ficelles et la lumière, le sujet qui intéressait à l’origine Descartes et Snell, est celui-ci : la lumière suit le trajet correspondant au temps de parcours minimal, juste comme la championne de natation trouve le chemin qui lui permet d’aller le plus rapidement possible au secours du nageur.
124
Chapitre 6. Intuition physique
7 Physique contre-intuitive Malgré les exemples que nous avons discutés dans le chapitre précédent, il doit être clair que tous les aspects de la physique ne sont pas intuitifs. De fait, certains des phénomènes les plus passionnants de la physique sont ceux où notre intuition est impuissante. Il peut arriver que notre intuition nous dise que telle ou telle situation ne peut pas se produire, et pourtant elle se réalise. Commençons notre exploration de la physique contre-intuitive par l’exemple de la portance. 7.1
La portance revisitée
C’est une idée assez largement répandue que la physique moderne est contreintuitive, et il y a certainement une part de vérité dans cet énoncé. Vu de l’extérieur, le domaine est de plus en plus étrange. Cependant, la physique contre-intuitive n’est pas une spécificité de la physique moderne, elle remonte aux tout débuts de celle-ci. La portance, par exemple, est un concept qui date de plus de 2000 ans, et pourtant il est très contre-intuitif. Comment un navire très lourd pourrait-il flotter par la seule vertu de la portance de l’eau ? Bien sûr, au chapitre précédent, nous avons vu qu’il suffisait d’envisager la question correctement pour que la portance du navire devienne intuitive. Nous pourrions dire que corriger notre intuition rend plus intuitive la physique non intuitive. Et pourtant nous sommes toujours émerveillés de voir des super-tankers longs d’un demi-kilomètre flotter avec aisance sur la mer. Nous savons tous qu’un ballon gonflé à l’hélium va s’élever en raison de la portance de l’air. Mais que se passe-t-il si vous êtes passager d’une voiture, observant un ballon d’hélium flottant dans la voiture, et que le conducteur freine brutalement ? Alors que vous allez être projeté vers l’avant, retenu seulement par
votre ceinture de sécurité, le ballon, lui, va partir vers l’arrière. Et si le conducteur prend un virage ? Le ballon va se mouvoir vers l’intérieur, contrairement à ce que vous pourriez penser. C’est parce que dans les deux cas, du point de vue du passager, il existe une accélération effective, souvent appelée force d’inertie, et le ballon se déplace en direction opposée à cette accélération relativement à l’air qui est plus dense, ce que l’on déduit de l’existence d’une portance. Il existe une version plus extrême de cet exemple, appelé le « paradoxe d’Archimède ». Supposez que vous disposez d’un énorme navire et de seulement quelques seaux d’eau. Est-ce que vous pouvez faire flotter ce navire avec uniquement l’eau de ces seaux ? La réponse, étonnante, est positive. Comme les forces de portance sont locales, il suffit de recouvrir la coque du navire audessous de la ligne de flottaison avec une couche d’eau très fine, comme dans la figure 7.1. De fait les arguments donnés au chapitre précédent pour la portance ne dépendaient en rien de la quantité d’eau disponible.
F IGURE 7.1. Archimède argumenta que l’on pouvait faire flotter une navire dans un seau d’eau à condition de disposer d’un récipient assez grand pour le contenir.
Alors que l’on peut déjà trouver de nombreux exemples contre-intuitifs en physique conventionnelle, le nombre de phénomènes non intuitifs a considérablement augmenté avec la physique contemporaine, lorsque nous avons été confrontés à la relativité, à la physique quantique, à la théorie des cordes, etc.
Les avions. On ne met plus en doute aujourd’hui la possibilité pour les avions de voler, mais en fait cette possibilité est absolument étonnante. Nous parlons d’assemblages métalliques énormes et massifs volant à des kilomètres d’altitude ! Comment cela est-il possible ? L’aile d’un avion est dessinée de telle sorte que l’air se déplace plus rapidement au-dessus de l’aile qu’en dessous. Le principe de Bernoulli, formulé au début des années 1700, énonce que la combinaison P + ρv2 /2 de la pression P, de la vitesse du fluide v et de la densité ρ de celui-ci, est constante le long de 126
Chapitre 7. Physique contre-intuitive
l’écoulement. Par conséquent plus la vitesse v est grande et plus la pression P est petite. La pression au-dessus de l’aile est plus petite que la pression en dessous, en raison du dessin de l’aile. Cela crée une force nette vers le haut, qui permet à l’avion de voler. Le principe de Bernoulli, en dépit de ses conséquences non intuitives, a une explication simple. En fait il découle de la conservation de l’énergie appliquée à des flots laminaires, sans turbulence. L’augmentation de la vitesse de l’écoulement, et donc de l’énergie cinétique d’un élément de fluide, est due au travail des forces de pression, et l’augmentation de l’énergie est accompagnée par une diminution de la pression.
Énigme. On vous donne un petit gonfleur et un ballon de plage gros mais léger. Comment maintenir le ballon en suspension dans l’air en utilisant uniquement le gonfleur ? Solution. On pourrait penser que pointer le gonfleur vers le haut est la bonne solution, mais cela conduirait à un équilibre instable, et le ballon retomberait quasiment intantanément (voir la figure 7.2).
F IGURE 7.2. La mauvaise technique pour maintenir le ballon en suspension.
De façon surprenante, il faut pointer le gonfleur juste au-dessus du ballon : voir la figure 7.3. Dans le contexte des avions, nous avons expliqué la façon dont pression et vitesse étaient liées par le principe de Benoulli. Lorsque l’on augmente la vitesse de l’air au-dessus du ballon, la pression diminue et l’air pousse le ballon vers le haut en compensant son poids, et l’équilibre est stable. 7.2
Pourquoi le ciel nocturne est-il sombre ?
Ce n’est pas si évident qu’il n’y paraît ! Dès 1576, Thomas Digges a effectué un calcul simple, qui a mis au jour un des paradoxes célèbres de l’histoire des sciences, le paradoxe du ciel nocturne sombre, souvent appelé paradoxe d’Olbers. En supposant que l’intensité lumineuse reçue varie comme l’inverse
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
127
F IGURE 7.3. La bonne technique. Il faut pointer le gonfleur juste au-dessus du ballon !
du carré de la distance à la source de lumière et que l’Univers est relativement homogène, de sorte que la densité des étoiles est approximativement constante en tout point, on peut montrer que l’intensité de la lumière reçue des étoiles devrait être aveuglante. En fait ces conditions impliquent même que cette intensité devrait être infinie, en contradiction flagrante avec notre expérience. Nous ne devrions pas avoir un ciel nocturne sombre ! Pour justifier ces affirmations, supposons que la densité des étoiles, leur nombre par unité de volume, soit ρ. Calculons le nombre d’étoiles contenues dans une couche sphérique de rayon R et d’épaisseur dR. Le volume de cette couche sphérique est 4πR2 dR, et le nombre d’étoiles dans cette couche sphérique est donc 4πR2 ρ dR. Cependant l’intensité lumineuse reçue sur Terre est proportionnelle à 1/R2 : si une étoile a pour luminosité 1 I0 , alors l’intensité lumineuse reçue sur Terre sera proportionnelle à I0 /R2 . En conclusion, l’intensité lumineuse que nous recevons de cette couche sphérique est proportionnelle à I0 (4πρ R2 dR) = 4π I0 ρ dR . R2 R∞ Si nous intégrons sur R de zéro à l’infini, nous trouvons 4π I0 ρ 0 dR = +∞. Autrement dit, l’intensité lumineuse reçue de l’ensemble des étoiles de l’Univers devrait être infinie. Manifestement, quelque chose ne colle pas. 1
N.d.T. La luminosité d’une étoile est l’énergie totale qu’elle émet par seconde dans toutes les directions de l’espace.
128
Chapitre 7. Physique contre-intuitive
Quelle est la réponse à ce paradoxe ? Une explication possible est que nous résidons dans un endroit tout à fait particulier de l’Univers et que la densité des étoiles n’est pas constante dans l’Univers. Newton a proposé une autre solution : il faut supposer que l’Univers est fini. Un calcul simple montre que cette hypothèse est compatible avec l’observation. Voilà une preuve de l’intérêt des paradoxes : le paradoxe du ciel nocturne sombre suggère que l’Univers est fini, un résultat qui n’a rien d’évident. En fait ce n’est pas que l’Univers est fini, c’est que son âge est fini. Comme la vitesse de la lumière est finie, nous ne pouvons recevoir de la lumière que d’une distance égale au maximum à l’âge de l’Univers multiplié par la vitesse de la lumière, ce qui revient à un Univers fini. Le point de vue moderne ajoute un élément à cette explication, à savoir l’expansion de l’Univers. Cette expansion fait que la lumière que nous recevons d’étoiles (ou plus précisément de galaxies) lointaines est décalée vers le rouge, et elle transporte une énergie plus faible que celle de l’instant de l’émission 2 . Cela réduit l’intensité lumineuse reçue sur Terre. Ces deux facteurs – âge fini de l’Univers et expansion – se combinent pour résoudre le paradoxe. En d’autres termes, même si l’Univers était infini, la partie de l’Univers qui nous est effectivement accessible serait finie. Cet exercice suggère que l’âge de l’Univers est fini, et donc que l’Univers pourrait avoir eu un commencement. Ainsi le ciel nocturne est noir parce que l’Univers a eu un commencement !
7.3
Équations de Maxwell
Nous avons déjà mentionné que Maxwell a été capable d’unifier les théories de l’électricité et du magnétisme. Ses équations ont conduit à la conclusion que nous énonçons en langage d’aujourd’hui : il existe des ondes se propageant dans le vide à la vitesse de la lumière. Cependant ce n’est pas la façon dont Maxwell envisageait les choses. Son intuition physique lui suggérait que les ondes correspondaient à de la matière en vibration, ce qui impliquait qu’il ne pouvait pas exister d’ondes se propageant dans le vide. Pour lui, la notion d’une solution ondulatoire dans l’espace vide n’avait simplement pas de sens. Il introduisit donc un milieu vibrant hypothétique qu’il appela « éther », mais cette hypothèse se révéla incorrecte. C’est la preuve que l’intuition peut parfois être bénéfique, mais qu’elle peut aussi nous conduire sur des voies de garage.
2
N.d.T. Cette expansion entraîne que la partie visible de l’Univers, environ 45 milliards d’années-lumière, est supérieure à la distance parcourue par la lumière en un temps égal à l’âge de l’Univers, soit 13,8 milliards d’années-lumière.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
129
7.4
La théorie d’Einstein de la relativité
La relativité regorge de paradoxes, et l’un des plus connus est celui de la loi d’addition des vitesses. Nous avons déjà mentionné la loi galiléenne d’addition des vitesses : si assis dans un train roulant à la vitese v1 vous lancez dans le sens de la marche une balle avec la vitesse v2 , alors cette balle aura par rapport au sol une vitesse v = v1 + v2 . Mais cette loi n’est qu’une approximation, qui devient de plus en plus fausse à mesure que les vitesses deviennent grandes, et la loi correcte d’addition des vitesses en relativité d’Einstein est v=
v1 + v2 . 1 + v1 v2 /c2
Ainsi la loi galiléenne n’est valable que si v1 et v2 sont petites par rapport à la vitesse de la lumière c. En revanche, si par exemple v2 = c, alors v = c quel que soit v1 ! Autrement dit, si au lieu de lancer une balle vous envoyez une impulsion laser vers l’avant du train, celle-ci va voyager à une vitesse c par rapport à vousmême mais aussi par rapport au sol. La vitesse de la lumière est la même dans tous les référentiels.
Énigme. Est-il possible, au moins en théorie, de fabriquer une machine temporelle ? L’idée est de concevoir un vaisseau spatial avec lequel vous pouvez voyager dans au minimum une direction du temps. Quelle direction de voyage dans le temps est possible et comment allez-vous fabriquer un tel engin ? Énoncez les spécifications de base de votre conception de sorte que si le voyage vous prend 1000 ans mesurés sur la Terre, vous voulez avoir juste le temps de visionner un film de deux heures pendant votre voyage. Solution. Le voyage dans le passé viole le principe de causalité et n’est permis dans aucune théorie physique. Cependant, vous pouvez voyager dans le futur en vous éloignant avec une certaine vitesse et en revenant ensuite sur vos pas. La vitesse requise est de (1 − 2, 6 × 10−14 )c. Cela découle de la dilatation des temps par un facteur (1 − v2 /c2 )−1/2 , qui transforme deux heures en mille ans. Le schéma du voyage consiste par exemple à adopter une trajectoire circulaire parcourue par votre vaisseau spatial voyageant à une vitesse proche de celle de la lumière. Vous pouvez aussi partir en ligne droite et faire demi-tour. Dans le premier cas, vous allez suivre un cercle dont la circonférence est de 1000 annéeslumière et dont le point de départ et d’arrivée sont la Terre. Vous aurez parcouru approximativenent un cinquantième du rayon de notre galaxie, la Voie lactée. Mais obtenir une telle vitesse n’est pas si pratique. En fait il faudrait accélérer votre masse m, environ 80 kg, en lui communiquant une énergie γmc2 , où γ, le facteur de Lorentz, est le rapport du temps mesuré par le jumeau immobile à 130
Chapitre 7. Physique contre-intuitive
celui mesuré par le jumeau voyageur, qui est de l’ordre de γ ≃ 4 × 106 avec les données numériques ci-dessus. Une centrale nucléaire standard de 1 GW convertit en énergie une masse de 80 kg en une centaine d’années , et il faudrait donc la faire fonctionner pendant plus d’un milliard d’années pour fabriquer l’énergie nécessaire ! Nous venons de décrire le célèbre paradoxe des jumeaux. Un des deux jumeaux reste sur Terre pendant que l’autre voyage dans l’espace à une vitesse proche de celle de la lumière. À leur retour ils ont des âges différents : le jumeau resté sur Terre est plus âgé que celui qui a voyagé. D’après la théorie de la relativité, galiléenne ou einsteinienne, tous les référentiels d’inertie sont équivalents. Comment peut-il se faire que les deux jumeaux vieillissent différemment ? Mais en fait les référentiels des deux jumeaux ne sont pas équivalents. Le référentiel terrestre est (approximativement) un référentiel d’inertie, tandis que le référentiel qui suit la trajectoire circulaire n’en est pas un. De même si le jumeau voyageur part en ligne droite et fait demi-tour, il va suivre deux référentiels d’inertie différents, l’un à l’aller et l’autre au retour. Il ressentira une accélération au moment du départ, du demi-tour et de l’arrivée, contrairement au jumeau resté sur Terre. Les référentiels des deux jumeaux ne sont donc pas identiques et cela lève tout paradoxe. Réfłéchir à ce problème nous conduit à un autre paradoxe. Que se passeraitil si l’Univers était périodique ? Par exemple l’Univers pourrait avoir la forme d’un cylindre et un vaisseau spatial pourrait finalement revenir à son point de départ en voyageant à vitesse constante et sans accélération. Que deviendrait alors le paradoxe des jumeaux ? Il se trouve qu’il existe dans ce cas un référentiel privilégié, dans lequel l’Univers est vraiment périodique dans l’espace, sans que le temps soit modifié lorsque l’on fait un cercle dans l’espace. Et c’est le référentiel où vous vieillissez le plus vite.
Une expérience classique. Si vous placez une balle de tennis juste un peu au-dessus d’un ballon de basket et que vous les lâchez simultanément d’une certaine hauteur, en théorie la balle de tennis va rebondir neuf fois plus haut que la hauteur dont elle a été lâchée, en supposant les collisions élastiques. La masse du ballon de basket est très grande par rapport à celle de la balle de tennis. Le fait que la balle de tennis rebondisse aussi haut est complètement contre-intuitif, et c’est pourtant une conséquence simple des lois de conservation de l’impulsion et de l’énergie. Voici comment cela marche : supposons que les deux objets sont tous deux en train de tomber et sont sur le point de toucher le sol avec la même vitesse v. Le ballon de basket va toucher le sol le premier et, comme la collision est supposée élastique, il va rebondir avec la vitesse v. Mais L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
131
juste après le rebond, la balle de tennis est encore en train de tomber avec une vitesse v, et la vitesse relative des deux balles est 2v. Un instant plus tard, le ballon de basket entre en collision avec la balle de tennis, ce qui va la propulser vers le haut. Le ballon de basket va continuer avec une vitesse proche de v car sa masse est très grande par rapport à celle de la balle de tennis, et l’impact de cette dernière a un effet négligeable. La collision des deux objets est élastique, ce qui implique qu’ils vont nécessairement maintenir une vitesse relative de 2v, et par conséquent la balle de tennis après rebond aura une vitesse 3v. Comme la hauteur maximale atteinte est proportionnelle au carré de la vitesse initiale 3 , la balle de tennis va monter à une hauteur qui sera approximativement neuf fois celle du ballon de basket. 7.5
Paradoxes en physique quantique
La relativité et la physique quantique ont émergé toutes deux il y a une centaine d’années. La relativité peut sembler bizarre, mais la physique quantique l’est encore plus. Après un siècle d’existence, la physique quantique continue à défier notre sens commun. Un des premiers paradoxe qui déclencha la naissance de la physique quantique fut le problème de la théorie du corps noir. Un corps noir est réalisé approximativement par une petite ouverture dans une boîte peinte en noir à l’intérieur et maintenue à la température T. Tout rayon lumineux incident sur l’ouverture est pratiquement certain d’être absorbé au cours d’une de ses multiples réflexions sur les parois internes, d’où la dénomination « corps noir ». L’ouverture émet du rayonnement électromagnétique, c’est le rayonnement du corps noir. Suivant une loi bien établie de la mécanique statistique classique, le « théorème d’équipartition », chaque mode du rayonnement de fréquence ω dans la boîte possède une énergie (1/2)kB T, où kB est la constante de Boltzmann, une constante qui relie échelles d’énergie et de température. Mais il existe une infinité de modes dans la boîte, de sorte que l’énergie totale du rayonnement dans la boîte devrait être infinie. Il y a une certaine analogie avec le ciel nocturne, qui devrait avoir une luminosité infinie au lieu d’être sombre. Planck fit l’hypothèse que les échanges d’énergie entre la boîte et le champ se faisaient par unités de h¯ ω, où h¯ est la constante de Planck, et cinq années plus tard, en 1905, Einstein fit l’hypothèse encore plus radicale que le champ électromagnétique 3
N.d.T. Lâchons un objet de masse m d’une hauteur h avec une vitesse initiale nulle. L’énergie cinétique acquise par l’objet pendant sa chute, mv2 /2 est égale, par conservation de l’énergie, à son énergie potentielle initiale mgh, d’où v2 = 2gh. La même formule donne la hauteur atteinte si on lance l’objet vers le haut avec une vitesse v.
132
Chapitre 7. Physique contre-intuitive
lui-même était composé de « quanta » d’énergie h¯ ω, des entités qui, une vingtaine d’années plus tard, seraient baptisées des photons. Cette hypothèse permettait de résoudre le paradoxe. Ce qui se passe est que la production de fréquences telles que h¯ ω ≫ kB T est inhibée, et en pratique cela limite le nombre de fréquences accessibles. Le théorème d’équipartition de la mécanique statistique classique, le fait qu’à chaque mode corresponde une énergie moyenne (1/2)kB T, n’est pas valable pour les grandes fréquences. Cette intuition fut un pas important dans le développement de la physique quantique, laquelle est sans aucun doute possible la principale source de paradoxes de la physique moderne. Ces aspects contre-intuitifs sont visibles dès l’énoncé des principes de base : les particules ont des propriétés ondulatoires et les phénomènes physiques ne peuvent pas être prédits avec certitude, mais seulement de manière probabiliste. L’onde associée à une particule n’est pas une onde se propageant dans un espace ordinaire, c’est une « onde de probabilité » : le carré de cette onde en un point d’espace donne la probabilité que la particule se trouve en ce point. L’incertitude sur la position n’est pas due à une limitation de nos appareils de mesure, mais elle est intrinsèque aux principes mêmes de la physique quantique. La mesure possède un caractère radicalement différent de la mesure classique : en physique classique, une mesure révèle une réalité préexistante, tandis qu’en physique quantique, c’est la mesure qui crée le résultat 4 . Il existe une célèbre citation de Feynman : « On peut affirmer sans risque de se tromper que personne ne comprend la mécanique quantique ». On peut être un praticien de tout premier plan de la physique quantique, et Feynman en était indubitablement un, sans avoir une compréhension instinctive de la façon dont les choses se passent dans le domaine quantique. Il est possible de pratiquer un formalisme de la physique sans complètement internaliser les idées qui le sous-tendent. La nature probabiliste de la physique quantique pose des questions philosophiques sur le déterminisme et le libre arbitre. Même si ces relations sont quelque peu spéculatives, la physique quantique est incontestablement contreintuitive. Einstein eut une répartie célèbre sur la mécanique quantique : « Dieu ne joue pas aux dés avec l’Univers », ce à quoi Bohr rétorqua : « On ne dicte pas à Dieu ce qu’il doit faire ! ».
4
N.d.T. Prenons l’exemple d’un policier qui mesure la vitesse des voitures sur une autoroute avec un radar : si la vitesse d’une voiture est mesurée à 140 km/h, cette vitesse existait avant la mesure, ce qui donne au policier la légitimité pour verbaliser. Lorsqu’un physicien quantique mesure la vitesse d’un atome, la valeur de la vitesse de cet atome, sauf exception, n’existe pas avant la mesure.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
133
F IGURE 7.4. Motif d’interférences dans l’expérience des fentes d’Young.
L’expérience des fentes d’Young. Dans l’expérience des fentes d’Young, on envoie des particules à travers un écran percé de deux fentes et on les détecte sur un écran (voir la figure 7.4). On commence par ouvrir la première fente, celle du haut, et ensuite on la referme et on ouvre la seconde fente. Dans une expérience ultérieure, on ouvre les deux fentes simultanément. On pourrait s’attendre à ce que le motif dessiné par les particules arrivant sur l’écran soit la somme de celui obtenu en ajoutant le motif obtenu avec la seule fente du haut ouverte à celui enregistré lorsque seule la fente du bas est ouverte. Mais ce n’est pas du tout ce qui se passe ! Lorsque les deux fentes sont ouvertes, tout se passe « comme si » les particules pouvaient passer par les deux fentes. C’est ce qui se passerait pour des ondes, et effectivement l’expérience fut réalisée la première fois en 1800 par Thomas Young, qui mit en évidence le phénomène typiquement ondulatoire des franges d’interférences (figure 7.4). Cette expérience eut un grand retentissement car à cette époque régnait une controverse sur la nature de la lumière. La lumière était-elle une onde (ce que soutenait Huyghens) ou était-elle formée de corpuscules (ce que soutenait Newton) ? L’expérience trancha en faveur de l’onde. Dans le cas de particules quantiques, tout se passe comme si l’onde associée à la particule interférait avec elle-même, car les particules arrivent une par une sur l’écran et ne peuvent pas interagir avec leurs voisines 5 . Nous pourrions essayer de déterminer le chemin suivi par la particule en utilisant par exemple des photons polarisés (voir ci-dessous), susceptibles d’étiqueter le chemin suivi, mais alors les interférences vont disparaître ! En fait, en ajoutant la polarisation, nous avons effectué une expérience différente ! C’est le dispositif expérimental qui détermine le résultat, et comme le dit Bohr en 1935 dans sa réponse à l’article 5
N.d.T. L’interprétation standard de la mécanique quantique, ou interpétation de Copenhague, ne se prononce pas sur ce qui se passe entre la source de particules et l’écran. La particule passet-elle par les deux fentes à la fois, par une seule fente, ou par aucune fente ? Dans l’interprétation dite de de Broglie/Bohm de la mécanique quantique, elle passe par une seule fente.
134
Chapitre 7. Physique contre-intuitive
F IGURE 7.5. L’ajout d’un polariseur intermédiaire permet à une partie de la lumière de passer.
d’Einstein, Podolsky et Rosen, on ne peut pas dissocier le phénomène quantique du dispositif utilisé pour l’observer. Donnons quelques détails sur la polarisation de la lumière. En physique classique, le champ électrique d’une onde électromagnétique vibre dans une direction orthogonale à la direction de propagation de l’onde. Un polariseur laisse passer intégralement la lumière vibrant dans une certaine direction, l’axe du polariseur, mais arrête la lumière vibrant dans une direction perpendiculaire. Si nous faisons passer de la lumière à travers deux polariseurs croisés, deux polariseurs dont les axes sont perpendiculaires, alors la lumière est arrêtée. Mais si l’on insère entre les deux polariseurs croisés un polariseur dont l’axe est incliné à 45o des axes précédents, alors une fraction de la lumière est rétablie à la sortie du second polariseur. Comment est-ce possible ? Supposons l’axe du premier polariseur vertical (voir la figure 7.5). Dans ce cas la lumière transmise par le premier polariseur vibre verticalement, et cette lumière est arrêtée par le second polariseur d’axe horizontal. Aucune lumière n’est transmise par l’ensemble. En ajoutant un troisième polariseur orienté à 45o , nous projetons le champ électrique √ sur cette direction. La longueur du vecteur champ électrique est réduite de 2, et comme l’intensité est proportionnelle au carré du champ, l’intensité lumineuse est ´ reduite d’un facteur deux. Le champ électrique intermédiaire est orienté à 45o de l’horizontale, et sa projection √ sur l’axe horizontal du polariseur de sortie réduit à nouveau sa longueur de 2, et donc l’intensité de 1/2. En tout 1/4 de l’intensité initiale sera transmise par l’ensemble des trois polariseurs. Mais quelle est la relation avec la théorie quantique ? Examinons le cas d’un électron. Cet électron possède un spin, et nous avons vu que ce spin se décrit commodément par une flèche. Le spin peut être orienté vers le haut ou vers le bas par rapport à n’importe quel axe. D’un point de vue classique, c’est assez étrange : on pourrait imaginer des orientations intermédiaires. Mais ce n’est pas le cas : quelle que soit la direction choisie, la valeur du spin est quantifiée, soit vers le haut, soit vers le bas, par rapport à cette direction. Il est possible de
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
135
F IGURE 7.6. Ajouter un polariseur intermédiaire permet de faire tourner graduellement la direction polarisation de la lumière.
concevoir une expérience 6 où vous demandez à l’électron si son spin est orienté vers le haut ou vers le bas par rapport à un certain axe. Si vous choisissez un axe, par exemple l’axe Ox, vous obligez le spin à adopter une des deux orientations, à s’aligner suivant celle des x positifs ou celle des x négatifs. Si, après avoir mesuré le spin suivant Ox et trouvé par exemple le spin aligné suivant la direction des x négatifs, vous le mesurez suivant la direction Oy, alors il aura 50 % de chances d’être aligné dans la direction des y positifs et 50 % d’être aligné dans la direction des y négatifs. Cependant, si vous mesurez le spin suivant un axe du plan xOy faisant un angle de 45o avec Ox, alors vous obligez le spin à s’orienter suivant cet axe. C’est analogue à l’exemple ci-dessus impliquant des ondes lumineuses polarisées : lorsque l’on ajoute un polariseur intermédiaire incliné à 45o , alors on projette le champ électrique suivant une nouvelle direction, ce qui change le résultat sur l’écran final.
7.6
Indiscernabilité en physique quantique
Un autre aspect contre-intuitif de la physique quantique est l’indiscernabilité des particules quantiques. Supposons que je possède un électron, que vous aussi en possédiez un, et que nous mettions les deux électrons dans une boîte. Il est impossible d’étiqueter les deux électrons de telle sorte que nous puissions distinguer entre mon électron et le vôtre. Cela découle de la symétrisation de la fonction d’onde globale. Si un électron se trouve en une position particulière et que vous échangez sa position avec celle d’un autre électron, rien ne change pour la physique : c’est ce que l’on entend par la symétrie d’échange entre deux particules. En un sens la nature est démocratique : tous les électrons de l’Univers 6
N.d.T. Cette expérience a été réalisée pour la première fois dans les années 1920 par les physiciens allemands Otto Stern et Walther Gerlach.
136
Chapitre 7. Physique contre-intuitive
sont identiques et indiscernables ! Il n’y a pas de traitement préférentiel pour un électron donné.
7.7
Le paradoxe EPR
Einstein n’était pas satisfait du formalisme de la mécanique quantique et il a essayé plusieurs fois de montrer qu’elle était incomplète. Une de ses tentatives est connue sous le nom de « paradoxe » EPR, où EPR est l’acronyme pour les trois auteurs d’un article écrit en 1935 par Einstein, Podolsky et Rosen. Imaginons que vous possédez une particule de spin zéro qui se désintègre en deux particules de spin 1/2, par exemple un électron et un positron. Comme la particule initiale a spin zéro, par conservation du moment angulaire les deux particules finales doivent avoir des spins de direction opposée. Si le spin de l’électron est orienté vers le haut, celui du positron le sera vers le bas et réciproquement. Mais la physique quantique nous dit seulement que l’électron a une probabilité de 50 % d’avoir son spin vers le haut et 50 % d’avoir son spin vers le bas, et nous devons faire l’expérience pour observer une valeur déterminée du spin. Rappelons que cette valeur n’existe pas tant que nous n’avons pas effectué la mesure. Maintenant, supposons que cette désintégration ait eu lieu il y a très longtemps, et que les deux particules se soient éloignées sans qu’aucune mesure de leur spin n’ait été effectuée. Une physicienne, Alice, décide de mesurer un des deux spins. Elle peut alors prédire avec certitude le résultat de la mesure du spin de l’autre particule, car cette autre particule aura un spin opposé. En d’autres termes, elle détermine le résultat d’une expérience effectuée en un lieu éloigné par un autre physicien, Bob. Einstein était perturbé par ce résultat, qu’il appelait un « effet fantomatique à distance » (spooky action at a distance). Mais, ainsi que nous allons le voir, Einstein se trompait : il n’y a pas d’effet fantomatique à distance. On dit parfois que « la mécanique quantique est non locale », mais cette affirmation mérite d’être précisée. En fait la mécanique quantique ne contredit pas la relativité, car le phénomène EPR ne permet pas de communiquer de l’information à distance à une vitesse plus grande que celle de la lumière. Les deux électrons de l’exemple de la figure 7.7 sont dit intriqués, et l’information sur l’état des deux électrons est distribuée sur l’ensemble des deux particules. Cette intrication implique des corrélations très fortes entre les deux particules, en fait des corrélations plus fortes que celles de tout processus classique. Alice et Bob mesurent les polarisations avec des détecteurs arbitrairement éloignés, et ils peuvent mettre en évidence ces corrélations : ils constatent par exemple que si Alice a mesuré un spin orienté vers le bas alors Bob a mesuré un spin orienté
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
137
F IGURE 7.7. Le paradoxe EPR.
vers le haut, en communiquant entre eux à des vitesses inférieures à celles de la lumière. Il n’y a jamais « d’influence » de la mesure d’Alice sur celle de Bob et il est clair qu’il n’y a jamais risque de violation de la relativité. Einstein était cependant choqué par cette apparente action à distance qui semblait violer la relativité. Le problème est qu’en mécanique quantique les probabilités sont intrinsèques : il n’y a pas de mécanisme sous-jacent qui les explique. L’idée d’Einstein et d’autres physiciens était de revenir à des probabilités d’ignorance. Par exemple en mécanique statistique nous ne connaissons pas le détail de ce qui se passe et nous utilisons des probabilités pour prendre en compte cette ignorance. Une possibilité, mais qu’Einstein trouvait trop « bon marché », est d’introduire des variables supplémentaires, ou variables cachées, dont la distribution de probabilité redonnerait les résultats de la mécanique quantique. Dans une théorie de variables cachées, nous devons utiliser les probabilités car nous ne connaissons pas avec précision l’état de ces variables, et dans une telle théorie l’expérience ne fait que révéler des valeurs pré-existantes de quantités physiques, en contradiction avec les principes de la mécanique quantique. En 1965, le physicien irlandais John Bell conçut un test de la théorie des variables cachées. Au lieu de mesurer les spins suivant un seul axe, comme dans la figure 7.7, il proposa de mesurer les deux spins suivant des axes différents et de déterminer leurs corrélations. Il montra que dans le cadre d’une théorie où les corrélations étaient introduites à la source, ce que l’on appelle aussi une théorie de variables cachées locales, on pouvait établir une inégalité violée par la mécanique quantique. De nombreuses expériences ont montré que ces inégalités étaient violées et que les corrélations étaient au contraire en parfait accord avec les prédictions de la mécanique quantique. En conclusion, les seules théories de variables cachées compatibles avec l’expérience sont les théories non locales
138
Chapitre 7. Physique contre-intuitive
comme celle de de Broglie-Bohm, un type de théorie qu’Einstein aurait sûrement détesté. Malgré les succès jamais démentis de la mécanique quantique, nombre de physiciens estiment que l’interprétation standard, dite interprétation de Bohr ou de Copenhague, n’est pas le dernier mot sur le sujet. Cette interprétation repose sur l’existence d’une frontière entre le monde quantique et le monde classique, qui permet de séparer strictement l’évolution quantique du processus de mesure. Mais les raisons pour l’existence d’une telle frontière sont obscures, et le « problème de la mesure quantique » reste ouvert aujourd’hui. Certains physiciens pensent que la solution pourrait venir de la gravitation quantique. 7.8
Trous noirs
Les trous noirs ont pour origine des singularités dans les équations d’Einstein de la relativité générale. Une conséquence de cette théorie est que lorsque vous empilez une quantité de matière suffisamment grande dans un volume déterminé, alors vous obtenez un trou noir. Par exemple, si vous arriviez à comprimer la masse du Soleil dans une sphère de 3 km de rayon, vous obtiendriez un trou noir. La vitesse nécessaire pour échapper au trou noir serait plus grande que la vitesse de la lumière. En d’autres termes, une fois que l’on a pénétré à l’intérieur d’un trou noir, il est impossible de s’en échapper. La frontière du trou noir, la surface (mathématique) qui marque le point de non-retour, est appelée l’horizon des événements du trou noir : l’horizon des événements marque le point de non-retour 7 . On a de très bonnes raisons de penser que des trous noirs supermassifs sont situés au centre de la plupart des galaxies, y compris la nôtre. Il existe aussi des trous noirs de masse intermédiaire, de quelques masses solaires à plusieurs centaines de masses solaires. Il a été possible d’observer directement la silhouette d’un trou noir supermassif situé dans une galaxie appelée M87 à 55 millions d’années-lumière, ainsi que les orbites d’étoiles soumises au champ gravitationnel du trou noir supermassif de notre galaxie. Enfin plusieurs fusions de trous noirs ont été observées par des détecteurs d’ondes gravitationnelles LIGO et VIRGO. Alors que les observations, directes ou indirectes, sur les trous noirs se multiplient, notre compréhension théorique reste limitée. Nous avons passé une trentaine d’années à nous figurer la façon dont un objet tombait dans un trou noir, 7
N.d.T. Il faut insister sur le fait que l’horizon des événements est une surface mathématique. Il ne se passe rien de particulier au voisinage de l’horizon. Si un astronaute tombe en chute libre vers le centre d’un trou noir, il ne ressent rien de spécial au passage de l’horizon, mais il disparaît pour toujours du champ de vision d’un observateur extérieur une fois franchi l’horizon.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
139
F IGURE 7.8. On peut traverser l’horizon des événements d’un trou noir et entrer en collision avec sa singularité en un temps fini.
et en fait nous ne savons pas encore vraiment comment cela se passe. Les équations d’Einstein nous disent qu’un objet qui tombe en chute libre dans un trou noir traverse l’horizon des événements et atterrit sur une singularité de l’espacetemps en un temps fini (voir la figure 7.8). Cette singularité située à l’intérieur du trou noir, – en son centre pour un trou noir sphérique –, correspond à un point où la courbure de l’espace-temps devient infinie. En ce qui concerne ce qui arrive quand on atteint la singularité, les paris sont ouverts. Le fait que les solutions des équations d’Einstein prédisent une courbure de l’espace-temps infinie en certains points donne une indication que la relativité générale ne suffit pas à décrire les trous noirs. Einstein lui-même a toujours refusé d’admettre l’existence de trous noirs, alors que nous sommes aujourd’hui pratiquement certains qu’ils existent. De nombreux physiciens estiment que pour comprendre ce problème des singularités qui sont tapies l’intérieur des trous noirs, nous aurons besoin d’une théorie plus vaste, qui intègre la relativité générale et la physique quantique. Mais le défi est immense, bien que des progrès aient été accomplis. En utilisant la physique quantique, Stephen Hawking a montré il y a une cinquantaine d’années que les trous noirs peuvent émettre un rayonnement, connu sous le nom de rayonnement de Hawking, en contradiction avec la théorie classique où rien, pas même du rayonnement, ne peut s’échapper d’un trou noir. De plus Hawking, en s’appuyant sur un raisonnement de Bekenstein, a montré que l’aire de l’horizon d’un trou noir est reliée à son entropie, c’est-à-dire l’entropie contenue dans son volume. L’aire de l’horizon est elle-même reliée à la masse du trou noir. Cela conduit au paradoxe de l’information, parce que tout objet tombant dans un trou noir ne peut s’en échapper. Mais Hawking nous dit que les trous noirs rayonnent de l’énergie, ce qui implique qu’ils vont finir par disparaître,
140
Chapitre 7. Physique contre-intuitive
F IGURE 7.9. Des objets situés à l’intérieur du cylindre, incluant des trous noirs, peuvent être décrits avec la seule perspective de la frontière du cylindre. C’est le concept d’holographie, proposé pour la première fois par Gerard t’Hooft et Lenny Susskind.
sans fournir de l’information en raison du caractère thermique du rayonnement, et en détruisant toute l’information contenue dans l’objet avalé par le trou noir. Cela pose un problème potentiellement sérieux, car la mécanique quantique nous dit que l’information ne peut pas être détruite. L’opinion majoritaire est aujourd’hui que cette information devrait pouvoir être récupérée d’une manière ou d’une autre, mais nous n’en savons pas assez sur ce qui se passe à l’intérieur d’un trou noir pour envisager un mécanisme permettant une telle récupération. C’est une des nombreuses raisons pour lesquelles les trous noirs sont considérés comme faisant partie des objets les plus énigmatiques et les plus contre-intuitifs dans l’Univers. 7.9
Holographie
Les hologrammes sont des objets à deux dimensions qui transportent l’information sur trois dimensions et peuvent créer l’illusion de trois dimensions. L’holographie, plus largement, traite de systèmes qui possèdent un degré de liberté de moins qu’il n’y paraît. Quel est le lien possible avec les trous noirs ? Eh bien, nous avons mentionné que l’entropie d’un trou noir est liée à sa surface plutôt qu’à son volume. Il semble donc qu’il nous manque une dimension, comme si toute l’information contenue à l’intérieur d’un trou noir, un objet à trois dimensions, était secrètement codée sur sa surface à deux dimensions (ou horizon des événements), à la manière d’un hologramme. Ainsi un problème de volume a été brutalement réduit à un problème de surface. Cette façon d’envisager le
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
141
problème a été une source d’inspiration importante pour les physiciens théoriciens qui ont essayé de relier la gravitation sous une certaine forme et dans un certain espace-temps à un système physique dans une dimension d’espace-temps inférieure. Le principe en jeu dans cette approche est le principe d’holographie, qui est au cœur de travaux théoriques parmi les plus excitants aujourd’hui. Et l’on peut affirmer que l’impulsion à ce type de travaux est venue de réflexions sur les trous noirs, des objets jugés impossibles par Einstein alors qu’ils émergeaient de ses équations dès 1915, et qui ont acquis aujourd’hui une importance considérable que l’on ne pouvait pas imaginer au départ.
142
Chapitre 7. Physique contre-intuitive
8 Normalité en physique : analyse dimensionnelle 8.1
Un moment d’enseignement
Un professeur explique le théorème suivant à des étudiants de mathématiques : si M est une matrice n × n, alors det( M − λI ) = P(λ), où I est l’opérateur identité, est un polynôme de degré n en λ appelé le polynôme caractéristique de M, et P(λ) = 0 est l’équation caractéristique de M. Le théorème de CayleyHamilton énonce que P( M ) = 0. En d’autres termes, une matrice obéit à sa propre équation caractéristique. Un étudiant demande pourquoi cet énoncé est vrai. Le professeur répond : « Si une matrice n’obéit pas à sa propre équation caractéristique, alors à quelle équation caractéristique pourrait-elle bien obéir ? ». Ceci est bien sûr une blague, bien que de nature technique. Et même si cette blague ne vous fait pas rire, elle a une implication pédagogique : elle fait allusion à la notion de « naturel » ou de « normal », qui est au cœur de ce chapitre 1 . 8.2
Ordres de grandeur
Ce que les physiciens entendent par « naturel » est le fait que nous nous attendons à ce que des résultats de physique soient raisonnables. Commençons par des exemples de la vie quotidienne. Demandons-nous par exemple combien 1
N.d.T. Le texte anglais utilise naturalness, impossible à traduire en français. C’est pourquoi j’utilise « normalité », ou pour les adjectifs « naturel », voire « raisonnable ».
de mains vous avez pu serrer en une journée. Peut-être 5, 10 ou 20 ? Les physiciens estimeraient que ce nombre se situe entre 1 et 100, ou comme étant d’ordre 1, ce que nous écrirons de façon abrégée comme O(1). Il est possible que certaines personnes aient serré des milliers de mains dans une journée, par exemple Jacques Chirac au Salon de l’Agriculture, ou au contraire que, respectant les gestes barrière du COVID-19, vous n’en ayez serré aucune aujourd’hui. Mais cette estimation, O(1), est dans la bonne fourchette, c’est un ordre de grandeur naturel. Par « ordre de grandeur », on entend en général un facteur 10, par exemple 155 diffère de 20 par un ordre de grandeur. Dans ce livre, un ordre de grandeur sera plutôt un facteur 100. Nous venons de donner un exemple de ce qu’est un ordre de grandeur. Il arrive souvent en physique que nous voulions estimer une quantité avec une précision raisonnable, mais nous voulons le faire rapidement, sans entrer dans les détails et sans vouloir donner de nombre exact. Nous allons en donner des exemples très bientôt. L’esprit de notre discussion est que nous voulons donner une estimation à l’intérieur d’un facteur 100, par exemple si le résultat exact est 0, 15, 7 sera une estimation raisonnable. De nombreuses constantes sans dimension telles que 2, e, π, · · · interviennent dans un calcul exact en physique. Elles sont toutes O(1) et on peut les remplacer par 1 dans un calcul approché. S’il vous arrive de rencontrer une formule avec un facteur déraisonnable comme 1025 , alors vous devez hocher la tête et devenir soupçonneux. Ou au minimum vous devez vous demander d’où provient un tel facteur. C’est, à mon avis, une bonne pratique en physique, car elle rend la vie plus facile tout en injectant une dose de raison dans le domaine. Tout cela n’est valable que si votre résultat est un nombre sans dimension. Mais cet argument n’a pas de sens si votre résultat s’exprime en mètres, en kilogrammes, ou tout autre unité physique, parce que nous pouvons redéfinir le système d’unités comme bon nous semble. Peut-on dire que le résultat 1,5 m est raisonnable et que ce même résultat exprimé comme 1,5 × 109 nm ne l’est pas ? Il faut donc exprimer le résultat comme une quantité sans dimension : seules de telles quantités sont a priori O(1). Mais une telle exigence est fondée sur une expérience de physicien, et elle n’est pas d’une validité absolue. Le plus souvent elle fonctionne, mais il y a des exceptions.
8.3
Analyse dimensionnelle
Supposons que nous soyons intéressés par une quantité physique produit d’une constante sans dimension X par une combinaison Aα B β C γ , où A, B et C sont des quantités dimensionnées, par exemple A est mesurée en mètres, B en
144
Chapitre 8. Normalité en physique : analyse dimensionnelle
kilogrammes et C en secondes quantit´e = X Aα B β C γ . Il arrive souvent que l’analyse dimensionnelle nous permette de déterminer les exposants α, β, γ. Cette approche est particulièrement puissante quand nous savons que la quantité qui nous intéresse dépend de quelques paramètres seulement, et qu’une combinaison unique de A, B, C donne la quantité recherchée avec la dimension correcte. Remarquons que cette méthode ne nous donne aucune information sur la constante X, mais notre intuition est qu’elle devrait être O(1).
Énigme. Supposons que la série Myth Busters essaie de faire un modèle réduit d’une cascade : un bus franchissant en vol un pont détruit. Les cinéastes construisent une maquette à l’échelle 1/15. Mais quelle vitesse doivent-ils donner au bus de la maquette pour rendre compte à cette échelle de la vitesse de 100 km/h du bus en taille réelle ? N’utilisez aucune équation de la mécanique, mais le fait que cette vitesse doit dépendre uniquement de l’accélération de la pesanteur g, de la vitesse initiale v du bus en taille réelle et de la longueur L du pont détruit, également en taille réelle. √ Solution. Il faut réduire la vitesse par un facteur 15. Pourquoi ? Soit v( g, L) la vitesse du bus au moment où il s’envole. Alors (∝ = proportionnel à) v( g, L) ∝ gα L β . L’unité de vitesse est L/T, celle de g est L/T 2 . Nous nous attendons donc à ce que v2 ∝ gL, de sorte que p v ∝ gL. √ √ Par conséquent v ∝ L = 1/ 15 : pour la maquette, il faut diviser la √ vitesse √ par 15 et donc donner au modèle réduit de bus une vitesse de 100/ 15 ≃ 26 km/h. C’est une très bonne estimation, avec X = O(1). On peut calculer exactement la distance L parcourue par un objet lancé avec une vitesse v qui fait un angle θ avec la verticale. On trouve que v2 ∝ gL/ sin(2θ ). Pour des valeurs de θ qui ne sont pas proches de zéro, la constante 1/ sin(2θ ) est O(1). 8.4
Rayonnement de charges accélérées
Si une charge électrique suit un mouvement accéléré, par exemple un mouvement circulaire uniforme, elle rayonne de la lumière et plus généralement un rayonnement électromagnétique. Essayons d’estimer la puissance rayonnée à
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
145
partir de l’analyse dimensionnelle. Nous notons une longueur L, un temps T et une masse M. La puissance est une énergie par seconde, P =énergie/temps. La puissance P est une fonction de la charge électrique q, de l’accélération a et de la vitesse de la lumière dans le vide c : P(q, a, c). En unités naturelles : 1. d’après la loi de Coulomb donnant la force entre deux charges q, la force est F ∼ q2 /r2 et l’énergie, E ∼ Fr ∼ q2 /r, et donc q2 a pour unité E · L ; 2. la puissance a pour unité P = E/T ∼ q2 /( LT ) ; 3. la vitesse de la lumière c a pour unité L/T ; 4. l’accélération a pour unité a = L/T 2 . Passons à l’analyse dimensionnelle. Comme T ∼ c/a et L ∼ c2 /a, nous pouvons deviner que la seule combinaison correcte est P∼
q 2 a2 . c3
Quelle est la réponse exacte ? Il se trouve que nous avons juste manqué un facteur 2/3 2q2 a2 . P= 3c3 Ce résultat est appelé loi de Larmor. L’analyse dimensionnelle nous a bien donné le résultat à un facteur O(1) près. 8.5
Invariance d’échelle et invariance conforme
Prenez une région d’un plan et faites-la tourner autour d’un axe pour obtenir un objet à trois dimensions comme dans la figure 8.1. Si la dimension le long de l’axe est de l’ordre de L, on peut en déduire que le volume de l’objet correspondant sera O( L3 ), avec un certain coefficient de proportionnalité. Cela pourrait se révéler faux si la forme présentait des pathologies, mais en général ce sera correct. Si on vous donne une pomme de terre et que vous mutipliez ses dimensions par 10, comment le poids va-t-il changer ? Il augmente évidemment par un facteur 103 . Lorsque la forme d’un objet est fixée et que chaque paramètre est multiplié par un facteur λ, alors le volume est multiplié par un facteur λ3 . Dans un espace de dimension D, on trouverait un facteur 2 λ D . C’est un énoncé mathématique qui définit la dimension de l’espace. Cela nous amène à une autre énigme. 2
N.d.T. C’est une blague bien connue des plaisanciers que si l’on achète un bateau plus long par un facteur λ, la surface à peindre est multipliée par λ2 , le volume habitable par λ3 . . . et les ennuis par λ4 .
146
Chapitre 8. Normalité en physique : analyse dimensionnelle
F IGURE 8.1. Faire tourner une courbe fermée de longueur L autour d’un axe voisin construit un objet dont le volume est d’ordre L3 .
Énigme. Supposons que nous multiplions toutes nos dimensions par un facteur 100, sans modifier notre composition chimique. Est-ce nous rencontrerions des problèmes ? Solution. Suivant les remarques précédentes, notre poids serait multiplié par 106 . Mais la résistance de nos os ne changerait pas, et nos pieds auraient à supporter un poids plus grand relativement à leur section droite, qui croît seulement comme 104 . Cela veut dire que les os devraient supporter une pression plus grande par un facteur 106 /104 = 102 , et ils s’effondreraient certainement. Nous constatons donc que notre Univers n’est pas invariant par les transformations d’échelle, ou plus brièvement il n’est pas invariant d’échelle. Ce n’est pas par hasard que nos corps ont des dimensions caractéristiques précises, bien sûr à l’intérieur de certaines limites. C’est un fait auquel nous sommes tellement habitués qu’il semble plutôt évident. De même les atomes ou les étoiles, du moins les étoiles à l’intérieur d’une classe spécifique, ont des dimensions particulières. Cependant il existe en physique des théories, appelées théories des champs invariantes conformes, qui sont invariantes par un changement d’échelle. Dans ces théories, les quantités physiques qui nous intéressent se transforment simplement par un changement d’échelle. Dans une théorie des champs conforme, la masse ne peut pas exister car, ainsi que nous allons le voir, une masse fixerait une échelle. Être en possession d’une théorie invariante d’échelle rend les choses bien plus simples, en un certain sens.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
147
8.6
Unités fondamentales
En physique, nous avons affaire à des quantités qui sont mesurées dans certaines unités. Les quantités dimensionnées de base sont choisies comme étant le temps (T), mesuré en secondes (s), la longueur (L), mesurée en mètres (m), et la masse ( M ), mesurée en kilogrammes (kg). C’est un choix pratique mais arbitraire, on aurait pu par exemple choisir l’énergie au lieu du temps, puisque l’énergie s’exprime comme E = ML2 T −2 . Il existe donc un grand nombre de choix possibles, on aurait aussi pu choisir la charge électrique ou la température. La charge électrique, nous l’avons vu, s’exprime comme q = E1/2 L1/2 , et quant à la température (absolue) Θ, elle est reliée à l’énergie par E = kB Θ, où kB est la constante de Boltzmann. Cette constante est omniprésente en thermodynamique et en mécanique statistique, par exemple la formule de l’entropie gravée sur la tombe de Boltzmann 3 est S = kB ln Ω, mais cette constante n’ajoute rien de fondamental à la physique : c’est juste un facteur de conversion entre énergie et température. On pourrait parfaitement mesurer la température en unités d’énergie, donc en joules, sans jamais introduire kB . D’ailleurs, dans de nombreux livres de mécanique statistique on pose tout simplement kB = 1. Il est souvent arrivé que les physiciens aient introduit une nouvelle unité, pour s’apercevoir ensuite qu’elle était fonction des précédentes. Donc nous avons trois unités fondamentales, L, T et M, mais pourquoi ? Je n’ai pas de bonne réponse à cette question, il semble que ce soit une caractéristique de notre Univers. Nous l’avons noté, nous pourrions choisir d’autres unités de base, par exemple l’énergie et la charge au lieu du temps et de la masse, mais quel que soit ce choix, nous aurions toujours trois unités. Un résultat assez extraordinaire est que la Nature semble choisir ses propres unités de base pour L, T et M. Il se trouve que ces trois unités sont reliées à trois domaines fondamentaux de la physique : la gravitation, l’électromagnétisme et la mécanique quantique. Ce que nous voulons dire est que chacun de ces domaines introduit une unité fondamentale de la Nature. 1. Newton a introduit la constante de gravitation G : la force entre deux masses ponctuelles M et M ′ séparées par une distance r est F = GMM ′ /r2 . 2. L’électromagnétisme et la relativité ont introduit la vitesse de la lumière dans le vide c.
3
N.d.T. En fait les notations sont différentes, et la formule gravée est S = k ln W.
148
Chapitre 8. Normalité en physique : analyse dimensionnelle
3. La mécanique quantique a introduit la constante de Planck 4 h¯ . Il se trouve que G, c et h¯ sont des quantités indépendantes en ce qui concerne leurs dimensions, ce qui permet d’écrire les unités L, T, M en fonction de ces constantes fondamentales de la physique. Faisons-le explicitement. 1. De la loi de Newton F = ma et en utilisant la loi de la gravitation [G ] M2 L−2 = MLT −2 , où [G ] désigne la dimension de G, nous déduisons [ G ] = L3 M −1 T −2 . 2. [c] = LT −1 . 3. De la relation énergie-fréquence E = h¯ ω, nous déduisons [h¯ ] = ET = ML2 T −1 . Pour vérifier que ces trois constantes sont bien indépendantes dimensionnellement, il faut s’assurer qu’il n’existe pas de nombres α, β, γ tels que G α c β h¯ γ soit sans dimension. On trouve 3α + β + γ = 0
α−γ = 0
2α + β + γ = 0 ,
et ces trois équations sont incompatibles. Déterminons maintenant les unités de longueur, de temps et de masse en fonction de ces trois constantes. On trouve : 1. L = h¯ 1/2 G1/2 c−3/2 : c’est la longueur de Planck. 2. T = h¯ 1/2 G1/2 c−5/2 : c’est le temps de Planck. 3. M = h¯ 1/2 c1/2 G −1/2 : c’est la masse de Planck. Un système d’unités très en vogue chez les théoriciens est celui où toutes ces quantités sont égales à l’unité. Cela donne un système d’unités élégant et pratique : on mesure les quantités physiques en unités de Planck, ou unités naturelles, qui sont reliés aux unités ordinaires par : 1. la longueur de Planck est égale à 1,6 × 10−35 m ; 2. le temps de Planck est de 5,4 × 10−44 s ; 3. la masse de Planck est de 2,2 × 10−8 kg. Une autre quantité également utile est l’énergie de Planck, qui est la masse de Planck fois c2 : EPlanck = 1,2 × 1019 GeV. La longueur de Planck et le temps 4
N.d.T. La constante h¯ est en fait h/(2π ), où h est la constante introduite à l’origine par Planck. On peut écrire la relation énergie (E)-fréquence (ν) sous la forme E = hν ou sous la forme équivalente E = h¯ ω, où ω = 2πν est la fréquence angulaire. Cette deuxième forme est la plus utilisée en pratique, et on constate empiriquement qu’il vaut mieux utiliser h¯ de préférence à h si l’on veut des facteurs numériques O(1).
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
149
de Planck sont très petits même par rapport à des échelles caractéristiques de la physique subatomique, mais la masse de Planck est grande à cette échelle, puisqu’elle est équivalente à la masse d’environ 1019 protons. Mais nous avons oublié quelque chose d’important ! La charge de l’électron e semble fondamentale, et pourtant nous ne l’avons pas utilisée. Mais la charge de l’électron n’est pas une quantité dimensionnellement indépendante. Le lecteur est encouragé à vérifier que e2 a la dimension de h¯ c, autrement dit la quantité e2 /(h¯ c) est un nombre sans dimensions. En fait e2 /(h¯ c) est O(1) dans ces unités α=
1 e2 ≃ . h¯ c 137
Ce nombre, 1/137, est appelé la constante de structure fine qui est notée α. Certains physiciens ont essayé de calculer cette constante en fonction de constantes mathématiques comme π, e, . . ., mais sans succès. Cependant la charge de l’électron n’est pas si fondamentale car, nous l’avons vu, la valeur de α croît avec l’énergie caractéristique du processus étudié 5 . Par exemple, aux énergies caractéristiques de la masse du boson Z0 , soit 90 GeV, α ≃ 1/128.
Énigme. Quelle est l’énergie minimale d’une particule de masse m enfermée dans une boîte cubique de côté l ? En physique classique ce serait zéro : une particule immobile, d’énergie cinétique nulle. Mais le principe d’indétermination de Heisenberg interdit que la particule ait à la fois une impulsion nulle et une position déterminée. Comme il s’agit d’un problème de physique quantique non relativiste, le résultat ne peut dépendre, en plus de la masse m et de la longueur l, que de h¯ : la vitesse de la lumière et la constante de gravitation ne sont pas pertinentes dans ce problème. Solution. Il faut construire une énergie avec l, h¯ et m. Cherchons une solution de la forme h¯ α l β mγ ayant dimension ML2 T −2 . Cela donne α+γ = 1 soit
2α + β = 2
γ = −1 ,
h¯ 2 E=X 2. ml
5
N.d.T. Cela peut sembler surprenant. En fait, dans le calcul d’un processus d’énergie caractéristique E, on voit apparaître des termes logarithmiques du type ln( E/m), où m est la masse de l’électron si l’on choisit la valeur de α = 1/137. Ces termes logarithmiques sont susceptibles de devenir grands si E/m est grand et de menacer la validité du calcul, mais ils peuvent être absorbés dans une redéfinition de α, si l’on fait dépendre α de l’énergie et que l’on choisit α( E ), et non 1/137. Si l’énergie caractéristique du processus étudié est de 90 Gev, on prendra α = 1/128.
150
Chapitre 8. Normalité en physique : analyse dimensionnelle
Le calcul exact donne X = 3π 2 /2, et on vérfie que 3π 2 /2 = O(1). Une autre manière d’arriver au résultat est de remarquer que l’analyse dimensionnelle donne pour l’impulsion p = h¯ /l et E = p2 /(2m). Lorsque l diminue, la particule est de plus en plus confinée et son énergie croît indéfiniment lorsque l → 0. Remarquez que p × l ∼ (h¯ /l ) × l ∼ h¯ , ce qui est le principe d’indétermination de Heisenberg : le produit de l’indétermination sur l’impulsion par l’indétermination sur la position est de l’ordre de h¯ .
Énigme. Déterminer le niveau d’énergie le plus bas (ou niveau fondamental) de l’atome d’hydrogène en remarquant que le proton est très lourd par rapport à l’électron. Solution. L’énergie de l’électron est composée de l’énergie cinétique de l’électron p2 /2m et de l’énergie potentielle de Coulomb −e2 /r, où m est la masse de l’électron et r la distance entre l’électron et le proton. L’énergie cinétique du proton est négligeable parce que le proton est très lourd par rapport à l’électron. Nous avons donc pour l’énergie E e2 p2 − . E= 2m r Mais le principe de Heisenberg nous dit que r ∼ h¯ /p. On remplace donc r par h¯ /p ce qui donne e2 p p2 − . E= 2m h¯ Comme on recherche le niveau le plus bas, il faut chercher le minimum de E, dE/dp = 0, ce qui donne p = me2 /¯h et E=−
me4 2¯h2
≃ −13, 6 eV .
C’est le résultat exact, mais bien sûr c’est un accident. Ce qui est intéressant est que l’énergie minimale est obtenue en cherchant le meilleur compromis entre une énergie potentielle qui croît négativement comme 1/r et une énergie cinétque qui croît comme 1/r2 lorsque r → 0 en raison du principe de Heisenberg. Sans ce principe, l’électron tomberait en spirale sur le proton en émettant du rayonnement électromagnétique : un atome d’hydrogène classique est instable. On remarque aussi que le même calcul donne le rayon de l’atome d’hydrogène, ou rayon de Bohr a0 h¯ h¯ 2 a0 ≃ ≃ ≃ 0,5 × 10−10 m , p me2 ce qui donne l’ordre de grandeur de la taille d’un atome.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
151
8.7
Trous noirs
Nous l’avons vu, les trous noirs sont parmi le objets les plus énigmatiques de l’Univers. Mais nous pouvons calculer certaines de leurs caractéristiques par analyse dimensionnelle.
Énigme. De combien devez-vous contracter le Soleil pour en faire un trou noir ? La solution implique uniquement G, c et la masse du Soleil M, car il s’agit d’un problème classique et h¯ n’est pas pertinent. Solution. Nous cherchons à écrire le rayon d’un trou noir en fonction de G, c et M, la masse du Soleil. Il est immédiat de voir que la solution est R∼
GM . c2
Il faut travailler d’arrache-pied et résoudre les équations de la relativité générale pour trouver le résultat exact 2GM R= . c2 Cette distance est appelé le rayon de Schwarzschild. C’est le rayon de l’horizon des événements d’un trou noir de masse M à symétrie sphérique. Si l’on remplace M par la masse du Soleil, on constate qu’un trou noir d’une masse solaire aurait un rayon de 2,95 km. Que dire de l’entropie d’un trou noir ? Bekenstein a argumenté que cette entropie devrait être proportionnelle à l’aire de l’horizon des événements, et c’est ce qui a mis Hawking sur la voie du calcul exact de cette entropie.
Énigme. Estimez l’entropie d’un trou noir par analyse dimensionnelle. Cette fois h¯ entre en jeu, parce que déterminer l’entropie consiste essentiellement à compter un nombre d’états quantiques. Solution. L’entropie, qui est le logarithme d’un nombre de configurations, est une quantité sans dimension 6 . La première étape est de construire une quantité sans dimension à partir de l’aire A. Autrement dit, nous voudrions exprimer l’aire en unités de Planck (BH=Bekenstein-Hawking) SBH ∝
A L2Planck
∝
GM2 G 2 M 2 c3 = . 4 c h¯ G h¯ c
6
N.d.T. Le lecteur familier de la thermodynamique sera sans doute surpris, car l’entropie thermodynamique s’exprime en joules par degré. En fait l’entropie S dans ce livre est reliée à l’entropie thermodynamique Sth par Sth = kB S où kB est la constante de Boltzmann, qui se mesure en joules par degré.
152
Chapitre 8. Normalité en physique : analyse dimensionnelle
Hawking a calculé exactement le facteur de proportionnalité qui se trouve être 4π, ce qui est égal à 1/4 de l’aire A SBH = 4π
8.8
GM2 . h¯ c
Symétrie et nombres naturels
Nous avons déjà mentionné que les physiciens ne sont pas très à l’aise lorsqu’ils sont confrontés à des nombres qui ne sont pas O(1). Mais ce n’est pas toujours le cas. Les physiciens sont prêts à accepter des nombres très petits au voisinage d’un point de symétrie, lorsque la symétrie d’un système physique est augmentée si ce nombre est juste égal à zéro. Nous pourrions accepter que ce nombre très petit soit considéré comme naturel parce que nous nous trouvons tellement près d’un point de symétrie. Dans ce cas, nous dirons que ce nombre est « protégé » par la symétrie, et nous le traitons comme s’il correspondait littéralement au point de symétrie. Donnons-en l’illustration suivante. Supposons une Terre idéale parfaitement sphérique, avec une symétrie de rotation exacte autour de son centre. À quelle distance serait situé le centre de masse de la Terre par rapport au centre de la sphère ? En raison de la symétrie, cette distance serait évidemment nulle. Supposons maintenant qu’une personne soit debout sur la surface de cette Terre idéale, ce qui brise la symétrie sphérique. Soit ∆ la différence de distance entre le centre de masse et le centre de la Terre et soit R le rayon de la Terre. Le centre de masse s’est écarté du centre de la Terre par une quantité minuscule, proportionnelle au rapport de la masse de la personne à celle de la Terre. Ainsi la distance entre le centre de masse et le centre de la Terre est une quantité microscopique, essentiellement négligeable, parce que cette distance est protégée par la symétrie sphérique. Dans ce cas, le fait que le rapport ∆/R soit si petit et non O(1) ne va surprendre personne. Au passage, mentionnons que l’on a effectivement mesuré la distance entre le centre de masse et le centre de la Terre, bien que ce dernier terme soit un peu compliqué à définir exactement. Le résultat – à supposer que la définition soit correcte –, est de 0,1 m, ce qui correspond à un rapport ∆/R ≃ 10−8 . C’est un exemple de quantité petite parce qu’elle est protégée par une symétrie. Nous allons explorer ces idées dans le prochain chapitre. Les physiciens se demandent parfois pourquoi la masse du proton est si petite, environ 10−19 fois la masse de Planck. C’est un nombre déraisonnablement petit, et nous aimerions pouvoir l’expliquer.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
153
On pourrait imaginer choisir comme comme unités fondamentales des candidates autres que celles que nous avons sélectionnées. Pourquoi pas la taille du proton comme unité de longueur ou l’âge de l’Univers comme unité de temps ? Pourquoi ne pas les choisir comme unités fondamentales de la Nature 7 ? Et quelle est la relation entre ces quantités et les unités fondamentales ? Dirac a exploré ces questions au début du XXe siècle, en essayant de comprendre l’origine des ces grands nombres et la façon dont ils pourraient être connectés. Les physiciens ont avancé quelques idées, mais on peut dire qu’aujourd’hui le problème reste entièrement ouvert. Cela met en lumière un autre point : la normalité est un principe d’orientation important, et nombreux sont les théoriciens qui consacrent une partie de leur temps à réfléchir à cette question et à son rôle dans l’Univers, tout en s’efforçant en parallèle de trouver une explication à des quantités qui ne sont pas a priori naturelles.
7
N.d.T. Ces deux quantités ont un défaut rhédibitoire en tant que constantes fondamentales : elles ne sont pas bien définies et de plus non reproductibles dans le second cas.
154
Chapitre 8. Normalité en physique : analyse dimensionnelle
9 Anormalité et grands nombres Au chapitre précédent, nous avons exploré la puissance de la normalité. Les nombres sans dimension qui apparaissent en physique sont a priori, avons-nous expliqué, de l’ordre de 1. Cela rend les choses plus simples et plus transparentes. Mais parfois ce préjugé entre en contradiction avec les faits. Il arrive que des nombres très grands ou très petits pointent le bout de leur nez en physique. Ce problème, ainsi que nous allons le voir dans ce chapitre, s’avère être un aspect plutôt important de la physique moderne. De fait, trouver une explication pour la persistence de nombres anormalement grands ou anormalement petits dans la Nature constitue un des grands défis de la physique contemporaine. 9.1
Nombres « anormaux »
On trouve peu de quantités fondamentales sans dimension en physique. Une de ces quantités est la constante de structure fine α, formée à partir de la constante de Planck h¯ , de la vitesse de la lumière c et de la charge de l’électron e α=
1 e2 ≃ . h¯ c 137
α est ce que l’on appelle une constante de couplage, dans ce cas la constante de couplage des interactions électromagnétiques. Malheureusement c’est une des rares quantités sans dimension qui est O(1). Un objectif de base en physique théorique moderne est de comprendre pourquoi les autres constantes sont « non naturelles », c’est-à-dire que leur valeur numérique est déraisonnable. Par exemple, une unité d’énergie naturelle en physique subatomique est l’énergie de masse du proton, m p c2 ≃ 1 GeV, mais l’énergie de Planck est de 1019 GeV. En
F IGURE 9.1. Les différentes échelles de masse de la physique subatomique comparées à l’échelle de Planck. On a porté en abscisses le logarithme en base 10 du rapport M/mPlanck .
d’autres termes, la masse du proton en unités naturelles de l’Univers, en unités de Planck, est m p /MPlanck = 10−19 . C’est un nombre minuscule, et nous ne pouvons certainement pas le considérer comme étant O(1). Il est intéressant de remarquer que les masses des particules se rassemblent en première approximation en trois groupes s’étendant sur 30 ordres de grandeur (voir la figure 9.1). Cette figure porte sur un axe le logarithme des masses m de certaines particules en fonction de la masse de Planck choisie comme origine : c’est donc log(m/MPlanck ) qui est porté sur le graphique. Les masses d’un certain nombre de particules sont contenues dans un intervalle qui va de 1 à 100 GeV/c2 , ou en termes de la masse de Planck, de 10−19 à 10−17 . La masse du proton est de 1 GeV/c2 et celles du quark top, la particule la plus lourde connue, de 175 GeV/c2 . Un autre groupe de particules a des masses comprises entre celle de l’électron (0,5 MeV/c2 ) et celle du proton. La masse des neutrinos est encore mal connue, mais elle estimée aux environs de 0,01 eV/c2 . De plus la figure 9.1 indique une autre échelle, MGUT , l’échelle de grande unification, que nous avons déjà introduite et qui est proche de l’échelle de Planck. Les charges, par exemple la charge de l’électron, dépendent de l’énergie (ou de la distance), mais cette dépendance est logarithmique, donc lente. Si nous portons la constante de structure fine et ses équivalents pour les interactions faibles et les interactions fortes en fonction de l’énergie, nous constatons qu’elles deviennent égales à très haute énergie : les trois interactions sont unifiées et ceci est appelé la grande unification dont on pense qu’elle se produit à une énergie MGUT c2 . C’est du moins l’opinion dominante chez les théoriciens. L’échelle d’énergie de la grande unification est proche (par un facteur 10−3 ) de l’échelle de Planck. Dans ce cas on n’a pas besoin d’un « ajustement millimétrique 1 ». Cependant les échelles d’énergie autres que celle de la grande unification sont très différentes de celle de Planck, et cette disparité mérite une explication. La théorie des champs quantiques suggère que les masses sont reliées entre elles de façon exponentielle, une manifestion de la dépendance en énergie des 1
N.d.T. Traduction de fine tuning. Cela veut dire qu’il faut ajuster très finement les paramètres d’une théorie pour rendre compte de nombres qui sont très grands ou très petits.
156
Chapitre 9. Anormalité et grands nombres
constantes de couplage. Une explication possible de la petitesse de la masse du proton par rapport à la masse de Planck est contenue dans l’équation X¯hc m p = MGUT exp − 2 , g où X est une constante sans dimension O(1) et g la constante de couplage des interactions fortes. Autrement dit, l’exposant peut être un nombre assez grand, disons de l’ordre de 102 que l’on peut encore considérer comme O(1), mais l’exponentielle, elle, est très grande. De la même façon, des idées issues de la théorie des champs quantiques expliquent de manière naturelle pourquoi la masse de l’électron n’est pas si différente de celle du boson de Higgs. Le même type d’idée prédit aussi que la masse du boson de Higgs, m H , est la moyenne géométrique de la masse du neutrino mν et celle de grande unification m2H ∼ mν × MGUT . Le fait que m H ≪ MPlanck est l’un des grands mystères de la physique fondamentale et constitue ce que l’on a appelé le « problème de la hiérarchie ». Pendant qu’un boson de Higgs voyage dans le vide de Higgs, il interagit avec de nombreuses autres particules qui se matérialisent un très court instant avant de redisparaître 2 . Chacune de ces interactions contribue en principe à la masse du boson de Higgs, et le résultat « naturel » serait que ce processus donne au boson de Higgs une masse voisine de la masse de Planck. Le fait que la masse du boson de Higgs soit 10−17 de la masse de Planck n’est donc pas « naturel ». Une solution possible à ce dilemme est de postuler une symétrie additionnelle, la supersymétrie, où les contributions virtuelles à la masse du boson de Higgs s’annulent deux à deux. En effet la supersymétrie a pour conséquence qu’à chaque particule de statistique donnée, boson ou fermion, correspond un superpartenaire, une particule de statistique opposée, fermion ou boson, et la contribution d’une particule à la masse du boson de Higgs est compensée par celle de son superpartenaire. Cependant, étant donné que la supersymétrie est loin d’être validée et que les résultats récents du LHC ne rendent pas très optimiste sur sa pertinence physique, le problème de la hiérarchie plane encore de façon menaçante au-dessus de nous, et nous continuons à nous demander pourquoi mHiggs ≪ MPlanck . Il nous faut donc trouver une explication à cette disparité : pourquoi la masse du boson de Higgs est-elle plus petite que la masse de Planck par 17 ordres 2
N.d.T. Le boson de Higgs peut par exemple se transformer en une paire quark-antiquark « virtuelle » car, en mécanique quantique, un processus peut violer la conservation de l’énergie pourvu qu’il se passe en un temps assez court : c’est ce que l’on appelle un processus virtuel.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
157
de grandeur ? Ainsi que nous l’avons expliqué précédemment, le vide de Higss induit une masse pour le boson en raison d’une brisure de symétrie. On pourrait donc rechercher une explication du type : la valeur moyenne sur le vide du champ de Higgs est petite en raison d’une symétrie. C’est une idée séduisante, mais la théorie quantique la met à mal. Il se trouve que même si nous partons d’une quantité petite en raison d’une symétrie, les fluctuations quantiques sont si importantes que cette quantité est renvoyée inexorablement à l’échelle de Planck. Les théoriciens ont cherché diverses manières de dompter ces fluctuations quantiques, mais pour le moment sans succès. La supersymétrie est la solution la plus populaire pour dompter ces fluctuations quantiques, mais il n’y a pour l’instant aucune preuve, directe ou indirecte, de sa validité, et elle continue à être recherchée au LHC. En résumé, nous n’avons aujourd’hui aucune explication convaincante de la hiérachie des masses, du facteur 10−17 entre la masse du boson de Higgs et la masse de Planck.
Énigme : le problème du troupeau d’Archimède. Il s’agit d’un problème que posait Archimède à ceux qui affirmaient maîtriser les mathématiques, et luimême n’en connaissait pas la solution. Dans ce problème, on dispose d’un troupeau de vaches et de taureaux, chacun des animaux pouvant être d’une couleur choisie parmi quatre couleurs différentes : blanc (B), noir (N), tacheté (T) et jaune (J). Il y a B, N, T, J vaches et B′ , N ′ , T ′ , J ′ , taureaux. Ces nombres doivent obéir aux équations 1 1 B= + N+J 2 3 1 1 N= + T+J 4 5 1 1 T= + B+J 6 7
B
′
=
N′ = T′ = J′ =
1 3 1 4 1 6 1 6
+ + + +
1 (N + N′ ) 4 1 (T + T ′ ) 5 1 ( J + J′ ) 5 1 ( B + B′ ) 7
À ces équations s’ajoutent deux contraintes additionnelles : ( B + N ) = k2 , un carré parfait, et ( T + J ) = n(n + 1)/2. La question est la suivante : quelle est la valeur minimale des entiers strictement supérieurs à zéro B, N, T, J, B′ , N ′ , T ′ , J ′ qui obéissent à ces équations ? On s’attendrait naïvement à ce que ces nombres soient O(1), car les nombres qui figurent dans les équations ci-dessus sont tous O(1).
158
Chapitre 9. Anormalité et grands nombres
En fait, la solution implique des nombres de l’ordre 3 de 10206545 , ce qui est énorme ! La leçon de cet exercice est que des équations simples avec des contraintes qui limitent le nombre d’animaux à des entiers strictement positifs peuvent conduire naturellement à des nombres astronomiques. Comment un problème qui semble aussi simple peut-il posséder une solution aussi extravagante ? Il est possible que quelque chose d’analogue se passe en physique, et que des contraintes impliquant des nombres entiers introduisent des nombres gigantesques. Et il est possible que les problèmes de hiérarchie aient quelque chose à voir avec une compréhension plus profonde de la théorie des nombres.
9.2
Nombres déraisonnables et système héliocentrique
L’idée que la Terre est en mouvement est naturelle aujourd’hui, mais dans le passé on pouvait développer nombre d’arguments en faveur d’une Terre stationnaire. En particulier, tous les objets en dehors du Soleil, de la Lune et de quelques planètes vagabondes étaient stationnaires par rapport à la Terre 4 . Lorsqu’au troisième siècle avant notre ère Aristarque de Samos proposa que la Terre n’était pas stationnaire et tournait autour du Soleil, il fut vertement critiqué. Son modèle suggérait-il que non seulement la Terre tournait autour du Soleil, mais en plus que les étoiles fixes par rapport à la Terre effectuaient aussi une telle rotation ? Supposer que tous les objets célestes tournaient autour du Soleil était une hypothèse bizarre. Mais Aristarque argumenta que si les étoiles étaient très éloignées du Soleil comparativement à la Lune et les planètes, alors elles apparaîtraient parfaitement stationnaires par rapport au Soleil. Ainsi un modèle héliocentrique était finalement aussi simple pour les étoiles que celui de la Terre stationnaire. Mais sa théorie présentait un aspect non naturel : comment peut-il se faire qu’un petit nombre de corps célestes soit proche de nous et que les autres se trouvent pratiquement à l’infini, de sorte que l’on ne peut pas détecter leur mouvement lorsque la Terre tourne autour du Soleil ? Le postulat selon lequel le rapport de la distance aux autres étoiles à celui de la distance au Soleil soit un nombre aussi grand était un problème pour le modèle. Cette hiérarchie des distances est aujourd’hui expliquée par les modèles de formation des étoiles et des galaxies. 3
Voir Das Problema bovinum des Archimedes, de A. Amthor et B. Krumbiegel, Zeit. Math. Phys., 25, 1880. 4
Bien sûr nos ancêtres, au moins certains d’entre eux, savaient que la Terre tournait sur elle-même, ce que l’on pouvait déduire du fait que les étoiles semblaient tourner la nuit autour de l’Étoile polaire. Presque tous les objets célestes apparaissaient stationnaires si l’on tenait compte de la rotation de la Terre.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
159
9.3
Théorie des nombres
La théorie des nombres est un endroit où des grands nombres se glissent naturellement. Le dernier théorème de Fermat 5 énonce qu’il n’y a pas de nombres entiers ( a, b, c, n) obéissant à l’équation an + bn = cn pour n > 2 (pour n = 2, on a par exemple 32 + 42 = 52 ). Leonhard Euler a prolongé la conjecture dans les années 1700, en proposant qu’il n’y ait pas de solutions entières à l’équation a4 + b4 + c4 = d4 . Cette conjecture est fausse, ainsi que l’a montré Noam Elkies en 1998, car
(95800)4 + (217519)4 + (414560)4 = (422481)4 . Est-ce que résultat est « naturel » ou non ? La question semble naturelle, car elle est formulée en termes de nombres qui sont petits. Cependant Elkies a donné des arguments expliquant pourquoi des nombres aussi extravagants, des nombres comportant 20 chiffres décimaux, sont impliqués dans la solution. On peut spéculer que les nombres déraisonnables interviennent en physique en raison de questions naturelles en théorie des nombres.
Énigme. On dispose d’un jeu de cartes. Aux cartes représentant un personnage, Roi, Dame et Valet, on attribue la valeur 1. Choisissez un nombre au hasard entre 1 et 10, disons n0 . Ensuite distribuez n0 cartes du jeu. Le nombre sur la carte n0 devient n1 et vous distribuez n1 cartes. La dernière carte devient n2 . Ensuite distribuez n2 cartes et continuez jusqu’à épuisement du jeu, n f désignant le dernier paquet de cartes. Le problème consiste à identifier la dernière carte que nous voyons des n f avant que le jeu ne soit épuisé. Solution. Si vous faites des essais avec différents nombres initiaux n0 , vous allez voir que tous les nombres convergent vers la même réponse pour n f ! Si vous n’avez pas dévoilé votre choix, un magicien peut encore deviner la dernière carte n f que vous allez obtenir. Cela donne l’illusion, en quelque sorte, que le magicien est aidé par la chance pour deviner la réponse, alors que tout ce qu’il fait est de revenir à son choix initial pour n f . Cette coïncidence vient du fait qu’une fois que deux personnes convergent à un certain point vers le tirage d’une même carte ni , elles vont être d’accord sur l’identité de la carte finale, et la probabilité est élevée pour que le choix des deux séries convergent vers la même carte finale. C’est le fait que vous avez compté pour 1 les cartes représentant des personnages qui vous aide aussi ! Ce jeu, ainsi défini, est condamné à converger, et tant qu’il y a une convergence quelque part dans le déroulement du jeu, la 5
Il s’agissait au départ d’une conjecture et non d’un théorème, mais le tléorème a été démontré en 1995 par Andrew Wiles, 350 ans après son énoncé par Fermat.
160
Chapitre 9. Anormalité et grands nombres
réponse finale sera identique. Cependant le résultat semble non naturel si on n’en saisit pas le mécanisme sous-jacent. Est-ce que les nombres apparemment déraisonnables et extravagants que nous rencontrons en physique ne pourraient pas avoir une origine analogue ? 9.4
Composition de l’Univers
Il faut encore mentionner une autre constante de la physique, la constante cosmologique notée Λ, qui a les dimensions d’une masse à la puissance 4 : dim(Λ) = M4 . Ainsi que nous allons le voir ultérieurement, Λ1/4 est de l’ordre de la masse du neutrino mν , une autre quantité très petite si elle est mesurée en GeV, ce qui mériterait une explication. Nous le discuterons dans la suite de ce chapitre. Λ est relié à ce qui est appelé l’énergie sombre, qui représente l’énergie de l’espace vide et peut être reliée à la constante cosmologique. L’énergie sombre conduit à l’accélération de l’expansion de l’Univers. Ce fut une découverte d’importance capitale au début des années 1990 : la composition en énergie de l’Univers est dominée par une forme mystérieuse d’énergie qui est directement reliée au taux d’accélération de l’expansion de l’Univers. Comprendre l’origine de cette énergie sombre est un des grands défis de la physique contemporaine. La composition en énergie de l’Univers est estimée aujourd’hui à :
Pourcentage de chaque composante. Matière ordinaire : 5 % ; Matière sombre : 25 % ; Énergie sombre : 70 % Les 5 % de matière ordinaire sont ce dont nous sommes faits. Nous ne pouvons pas voir directement les 95 % restants car ils n’interagissent pas avec la lumière, ce qui veut dire que la plus grande part de l’Univers nous est invisible. Nous avons déduit l’existence de la matière sombre à partir de ses effets gravitationnels, en particulier à partir de l’étude des lentilles gravitationnelles et de la vitesse rotation d’étoiles ou de galaxies. Elle est appelée sombre parce que son interaction avec la lumière est négligeable. 9.5
La géométrie de l’espace-temps
Einstein a postulé que la géométrie de l’espace-temps où se développe l’Univers ne doit pas être considérée comme fixe et rigide, mais plutôt comme une étoffe souple qui dépend de la matière environnante. La géométrie de l’espace-temps est décrite par un tenseur gµν , le tenseur métrique, qui permet en fait de mesurer les distances, ou plus exactement les distances de l’espace-temps. Inversement, la distribution de matière-énergie agit sur la métrique et la modifie. Dans les
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
161
zones de grande concentration de matière, la métrique va correspondre à une plus grande courbure et l’espace-temps sera davantage courbé. Les objets suivent des géodésiques de l’espace-temps, le chemin extrémal entre deux points de l’espace-temps courbe. Un élément clé de la théorie de la relativité générale d’Einstein est l’équation qui régit le comportement du champ gravitationnel 6 Gµν + Λgµν ∼ Tµν , où Gµν est un tenseur qui décrit la géométrie de l’espace-temps et peut être caculé à partir du tenseur métrique gµν , Tµν décrit l’énergie et l’impulsion et Λ la constante cosmologique. À l’origine, cette constante ne figurait pas dans les équations d’Einstein, mais en son absence l’Univers n’était pas stationnaire, il se contractait ou il se dilatait. Aujourd’hui l’idée d’un Univers qui n’est pas stationnaire est devenue familière, mais en 1915 l’idée d’un Univers qui se contracte ou se dilate était parfaitement choquante. Aussi Einstein se résolut, un peu à contrecœur, à introduire cette constante cosmologique qui lui permettait d’obtenir un Univers stationnaire, à condition de choisir la valeur Λ = 4πρ, où ρ est la densité de masse-énergie moyenne. En unités de Planck, la constante cosmologique dont avait besoin Einstein était un nombre ridiculement petit, de l’ordre de 10−120 , mais c’était le nombre requis pour un Univers stationnaire. Malheureusement pour Einstein, ainsi que le fit remarquer Eddington, la solution stationnaire était instable. Avec une valeur de Λ juste un peu plus petite ou juste un peu plus grande, on retrouvait une expansion ou une contraction. L’abbé belge Georges Lemaître, qui était aussi un physicien mathématicien, proposa au début des années 1920 un modèle où l’Univers débutait par un « atome primordial » et se dilatait ensuite. Einstein, bien qu’il eût reconnu que les mathématiques étaient correctes, rejeta le modèle de Lemaître pour des raisons physiques. Un peu auparavant, le physicien mathématicien soviétique Alexander Friedmann avait dévelopé des idées analogues, et son travail fut repris et popularisé aux États-Unis par Robertson et Walker, qui ont introduit la célèbre « métrique FRW », ou « métrique de Friedmann-Robertson-Walker » ; pour être correct, il faudrait y ajouter le nom de Lemaître. L’histoire des tout premiers instants de l’Univers fait encore débat aujourd’hui, mais on admet que le scenario général élaboré par Lemaître et Friedmann-Robertson-Walker est pour l’essentiel correct. 6
La première expérience dédiée à la vérification de la relativité générale fut conçue par l’astronome britannique Sir Arthur Stanley Eddington. Il s’agissait de vérifier la déviation des rayons lumineux issus d’étoiles par le champ de gravitation du Soleil, ce qui n’était possible que dans le cas d’une éclipse totale de Soleil. Deux expéditions supervisées par Eddington permirent de vérifier la prédiction de la relativité générale en mettant à profit l’éclipse totale du 29 mai 1919, l’une à Sobral au Nord du Brésil et l’autre à Principe, une île de l’Afrique de l’Ouest.
162
Chapitre 9. Anormalité et grands nombres
Au début des années 1930, l’astronome américain Edwin Hubble mit en évidence l’expansion de l’Univers en mesurant le décalage vers le rouge de la lumière émise par des galaxies lointaines. Einstein se convainquit finalement de la réalité de l’expansion de l’Univers et mit au rebut sa constante cosmologique. La légende veut qu’il ait qualifié l’introduction de cette constante de « plus grande gaffe de ma vie scientifique ». De fait, s’il avait davantage fait confiance à ses équations, il aurait prédit l’expansion de l’Univers. Des dizaines d’années plus tard, vers 1980, les physiciens recommençaient à s’interroger : pourquoi donc la constante cosmologique est-elle nulle, Λ = 0 ? Le problème est que les fluctuations quantiques semblent imposer une valeur de Λ extravagante, Λ ∼ MPlanck ! En unités de Planck, Λ = O(1) et non zéro. Les physiciens se sont efforcés de trouver une explication au fait que Λ ≃ 0, la valeur communément acceptée, en dépit du fait que les fluctuations quantiques suggéraient tout autre chose. L’explication la plus populaire à l’époque reposait sur la supersymétrie, qui fournissait aussi une justification possible à la hiérarchie des masses, mais il n’était cependant pas possible de forcer la théorie à prédire Λ = 0. Les physiciens ont aussi essayé la supergravité et la théorie des cordes, mais sans succès évident. À la fin des années 1980, j’assistais à une conférence de Steven Weinberg donnée à Harvard sur la constante cosmologique. Il rappela que certains physiciens tentaient d’expliquer la valeur Λ = 0 en utilisant le « principe anthropique ». Ils argumentaient que notre existence même serait impossible avec Λ = O(1) en unités de Planck, parce que, dans ces conditions, la durée de vie de l’Univers serait de l’ordre du temps de Planck, soit 10−43 s, et nous ne serions pas dans cette salle pour poser la question. Weinberg fit remarquer que les critiques de ce principe le considéraient comme anti-scientifique parce que c’était une postdiction, arrivant après la bagarre et incapable de faire la moindre prédiction. Cependant, Weinberg argumenta que, moyennant une interprétation correcte, cette approche pouvait conduire à des prédictions : le principe anthropique, disait-il, ne peut fonctionner que s’il y a plusieurs univers possibles, chacun avec une valeur différente de Λ. Les univers avec des valeurs grandes, moyennes ou petites de Λ ne seraient pas compatibles avec la vie, et seuls ceux avec une valeur de Λ ridiculement faible pourraient l’être. Nous pouvons dans ce cas utiliser les probabilités conditionnelles : la valeur de Λ qui nous intéresse doit être tirée de l’ensemble de celles qui sont compatibles avec la vie. Étant donné notre existence comme précondition, quelle est la valeur la plus probable de la constante cosmologique de notre Univers ? L’idée est donc que la valeur de Λ ne devrait pas subir d’ajustement millimétrique au-delà de ce qui serait strictement nécessaire pour assurer notre existence. Cela veut dire que Λ ne doit pas être strictement nul, mais qu’il
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
163
doit prendre une valeur générique suffisamment faible pour autoriser la vie. En 4 se fondant sur cet argument, Weinberg estima que Λ ∼ ρ ∼ 10−120 MPlanck , et il ajouta que cela serait bientôt vérifié parce que cette valeur était proche des limites expérimentales à cette époque. Une dizaine d’années plus tard, on mesura effectivement la valeur de la constante cosmologique grâce à l’observation du décalage vers le rouge de la lumière émise par certains types d’étoiles très éloignées, les supernovæde type Ia. La valeur mesurée se trouva proche de la prédiction fondée sur le principe anthropique. Par un retournement surprenant de l’histoire, la valeur mesurée était également proche de celle estimée par Einstein pour garantir un Univers stationnaire. Finalement Einstein a eu tort de supprimer la constante cosmologique de ses équations, car celle-ci, mise à la porte en 1930, est revenue par la fenêtre en 1990 avec une valeur proche de celle envisagée initialement 7 . On trouve encore nombre de physiciens qui sont mal à l’aise avec le principe anthropique. Il est évident que ce principe est une entorse aux lois de la physique, mais il suit la méthodologie scientifique. . . jusqu’à un certain point 8 . 9.6
D’autres questions
Comment se fait-il que la constante cosmologique et la densité de matière ρ de l’Univers soient aujourd’hui du même ordre de grandeur : Λ ≃ ρ = ρaujourd′ hui ? C’est une étrange coïncidence étant donné que ρ diminue à mesure que l’Univers se dilate, mais que Λ devrait être une constante indépendante de l’évolution de l’Univers. Cela veut dire que cette proximité de Λ et de ρ est correcte uniquement à l’époque où nous vivons, une situation assez improbable que l’on appelle d’ailleurs le « problème de coïncidence ». Cela voudrait dire que nous vivons à un moment très particulier de l’histoire de l’Univers, ce qui est mal vécu par certains physiciens. 7
Afin d’utiliser son argument anthropique, Weinberg a dû supposer qu’il y avait plusieurs univers possibles. Les théoriciens des cordes ont développé des théories qui suggèrent des solutions d’univers multiples et qui sont compatibles avec ce principe. Chacune des solutions correspond à un univers possible. Mais bien sûr ce principe crée ses propres maux de tête car nous n’avons pas encore trouvé le principe capable de nous dire dans quel univers nous vivons. 8
N.d.T. Un autre succès de l’argument anthropique est dû à Fred Hoyle, astronome britannique, qui dans les années 1950 prédit l’existence, le spin et la parité d’un niveau d’énergie excité du 12 Carbone indispensable pour la synthèse du carbone dans les étoiles grâce à la réaction dite « triple α », la collision de trois noyaux d’4 Helium, et donc indispensable à la vie même. L’existence de ce niveau ainsi que les valeurs prédites de son énergie, de son spin et de sa parité, furent confirmées expérimentalement dans une expérience de physique nucléaire. Fred Hoyle est aussi connu pour avoir baptisé « théorie du Big Bang » la théorie de l’expansion de l’Univers , mais c’était avec l’intention de la ridiculiser.
164
Chapitre 9. Anormalité et grands nombres
Un autre mystère est que Λ ∼ mneutrino ∼ ρaujourd′ hui . À l’évidence ce sont des questions difficiles, qui ont un lien possible avec le problème de hiérachie, lequel n’est pas mieux compris. C’est une question explorée dans les modèles élaborés par les théoriciens, qui essaient de trouver des réponses à ces questions. 9.7
Échelles de longueur
Nous nous sommes jusqu’à présent focalisés sur les échelles de masse ou d’énergie, mais il est instructif de reformuler la discussion en termes d’échelles de longueur, qui sont reliées aux échelles de masse. De fait, échelle de masse M et de longueur L sont reliées par L = h¯ /Mc. La plus petite échelle est la longueur de Planck, et on peut ensuite prendre comme repères possibles l’échelle de la taille du proton 9 L p , le rayon du Soleil et le rayon de l’Univers observable (voir la figure 9.2). En unités de Planck, avec h¯ = c = 1, nous avons simplement L = 1/M. Le fait que le rayon du proton est approximativement 1019 fois la longueur de Planck est équivalent au fait que la masse du proton est 10−19 fois la masse de Planck.
F IGURE 9.2. Les différentes échelles de longueur de la physique comparées à l’échelle de Planck sur une échelle logarithmique.
Il se trouve que l’on peut expliquer pourquoi le rayon du Soleil est donné en fonction de m p et de la masse de l’électron me par RSoleil ∼ 1/(m p me ) ∼ L2p ∼ 1041 en unités de Planck. Le fait que les masses du proton et de l’électron diffèrent seulement par un facteur ∼ 2000 explique pourquoi le rayon du Soleil est de l’ordre de L2p . En revanche on n’a pas d’explication évidente du fait que le rayon de l’Univers observable est de l’ordre de L3p . 9.8
Échelles de temps
Il existe aussi une échelle de temps associée aux unités naturelles. L’échelle la plus petite est celle du temps de Planck, environ 10−43 s, et l’échelle la plus 9
N.d.T. Plus précisément, l’échelle de distance L p fixée par le proton est donnée par sa masse m p , et donc L p = h¯ /m p c ≃ 10−15 m. ll se trouve que cette échelle de distance est approximativement égale au rayon du proton, pour autant que l’on sache définir cette grandeur de manière précise.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
165
F IGURE 9.3. Les différentes échelles de temps de la physique comparées à l’échelle de Planck sur une échelle logarithmique.
grande est l’âge de l’Univers, environ 1062 en unités de Planck. Par conséquent le rayon de l’Univers observable est aussi 1062 en unités naturelles, puisque la vitesse de la lumière est égale à 1 dans ces unités. On peut se poser la question : existe-t-il des échelles de temps plus grandes ? Nous n’en savons rien. Cependant, en nous fondant sur des modèles inspirés de la théorie des cordes, nous ne connaissons aucun modèle d’Univers stable si la supersymétrie est spontanément brisée. Si nous nous reposons sur les observations faites à ce jour, nous devrions conclure que la supersymétrie n’est pas réalisée dans la Nature, ou est au moins spontanément brisée. Ainsi, autant que nous le sachions, l’Univers va se désintégrer. Cela veut dire, malheureusement, que notre Univers aura une durée de vie finie. Nous n’avons aucune idée de ce que cette durée de vie peut être, mais nous nous attendons à ce que notre Univers instable se désintègre en un Univers plus stable. Il est possible qu’une bulle de matériau du nouvel Univers commence par se dilater à la vitesse de la lumière et finisse par englober tout l’espace. Je suis sincèrement désolé d’avoir à annoncer à ceux qui aiment le statu quo que notre histoire ne semble pas avoir une fin heureuse. Mais certains lecteurs pourraient trouver un réconfort dans le fait que notre Univers actuel ait émergé d’une telle transition dans un passé lointain. Et de nouvelles transitions pourraient bien arriver dans le futur. De fait, la constante cosmologique donne une échelle de temps théorique Λ−1/4 ∼ 100 milliards d’années. Il est concevable, et c’est suggéré par des arguments théoriques récents, que cela puisse fixer une limite supérieure à l’âge de l’Univers. Le fait que notre Univers actuel soit vieux d’environ 14 milliards d’années seulement suggère que nous en sommes encore au stade de l’adolescence d’un cycle de vie cosmique. Si l’Univers se comporte de façon responsable, il est possible que nous ayons encore devant nous des années fastes et peut-être même un âge d’or de l’Univers !
166
Chapitre 9. Anormalité et grands nombres
10 Science et religion Les interactions entre science et religion ont une longue histoire, et c’est peu dire que leur relation a été par moments très tendue. En 1600, le philosophe et cosmologiste italien Gordano Bruno, qui avait été un prêtre catholique, finit sur le bûcher pour avoir épousé des vues hérétiques, incluant l’idée que l’Univers était infini et contenait un nombre infini de mondes. En 1633, Galilée fut condamné par l’Église Catholique Romaine pour ses affirmations blasphématoires selon lesquelles la Terre tournait autour du Soleil. Galilée, qui avait 69 ans quand le jugement fut prononcé, aurait probablement connu le funeste sort de Bruno s’il n’avait pas renoncé à ses convictions scientifiques. Au lieu de tortures, prison et probablement exécution, il fut assigné à résidence jusqu’à sa mort en 1642. Il est évident que les interactions entre science et religion n’ont pas toujours été harmonieuses, et des signes de tension et de conflit sont encore visibles aujourd’hui. Cependant, on peut dire que la religion fut la première forme de science, dans la mesure où elle prétendait donner un sens au monde où nous vivons et expliquer son fonctionnement. La plupart des (voire toutes les) religions s’efforcent de dire quelque chose sur l’Univers physique. De plus, science et religion reposent toutes deux sur l’observation, bien que leurs « méthodologies » – dans la mesure où ce mot s’applique – soient totalement différentes. Que se passe-t-il lorsque des visions différentes entrent en conflit ? Mon objectif dans le chapitre qui suit n’est pas de risquer une conclusion aux débats sur la relation entre science et religion, mais de passer en revue l’opinion sur ce sujet de scientifiques qui ont réfléchi à cette relation, sans prendre position personnellement. Et je vais, comme précédemment, le faire dans un contexte d’énigmes.
10.1
Questions fondamentales
On trouve quelques énigmes mathématiques et logiques associées à des descriptions populaires de Dieu. Par exemple, on dit souvent que Dieu peut faire ou créer ce qu’il souhaite. S’il en est ainsi, est-ce que Dieu peut créer une pierre qu’il ne pourrait pas soulever ? Certains incroyants ont essayé d’utiliser cet type d’argument pour contester l’existence de Dieu. Mais c’est un simple jeu logique. C’est la même chose que de posséder une feuille de papier contenant des énoncés contradictoires sur chaque côté. « La phrase sur le côté opposé est fausse » est écrite sur un des côtés, tandis que « la phrase sur le côté opposé est vraie » est écrite sur l’autre. Avec cette boucle d’oppositions, il n’y a aucune possibilité d’attribuer un caractère de vrai ou de faux à l’une quelconque des deux phrases. Autrement dit, il n’est pas vrai que tout énoncé soit, ou vrai, ou faux. Cette observation pourrait aussi résoudre le paradoxe de l’existence de Dieu. Cela me rappelle l’énigme suivante.
Énigme. Deux prisonniers sont enfermés dans des cellules séparées. On donne à chaque prisonnier une pièce de monnaie pour un jeu de pile ou face. Chacun des prisonniers doit prédire si son collègue a obtenu pile ou face. Si exactement l’un d’entre eux obtient le résultat correct, alors ils sont tous deux libérés, et sinon ils restent enfermés. Ils sont autorisés à discuter leur stratégie avant de rejoindre leur cellule et de commencer le jeu. Existe-t-il une stratégie gagnante, qui leur permet à tous les coups de sortir de prison ? Solution. Au premier abord, il semble qu’ils peuvent seulement compter sur la chance. Cependant, il existe une stratégie simple qui leur permet de sortir de prison. L’un des deux prisonniers doit prédire que l’autre a obtenu la même face de la pièce que lui, et l’autre doit prédire que le premier a obtenu l’opposé de son résultat. En examinant les quatre possibilités, il est facile de voir que c’est bien une stratégie gagnante. Méthodologie. Vous pourriez être tentés de supposer que les mathématiques et la religion campent sur deux pôles opposés et n’ont rien en commun, mais ce n’est pas complètement le cas. Les mathématiques et la religion s’appuient sur des définitions et des axiomes initiaux qui ne peuvent pas être entièrement justifiés et elles se développent à partir de ces axiomes. Même si les mathématiques sont bâties sur la logique, les mathématiciens doivent se donner un point de départ, et ils ne peuvent pas prouver, et n’essaient d’ailleurs pas de le faire, les axiomes originaux qui fondent leur théorie. De fait les axiomes, non seulement ne peuvent pas être prouvés, mais certains énoncés sont non démontrables dans le cadre de ces axiomes, en raison du théorème d’incomplétude de Gödel. 168
Chapitre 10. Science et religion
Les scientifiques ne se préoccupent pas de faire émerger une vérité absolue et irréfutable, mais ils s’efforcent d’établir la meilleure des vérités à laquelle on puisse accéder à un instant donné, en sachant parfaitement que tous les énoncés scientifiques sont soumis à des raffinements et à des révisions. Même aujourd’hui, après que nous avons été témoin des grands succès de la science et que nous avons établi fermement les principes fondamentaux de la physique, je ne pense pas que nous puissions énoncer des vérités absolues. En particulier, je trouve difficile à admettre que nous ayons énoncé un seul principe fondamental de la physique avec une certitude absolue. Bien évidemment ces principes semblent être sur la bonne voie, mais ce n’est pas la même chose que de proclamer qu’ils sont exactement corrects. 10.2
Science contre religion
Selon la conception de nombre de scientifiques, la religion n’est pas partie prenante de la discussion sur la nature du monde réel et observable et elle doit être réservée à l’exploration de sujets moraux et spirituels. Ils font remarquer que la science repose sur des observations contrôlées, alors que la religion est fondée sur des croyances impossibles à vérifier. Cependant je peux opposer des arguments qui vont à l’encontre de cette perspective, car la science est incapable de montrer la fausseté de certaines affirmations religieuses. Il arrive que l’on tente de ridiculiser une religion, au motif que celle-ci affirme que la création du monde remonte à seulement 6 000 ans. Nous, les scientifiques, disposons d’un faisceau de preuves qui réfutent cette affirmation. Mais si nous y réfléchissons un peu, nous constatons que ces preuves ne sont que des présomptions, certes suffisantes pour convaincre des scientifiques, mais qui ne sont pas des preuves absolues.
Quand l’Univers a-t-il été créé ? Bertrand Russell a fait remarquer que nous ne pouvons même pas réfuter l’affirmation selon laquelle l’Univers aurait été créé il y a cinq minutes. Il se pourrait que l’Univers ait été créé cinq minutes juste avant que vous ne lisiez ces lignes. Il se pourrait que tous vos souvenirs aient été initiés et stockés dans votre cerveau à cet instant, en incluant tous les souvenirs qui vous donnent l’impression que vous avez eu une vie bien plus longue que ces cinq minutes. De même tous les fossiles qui semblent documenter le passage de plusieurs millénaires auraient pu être déposés il y a cinq minutes. Pourquoi un scientifique hésiterait-il à épouser un tel scénario ? Tout d’abord ce scénario ne peut faire aucune prédiction. Ce sont les prédictions qui font la puissance des énoncés. Nous faisons de préférence confiance aux énoncés qui ont un pouvoir prédictif, et celui décrit ci-dessus n’en fait pas partie. On peut L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
169
aussi argumenter que ce scénario est très improbable. Toutes les informations concernant les histoires des fossiles et les souvenirs de milliards d’individus devraient être exactement ajustées pour dérouler une histoire plausible sans générer de contradictions. Bien sûr c’est possible en principe. Mais la science donne la priorité aux théories qui n’exigent pas d’ajustements fins et arbitraires. La simplicité avant tout ! C’est le principe du rasoir d’Occam. En science nous préférons les explications naturelles !
10.3
Science et religion
Une opinion largement partagée est que la religion a parfois tenté d’interférer avec la pratique scientifique. L’exemple le plus connu est celui de Galilée, persécuté par l’Église en raison de ses convictions scientifiques et à qui on ordonna de se rétracter publiquement. Mais le conflit entre science et religion n’a rien d’automatique et la coexistence pacifique est possible. Isaac Newton, par exemple, était un ardent disciple de l’Église. La partie la plus importante de ses écrits concerne la chrétienté et non la science ! Il semble même que son intérêt pour l’étude de la Nature ait eu une motivation religieuse. Il s’imaginait en train de mettre au jour les lois de Dieu et non de contredire la notion de Dieu. Ce faisant, il espérait aider les gens à accepter la religion à la lumière des superbes lois physiques que Dieu nous avait données. Cela ne veut pas dire que Newton acceptait aveuglément tout ce que proclamaient les institutions religieuses. Par exemple il ne croyait pas à la Sainte Trinité, et il avait certainement sa conception personnelle de la religion. Il est intéressant de souligner que Newton pensait que Dieu pouvait interférer avec la réalité physique et qu’il lui arrivait de le faire. Lorsqu’il constatait que certains objets célestes semblaient ne pas se comporter conformément à ses équations, Newton l’attribuait à une intervention divine qui pouvait entraîner des exceptions à ses lois physiques ! Dans une perspective moderne, Newton semble un peu extrême de ce point de vue. Cependant il est tout aussi vrai qu’il fut un des plus grands scientifiques de l’histoire, et ses convictions religieuses ne l’empêchèrent pas d’accumuler une quantité stupéfiante de travaux qui sont encore pertinents aujourd’hui, 350 années plus tard. Aujourd’hui nous savons que les violations apparentes de ses équations provenaient de l’influence de corps célestes invisibles avec les télescopes de son époque et qui venaient perturber les trajectoires qu’il avait calculées. Bien que la plupart des scientifiques d’aujourd’hui pensent que science et religion ne doivent pas se mélanger afin de minimiser les conflits et de limiter les interférences, il se peut que ces domaines ne soient pas entièrement distincts.
170
Chapitre 10. Science et religion
Un recouvrement possible entre science et religion se trouve dans notre conception de Dieu. C’était auparavant un sujet limité aux cercles religieux, mais étant donné le degré d’abstraction de la physique contemporaine, un scientifique pourrait essayer d’imaginer la possibilité que Dieu existe en dehors de notre espace-temps, en jouant peut-être un rôle dans des multivers sous-tendus par des dimensions supplémentaires. En s’inspirant de la physique théorique et des mathématiques modernes, on pourrait peut-être arriver à une conception cohérente de Dieu en le plaçant en dehors de notre Univers. Comment tester cette théorie est une autre question, mais cet exercice pourrait représenter une version contemporaine des efforts de Newton pour comprendre la Nature et le rôle que Dieu y joue.
10.4
L’origine de l’Univers
On peut soutenir l’idée que le recouvrement le plus évident entre science et religion concerne l’origine de l’Univers. Chaque religion, ou presque, commence par un énoncé du type « Dieu a créé l’Univers ». Vous pourriez penser que cet énoncé entre en conflit direct avec la science, mais ce n’est pas obligatoirement le cas. Les scientifiques font souvent des hypothèses sur les conditions initiales. Dans un tel cadre, Dieu pourrait faire partie des conditions initiales, et les prédictions des théories physiques ne prendraient le dessus que juste après la création ! Rappelons qu’Einstein avait introduit la constante cosmologique pour éviter que ses équations aient comme conséquence inéluctable un Univers en expansion (ou en contraction). Le prêtre jésuite Georges Lemaître contestait ce raisonnement. Ainsi que nous l’avons déjà mentionné, Lemaître soutenait l’idée d’un « atome primordial » et il pensait que l’Univers avait commencé par une expansion soudaine à partir de cet atome primordial. De plus il se servit de la théorie d’Einstein de la relativité générale pour conforter sa propre théorie. Einstein estimait que les mathématiques de Lemaître étaient correctes, mais sa physique abominable. En effet, selon Einstein, l’Univers ne pouvait pas avoir de commencement, il était éternel. Il est possible, mais cela relève peut-être de la légende, qu’Einstein ait accusé Lemaître de propager le mythe créationniste de la Bible. Si c’est exact, cette critique était infondée car la démarche de Lemaître était purement scientifique, et Lemaître s’est d’ailleurs élevé contre la tentative du pape Pie X de récupérer sa théorie comme confirmant le mythe de la création. Nous pensons aujourd’hui qu’il y a eu un Big Bang ; en ce sens Lemaître avait raison et Einstein avait tort ! La conclusion est que des convictions religieuses fortes ne sont pas nécessairement incompatibles avec la science. Il peut arriver que des scientifiques se posent des questions pertinentes dont la motivation
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
171
est d’origine religieuse. Même si nous sommes principalement intéressés par la science, et peut-être pour l’intérêt même de la science, nous ne devons pas éliminer a priori la religion en l’empêchant de prendre part au débat, et elle peut être source d’inspiration. Un exemple du rôle bénéfique de la religion est le développement de la science au zénith de la civilisation islamique, au tournant du premier millénaire, un développement que l’on a pu attribuer au fait que les scientifiques islamiques étaient à l’époque inspirés par la religion et le Coran. Un sujet assez proche concerne le rôle de la philosophie dans les sciences. Le pragmatisme de la culture américaine a largement influencé la science. Il est rare aujourd’hui que les scientifiques parlent de philosophie, et de fait beaucoup d’entre eux ont tendance à la mépriser. C’est probablement enraciné dans le pragmatisme américain. Aux débuts de la mécanique quantique, dans les années 1930, les discussions entre les protagonistes, Einstein, Bohr, Heisenberg et d’autres, prenaient souvent un tour philosophique. C’est rarement le cas aujourd’hui parmi les physiciens de premier plan. Cependant, si vous creusez un peu le sujet, vous vous apercevrez que la plupart des scientifiques sont influencés par des principes philosophiques, qu’ils veuillent bien l’admettre ou non. De nombreux scientifiques sont à leur insu des philosophes amateurs ! Aujourd’hui, les principes philosophiques se sont souvent substitués aux convictions religieuses.
10.5
Einstein et la religion
Disons quelques mots sur la façon dont Einstein envisageait la religion. Pour faire simple, on peut dire qu’Einstein était très critique de la religion conventionnelle. Il écrivit dans une lettre : « Le mot Dieu n’est pour moi rien d’autre que l’expression et le produit des faiblesses humaines, la Bible un recueil de légendes honorables, mais encore primitives, et même enfantines. Aucune interpétation, aussi subtile soit-elle, ne me fera changer d’avis ». Voici une autre anecdote. Un soir, Einstein et son épouse participaient à un dîner où un invité affirma qu’il croyait à l’astrologie. Einstein ridiculisa ce point de vue comme de la pure superstition. Un autre invité se mêla à la conversation en caractérisant la religion comme étant aussi de la superstition. L’hôte intervint alors pour dire qu’Einstein lui-même était religieux. Einstein précisa qu’il croyait à une structure subtile et vénérable des lois de la Nature. C’était là son interprétation de la religion. Einstein en dit plus dans une lettre de 1936, écrite pour un collégien de sixième qui lui demandait si les scientifiques priaient, et si oui à qui s’adressaient leurs prières. Einstein répondit que « la recherche scientifique est fondée sur
172
Chapitre 10. Science et religion
l’idée que chaque chose qui arrive est déterminée par les lois de la Nature ». Mais il reconnut que « notre connaissance présente de ces lois est encore imparfaite et fragmentaire », ajoutant que « la croyance en l’existence de lois universelles de la Nature repose aussi sur une sorte de foi [qui] a jusqu’à présent été largement validée par les succès de la recherche scientifique. Mais, d’un autre côté, toute personne sérieusement impliquée dans le développement de la science devient convaincue qu’une spiritualité est manifeste dans les lois de l’Univers, une spiritualité très supérieure à celle de l’homme et en face de laquelle nous devons éprouver une grande humilité compte tenu de nos modestes pouvoirs. Suivant cette conception, la poursuite de la science conduit à un sentiment religieux d’un caractère particulier, qui est en fait absolument différent d’une religiosité un peu naïve ». Une autre circonstance bien connue où Einstein mentionna Dieu est liée à son débat avec Bohr sur les probabilités en mécanique quantique. Pour mieux faire comprendre son insatisfaction face au caractère probabiliste de la mécanique quantique, il déclara à Bohr « Dieu ne joue pas aux dés ». Cependant il ne prenait pas cette référence à Dieu de façon littérale, mais plutôt dans le sens exposé dans la lettre précédemment citée.
10.6
Feynman et la religion
Le point de vue de Feynman sur la religion était agnostique. Il pensait par exemple que, puisque nous vivons sur juste une petite planète appelée Terre au milieu d’un vaste Univers qui contient un nombre gigantesque de galaxies, d’étoiles et de planètes, pourquoi Dieu devrait-il envoyer ses prophètes seulement sur notre planète en négligeant toutes les autres 1 ? Cette particularité de la Terre n’avait aucun sens pour lui, et pourtant aucune religion ne parle des autres planètes visitées par leurs propres prophètes ! Les conceptions de Feynman sur la physique étaient aussi quelque peu iconoclastes. Alors que la plupart des scientifiques estiment que la science va nous apprendre quelque chose de profond sur la nature de l’Univers, Feynman se focalisait de préférence sur des problèmes concrets. À rebours de l’attitude de la plupart de ses collègues, Feynman considérait les découvertes sur la nature profonde de l’Univers comme un effet collatéral et accéder à cette nature profonde n’était en aucun cas sa motivation primaire. C’est une attitude qui contraste fortement avec celle de la plupart des chercheurs. Il est possible que, en un sens et 1
N.d.T. Cette remarque de Feynman est d’autant plus pertinente que nous savons aujourd’hui qu’il existe un nombre incalculable d’exoplanètes.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
173
sans doute inconsciemment, les scientifiques cherchent à substituer la science à la religion comme paradigme pour comprendre l’Univers. On doit cependant souligner que Feynman ne rejetait pas d’emblée la religion. Il admettait qu’il avait eu de longue date un intérêt pour la relation entre science et religion. Dans un exposé donné en 1956, Feynman affirma que « nombre de scientifiques croient à la fois en la science et en la religion d’une manière parfaitement cohérente. Mais cette cohérence, bien qu’elle soit possible, n’est pas facile à maintenir ». Une des source de difficultés lorsque l’on essaie de concilier les deux est due au fait, disait-il, « qu’en science le doute est impératif. Le doute est absolument indispensable au progrès scientifique, et prendre en compte les incertitudes est un aspect fondamental de la démarche scientifique. . . Rien n’est acquis définitivement ou prouvé au-delà de tout doute possible. Les scientifiques cherchent par curiosité, parce qu’il y a des inconnues, et non parce qu’ils connaissent la réponse ». Et Feynman continuait en précisant que lorsqu’ils creusent plus profondément, « ce n’est pas pour découvrir la vérité, mais parce qu’ils vont découvrir que telle ou telle chose est plus ou moins probable ». Cette attitude, si on l’applique à des questions telles que l’existence de Dieu, empêche un scientifique d’accepter ces « certitudes absolues propres à certaines personnes religieuses ». Une fois que l’existence de Dieu a quitté le domaine de la certitude absolue, les doutes concernant d’autres aspects de la religion ne peuvent que s’accumuler. C’était là une des raisons pour lesquelles Feynman pensait qu’il était difficile de s’investir pleinement à la fois dans la science et dans la religion, et il a choisi la science tout en assumant les doutes que ce choix impliquait. 10.7
Hawking et la religion
Notre vision actuelle est que nous avons été capables de repousser très loin les frontières de la science. Jusqu’à un certain point, nous disposons de prédictions précises sur les débuts de l’Univers, qui a probablement été mis sur les rails par le Big Bang survenu il y a environ 13,8 milliards d’années. Stephen Hawking décrivait le Big Bang comme une conséquence des lois de la gravitation et ne voyait pas la nécessité d’une intervention divine. Mais qu’y avait-il avant cette gigantesque explosion 2 ? Est-ce que la physique a quelque chose à dire sur ce sujet ? Certains physiciens sont pragmatiques et répondent que, étant donné que cette question ne peut être soumise à aucun test expérimental et ne peut 2
N.d.T. Rappelons que le Big Bang n’est pas une explosion dans l’espace, mais une explosion de l’espace lui-même.
174
Chapitre 10. Science et religion
F IGURE 10.1. Tracer quatre droites passant par les 9 points de la grille sans lever le crayon.
conduire à aucune application, nous devons simplement l’ignorer. D’autres scientifiques ont tenté de réfléchir sérieusement à cette question et Hawking en est un exemple éminent. Il a posé la question suivante : est-ce que l’Univers peut émerger du néant, sans aucune intervention ? Il se trouve qu’il existe un formalisme mathématique qui, dans le contexte de la gravitation quantique, permet de donner un sens à cette question. Hawking, en collaboration avec James Hartle, a esquissé une description quantique (ou une fonction d’onde) de l’Univers, sous forme d’une intégrale de chemin faisant la somme de toutes les histoires qui pourraient donner naissance au cosmos actuel en partant du néant. Le résultat de cette analyse, confortée par celles d’autres physiciens, suggère qu’il est concevable que notre glorieux Univers, notre seul domicile connu, ait pour source le néant !
Énigme. Essayez de tracer quatre droites passant par les 9 points de la grille sans lever le crayon (voir la figure 10.1). Solution. C’est impossible en restant confiné dans la boîte (voir les figures 10.2 et 10.3 pour des solutions). La clé est de sortir de la boîte. Cela rappelle les
F IGURE 10.2. La solution.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
175
F IGURE 10.3. La solution en trichant un peu.
discussions sur la religion où l’on nous dit que nous avons besoin d’une étape allant au-delà de notre monde si nous voulons entrevoir les réponses et les pouvoirs communément attribués à Dieu. Mais dans le cas de cette énigme, tout ce dont nous avons besoin est d’un crayon convenablement taillé et d’un esprit affûté. On peut même se limiter à trois droites si les points sont suffisamment épais.
Énigme. Le propriétaire d’une maison demande à son jardinier de planter 5 rangées de 4 arbres, mais le jardinier ne dispose que de 10 arbres. Comment va-t-il procéder ? Solution. Il faut planter les arbres en étoile (voir la figure 10.4).
F IGURE 10.4. Planter des arbres en étoile.
10.8
Pascal et la religion
Une attitude possible vis-à-vis de la religion est de se dire qu’il vaut mieux y croire parce qu’il se pourrait qu’elle soit vraie et dans ce cas on a tout intérêt à
176
Chapitre 10. Science et religion
croire, ne serait-ce que pour entrer au Paradis. Le mathématicien et philosophe français Blaise Pascal a justifié ce raisonnement dans son célèbre pari qui fut publié dans ses Pensées en 1670, huit ans après sa mort. La logique utilisée par Pascal a été considérée comme un jalon dans la théorie des probabilités et de la décision. En première approximation, son argument peut être résumé ainsi : si Dieu existe et que vous ne croyez pas en lui, alors vous serez condamnés pour toujours à l’enfer. Si Dieu n’existe pas et que vous croyez néanmoins en lui, cette croyance n’entraînera pour vous aucune conséquence négative. Il est donc préférable de croire en Dieu juste au cas où il existerait vraiment. Par conséquent, même si la probabilité de l’existence de Dieu est de un sur dix-mille (10−4 ), le bénéfice attendu est bien plus important que cette probabilité. On raconte aussi une anecdote à propos de Niels Bohr, un des pères, sinon le père, de la théorie quantique, et l’auteur du premier modèle de l’atome. Un collègue qui lui rendait visite dans sa maison de campagne remarqua un fer à cheval accroché comme porte-bonheur au-dessus de la porte d’entrée. Le visiteur lui demanda : « Bien sûr tu ne crois pas à ce genre de superstition ». « Naturellement non », répondit Bohr, « mais ça ne peut pas faire de mal ! ».
10.9
Causalité et Dieu
La notion de causalité est une des raisons qui peuvent justifier la croyance en Dieu. Un argument théologique très ancien affirme que, puisque toute chose a une cause, en remontant la chaîne de causalité on aboutit nécessairement à Dieu. On peut faire une longue liste d’arguments en sens inverse, dont le premier est : « Qui a créé Dieu ? ». La réponse usuelle est que Dieu est la seule entité qui n’a pas besoin d’un créateur pour exister. Mais s’il existe des entités qui n’ont pas besoin d’un créateur, pourquoi l’argument ne s’appliquerait pas tout simplement à l’Univers tout entier ? Cette discussion indique que nos actions et nos croyances ne sont pas dictées uniquement par la causalité ou d’autres constructions intellectuelles. Nous sommes des êtres humains, et fondamentalement nous ne sommes pas toujours parfaitement logiques. Nous avons des émotions, des intuitions, nous sommes parfois inspirés mais il arrive aussi que nous ayons tout faux. Bien sûr les scientifiques ne sauraient échapper à leur condition d’êtres humains, et ils ne devraient pas essayer de le faire. Nous ne croyons pas en la science juste pour des raisons pragmatiques. Certains d’entre nous sont motivés par la poursuite d’une sorte de vérité absolue, ou du moins aussi absolue qu’il est possible étant donné nos propres limitations et les incertitudes intrinsèques au monde dans lequel nous vivons. L’existence d’un objectif intellectuellement aussi ambitieux et, jusqu’à
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
177
F IGURE 10.5. Un grand rectangle est pavé avec des petits rectangles tels que chacun de ces petits rectangles possède soit une longeur qui est un nombre entier de mètres, soit une largeur qui est aussi un entier. Le grand rectangle doit hériter de la même propriété.
un certain point hors de portée, n’est pas défendable rationnellement. En fait un tel objectif s’apparente un peu à une croyance religieuse.
Énigme. Considérons un rectangle de longueur a et de largeur b, pavé avec des petits rectangles tels que chacun de ces petits rectangles possède soit une longueur qui est un nombre entier de mètres, soit une largeur qui est aussi un entier (voir la figure 10.5). Que la longueur soit un entier ou que ce soit la largeur varie de rectangle en rectangle. Montrer que le grand rectangle possède la même propriété : soit sa longueur, soit sa largeur sont des entiers. Cette énigme montre que des propriétés globales étonnantes peuvent être déduites de structures locales apparemment aléatoires. Dans ce contexte, il n’est nul besoin d’un Dieu ou d’un architecte omniscient faisant en sorte que cette propriété soit vraie, car elle émerge naturellement de structure locales. Solution. Placez l’origine des coordonnées (0, 0) à un des sommets du grand rectangle. Les autres sommets sont à ( a, 0), (0, b) et ( a, b). Une solution élégante consiste à intégrer la fonction sin(2πx + φ) sin(2πy + θ ), sur le rectangle, les angles θ et φ étant arbitraires. Z aZ b 0
0
sin(2πx + φ) × sin(2πy + θ )dxdy
=
1 [cos(2πa + cos φ) − cos φ)] [cos(2πb + θ ) − cos θ ] . 4π 2
Cette intégrale restreinte à chacun des petits rectangles s’annule parce que c’est le produit de deux facteurs dont l’un au moins est nul en raison de la longueur
178
Chapitre 10. Science et religion
F IGURE 10.6. Comptage du nombre de rectangles associés au point p. Ces nombres sont pairs sauf aux sommets du grand rectangle.
ou de la largeur entière. L’intégrale est donc nulle sur le grand rectangle et c’est possible seulement si la largeur ou la longueur d’au moins un de ses côtés est un nombre entier. On peut également résoudre ce problème par un argument de parité, ou un argument utilisant les nombres modulo 2. Soit N le nombre de paires ( R, p) où p est un nombre de coordonnées ( x, y) avec x et y entiers, et est aussi un sommet d’un des rectangles R. Pour chaque rectangle R obtenu par la division du rectangle initial, le nombre de sommets entiers, c’est-à-dire les sommets dont les coordonnées sont des entiers, est pair, parce que au moins un des côtés est un entier, de sorte que chaque rectangle R contribue par un nombre entier à N. Par conséquent N doit être pair. Une autre façon de déterminer N est de se demander, pour chaque point p, à combien de rectangles appartient ce sommet et ensuite d’additionner ces rectangles pour obtenir N. Pour chaque point p, le nombre de rectangles qui lui sont associés est pair, sauf pour les quatre sommets du grand rectangle (voir la figure 10.3). Comme le nombre global N est pair, un nombre pair des coins du grand rectangle est pair. Comme nous avons placé un des sommets du grand rectangle à l’origine, qui a des coordonnées entières, nous devons avoir au minimum un autre coin entier. Cette énigme peut être généralisée à trois dimensions avec des longueurs, largeurs et hauteurs entières et même à des dimensions plus élevées.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
179
11 Dualités La dualité, un sujet dont l’importance va croissant à la fois en physique et en mathématiques, fournit le cadre idéal pour faire le lien entre les sujets dont nous avons parlé précédemment. Aujourd’hui, il est courant en mathématiques et en physique que l’on cherche à répondre à une question complexe qui se trouve être équivalente, ou « duale », à une question bien plus simple. Il arrive que la réponse à cette question plus simple rende presque triviale la question complexe de départ, montrant qu’elle n’était finalement pas si complexe que cela. On trouve un exemple de cette dualité dans le cas de certaines bonnes énigmes. Tout ce qu’il convient de faire pour les résoudre est de changer de perspective. La difficulté est, bien sûr, de savoir comment effectuer ce changement et de quelle manière. En un certain sens, l’idée de chercher des dualités semble être innée, car nous sommes naturellement portés à chercher la voie la plus simple pour résoudre un problème. Au fil des ans, nous avons par exemple appris que les cinq versions différentes de la théorie des cordes sont mathématiquement équivalentes entre elles, que les théories des cordes à dix dimensions sont duales d’une théorie M à onze dimensions, une théorie gravitationnelle de membranes, et que les théories des cordes sont aussi duales de certaines théories des champs quantiques dans des espaces de dimension plus basse. La version que l’on choisit dépend du problème considéré. La correspondance 1 AdS/CFT, pour prendre un autre exemple, est une dualité qui relie une théorie de la gravitation régissant une région de l’espace-temps 1
Cette correspondance a été proposée à l’origine par Juan Maldacena et a été ensuite développée par de nombreux physiciens.
à une théorie des champs quantiques sans gravitation qui se rattache au bord de cette même région. Cette correspondance, découverte il y a plus de vingt ans, continue à guider notre intuition et réserve encore des surprises. « Les physiciens continuent à découvrir de nouveaux aspects des dualités », écrit le physicien-mathématicien Ed Witten : « Les dualités sont intéressantes, parce qu’elles permettent de répondre à des questions qui étaient a priori hors de notre portée. Par exemple, les physiciens ont passé des années à réfléchir sur la théorie quantique, et ils ont compris ce qui se passe lorsque les effets quantiques sont faibles, cas où l’on peut appliquer des méthodes dites perturbatives. Mais les manuels de théorie des champs quantiques ne sont d’aucun secours lorsque ces effets quantiques sont importants. Vous ne savez même pas comment aborder le problème. Les dualités permettent souvent de vous guider. Elle vous donnent une description alternative et les questions auxquelles vous pouvez répondre dans une description sont différentes de celles auxquelles vous pouviez répondre dans une description alternative ». En un sens, les dualités représentent des symétries, ainsi que des équivalences hautement non triviales, c’est-à-dire des correspondances qui ne sont absolument pas évidentes. Les dualités ont permis récemment de résoudre des problèmes extrêmement complexes de mathématiques et de physique. Mais il faut avouer que nous ne savons pas vraiment pourquoi plusieurs de ces dualités sont valables. Elles sont un rêve pour ceux qui veulent résoudre des énigmes, mais ce sont aussi des énigmes en elles-mêmes. Lorsque nous résolvons une énigme, nous avons en principe compris comment nous sommes arrivés au résultat. Au contraire, lorsque nous invoquons la dualité pour résoudre une énigme, nous ne savons pas en général comment elle fonctionne. Nous disposons d’un outil étonnant, mais l’explication de la façon dont il fonctionne nous échappe : c’est embarrassant et frustrant ! 11.1
Deux exemples mathématiques
Soit un espace de dimension D où vivent des objets Aℓ de dimension ℓ = 0, 1, · · · , D. On définit alors une dualité de Aℓ vers Bℓ˜ , où ℓ˜ = D − ℓ. Autrement dit, la dualité établit une correspondance entre des objets de dimension ℓ et des objets de dimension ℓ˜ . Par exemple, pour D = 2, un objet de dimension 0, un point, se transforme en un objet de dimension 2, disons un triangle, et réciproquement, ce qui est représenté sur la figure 11.1. C’est ce que l’on appelle une « dualité de Poincaré ».
182
Chapitre 11. Dualités
F IGURE 11.1. La dualité de Poincaré.
F IGURE 11.2. Un exemple de la dualité de Poincaré dans le cas D = 2.
Dans l’exemple à deux dimensions de la figure 11.1, les points s’échangent avec des faces et les lignes avec des lignes. Chaque énoncé sur une triangulation possède un analogue dual comme on le voit sur la figure 11.2. Donnons un autre exemple de dualité mathématique : supposons que nous devions résoudre l’équation différentielle N
∑
an
n =0
dn f ( x ) = 0. dxn
Cela semble très compliqué, mais essayons une fonction du type f ( x) = exp( px). L’opération de différentiation d/dx devient alors une simple multiplication par p, et l’équation différentielle devient N
∑ an pn = 0 . n =0
Ainsi notre équation différentielle intimidante est devenue une simple équation algébrique. C’est évidemment un gros progrès parce que les équations algébriques sont bien plus simples à résoudre que les équations différentielles. En fait nous avons utilisé une transformée de Fourier. Dans une transformée de
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
183
Impulsion
F IGURE 11.3. L’espace des positions et l’espace dual des impulsions.
Fourier, on écrit une fonction f ( x) comme une somme (ou une intégrale) d’exponentielles complexes : f ( x) = ∑ cα exp(iαx). La transformée de Fourier n’est pas une approximation d’une fonction, c’est une autre façon de la représenter. Dans l’exemple ci-dessus, en passant à la transformée de Fourier de f ( x), autrement dit en passant de l’espace direct x à l’espace de Fourier α, souvent appelé espace des fréquences, nous avons rendu trivial un problème a priori complexe. Ce sont là des dualités que nous pouvons formaliser mathématiquement de manière rigoureuse. Mais les dualités que nous avons récemment découvertes en physique sont à la fois plus mystérieuses et plus puissantes que les transformations de Fourier. D’un point de vue strictement mathématique, nous ne disposons pas encore d’un formalisme mathématique rigoureux pour ces dualités. Imaginons que l’on vous présente une équation différentielle exotique et que vous découvriez une boîte noire qui vous donne la solution, que vous pouvez ensuite vérifier sans avoir compris d’où provenait cette solution. C’est précisément l’analogue de ce qui se passe souvent en physique aujourd’hui. Cela ressemble à un code magique qui décrypte votre problème, quelque chose comme une formule maîtresse pour résoudre des énigmes. Nous ne comprenons pas bien pourquoi cela marche, mais le fait est que cela marche. Pour mettre cette découverte en perspective, mentionnons que ces méthodes fondées sur des dualités ont pu résoudre des problèmes de mathématiques qui avaient résisté jusqu’ici à tous les angles d’attaque. Autrement dit, ces méthodes peuvent nous donner des réponses correctes sans que nous ayons une compréhension profonde de la façon dont elles fonctionnent. 11.2
Dualité en mécanique quantique
La transformation de Fourier a joué un rôle crucial dans la compréhesion de la dualité onde-particule en mécanique quantique. La position et l’impulsion sont liées par la transformation de Fourier : l’impulsion est la variable duale de la position. Une fonction d’onde d’espace très concentrée dans l’espace décrit une
184
Chapitre 11. Dualités
situation où l’indétermination sur la position est faible, et la transformation de Fourier lui fait correspondre une distribution en impulsion très étalée, une situation où l’indétermination sur l’impulsion est grande, et vice-versa. Les particules dont la position est bien définie sont décrites par une fonction d’onde d’espace présentant un pic aigu autour de cette position. Au contraire, les particules dont l’impulsion est bien définie sont décrites par une fonction d’onde très étalée en position. La transformée de Fourier d’une telle fonction d’onde d’espace est une fonction d’onde en impulsion, qui présente un pic aigu autour d’une valeur bien définie de l’impulsion. Plus une fonction d’onde est piquée dans un des deux espaces, et plus elle est étalée dans l’espace dual. La relation précise entre l’écart quadratique moyen sur la position, ∆x, et l’écart quadratique moyen sur l’impulsion, ∆p, est contrainte par le principe d’indétermination de Heisenberg 2 : ∆x ∆p ≥
1 h¯ . 2
D’où ces dualités sortent-elles ? Pourquoi existe-t-il plusieurs descriptions ? Nous n’avons pas de bonne explication, mais l’existence de ces dualités semble bien être un trait inéluctable et profond de la nature. 11.3
Théorie de Maxwell
La théorie électromagnétique introduit un champ électrique ~E et un champ magnétique ~B. La charge électrique qe est la source du champ électrique. On pourrait imaginer assez naturellement que le champ magnétique ait pour source une charge magnétique qm , mais nous n’avons jamais découvert dans la nature de telles charges, appelées monopôles magnétiques. Ces monopôles magnétiques seraient des unités isolées de charge magnétique, par exemple un pôle nord sans un pôle sud. Dans la vie usuelle, les champs magnétiques ont pour source des courants électriques ou des aimants comportant les deux types de pôles. Dirac a montré que si des monopôles magnétiques existaient, alors la charge électrique serait nécessairement quantifiée, un résultat intéressant car nous n’avons pour le moment aucune explication 3 de la quantification de la 2
N.d.T. « Principe d’indétermination » est préférable à la terminologie habituelle « principe d’incertitude », car cette dernière expression implique que la position, par exemple, existe mais qu’elle n’est connue qu’avec une certaine incertitude. Ce n’est pas ce que dit la mécanique quantique, car en mécanique quantique la position n’existe pas tant qu’elle n’a pas été mesurée. La position n’est donc pas incertaine, elle est indéterminée. 3
N.d.T. Sauf dans certains modèles de grande unification qui sont pour l’instant très hypothétiques.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
185
charge électrique, le fait que toute charge électrique soit un multiple entier d’une charge élémentaire. À partir d’arguments fondés sur la gravitation quantique, nous nous attendons à ce que de tels monopôles existent. Leur existence serait aussi naturelle dans des modèles de grande unification. La théorie de Maxwell présente une symétrie intéressante entre le champ électrique et le champ magnétique
~E → ~B ~B → −~E qe → qm =
1 qe
Bien sûr, si les charges magnétiques n’existent pas ou que leurs masses sont différentes de celles des charges électriques, il n’y a pas de symétrie. Cependant, même s’il n’existe pas de monopôles magnétiques, ces équations font sens dans un espace vide sans particules chargées. Dans ces conditions d’espace vide, la théorie de Maxwell présente une symétrie étonnante : si vous remplacez le champ électrique par le champ magnétique et le champ magnétique par l’opposé du champ électrique, alors les équations sont inchangées. Mais souvenezvous que ce n’est vrai que dans un espace vide de charges. La situation devient plus complexe en théorie quantique : les fluctuations quantiques détruisent la symétrie entre le champ électrique et le champ magnétique. Pour quantifier la théorie de Maxwell, la théorie des interactions entre charges électriques et champ électromagnétique, vous devez connaître la charge quantique en fonction de la charge de l’électron e 1 e2 ≃ . h¯ c 137 C’est ce nombre qui contrôle les fluctuations quantiques : plus ce nombre est grand, et plus les fluctuations sont importantes. Comme ce nombre est assez petit, de l’ordre de 10−2 , les effets quantiques sont de l’ordre du pourcent et ne sont pas dominants dans notre vie quotidienne. En théorie quantique, la symétrie impliquant le champ électrique et le champ magnétique inverse ce nombre : h¯ c e2 → 2 ≃ 137 . h¯ c e En première approximation, le couplage faible des interactions électriques se transforme en un couplage fort d’interactions magnétiques, parce que qe qm ≃ 1. 186
Chapitre 11. Dualités
On dit que l’interaction électrique est faiblement couplée et l’interaction magnétique fortement couplée. Plus l’interaction électrique est faible et plus l’interaction magnétique est forte, et réciproquement. Cependant, ainsi que nous l’avons déjà remarqué, la symmétrie entre les interactions électriques et magnétiques ne fonctionne pas en raison de l’absence de monopôles magnétiques (et des effets quantiques) dans la théorie de Maxwell. Mais il existe une théorie de Maxwell modifiée où cette symétrie fonctionne, ce que je vais maintenant expliquer. La méthode consiste à généraliser les vecteurs (~E, ~B, · · · ) à des matrices. On appelle cela une version non abélienne de la théorie de Maxwell parce que les matrices qui interviennent ne commutent pas et forment un groupe multiplicatif non abélien. Développons un peu les mathématiques. Dans la théorie de Maxwell, les composantes de champs peuvent être considérées comme des matrices 1 × 1 et la théorie obéit à une symétrie de jauge de type U (1), une symétrie qui correspond à une invariance par transformations de phase. Une matrice 1 × 1 est équivalente à un nombre, mais formuler la théorie en termes de matrices permet de la prolonger plus facilement. Si les composantes des champs étaient des matrices N × N, nous obtiendrions une symétrie de jauge de type U ( N ), où U représente une matrice hermitienne. La dualité forte/faible que nous avons mentionnée ne fonctionne pas encore, à moins d’introduire des fermions qui rendent la théorie supersymétrique, ainsi que nous l’avons déjà mentionné. Cela permet de dompter les fluctuations quantiques et restaure la dualité entre champs électriques et magnétiques. Cela conduit à une dualité pour laquelle nous avons de fortes présomptions qu’elle soit valable, mais que nous sommes loin de vraiment comprendre, et que nous ne savons pas comment justifier 4 . Il se trouve que cette dualité est reliée à des questions qui intéressent les mathématiciens pour des raisons indépendantes, parce qu’elle fait partie de ce que l’on appelle le programme de Langlands géométrique, lui-même relié à la théorie des nombres. La dualité forte/faible est un des liens entre physique et mathématiques, mais il y en a d’autres. Les physiciens ont vérifié cette dualité dans nombre de situations non triviales, mais ils ne peuvent pas encore expliquer comment elle fonctionne à partir de principes fondamentaux. Alors que les énoncés des physiciens peuvent être exprimés sous une forme mathématique concrète, nous ne serons pas capables d’en donner une formulation unifiée avant d’avoir une 4
Le seul cas où nous avons une preuve solide est celui de la symétrie U (1), car dans ce cas nous pouvons utiliser la transformation de Fourier dans l’espace de dimension infinie de la théorie des champs quantiques.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
187
compréhesion complète et mathématiquement rigoureuse de la théorie des champs quantiques, quelque chose qui nous fait encore défaut près d’un siècle après sa formulation initiale à la fin des années 1920. La dualité forte/faible entre les interactions électriques et magnétiques est un exemple de ce que l’on appelle la S-dualité, dont la version la plus étudiée est la théorie supersymétrique Yang-Mills U ( N ) avec N = 4. 11.4
La dualité en théorie des cordes
La théorie des cordes a mis en lumière plusieurs dualités puissantes et étonnantes, et qui illustrent l’importance des dualités en physique. Ainsi que nous allons le voir, la dualité entre les couplages forts et faibles des charges électriques et magnétiques peut se traduire dans le langage géométrique de la théorie des cordes. Dans cette approche, nous ne nous plaçons pas dans le cadre de l’espace-temps quadridimensionnel R4 , mais nous devons prendre en compte des géométries dans des espaces de dimension plus grande, qui sont nécessaires pour assurer la cohérence de la théorie. La partie pertinente pour la géométrie du problème considéré se trouve être un espace de dimension 6. Cette géométrie à 6 dimensions est le produit de l’espace-temps habituel de Minkowski à 4 dimensions par un tore bidimensionnel (4+2=6 !) Ce tore additionnel pourrait par exemple être caractérisé par les longueurs ℓ1 et ℓ2 , dont le rapport est
ℓ2 = e2 . ℓ1 On peut penser à ces deux longueurs comme étant celles des deux côtés du rectangle de papier à partir duquel on fabrique le tore : on enroule d’abord un côté pour fabriquer un cylindre et les deux extrémités du cylindre se rejoignent pour former un tore (voir la figure 11.4). Dans le contexte de la théorie des cordes, ce qui correspond à la symétrie ~E ↔ ~B dans la théorie U ( N ) est un enroulement de N objets de dimension 6 autour d’un tore bidimensionnel, et la théorie quadrimensionnelle qui en résulte possède cette symétrie. Dans cette formulation, la symétrie vient de ce que l’on peut considérer le tore comme un rectangle (voir la figure 11.4). Si nous faisons tourner la figure de π/2 dans le sens contraire des aiguilles d’une montre, cela correspond à la transformation x → y y → −x . Cette opération change la signification de e2 , parce que longueur et largeur du rectangle ont échangé leur rôle et nous avons maintenant ℓ1 /ℓ2 = 1/e2 , que 188
Chapitre 11. Dualités
F IGURE 11.4. La dualité électrique/magnétique peut être envisagée comme une rotation de 90o appliquée à un tore de dimension 2.
nous identifions à la charge magnétique au carré. La dualité entre l’électricité et le magnétisme, lorsqu’on la transpose à la théorie des cordes, devient l’observation triviale qu’on ne peut pas distinguer les côtés du rectangle initial sur un tore. Nous voulons dire par là que si nous revenons au rectangle, peu importe que vous baptisiez tel côté vertical ou horizontal. Le choix est complètement arbitraire : choisir ℓ1 /ℓ2 ou ℓ2 /ℓ1 conduit à la même physique.
11.5
La T -dualité
La dualité la plus simple de la théorie des cordes, bien que ce soit l’une des plus puissantes, est la « T-dualité ». Pour développer une intuition de ce qu’est cette dualité, considérons un intervalle de longueur L que nous pouvons refermer pour en faire un cercle. Vous pouvez aussi considérer une version périodique d’un carré de côté L formant un tore bidimensionnel, ou même une version périodique tridimensionnelle formant un tore à trois dimensions. Imaginons que cette boîte cubique soit notre Univers et réduisez L. L’Univers devient de plus en plus petit et plus comprimé (voir la figure 11.5). Mais en théorie des cordes il arrive quelque chose de remarquable. Lorsque l’on continue à rétrécir au-delà de la taille d’une corde, l’univers se comporte finalement comme s’il se dilatait. On assiste à une inversion duale des longueurs : l’univers de longueur L en unités de longueur de cordes est dual à un univers de longueur 1/L. Au premier abord, cela semble absurde, mais en fait c’est une des dualités que l’on peut effectivement démontrer. L’énergie d’une particule dans une boîte
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
189
F IGURE 11.5. Un petit univers de longueur caractéristique L est dual d’un univers de longueur caractéristique 1/L. Les cordes en mouvement sont duales des cordes qui s’enroulent.
est quantifiée, et elle est donnée par E ∼ n/L si la longueur 5 est L. C’est l’énergie typique associée aux harmoniques dans une boîte, et n/L peut être considéré comme l’impulsion du centre de masse de la corde. Remarquez que cela n’est pas symétrique dans l’échange L ↔ 1/L. Lorsque L diminue, l’énergie de ces modes harmoniques devient énorme. La théorie des cordes ajoute un ingrédient à cette situation, l’enlacement des cordes autour de la boîte. Cet enlacement est caractérisé par le nombre d’enlacements m, et l’énergie est proportionnelle à L : E ∼ mL, parce que l’on doit fournir de l’énergie pour étirer la corde. Observez maintenant que si vous échangez L et 1/L ainsi que m et n, autrement dit si vous échangez les modes d’enlacement de la corde et les modes de l’impulsion de son centre de masse, vous obtenez le même spectre de niveaux d’énergie. En d’autres termes, si on se limite à des considérations d’énergie, on ne peut pas distinguer une boîte de côté L d’une boîte de côté 1/L. En résumé, ce que nous affirmons est que vous ne pouvez pas distinguer un univers de taille L d’un univers de taille 1/L. Ne connaissant pas la théorie des cordes, Einstein aurait fort bien pu être en désaccord avec cette conclusion. Il aurait pu dire que si l’on veut mesurer une distance, il suffit d’expédier un flash lumineux et de mesurer combien de temps il lui faut pour traverser l’univers. Cela donnerait une définition non ambiguë de la distance. Comment pourrions-nous donc réconcilier ces points de vue conflictuels ? En théorie des cordes, il existe deux types de lumière : d’une part notre lumière ordinaire, 5
N.d.T. N’oubliez pas que E et L sont mesurées en unités de Planck et que ce sont des nombres sans dimension. La fonction d’onde d’une particule quantique confinée dans une boîte unidimensionnelle de longueur L est proportionnelle à sin kx, avec k = nπ/L si l’on veut que la fonction d’onde s’annule aux extrémités x = 0 et x = L. L’impulsion est donc p = h¯ k = h¯ nπ/L et l’énergie E = cp pour une particule de masse nulle, soit E = n/L en unités de Planck.
190
Chapitre 11. Dualités
fondée sur les modes d’impulsion, et d’autre part un autre type de lumière, fondée sur les modes d’enlacements. Si vous mesurez les distances avec le premier type de lumière, alors vous obtenez la longueur L. Mais si vous utilisez l’autre type, impliquant des photons enlacés, alors vous allez mesurer l’autre longueur, 1/L ! Cela nous dit que la distance n’est pas une notion fondamentale en théorie des cordes. Vous pourriez vous demander s’il ne serait pas possible de détecter cet autre type de lumière dans des situations ordinaires, par exemple avec une lampe de poche. La réponse est maheureusement négative, car son énergie est proportionnelle à la longueur de l’Univers, et il faudrait une énergie astronomique pour la créer, et ce n’est certainement pas possible avec notre technologie actuelle des batteries.
11.6
Variétés de Calabi-Yau et symétries miroir
La T-dualité donne naissance à de nouvelles dualités 6 . De façon spécifique, les variétés 7 de Calabi-Yau sont des types très particuliers de variétés : chacune de ces variétés possède une variété miroir ou duale, dont la topologie complexe est différente. D’un point de vue mathématique, la variété initiale et sa variété duale appartiennent en principe à des classes topologiquement différentes, mais ce n’est pas nécessairement le cas de la physique en théorie des cordes, où des variétés de topologie différente peuvent néanmoins décrire la même physique. Cette généralisation de la T-dualité est appelée la symétrie miroir. Les dualités permettent de transformer une question en une question duale, ce qui veut dire qu’à une question formulée dans un certain cadre vous pouvez faire correspondre une question duale formulée dans le cadre dual. Quel peut être l’intérêt de passer d’une question à la question duale ? Donnons un exemple. Si l’on veut calculer des interactions physiques en théorie des cordes, on doit partir de la dimension 10 et réduire la théorie aux quatre dimensions usuelles en admettant que les six dimensions restantes ont été « compactifiées », enroulées dans des volumes de très petite dimension, par exemple des sphères. À grande distance, ces dimensions supplémentaires apparaissent comme des points et on retrouve un espace à quatre dimensions. Les six dimensions supplémentaires sont donc enroulées et dissimulées dans des « petits » espaces de dimension 6, qui dans la théorie des cordes sont des variétés de Calabi-Yau. Pour poursuivre, nous avons besoin de calculer le nombre de sphères d’aire minimale qui peuvent être empilées dans la variété. C’est un calcul difficile qui dépasse en 6 7
Pour un exposé très accessible, on pourra se reporter au livre de Brian Greene, L’Univers élégant. N.d.T. En mathématiques, la notion de variété généralise celle de surface.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
191
général nos possibilités. Mais, en utilisant la dualité, nous pouvons répondre à cette question en calculant des intégrales simples dans la variété de Calabi-Yau miroir, en remplaçant ainsi un problème intimidant par un autre bien plus sympathique. En utilisant cette méthode, les physiciens ont pu calculer le nombre de sphères d’aire minimale pour des sphères de degré différent, chaque degré correspondant au nombre d’enlacements sur la sphère, le nombre de façons dont une sphère peut s’enrouler autour de l’espace. Les mathématiciens avaient déjà résolu le problème pour des degrés 1 et 2, et leur réponse était en accord avec les nombres obtenus par les physiciens. Mais, en utilisant la symétrie miroir, les physiciens ont obtenu la réponse pour n’importe quel degré, et pas uniquement les degrés 1 et 2. À l’origine, les mathématiciens avaient essayé de déterminer ces nombres par des méthodes traditionnelles et, après un travail considérable, ils avaient obtenu la solution dans le cas du degré 3. Cependant leur résultat était en désaccord avec celui obtenu par les physiciens, qui avaient eux utilisé la symétrie miroir. Une opinion largement répandue était que les physiciens s’étaient trompés, mais les mathématiciens découvrirent une erreur dans leurs calculs et, après les avoir révisés, confirmèrent le résultat des physiciens. Cet épisode a donné confiance dans l’utilisation des dualités pour résoudre des problèmes difficiles de physique et de mathématiques, car cette approche a fourni des résultats inaccessibles par d’autres méthodes. Nous pouvons non seulement nous poser la question du nombre minimal de sphères qui peuvent être empilées dans un espace de Calabi-Yau, mais aussi celle du nombre minimal de surfaces à g-trous que l’on peut placer dans un tel espace. La sphère est une surface à zéro trou, g = 0, une sphère avec une anse une surface à un trou, g = 1, etc. g est appelé genus de la surface. Il y a plus de vingt-cinq ans, les physiciens ont calculé le nombre minimal de sphères à g-trous pour les genus 1 et 2, puis jusqu’à g = 49 environ une décennie plus tard. Sans exploiter la symétrie miroir, les mathématiciens sont limités au cas 8 g = 1. Cela démontre la puissance des ces mystérieuses dualités. Même s’il n’en existe pas aujourd’hui de compréhension mathématique profonde, la symétrie miroir est excitante pour les mathématiciens car ils peuvent tourner leur regard vers la physique pour aborder des problèmes mathématiques, et même y trouver la motivation pour des mathématiques nouvelles. La symétrie miroir, qui a attiré l’attention des chercheurs alors qu’ils exploraient la théorie des cordes, est une des dualités les plus faciles à utiliser. 8
Les résultats obtenus par les physiciens sont considérés par les mathématiciens comme des conjectures, parce que les standards de rigueur sont différents. Il arrive souvent que ce que les physiciens appellent « un résultat établi » soit pour les mathématiciens « une conjecture de physiciens ».
192
Chapitre 11. Dualités
La S-dualité pour la version non abélienne de la théorie de Maxwell que nous avons discutée ci-dessus est au contraire bien plus compliquée à comprendre. Essayons de donner quelques analogies grâce à des énigmes simples qui sont susceptibles transmettre quelques idées sur la nature de la théorie des cordes et la façon de la penser.
Énigme. Soit un damier formé de un million (106 ) carrés de 1 cm de côté. On vous donne des briques cubiques de 1 cm de côté et vous devez les placer sur les carrés du damier sans aucun recouvrement. Supposons que l’on vous donne 999 990 briques. Quel est le nombre de manières possibles de les placer sur le damier ? p
999 990 = C 10 , où C , le coefficient du binôme, est le Solution. La réponse est C10 n 6 106 nombre de façons possibles de choisir p objets identiques parmi n objets identiques, avec n ( n − 1) · · · ( n − p + 1) n! p = , Cn = p!(n − p)! p!
où n! = n × (n − 1) × (n − 2) · · · × 2 × 1. Nous avons utilisé la symétrie du coefficient du binôme, évidente sur la première égalité p
n− p
Cn = Cn
.
C’est effectivement une symétrie parce que nous obtenons le même résultat quel que soit le membre de l’équation utilisé. Mais c’est aussi une sorte de dualité : nous pouvons considérer les carrés recouverts par des briques et ceux qui ne le sont pas sur un pied d’égalité : les deux situations sont parfaitement symétriques. Autrement dit, chaque façon de placer les briques sur le damier peut être vue comme une façon de ne pas placer les briques sur les carrés restants. Ainsi la réponse est la même que si l’on vous avait demandé de placer 10 briques et non 999 990. En un sens, c’est une indication en faveur de l’idée, non prouvée mais intrigante, qu’il ne peut pas exister de théorie physique infiniment compliquée. Si l’on ajoute des briques sur le damier, le problème se complique à mesure que le nombre de briques augmente, mais à un certain point il devient de plus en plus facile. La complexité maximale ne correspond pas au nombre maximum de briques, lorsque les paramères du problème sont les plus grands possibles, parce que si on vous avait donné au départ 106 briques, il n’y aurait qu’une seule solution pour les placer sur le damier. Dans notre exemple, la complexité maximale est atteinte pour p = n − p, soit p = n/2 et que nous avons un demi-million de briques. C’est aussi le cas de la T-dualité, où la complexité maximale est obtenue pour L = 1/L, soit L = 1 en unités de Planck.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
193
Énigme. On vous donne une tige d’un mètre de long et vingt fourmis que vous placez sur la tige au temps t = 0. Les fourmis sont placées sur la tige et on leur demande de se déplacer vers la droite ou vers la gauche à une vitesse d’un mètre par minute. Chaque fois que deux fourmis se rencontrent, comme elles ne peuvent pas se croiser sur la tige sans tomber, elles inversent leur vitesse et reprennent donc leur vitesse initiale d’un mètre par minute, mais en sens opposé. Lorsqu’une fourmi arrive à une des extrémités de la tige, elle tombe. Quelle est la façon de placer les fourmis avec l’orientation de leur vitesse intiale si vous voulez maximiser le temps avant la chute de la dernière fourmi ? Solution. Au lieu d’imaginer qu’à chaque collision deux fourmis effectuent une inversion de leur vitesse, on imagine que les deux fourmis se croisent sur la tige en conservant leur vitesse initiale. Autrement dit, on effectue une opération de dualité en échangeant les identités des deux fourmis entrant en collision (voir la figure 11.6). Il est alors évident que l’on peut ignorer les collisions et maximiser
F IGURE 11.6. Dualité des fourmis entrant en collision : à droite, échange des identités lors d’une collision.
194
Chapitre 11. Dualités
le temps précédant la chute de la dernière fourmi, et ce temps est exactement d’une minute, pour toute solution telle qu’au moins l’une des fourmis part d’une des extrémités de la tige et se dirige vers l’autre extrémité.
Énigme : la mouche et le train. À midi, un train part d’une ville A vers une ville B distante de 100 km à une vitesse de 100 km/h. Une mouche part de B vers A également à midi mais à une vitesse de 200 km/h. Elle fait un demi-tour instantané quand elle rencontre le train et revient en B où elle fait à nouveau demi-tour, revient vers le train et fait demi-tour quand elle le rencontre et ainsi de suite jusqu’au moment où le train arrive en B. Quelle est la distance parcourue par la mouche quand le train arrive en B ? Solution. Il est possible d’obtenir le résulat en calculant la distance parcourue par la mouche pour aller de B au train, puis du train en B et ainsi de suite et de faire la somme (infinie) de toutes ces distances, c’est-à-dire la somme de la série des distances. Mais il est plus simple de remarquer que le train met une heure pour aller de A à B et, comme la vitesse de la mouche est de 200 km/h, elle va parcourir 200 km ! En d’autres termes, il est plus simple de calculer le temps dual de celui de la mouche, celui du train, pour obtenir la distance parcourue par la mouche 9 . 11.7
Autres dualités : géométrie et forces
Selon la théorie des cordes, l’Univers est formé du produit de notre espacetemps quadridimensionnel R4 et d’un espace compact 10 à six dimensions. La physique est « engendrée géométriquement », dans le sens où les forces et les particules de la Nature peuvent être interprétées en termes de la géométrie de ces espaces à six dimensions. De la même manière qu’Einstein nous a appris que la gravitation est une manifestation de la courbure de l’espace-temps, les théoriciens des cordes affirment que l’essentiel de la physique que nous voyons est dicté par la forme, ou la géométrie, des six dimensions cachées en chaque point de l’espace-temps. La théorie affirme que nous vivons dans un espacetemps à 3 + 1 dimensions (trois d’espace et une de temps), auxquelles s’ajoutent peut-être 6, voire 7 dimensions supplémentaires cachées. Où se cachent ces 9
N.d.T. La légende veut que cette énigme ait été proposée au célèbre mathématicien John von Neumann, connu pour ses extraordinaires capacités calculatoires, mais peu doué pour résoudre des énigmes. Après à peine trois secondes von Neumaan donne la réponse : 200 km ! Un peu déçue, la personne qui a proposé l’énigme lui dit : « je pensais que tu allais faire la somme de la série » ce à quoi, très étonné, von Neumann rétorque : « mais j’ai fait la somme de la série ! ». 10
N.d.T. En première approximation, on peut se représenter un espace compact comme un espace de taille finie, par exemple une sphère.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
195
F IGURE 11.7. Des dimensions supplémentaires peuvent apparaître si l’on y regarde de plus près.
F IGURE 11.8. À chaque point de l’espace-temps macroscopique est associé un espace de petite taille de dimension 6 enroulé sur lui-même.
dimensions supplémentaires ? Eh bien, un fil de téléphone, vu de loin, est un objet à une dimension, comme sur la figure 11.7, mais si nous nous rapprochons, nous le voyons comme un objet à trois dimensions avec un volume. L’espace macroscopique est à 3 dimensions, mais juste comme dans le cas du fil, c’est peut-être parce que nous le regardons de trop loin et que ces dimensions supplémentaires sont trop petites pour être distinguées à notre échelle. La théorie des cordes repose sur un espace-temps quadridimensionnel et six dimensions compactes (voir la figure 11.8). À quoi ressemblent ces espaces supplémentaires ? Ces questions ont conduit à la notion que nous avons déjà mentionnée d’ingénierie géométrique de la physique. La physique observée à l’échelle macroscopique sera différente suivant l’aspect et la taille des espaces internes à six dimensions : on observera différents types de particules ou des forces d’intensité différentes entre ces particules, etc. Supposons par exemple que nous voulions décrire la géométrie de l’interaction forte qui régit les forces entre quarks. Qu’aurions nous besoin de faire pour que le petit espace interne puisse accommoder deux sphères se touchant en un point comme sur la figure 11.9, de façon à obtenir en fin de compte une interaction non abélienne avec un groupe de jauge SU (3), autrement dit la chromodynamique quantique ?
196
Chapitre 11. Dualités
F IGURE 11.9. Deux sphères minuscules se touchant en un point mènent à la physique des interactions fortes entre quarks.
La manière dont la physique et la géométrie sont reliées entre elles, dans ce cas et bien d’autres, est tout à fait magique, même si les détail sont malheureusement trop complexes pour être exposés ici. À strictement parler, nous devons considérer le cas où l’aire des sphères tend vers zéro.
Énigme. Soit quatre fourmis se déplaçant sur un plan avec des vitesses constantes suivant différentes directions. Nous les étiquetons 1, 2, 3 et 4. Supposons que l’on nous dise que toutes les fourmis entrent en collision par paires au cours de leurs déplacements, sauf pour les fourmis 1 et 2, pour lesquelles nous ne savons pas si elles entrent ou non en collision. Étant donné ces conditions, pouvons-nous affirmer que les fourmis 1 et 2 vont entrer en collision ? Solution. Elles vont nécessairement entrer en collision. Pour le voir et apprécier la puissance du raisonnement qui consiste à utiliser des dimensions supplémentaires, ajoutons le temps à cette description. En d’autres termes, nous considérons l’espace-temps (t, x, y), où x et y sont les coordonnées d’une fourmi dans le plan et t désigne le temps. Si nous traçons la trajectoire d’une des fourmis dans cet espace-temps, nous obtenons une ligne droite, que l’on appelle la ligne d’univers de la fourmi. Comme chaque fourmi se déplace à vitesse constante, sa ligne d’univers doit être une ligne droite dans l’espace (t, x, y). Le fait que deux fourmis entrent en collision implique que leurs lignes d’univers se coupent, car l’existence de la collision implique que les deux fourmis se trouvent au même point ( x, y) au même instant t. En particulier les lignes d’univers des fourmis 1 et 3 ainsi que 1 et 4 se coupent par hypothèse, de même que celles de 2 et 3 ainsi que 2 et 4. Cela implique que les lignes d’univers des fourmis 1, 3 et 4 forment un plan dans l’espace-temps, de même que celles des fourmis 2, 3 et 4 (voir la figure 11.10). Mais les lignes d’univers des fourmis 3 et 4 se coupent et définissent un plan. Cela implique que les lignes d’univers des fourmis 1 et 2 sont dans ce même plan. Étant donné que les fourmis 1 et 2 se déplacent dans des directions différentes, qui ne sont donc pas parallèles, et que leurs lignes d’univers sont dans un même plan, elles se coupent nécessairement. L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
197
F IGURE 11.10. Ajouter le temps comme dimension supplémentaire permet de résoudre l’énigme en montrant que les lignes d’univers des fourmis 1, 3 et 4, ainsi que 2, 3 et 4 sont dans un même plan d’espacetemps. Cette observation implique que les lignes d’univers des fourmis 1 et 2 sont dans un même plan.
11.8
Dualité et trous noirs
Hawking nous a appris que les trous noirs possédaient un entropie extraordinairement élevée. S’appuyant sur des travaux antérieurs de Bekenstein, il a montré que cette entropie était proportionnelle à l’aire de l’horizon du trou noir. Mais d’où cette entropie provient-elle ? Quels sont ses ingrédients microscopiques ? Quels degrés de liberté devons-nous compter pour obtenir cette entropie, sachant que l’entropie est le logarithme du nombre de degrés de liberté ? En collaboration avec Andy Strominger, j’ai pu obtenir une solution exacte pour le calcul de l’entropie, c’est-à-dire le décompte exact des degrés de liberté dans le cadre d’une description duale d’un trou noir en théorie des cordes 11 . Le calcul implique le décompte du nombre de sphères autour desquelles des membranes, ou D-branes, sont enroulées, et qui peuvent être empilées dans une variété de Calabi-Yau à six dimensions. Cette approche a permis de reproduire le résultat de Bekenstein-Hawking, tout en fournissant une image interne expliquant la raison pour laquelle les trous noirs ont une entropie aussi élevée. C’est un exploit notable de la théorie des cordes ainsi qu’une reconnaissance de la puissance des dualités : le décompte d’objets mathématiques à l’intérieur d’une variété de 11
N.d.T. On peut soutenir que ce résultat de Strominger et Vafa est probablement le seul résultat de physique de la théorie des cordes, dont l’importance jusqu’à ce jour a plutôt été d’ordre mathématique.
198
Chapitre 11. Dualités
F IGURE 11.11. Exemple de transition géométrique : un tore se transforme en sphère.
Calabi-Yau a donné miraculeusement le même nombre que l’horizon d’un trou noir. Plusieurs dualités significatives qui interviennent en théorie des cordes impliquent un changement de géométrie appelé « transition géométrique » (voir la figure 11.11). Imaginons par exemple un tore posé horizontalement sur une table. Ajoutons un cercle aligné verticalement avec sa base sur la table. Supposons que le cercle se rétrécisse en un point, en pinçant le tore jusqu’au moment où il se défait et s’ouvre, en devenant topologiquement équivalent à une sphère. Cela fournit une image simple d’une transition géométrique, bien que cette image ne donne pas le reflet de son importance en théorie des cordes. Un exemple clé en est la notion d’holographie, que nous allons bientôt discuter. Le confinement des quarks, le fait que les quarks soient fortement liés dans un nucléon, peut être représenté par une transition géométrique, où une sphère rétrécit et une est remplacée par une autre sphère qui se dilate (voir la figure 11.12).
F IGURE 11.12. Une sphère se rétrécit et une autre sphère s’ouvre : un modèle géométrique du confinement des quarks.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
199
11.9
Holographie
Vous avez probablement fait l’expérience de cartes holographiques, dont les images 2D donnent l’impression d’images 3D. Nous avons déjà mentionné l’holographie dans le contexte des trous noirs, qui sont complètement caractérisés si nous connaissons l’aire de leur horizon plutôt que leur volume. Soit un photon caractérisé classiquement par une matrice 1 × 1, un nombre, par exemple une phase. Si l’on généralise à une théorie de Yang-Mills, il sera représenté par une matrice N × N. Si l’on prend N ≫ 1, et en l’interprétant dans R4 , alors on obtient une théorie de la gravitation dans un espace à cinq dimensions ! C’est un exemple d’holographie, ainsi que de la dualité AdS/CFT. Cette dualité peut être exprimée dans un langage plus simple : toute l’information sur un espace-temps à cinq dimensions tel que décrit par la théorie des cordes, une théorie qui inclut la gravitation, est complètement codée sur le bord de cet espace-temps, mais qui est elle décrite par une théorie des champs quantique qui n’inclut pas la gravitation. Il est remarquable que ces deux images, qui impliquent deux espaces-temps de dimension différente dont l’un inclut la gravitation et l’autre non, s’avèrent être équivalents. C’est un phénomène non seulement surprenant mais aussi très utile en pratique, et qui a initié nombre de travaux intéressants de physique théorique au cours des deux dernières décennies. 11.10
La loi du demi-cercle de Wigner
Soit la distribution gaussienne donnée par la densité (par exemple une densité de probabilité) f ( x) d’une variable à une dimension x x2 f ( x) ∝ exp − g
.
Wigner s’est posé la question suivante : que se passe-t-il si on passe à une dimension plus grande en remplaçant la variable à une dimension x par une matrice X, où X est une matrice symétrique N × N, chaque élément de la matrice étant une variable aléatoire. Examinons les valeurs propres de cette matrice. De façon générique, il y en aura N. Dans le cas de matrices X hermitiennes, Wigner a montré que si N ≫ 1 et g ≪ 1, avec gN fixé, alors les valeurs propres sont distribuées suivant unepdensité qui est un demi-cercle parfait ! Le diamètre de ce demi-cercle est R ∼ Ng. Mais quel peut bien être le lien avec l’holographie ? Soit ρ(λ) la densité des valeurs propres λ. Il se trouve que dans la limite N → ∞, on obtient
200
Chapitre 11. Dualités
F IGURE 11.13. La densité des valeurs propres d’une matrice aléatoire de grande taille va apparaître comme un demi-cercle.
approximativement αρ2 + λ2 = gN , et la densité de valeurs propres est ρ( λ) ∝
p
R 2 − λ2 .
Mais nous pouvons envisager ρ comme une nouvelle dimension (voir la figure 11.13). En ce sens l’holographie est reliée à la compréhension de certains problèmes aux extrêmes, dans notre exemple le cas où la taille de la matrice devient grande : N → ∞. On obtient une image équivalente : l’image du demicercle. Dans des exemples plus complexes de la théorie des cordes, l’holographie donne la gravitation mais dans une dimension supérieure par une unité. Ces images peuvent être intéressantes et illuminantes en elles-mêmes. L’holographie, dans le sens où nous l’entendons ici, est une idée époustouflante mise au jour par l’intermédiaire de la théorie des cordes, une boîte à outils incroyable pour résoudre des énigmes et qui peut s’appliquer à une grande variété de problèmes. Nous ne savons toujours pas pourquoi l’holographie fonctionne, et il en est de même pour d’autres approches fondées sur les dualités. Comprendre ce fonctionnement va exiger une collaboration de long terme entre mathématiciens et physiciens. Personne ne peut savoir aujourd’hui combien de temps cela va prendre et jusqu’où cela va nous mener.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
201
12 En résumé Dans les discussions des chapitres précédents nous avons exposé alternativement les points de vue de la physique et celui des mathématiques et dans le dernier chapitre nous les avons vus imbriqués dans le concept de dualité. Dans certains cas, nous avons discuté d’un sujet donné (A) aussi bien sous un angle physique que sous un angle mathématique. Nous avons alors examiné le sujet opposé (appelons-le anti A) en le regardant également sous ces deux angles. Nous avons aussi résolu des énigmes qui combinaient des idées de physique et de mathématiques dans une sorte d’image duale. La dualité, nous l’avons expliqué, a pris aujourd’hui une importance croissante en physique, et c’est une idée emblématique si l’on veut résumer ce que nous avons appris dans cet exposé. Une leco¸n que nous avons glanée de l’exploration des dualités qui émergent de nos théories physiques est que nous devons être ouverts à des idées diverses et novatrices dans notre approche aux lois physiques. Il ne faut pas se limiter à un seul point de vue en rejetant a priori des points de vue alternatifs. Il existe plusieurs angles d’approche différents, qui peuvent être tous légitimes et peuvent fournir des points de vue novateurs et des intuitions qui leur sont propres. Dans certains cas un de ces angles d’approche peut se révéler être la meilleure voie vers la solution. En bref, voilà le message à retenir de nos discussions. Passons en revue certains des sujets que nous avons couverts tout en ajoutant quelques détails ici et là.
F IGURE 12.1. Un diagramme schématisant la manière d’aborder les sujets dans ce livre.
F IGURE 12.2. Détermination d’un angle.
12.1
Symétries et leur brisure
Nous avons d’abord souligné l’importance des symétries en physique. Nous avons examiné les symétries de translation et de rotation ainsi que d’autres symétries plus subtiles.
Énigme. Quelle est la valeur de l’angle indiqué sur la figure 12.2 qui comporte deux triangles isocèles ? Solution. Nous pouvons constater que les triangles ABD et ACE sont des triangles égaux, et après une rotation de 36o degrés autour de A, ils se superposent. L’angle entre BD et CE est de 36o degrés, car c’est l’angle de rotation entre ces lignes. Notre analyse utilise l’idée de symétrie de rotation car nous savons qu’effectuer des rotations sur un triangle ne modifie pas ses caractéristiques. Énigme. On dispose quatre tortues aux sommets d’un carré de 10 m de côté (figure 12.3). Chacune des tortues se déplace vers la tortue adjacente dans le sens opposé des aiguilles d’une montre à une vitesse de 1 m/s et choisit le trajet 204
Chapitre 12. En résumé
F IGURE 12.3. Le problème des tortues.
F IGURE 12.4. Lorsqu’elles se déplacent, les tortues sont toujours aux sommets d’un carré.
le plus court vers sa cible. Combien de temps faut-il aux tortues pour atteindre le centre ?
Solution. Cela prend 10 secondes aux tortues. Notre intuition nous dit que du point de vue d’une tortue, si les autres tortues ne bougeaient pas, cela lui prendrait 10 secondes pour aller rejoindre une autre tortue à un sommet adjacent. Mais pourquoi cela reste-t-il vrai si la tortue cible est en mouvement ? Le système présente une symétrie pour des rotations de 90o degrés autour du centre du carré, et les tortues se trouvent donc toujours aux sommets d’un carré lorsqu’elles se déplacent (figure 12.4). Les tortues maintiennent donc une égale distance entre elles. Cela veut dire que la tortue qui poursuit sa cible se déplace toujours perpendiculairement à la vitesse de la tortue cible, et le taux d’approche est donc le même que si la tortue cible ne bougeait pas. L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
205
Les symétries sont amusantes, mais la brisure de symétrie peut l’être encore plus. En un certain sens notre existence même est le résultat de brisures de symétrie, par exemple la brisure de la symétrie matière-antimatière. La matière est duale de l’antimatière, et comment se fait-il que la matière existe alors que l’antimatière a disparu ? Dans une situation parfaitement symétrique, la matière n’existerait pas et nous ne serions pas là pour en parler. La matière et l’antimatière se seraient annihilées, en ne laissant que de l’énergie derrière elles. Le fait que la matière ait persisté n’est possible que grâce à une petite différence entre matière et antimatière, en gros une différence de l’ordre de 10−9 en valeur relative, appelée la violation de la symétrie CP. Bien que nous baignions dans des symétries, la brisure de symétrie fait aussi partie de notre environnement et est peut-être même plus importante. Cependant la brisure de symétrie peut être très contre-intuitive. Par exemple la physique n’est pas invariante par symétrie de réflexion, ce que Pauli estimait absurde.
12.2
Symétrie de jauge
De nombreuses propriétés de la physique des particules élémentaires impliquent ce que l’on appelle des « symétries de jauge ». Ces symétries ont un parfum un peu différent de celles que nous apercevons autour de nous. Si l’on prend un exemple familier, la symétrie de translation implique qu’une expérience faite en un lieu d’espace différent doit avoir le même résultat. Dans une symétrie de jauge, nous pourrions dire que deux points différents sont essentiellement le même point. D’un point de vue mathématique, nous relions la configuration du champ en ces deux points par une relation d’équivalence. Un exemple d’une telle relation serait celle qui relie tous les points sur un cercle horizontal tracé sur un cylindre vertical. On peut penser un cylindre comme étant l’espace produit d’un segment de droite par un cercle. Chaque point de la droite étiquette un cercle, à savoir le cercle qui passe par ce point. Considérons la symétrie qui consiste à faire tourner le cylindre autour de son axe. Si nous identifions cette opération à une symétrie de jauge, nous identifierons tous les points du cercle entre eux. En d’autres termes, tous les points d’un cercle horizontal sur le cylindre sont considérées comme équivalents. L’électromagnétisme classique a fourni le premier exemple d’une symétrie de jauge, qui réalise la symétrie de jauge du cylindre décrite ci-dessus. Pour chaque configuration du champ électrique ~E il existe un potentiel électrique V fonction du point d’espace. Il se trouve que la valeur absolue de ce potentiel électrique en un point est arbitraire, car on définit en général le potentiel à partir
206
Chapitre 12. En résumé
F IGURE 12.5. Le schéma des taux de change.
d’un potentiel zéro, le potentiel de la Terre, qui est en fait arbitraire. Si nous choisissions un potentiel de la Terre différent, cela changerait seulement la valeur absolue de V sans changer la physique : le champ électrique ne dépend que des variations de V. En d’autres termes, si V est une solution des équations de Maxwell, alors V + C, où C est une constante arbitraire, est aussi une solution qui ne modifie en rien le champ électrique. C’est l’exemple le plus simple d’une transformation de jauge. En fait les équations de Maxwell possèdent une symétrie de jauge un peu plus compliquée : les équations sont invariantes par une transformation appelée transformation de jauge. Dans l’analogie précédente du cylindre, lorsque l’on choisit un potentiel particulier, cela revient à choisir un point spécifique sur le cercle pour tout point de l’espace-temps. Le taux de change entre pays fournit une bonne analogie pour les symétries de jauge 1 . Imaginons un réseau de points, où chaque point représente un pays (voir la figure 12.5). Il existe un taux de change entre deux pays voisins sur le réseau. Modifier l’unité de monnaie dans un pays (i ), par exemple passer du franc à l’euro, va modifier les taux de change ri de ce pays avec tous les autres. Mais une telle modification dans l’unité de monnaie n’affecte en rien les facteurs économiques, car il s’agit simplement d’une convention. Considérons le taux de change entre les États-Unis et la France. Avant le passage à l’euro, le taux de change était de 5 francs pour un dollar (environ). Le passage du franc à l’euro s’est fait suivant le taux de conversion : 1 euro = 6,57 francs, et par conséquent un dollar US s’est échangé pour 5/6,57=0,761 euros. C’est une symétrie de jauge parce qu’après cette conversion du francs en euros, rien n’a vraiment changé. Tous les choix d’unités de monnaie sont équivalents, et en ce sens cela ressemble à une symétrie de jauge. Remarquons que le produit r1 r2 r3 r4 le long d’une boucle (voir la figure 12.5) ne va pas changer dans une modification des monnaies de pays (1, 2, 3, 4), et ce produit possède une signification physique. C’est ce que 1
Pour plus de détails sur cet exemple, on pourra consulter Juan Maldacena : https://arxiv.org/pdf/1410.6753.pdf.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
207
les physiciens appellent une quantité invariante de jauge. S’il s’agit d’un taux de change qui n’est pas manipulé, le produit du cycle doit rester égal à un. Mais en cas de spéculation, on peut gagner de l’argent en jouant sur le fait que r1 r2 r3 r4 6= 1. Ceci est une analogie simple de la symétrie de jauge, mais qui ne permet pas vraiment de comprendre en profondeur son rôle crucial en physique. L’électromagnétisme, que nous avons discuté ci-dessus, possède une symétrie de jauge U (1). Nos théories actuelles des trois autres types d’interactions, fortes, faibles et gravitationnelles, incorporent aussi les symétries de jauge, et ces symétries sont donc centrales pour le modèle standard des particules et la relativité générale, les deux piliers de notre connaissance physique de la Nature. 12.3
Mathématiques intuitives
Nous avons examiné une grande variété de phénomènes mathématiques en physique. Nous avons par exemple été capables de montrer qu’il existe toujours à la surface de la Terre deux points antipodaux avec la même pression et la même température, en nous servant uniquement d’un principe de continuité. Nous avons aussi montré que les mathématiques peuvent imposer des contraintes à certains problèmes physiques, mais sans donner d’information sur la dynamique des processus physiques considérés. Les mathématiques peuvent vous donner une preuve de l’existence de ces points antipodaux avec la même pression et la même température, mais elles ne vont pas vous dire où se trouvent ces points ni la façon dont ils vont se déplacer au cours du temps.
Énigme. Imaginons que des atomes soient localisés sur des sites sur la surface d’une boule. Imaginons aussi une espèce de jeu de chaises musicales pour ces atomes, qui changent de site pendant un temps et ensuite s’immobilisent. Décidons qu’un atome « a perdu » à ce jeu s’il se retrouve sur le même site. Les atomes font de leur mieux pour qu’aucun atome ne perde au jeu. Est-il possible qu’aucun atome ne perde ? Solution. Non, ce n’est pas possible ! Un théorème de mathématiques, le théorème du point fixe de Brouwer, affirme qu’une application continue de la sphère sur elle-même a toujours un point fixe. La preuve est similaire à celle utilisant des arguments fondés sur le nombre d’enlacements que nous avons discutée antérieurement. La version infinitésimale de ce théorème énonce qu’un champ de vecteurs sur la sphère doit avoir un zéro quelque part. Une autre version équivalente du théorème, mais plus imagée, est la suivante : vous ne pouvez pas peigner des cheveux en tout point sur une sphère. Il y a toujours un point sur la sphère où vous devrez faire un épi au lieu de pouvoir peigner les cheveux 208
Chapitre 12. En résumé
dans une direction choisie. Vous obtenez un champ de vecteurs sur la sphère en associant à chacun de ses points un vecteur ayant pour direction celle où vous peignez les cheveux en ce point. Mais le théorème du point fixe vous dit qu’en au moins un de ces points ce vecteur doit s’annuler, et là vous devez faire un épi. De même, dans le cas des atomes sur la sphère, on construit un champ de vecteurs en associant à chaque site la direction du mouvement de l’atome situé au site correspondant, et le théorème du point fixe vous dit que ce champ de vecteurs doit s’annuler en au moins un site : en ce site l’atome ne bouge pas. Ces concepts mathématiques qui semblent formels jouent parfois un rôle important en physique. Le fait que le nombre d’enlacements est conservé dans la concaténation de courbes autour d’un cylindre correspond à la conservation de la charge, une propriété que nous avons discutée précédemment. Il existe un modèle topologique pour le proton, fondé sur l’argument suivant. Au départ, on considère un champ g qui prend ses valeurs sur la sphère à trois dimensions S3 . La valeur de ce champ de ce champ sur l’espace R3 peut être g
considérée comme une application R3 → S3 , où R3 est l’espace ordinaire et g un champ. Un proton, et plus généralement un baryon, peut être imaginé dans le cadre suivant. On considère une compactification à un point de l’espace en remplaçant R3 par S3 et en ajoutant un point à l’infini. Un baryon donné correspond au choix pour g de l’application identité : S3 → S3 , et en général le nombre baryonique correspond au nombre d’enlacements de l’application. 12.4
Mathématiques contre-intuitives
Un exemple frappant de mathématiques contre-intuitives est donné par les 120 mètres de hauteur supplémentaires que l’on peut gagner en ajoutant un mètre à une corde faisant le tour de la Terre. Rappelez-vous l’énigme qui consistait à déterminer le nombre de régions dans un disque découpé par des droites tracées entre des points sur la frontière du disque. Nous avons appris à nous méfier des motifs qui semblent naturels au premier abord mais ne se généralisent pas à une situation plus complexe. En physique, nous ne disposons que d’un nombre limité de données et d’exemples à partir desquels nous aimerions extrapoler. Même si notre théorie favorite est en accord avec ces données en nombre fini, il faut toujours envisager le cas où notre théorie serait fausse.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
209
Les infinis sont souvent une source de confusion et de perplexité. Un aspect intéressant des infinis est que l’ensemble des nombres réels calculables – les nombres qui sont calculables au moyen d’un algorithme donnant un nombre arbitrairement grand de chiffres – est dénombrable, en dépit du fait que l’ensemble des nombres réels ne l’est pas. En effet les nombres réels calculables sont fabriqués à partir d’un ensemble dénombrable d’opérations. Et si vous effectuez un nombre dénombrable d’opérations, il n’est pas surprenant que vous obteniez un nombre dénombrable de résultats. Il arrive que des mathématiques un peu folles fassent leur chemin en physique. Rappelez-vous notre discussion de l’hôtel de Hilbert où ∞ + 1 = ∞. Cela arrive aussi en physique par exemple quand on produit des particules à partir du vide. La partie des mathématiques qui décrit ce type d’« anomalie » est appelée la théorie de l’index.
Énigme. Dans un jeu de pile ou face nous disposons d’une pièce de monnaie très spéciale. Le premier lancer de la pièce donne pile et le second face. De plus la pièce a la propriété suivante : après les deux premiers lancers, la probabilité de trouver pile est proportionnelle au rapport des pile (relativement au nombre total de lancers) que l’on a observés dans les lancers précédents. Nous effectuons 100 lancers supplémentaires. Quelle est la probabilité de trouver 13 pile, après les deux lancers initiaux ? De trouver 50 pile ? De trouver 100 pile ?
Solution. Il y a deux effets en compétition. Il y a un aspect combinatoire concernant le nombre de façons d’obtenir un nombre donné de pile (P) et un effet d’avalanche, qui favorise le fait d’obtenir à un certain lancer le même résultat qu’au lancer précédent. Le premier effet rend bien plus probable le fait d’obtenir 50 pile plutôt que 0 ou 100. Le second effet favorise la tendance opposée et rend les résultats extrêmes très probables. Par exemple, si par chance vous obtenez des pile pour les premiers lancers, alors les chances d’obtenir des pile augmentent et par un effet d’avalanche vous allez obtenir uniquement des pile, ce qui rend les extrêmes plus probables. Mais il s’avère que les deux effets s’annulent, et le résultat final est que la probabilité ne dépend pas du nombre de pile ! Tous les résultats ont la même probabilité p = 1/101. Nous pouvons le voir en examinant la séquence suivante de lancers et la probabilité correspondante de chaque lancer :
P : 1 ; F : 1 ; P :
210
2 1 3 2 1 P : ; F : ; P : ; F : . 2 3 4 5 6 Chapitre 12. En résumé
En suivant ce motif, nous pouvons déduire que pour un résultat donné de P pile et F face, la probabilité est CPP+ F ×
1 P!F! = . ( P + F + 1) ! P+F+1
Le premier facteur, le coefficient du binôme, est un facteur combinatoire et le second facteur est dû à l’avalanche 2 . Le résultat net est donc une probabilité de 1/101 quel que soit le nombre de P et de F. 12.5
Physique intuitive et non intuitive
L’intuition physique peut nous aider de façon surprenante à nous orienter dans un problème. Un exemple remarquable en est l’intuition physique qui, par l’intermédiaire de la théorie des cordes, nous a permis de progresser dans des problèmes difficiles d’énumération géométrique qui avaient indépendamment une grande importance mathématique. À la frontière de la physique théorique, nous avons utilisé la symétrie miroir et l’intuition physique pour prédire des résultats de mathématiques que les mathématiciens eux-mêmes ne peuvent pas encore démontrer. Rappelez-vous comment nous avons prouvé le théorème de Pythagore en utilisant un argument de physique fondé sur des couples mécaniques. On peut discuter à l’infini de ce que l’argument était plus ou moins circulaire, mais il est indubitable que reformuler un problème de mathématiques dans un cadre physique fournit de nouvelles intuitions. Vous pouvez par exemple prolonger l’argument pour découvrir une loi plus générale, celle des cosinus des angles d’un triangle. Ce sont là deux exemples simples pour illustrer notre point, dont la portée est bien plus générale. Certaines théories semblent non intuitives jusqu’au moment où vous les examinez sous le bon angle. Par exemple, la théorie de la relativité restreinte d’Einstein semble très contre-intuitive, avec des phénomènes très mystérieux comme la dilatation des temps et la contraction des longueurs, mais ces phénomènes découlent du fait que tous les systèmes de référence inertiels sont équivalents et que la vitesse de la lumière est donc identique dans tous les référentiels inertiels. Cette dernière hypothèse était a priori surprenante au premier abord car les physiciens de la fin du XIXe siècle pensaient que la propagation de la lumière nécessitait un support, qu’ils ont appelé éther, de sorte que la vitesse de la lumière dépendait du référentiel. Après avoir essayé en vain de détecter cet éther, ils durent se rendre à l’évidence : l’éther n’existait pas. Dès que vous avez admis 2
N.d.T. Il est facile de démontrer la formule du texte par récurrence.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
211
que la vitesse de la lumière est la même dans tous les référentiels inertiels, la relativité restreinte s’en déduit et devient intuitive. Malheureusement toute la physique n’est pas aussi intuitive. Un exemple remarquable est la mécanique quantique. Nous devons admettre que nous n’avons pas encore trouvé le bon angle d’approche pour la mécanique quantique. C’est une théorie très contre-intuitive. Certains aspects, comme le principe de superposition ou le rôle des probabilités échappent à notre intuition. Après plus d’un siècle, notre intuition ne l’a pas encore intégrée. Un exemple en est l’expérience des fentes d’Young pour des particules, qui selon Feynman contient le cœur de la mécanique quantique, mais défie notre sens commun si nous essayons de nous représenter « la façon dont les choses se passent ». Un autre aspect contre-intuitif est l’impossibilité d’étiqueter des particules identiques. 12.6
Normalité
Nous sommes ensuite passés à la « normalité », le fait que nous pouvons souvent obtenir un résultat de physique approché à partir de l’analyse dimensionnelle. Cette analyse dimensionnelle ne donne le résultat qu’à un facteur numérique près, un facteur d’ordre 1, ou O(1). La normalité est précisément le fait que le facteur numérique inconnu est O(1). C’est du moins ce que les physiciens ont longtemps pensé. Dirac fut l’un des premiers à envisager que des nombres très grands, « non naturels », puissent intervenir en physique. Par exemple, le rapport de la force électrostatique entre deux protons à la force gravitationnelle entre ces deux mêmes protons est un nombre astronomique, de l’ordre de 1036 . Ensuite, en utilisant la constante de gravitation G, la constante de Planck h¯ et la vitesse de la lumière c, nous avons construit un système d’unités physiques, les unités de Planck. Le schéma ci-dessous donne quelques repères pour des longueurs caractéristiques qui diffèrent par un facteur 1020 environ : ×1020
×1020
×1020
ℓPlanck −→ ℓproton −→ ℓSoleil −→ ℓUnivers . Nous avons rencontré ces énigmes de la hiérarchie, d’où émergent des nombres qui sont très grands ou très petits d’une façon qui n’est pas normale, ou naturelle. La raison de l’existence des ces hiérarchies est aujourd’hui une question ouverte. Une configuration plus naturelle aurait probablement été que la taille de l’Univers soit de l’ordre la longueur de Planck ! Si c’est le cas, on doit considérer que notre existence même est un phénomène qui n’est absolument
212
Chapitre 12. En résumé
pas naturel et très improbable. Dans une configuration plus naturelle, l’Univers n’existerait que pour un temps de l’ordre du temps de Planck, 10−44 s, une minuscule fraction de seconde. Certains physiciens invoquent le principe anthropique afin de rendre naturel l’ajustement millimétrique nécessaire pour les hiérarchies, mais cette approche est très peu prédictive, l’exception étant la prédiction par Weinberg de la valeur de la constante cosmologique. Nous avons donné quelques exemples de problèmes en théorie des nombres qui, bien que formulés en termes de nombres qui sont petits, ont des solutions faisant intervenir des nombres astronomiques. Il est possible que ce soit là l’origine des hiérarchies dans un contexte physique : il suffirait de poser la question de la bonne manière pour pouvoir se limiter à des nombres O(1).
12.7
Physique et religion
Nous avons aussi discuté de quelques idées sur le lien entre la physique et les religions. Un des mystères de la physique, nous l’avons vu, est que nous avons besoin d’un ajustement millimétrique de certains paramètres de nos théories pour assurer notre existence même. Un créationniste pourrait dire que quelqu’un, un être non précisé, a été nécessaire pour ajuster finement ces paramètres à la main. Des personnes qui cherchent des explications plus naturelles feraient appel à des considérations anthropiques, suggérant que notre Univers a subi une évolution sélective afin d’assurer notre existence, sinon nous ne serions pas là pour poser de telles questions. Notre conclusion finale a été que la science ne peut pas être utilisée pour contester la validité de la religion, pas plus que la religion ne peut être utilisée pour contester la validité de la science. Nous ne devrions pas non plus tirer des conclusions d’une école de pensée et l’appliquer à une autre. Lorsque vous remontez dans le temps, disons au temps de Newton, vous allez observer différents types de religiosité. Je pense que les scientifiques ont des convictions religieuses, sans doute dans une acception non conventionnelle, bien qu’ils ne le reconnaissent pas. Ils recherchent un motif ultime dans l’organisation de l’Univers, un motif qui pourrait bien ne pas exister, mais auquel ils croient cependant. Cela pourrait être considéré comme une croyance irrationnelle, une sorte de conviction de type religieux. Le point crucial est de garder un esprit ouvert. C’est à un manque d’ouverture d’esprit que l’on peut attribuer le scepticisme d’Einstein sur l’existence des trous noirs et des ondes gravitationnelles, bien que ces phénomènes aient été inscrits dans ses équations de la relativité générale. Et c’est peut-être en raison de préjugés qu’Einstein a au départ rejeté le Big Bang comme de la mythologie religieuse.
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
213
Mais ce sont là des remarques mineures, en regard du fait qu’Einstein fut sans aucun doute un des scientifiques les plus visionnaires de l’histoire. 12.8
Dualités
Nous avons vu comment les dualités, qui semblent intervenir de façon naturelle en physique et en mathématiques, peuvent transformer un problème complexe en un autre bien plus simple. C’est un concept révolutionnaire, dont l’impact sur la physique est déjà immense, et dont l’influence se propage en mathématiques. Cependant, c’est presque embarrassant d’avoir à reconnaître que nous ne savons pas vraiment pourquoi cela marche. Il se pourrait néanmoins qu’il existe une raison philosophique pour que ces dualités jouent un rôle dans la Nature. Les théories physiques présentent des structures si riches et si complexes qu’il semble que nous devons presque postuler un trop grand nombre de miracles pour qu’elles voient le jour. Ainsi, si vous observez le même type de miracle à l’œuvre pour des théories d’apparence très différente, il est possible qu’elles soient en fait identiques mais qu’elles se présentent sous des déguisements différents, c’est-à-dire qu’elles soient duales l’une de l’autre. C’est l’explication avancée par Sergio Cecotti : la rareté des structures complexes les oblige à se répéter ! Les progrès dans la théorie modifient notre conception de l’Univers et mettent au défi nos notions fondamentales comme celle de masse ou encore celle de l’espace-temps que nous sommes supposés habiter. Cela dit, il est possible qu’il existe des limites sur ce que la théorie peut atteindre. Au cours des quelques décennies passées, nos frontières théoriques nous ont repoussé bien au-delà de nos capacités expérimentales, et les toutes dernières découvertes théoriques n’ont pas pu se traduire par des observations expérimentales. Cependant des idées venant de la physique théorique ont irrigué les mathématiques, ce qui s’est avéré être une voie très productive. Des relations entre physique et mathématiques se développent de plus en plus à mesure que la science nous pousse dans des directions nouvelles et imprévisibles. Même si nous ne savons pas où cela va nous mener, ce sera certainement un parcours excitant. J’espère que vous allez nous rejoindre dans cette aventure !
214
Chapitre 12. En résumé
“INDEX” — 2021/6/26 — 13:49 — page 215 — #1
Index A addition des vitesses 9, 130 analyse dimensionnelle 143, 145, 146, 151, 152, 212 antimatière 16, 26, 27, 45, 46, 206 antiparticule 16, 27
constante de gravitation 148, 150, 212 constante de Hubble constante de Planck 4, 14, 17, 132, 149, 155, 212 constante de structure fine 150, 156 continuité 3, 70, 74-78, 80, 82, 83, 208 contraction des longueurs 118, 211 courbure 11, 12, 78-80, 140, 162, 195
B Big Bang 27, 45, 59, 60, 164, 171, 174, 214 boson de Higgs 58, 59, 157, 158 bouteille de Klein 99-101 brisure de symétrie 45, 47, 48, 54, 55, 58, 60, 61, 65, 68, 158, 206
C champ de Higgs 59-61, 64 charge électrique 40, 145, 146, 148, 186 chiralité 25, 65-67 conjecture de Toeplitz 98 conjugaison de charge 26 constante cosmologique 161-164, 166, 171 constante de Boltzmann 53, 148, 152
D degré d’une application 82 dilatation du temps 118 dualité électromagnétique 189 dualité 40, 181-185, 187-189, 191-195, 198-201, 203, 214 dualité et cordes 188, 198 dualité et trous noirs 198 dualité onde-particule 184 dualité-T 189, 191
E échelles de distance 3 échelle de grande unification 62, 156 échelles de masse 156, 165, 166 échelles de temps 165, 166
“INDEX” — 2021/6/26 — 13:49 — page 216 — #2
électromagnétisme 8, 10, 17, 20, 148, 206, 208 énergie sombre 161 énigme des anniversaires 103 épaisseur de l’atmosphère 4 équation d’Einstein 139, 140, 162 entropie 119, 120, 140, 141, 148, 152, 198 entropie d’un trou noir 141, 152 équations d’Einstein 83, 139, 140, 162 équations de Maxwell 9, 10, 207 équations de Newton 170 espace-temps 12, 28, 59, 78, 79, 93, 94, 140, 142, 161, 162, 171, 181, 188, 195-198, 200, 207, 214 étoile à neutrons 62 expansion de l’Univers 161, 163, 164 expérience des fentes d’Young 134
F force 5, 6, 10, 59, 48, ,52, 60, 61, 63, 65, 69, 78, 108, 110, 111, 113, 114, 116, 117, 124, 126, 127, 146, 148, 163, 212, force de gravitation 108 formule de Larmor 146
gravitation 11, 12, 18, 20, 38, 43, 44, 49, 61, 62, 78, 80, 107, 108, 122, 139, 142, 148-150, 161, 162, 174, 175, 181, 182, 186, 195, 200, 201, 208, 212, 214 gravitation quantique 18, 20, 139, 175 graviton 18, 20 groupe 27, 28, 37, 41, 42, 54, 63, 64, 88, 94, 102, 103, 120, 121, 156, 187, 196 groupe abélien 41 groupe non abélien 42 groupe de rotation 27, 37, 63
H holographie 141, 142, 199-201 horizon des événements 139-141, 152
I indiscernabilité quantique 136 intégrale de chemin 17, 175 interférence 134, 170 intrication quantique 136
L G galaxie 61, 80, 82, 129, 130, 139, 159, 161, 163, 173 géodésique 12, 78-80, 162 géométrie euclidienne 3, 79 grande unification (GUT) 61-63, 156, 157, 185, 186
216
Lentille gravitationnelle 78, 80, 161 LHC : Grand Collisionneur de Hadrons 60, 61 LIGO : détecteur interférométrique 139 lois de Newton 2, 9 loi de Snell-Descartes 123, 124
Index
“INDEX” — 2021/6/26 — 13:49 — page 217 — #3
M matière sombre 161 mécanique quantique 7, 8, 13, 14, 16-18, 60, 91, 99, 133, 134, 137-139, 141, 148, 149, 157, 172, 173, 184, 185, 212 mécanique statistique 119, 132, 133, 138, 148 mer de Dirac 15, 16, 91 modèle d’Ising 53, 55, 57, 59, 64 modèle héliocentrique 159
postulat d’Euclide 11 principe anthropique 163, 164, 213 principe d’Archimède 114 principe de Bernoulli 127 principe de correspondance principe d’équivalence 182, 206 principe d’indétermination 150, 151
Q quasi-cristaux 38, 39
N
R
naturalité = normalité 143 neutrino 25, 31, 156, 157, 161, 165 nombres complexes 71, 72, 99 nombres premiers 78, 85 nombres rationnels 89, 90 non localité 137 normalité 143, 154, 155, 212
rayon de Schwarzschild 152 rayonnement d’une charge accélérée 132 rayonnement électromagnétique 132 rayonnement de Hawking 140 rayonnement du corps noir 132 relativité générale 12, 13, 18, 79, 80, 82, 139, 140, 152, 162, 171, 208, 214 relativité restreinte 10, 13, 14, 27, 117, 118, 211, 212 renversement du temps 26, 27 ruban de Moebius 99, 100
O observateur 9, 10, 50, 51, 82, 118, 119, 139 onde électromagnétique 9, 135 onde gravitationnelle 18, 139, 214
P paradoxe des jumeaux 131 paradoxe d’Olbers 137, 138 paradoxe EPR 137, 138 parité 25, 26, 65, 156, 157, 164, 179 polarisation de la lumière 135, 136 portance 125, 126
L’UNIVERS DÉCRYPTÉ PAR LES ÉNIGMES
S série analytique 92 singularité d’un trou noir supercordes 94 supersymétrie 35-37, 94, 157, 158, 163, 166 supraconductivité 64, 65 symétrie de translation 27-29, 65, 106, 206 symétrie miroir 191, 192, 211
217
“INDEX” — 2021/6/26 — 13:49 — page 218 — #4
T température 52-55, 59-61, 64, 74-76, 132, 148, 208 théorème de Fermat 160 théorème de Noether 28 théorème de Pythagore 39, 116, 117, 119 théorème de Torricelli 109 théorème du point fixe 208, 209 théorème fondamental de l’algèbre 72, 73, 76 théorie des champs conforme (CFT) 16-18, 27, 182, 187, 188 théorie des champs quantiques 16-18, 27, 182, 187, 188 théorie des cordes 19, 20, 40, 66, 94, 166, 181, 188-193, 195, 196, 198-201, 211
218
théorie des nombres 159, 160, 187 topologie 6, 19, 70, 74, 83, 191 tore 79, 99, 100, 188, 189, 199 transformation de Fourier 184, 185, 187 trou noir 97, 139-141, 152, 198, 199
U unités de Planck 149, 152, 156, 162, 163, 165, 166, 190, 193, 212
V variété de Calabi-Yau 198, 199
Index