215 75 3MB
French Pages 231 [232] Year 2015
Les relativités : espace, temps, gravitation
Michel Le Bellac
17, avenue du Hoggar Parc d’activités de Courtabœuf, BP 112 91944 Les Ulis Cedex A, France
Dans la même collection Le monde quantique Michel Le Bellac, préface d’A. Aspect Le laser Fabien Bretenaker et Nicolas Treps, préface de C.H. Townes Naissance, évolution et mort des étoiles James Lequeux La fusion thermonucléaire contrôlée Jean-Louis Bobin Le nucléaire expliqué par des physiciens Bernard Bonin, préface d’É. Klein Mathématiques des marchés financiers Mathieu Le Bellac et Arnaud Viricel, préface de J.-Ph. Bouchaud Physique et biologie Jean-François Allemand et Pierre Desbiolles La cryptologie Philippe Guillot L’aventure du grand collisionneur LHC Daniel Denegri, Claude Guyot, Andreas Hoecker et Lydia Roos, préface de C. Rubbia Le climat : la Terre et les hommes Jean Poitou, Pascale Braconnot et Valérie Masson-Delmotte, préface de J. Jouzel Aux origines de la masse : particules élémentaires et symétrie fondamentales Jean Iliopoulos, préface de F. Englert Retrouvez tous nos ouvrages et nos collections sur http://laboutique.edpsciences.fr
Illustration de couverture : Vue d’artiste d’une étoile à neutrons en rotation, ou pulsar. L’axe de rotation est vertical et la direction d’émission des ondes radio est indiquée par les deux flèches.
© 2015, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc d’activités de Courtabœuf, 91944 Les Ulis Cedex A Tous droits de traduction, d’adaptation et de reproduction par tous procédés réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective, et d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code de la propriété intellectuelle). Des photocopies payantes peuvent être réalisées avec l’accord de l’éditeur. S’adresser au : Centre français d’exploitation du droit de copie, 3, rue Hautefeuille, 75006 Paris. Tél. : 01 43 26 95 35. ISBN 978-2-7598-1294-3
Table des matières
Préface
ix
Avant-Propos
xi
1
2
3
L’espace-temps 1.1 Espace . . . . . . . . . . . . . 1.2 Temps . . . . . . . . . . . . . . 1.3 Lignes d’univers . . . . . . . . 1.4 Plus vite que la lumière ? . . . 1.5 Temps propre . . . . . . . . . 1.6 Espace-temps de Minkowski 1.7 Bibliographie . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
1 1 4 6 9 12 17 22
Principe de relativité 2.1 Forces d’inertie . . . . . . . . . . . . . . . 2.2 Référentiels d’inertie . . . . . . . . . . . . 2.3 Principe de relativité . . . . . . . . . . . . 2.4 Transformations de Lorentz . . . . . . . . 2.5 Référentiels d’inertie dans l’espace-temps 2.6 Observateurs accélérés . . . . . . . . . . . 2.7 Bibliographie . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
23 23 26 29 31 35 39 42
Le temps relativiste 3.1 Paradoxe des jumeaux . . . . . 3.2 Vérifications expérimentales . . 3.3 Usain Bolt sprinter relativiste ? 3.4 L’effet Doppler . . . . . . . . . . 3.5 Bibliographie . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
43 43 46 47 48 51
. . . . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . . . .
. . . . .
. . . . .
4 Masse et énergie 4.1 Collisions en physique newtonienne 4.2 Conservation de l’énergie-impulsion 4.3 Applications simples . . . . . . . . . 4.4 Bibliographie . . . . . . . . . . . . .
. . . .
. . . .
5 Principe d’équivalence et relativité générale 5.1 Principe d’équivalence . . . . . . . . . . 5.2 Application au GPS . . . . . . . . . . . . 5.3 Espaces courbes . . . . . . . . . . . . . . 5.4 Déviation géodésique . . . . . . . . . . . 5.5 Équations d’Einstein . . . . . . . . . . . 5.6 Métrique de Schwarzschild . . . . . . . 5.7 Bibiographie . . . . . . . . . . . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
6 Vérifications dans le système solaire 6.1 Théorie de Newton des orbites planétaires 6.2 Particules massives . . . . . . . . . . . . . . 6.3 Photons . . . . . . . . . . . . . . . . . . . . . 6.4 L’effet Shapiro . . . . . . . . . . . . . . . . . 6.5 Précession géodésique . . . . . . . . . . . . 6.6 Bibliographie . . . . . . . . . . . . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
. . . . . . .
. . . .
53 53 57 61 65
. . . . . . .
67 67 72 77 81 86 92 96
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
97 98 102 106 107 109 110
7 Trous noirs 7.1 À l’extérieur du rayon de Schwarzschild . . . . . 7.2 À l’intérieur du rayon de Schwarzschild . . . . . 7.3 Trous noirs en rotation . . . . . . . . . . . . . . . 7.4 Trous noirs astrophysiques . . . . . . . . . . . . . 7.5 Rayonnement de Hawking et thermodynamique 7.6 Bibliographie . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
111 112 114 120 127 131 135
. . . . .
137 138 144 145 151 154
8 Ondes gravitationnelles 8.1 Ondes électromagnétiques . . . . . . . . 8.2 Description des ondes gravitationnelles 8.3 Génération d’ondes gravitationnelles . . 8.4 Détection des ondes gravitationnelles . 8.5 Bibliographie . . . . . . . . . . . . . . .
vi
. . . . .
. . . . .
. . . . . .
. . . . .
. . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
Table des matières
9
Cosmologie 9.1 Description qualitative de l’Univers . . . . . . . . 9.2 Décalage vers le rouge gravitationnel . . . . . . . . 9.3 Distances dans l’Univers et problème de l’horizon 9.4 Évolution temporelle du facteur d’échelle . . . . . 9.5 Une brève histoire du Big Bang . . . . . . . . . . . 9.6 Bibliographie . . . . . . . . . . . . . . . . . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
10 Conclusion 11 Annexes 11.1 Notation exponentielle . . . . . . . . . 11.2 Ondes électromagnétiques et photons 11.3 L’énergie-impulsion relativiste . . . . 11.4 Invariance et covariance . . . . . . . . 11.5 Géodésiques et déviation géodésique . 11.6 Espaces courbes en cosmologie . . . .
155 156 160 170 175 181 191 193
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
195 195 197 199 201 202 207
References
211
Index
215
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
vii
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Préface Au sein de la physique, les deux théories de la relativité (relativité restreinte et relativité générale) jouissent d’une aura particulière, liée à leur création quasiment ex nihilo par le scientifique le plus célèbre du XXe siècle : Albert Einstein. Malgré cette aura, et l’attirance qu’elle entraîne chez les jeunes, les programmes actuels de l’enseignement secondaire ne prévoient que très peu de place pour introduire les idées fondamentales de ces théories. C’est pourquoi j’applaudis à la belle initiative de Michel Le Bellac d’écrire un livre d’initiation aux deux théories de la relativité qui soit accessible aux lycéens, et plus généralement à toute personne curieuse des fondements de la science d’aujourd’hui. En le lisant, j’ai eu plaisir à imaginer la joie intellectuelle de tous ses lecteurs à découvrir, sous la houlette bienveillante de Michel Le Bellac, la profondeur des concepts de base de la relativité, et à en appréhender les structures essentielles, sans se perdre dans trop de détails mathématiques. En outre, l’exposé des théories est fait d’une façon très vivante, et en prise avec l’univers conceptuel et technologique dans lequel nous baignons tous aujourd’hui. Plus important encore, l’auteur a réussi, en un nombre restreint de pages, à couvrir une très large gamme de sujets liés aux théories de la relativité, allant de résultats récents de physique des particules obtenus au CERN (Genève) à certains des derniers résultats en cosmologie relativiste (inflation, masse noire, énergie noire. . .), en passant par l’importance des effets relativistes dans le système GPS, une introduction à la physique des trous noirs (et notamment au phénomène quantique du rayonnement de Hawking) et une initiation aux ondes gravitationnelles et à leurs projets actuels de détection. J’espère que ces remarques liminaires, indicatives de la nouveauté et de la richesse de ce livre, donneront envie à beaucoup de lecteurs de découvrir la beauté intellectuelle et l’importance majeure dans la physique et l’astrophysique actuelles, des théories de la relativité. Thibault Damour Professeur à l’Institut des Hautes Études Scientifiques, Membre de l’Académie des Sciences.
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
Avant-propos En 1905, avec la relativité restreinte, Einstein bouleverse nos conceptions de l’espace et du temps. En particulier, il montre qu’il n’existe pas de temps universel et que deux événements simultanés pour un observateur ne le sont pas en général pour un autre. Une des conséquences est le célèbre paradoxe des jumeaux : si l’un des deux jumeaux effectue à très grande vitesse un voyage aller-retour dans notre galaxie, il sera plus jeune à son retour que son frère ou sa sœur resté(e) sur Terre. Cet effet est vérifié quotidiennement par le système GPS : une horloge voyageant dans un satellite est décalée par rapport à une horloge terrestre après avoir effectué une révolution complète autour de la Terre. Dix années après la relativité restreinte, Einstein présente une théorie de la gravitation, la relativité générale. La nouveauté introduite par cette théorie est la courbure de l’espace-temps. La gravitation n’est plus une force, mais une propriété géométrique : les trajectoires dans l’espace-temps des particules massives et des photons sont déterminées par des courbes particulières fixées par sa géométrie, les géodésiques. Il n’existe plus d’espace absolu où l’on pourrait disposer étoiles et galaxies, et l’espace-temps est déformé au voisinage d’objets astrophysiques compacts comme les naines blanches ou les étoiles à neutrons. Cette déformation est très faible dans notre environnement quotidien, mais malgré tout suffisamment forte pour que le système GPS doive en tenir compte : au décalage des horloges dû à la vitesse des satellites s’ajoute un décalage dû à la gravitation. La déformation de l’espace-temps est importante dans le voisinage des étoiles compactes et, en un sens qui sera précisé au chapitre 7, elle est même infinie dans celui des trous noirs. Dans un environnement de gravité très forte, le temps n’a plus rien à voir avec notre temps usuel et il peut arriver que la lumière fasse du surplace ou se retrouve piégée. Ce livre a deux objectifs : 1. exposer les concepts fondamentaux introduits par Einstein ; 2. confronter ces concepts aux expériences les plus récentes en physique des particules élémentaires et surtout en astrophysique.
Le lecteur sera invité à découvrir la façon dont la relativité générale décrit les objets étranges et fascinants que sont les étoiles à neutrons, les trous noirs ou les ondes gravitationnelles, et il verra pourquoi cette théorie est à la base de la cosmologie moderne, l’histoire de l’Univers. Il est important de bien comprendre la différence entre les deux relativités. La relativité restreinte fixe le cadre conceptuel général de la physique classique, c’est-à-dire non quantique, lorsque l’on peut négliger les forces de gravitation. Elle est par exemple indispensable pour la conception des accélérateurs de particules comme le LHC (Large Hadron Collider), l’accélérateur le plus puissant du monde situé à Genève, qui accélère des protons à une vitesse très proche de celle de la lumière et a permis en juillet 2012 la découverte du boson BEH (le terme correct pour boson de Higgs). Des accélérateurs moins puissants, comme les synchrotrons SOLEIL à Saclay ou l’ESRF (European Synchrotron Radiation Facility) à Grenoble, utilisent un effet relativiste, le rayonnement synchrotron, afin d’analyser par exemple la structure de cristaux ou de molécules biologiques, ou même celle de tableaux de maîtres. De nombreux processus astrophysiques font aussi intervenir des particules dont la vitesse est proche de celle de la lumière, et la théorie de ces processus ne peut être développée sans prendre en compte la relativité restreinte. Afin d’éviter toute confusion, je précise que la relativité restreinte ne rend pas caduque la mécanique newtonienne, mais qu’en fait elle l’englobe : elle se réduit à celle-ci lorsque les vitesses typiques dans un processus physique sont faibles par rapport à la vitesse de la lumière, ce qui est le cas de la plupart des phénomènes usuels où l’approximation de la physique classique newtonienne est suffisante. En d’autres termes, on obtient l’approximation newtonienne en faisant tendre la vitesse de la lumière vers l’infini, car cette limite n’est pas singulière. Par contraste, la limite newtonienne de la mécanique quantique ne s’obtient pas nécessairement en faisant tendre la constante de Planck vers zéro, car dans ce cas la limite est singulière. La relativité restreinte se combine à la physique quantique pour donner la théorie relativiste des champs quantiques, dont un exemple est l’électrodynamique quantique, la théorie de l’interaction entre électrons et photons. Cette théorie reproduit l’expérience avec un accord allant jusqu’à douze chiffres significatifs, ce qui est de très loin le meilleur résultat obtenu par une théorie physique. Une autre théorie relativiste des champs quantiques est celle du modèle standard des particules élémentaires, qui est en accord avec l’expérience avec une précision de l’ordre de 0,1 %. On ne saurait trop souligner le rôle de la relativité restreinte comme cadre conceptuel fondamental d’une grande partie de la physique. Cependant, lorsque l’on veut prendre en compte la gravitation en allant au-delà de l’approximation newtonienne, il faut élargir ce cadre conceptuel et passer à celui de la relativité générale.
xii
Avant-propos
La relativité générale est, nous l’avons mentionné, de dix ans postérieure à la relativité restreinte : son article fondateur date de 1915. La relativité générale est le résultat de dix années d’un travail intellectuel acharné, pendant lequel Einstein se retrouva le plus souvent seul en dépit du soutien d’amis fidèles comme Michele Besso ou Marcel Grossmann. La relativité générale se substitue à la théorie newtonienne de la gravitation lorsque le champ gravitationnel devient fort, par exemple lorsque l’on se trouve au voisinage d’une étoile compacte. En fait, si l’on place autour de cette étoile une particule massive sur une orbite circulaire, sa vitesse croît quand le rayon de l’orbite décroît, et on peut atteindre une situation où la vitesse sur l’orbite n’est plus petite par rapport à celle de la lumière. Il peut arriver que l’on doive prendre en compte des vitesses proches de celle de la lumière en l’absence de gravitation, par exemple si l’on pratique la physique des particules élémentaires, mais en revanche l’inverse n’est pas possible : gravitation forte implique vitesses élevées. La relativité générale inclut simultanément vitesses proches de celle de la lumière et champ de gravitation intense. Naturellement, la relativité générale a pour limite la théorie newtonienne de la gravitation en champ faible. L’article d’Einstein sur la relativité générale fut publié en plein conflit mondial, mais malgré tout quelques scientifiques importants comme Schwarzschild, Eddington ou Lorentz en prirent connaissance. Une fois la guerre de 1914–1918 terminée, les activités scientifiques retrouvèrent le niveau d’avant la guerre, et Einstein fut transformé en icône médiatique lorsque la mesure de la déviation des rayons lumineux par le Soleil se trouva en accord avec la prédiction théorique. Puis la relativité générale connut une longue traversée du désert de près de 40 ans, même si un certain nombre de résultats théoriques importants, comme la métrique de Friedmann-Lemaître décrivant l’expansion de l’Univers (chapitre 9) ou la théorie des étoiles à neutrons de Tolman-OppenheimerVolkoff, furent obtenus dans cette période. En effet, la technologie de l’époque ne permettait pas la confrontation de la théorie avec l’observation en dehors de deux cas particuliers, alors que dans le cas de la théorie quantique développée à partir de 1925, les résultats expérimentaux étaient légion, d’où la préférence affichée par les physiciens en faveur de recherches en physique quantique. C’est seulement vers 1960, sous l’impulsion de physiciens comme John Wheeler, que la relativité générale retrouva un rôle majeur en physique et en astrophysique, compte tenu de progrès importants dans la théorie et de progrès spectaculaires dans l’observation de l’Univers. Dans ce livre, j’accorderai une place importante à la confrontation entre théorie et expérience. J’ai supposé que le lecteur possédait un bagage mathématique minimum, qu’il connaissait par exemple la notion de vecteur, de coordonnées d’un point, de puissance fractionnaire et les fonctions trigonométriques élémentaires. Dans
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
xiii
le texte principal, j’ai préféré utiliser quelques équations algébriques simples, plutôt que des périphrases : « E = mc2 » au lieu de « l’énergie est égale à la masse fois le carré de la vitesse de la lumière ». Les encadrés contiennent parfois des équations algébriques un peu plus longues que celles du texte principal. J’y ferai ponctuellement appel, mais il est tout à fait possible de les omettre en première lecture. Les annexes sont un peu plus exigeantes en connaissances mathématiques, mais un niveau L1 devrait suffire pour les aborder. Elles pourront éviter au lecteur, qui souhaite vérifier par lui-même un résultat du texte, de se plonger dans un manuel de relativité générale, sauf bien sûr s’il désire approfondir encore le sujet. Il existe d’excellents manuels récents, dont certains sont cités dans la bibliographie du chapitre 5. Remerciements. Je remercie Hubert Doubre (trop tôt disparu), Thierry Grandou, Franck Laloë, Jean-Pierre Lasota, Michèle Leduc, Jean-Marc LévyLeblond, Fabrice Mortessagne, Alain Omont et Jean-Pierre Romagnan pour leur lecture critique du manuscrit et pour leurs suggestions. Je remercie tout particulièrement Thibault Damour et Éric Gourgoulhon pour leur lecture extrêmement minutieuse de l’ensemble du texte et pour leurs très nombreuses suggestions. Enfin, je suis très reconnaissant à Thibault Damour qui a bien voulu préfacer ce livre.
xiv
Avant-propos
1 L’espace-temps Le principe de relativité et la relativité restreinte sont le plus souvent introduits à partir de la notion de référentiel d’inertie. Dans ce livre, j’ai choisi au départ un point de vue géométrique, s’appuyant directement sur le concept d’espace-temps, qui me semble plus général et plus aisément transposable à la relativité générale. Cela dit, la notion de référentiel d’inertie reste bien évidemment très fondamentale, et je la développerai en détail au chapitre suivant. Après un bref rappel dans la section 1.1 du concept sur lequel repose notre perception de l’espace ordinaire, le concept d’espace euclidien, j’introduis dans les deux sections suivantes la mesure du temps et les lignes d’univers dans l’espace-temps, illustrées par un exemple élémentaire. Cela me permet d’énoncer le postulat fondamental de la relativité, à savoir l’existence d’une vitesse limite, qui coïncide avec la vitesse de la lumière dans le vide et donc avec celle des « particules de lumière », les photons. La validité de ce postulat est examinée dans la section 1.4. Un observateur transportant une horloge le long d’une ligne d’univers mesure son temps propre, qui n’est pas en général celui d’un autre observateur (section 1.5). Dans la section 1.6, je montre comment l’échange de photons permet de définir la notion de simultanéité de deux événements, et j’introduis la métrique de Minkowski qui définit une « distance » sur l’espace-temps. 1.1
Espace
Imaginons un voyageur venu d’une galaxie lointaine qui traverse le système solaire à très grande vitesse, par exemple le dixième de la vitesse de la lumière. Ce voyageur transporte avec lui une horloge, et il dispose aussi d’un radar qui
lui permet d’explorer l’espace autour de sa trajectoire. Comment ce voyageur percevra-t-il l’espace qui l’entoure, et cette perception sera-t-elle conforme à celle que nous enseigne notre expérience quotidienne ? Avant de répondre à cette question, il est utile de revenir sur quelques notions élémentaires. Nous avons une excellente intuition de l’espace dans lequel nous vivons et nous ne doutons pas qu’il s’agit d’un espace à trois dimensions : il faut trois nombres, ou coordonnées, pour repérer, ou étiqueter, un point dans l’espace. À l’occasion, nous ferons aussi appel aux espaces à deux dimensions, comme la surface d’une sphère, ou même aux espaces à une dimension, une simple ligne. Dans le cas de la sphère, il suffit de deux coordonnées pour repérer un point, par exemple sa latitude et sa longitude s’il s’agit de la surface de la Terre, et une seule coordonnée est suffisante pour repérer un point sur une ligne, par exemple sa distance à un point fixé sur celle-ci. Si nous voulons repérer le sommet d’une montagne, il nous faut son altitude en plus de sa latitude et sa longitude, soit à nouveau trois coordonnées, étant donné que nous avons quitté la surface de la sphère pour revenir à l’espace à trois dimensions. Pour les mathématiciens, notre espace est d’abord un espace de points, repérés par trois coordonnées. Mais les mathématiciens aiment les définitions précises, et ils attribuent à notre espace deux qualificatifs, qui peuvent sembler abstraits, mais sont en fait très intuitifs : notre espace est d’abord un espace affine, et c’est ensuite un espace euclidien. Espace affine veut dire que les points de l’espace peuvent être reliés par des vecteurs obéissant à la loi d’addition usuelle (figure 1.1)
−→ −→ − → AB = AC + CB .
(1.1)
−→ Un vecteur est un segment de droite orienté, comme AB dans la figure 1.1. Un exemple de vecteur est la vitesse : pour définir la vitesse d’une fusée par
−→ AB
B −→ CB
A −→ AC
C −→
−→
−→
F IGURE 1.1. Espace affine et loi d’addition des vecteurs : AB = AC + CB. Un marcheur peut aller en ligne droite directement de A à B, mais il peut aussi marcher d’abord en ligne droite de A à C, puis de C à B, avec le même point d’arrivée.
2
Chapitre 1. L’espace-temps
rapport à la Terre, il faut non seulement donner sa valeur absolue, en km/s par exemple, mais aussi son orientation dans l’espace. Ensuite notre espace est euclidien, ce qui veut dire que l’on peut définir une distance à partir du théorème de Pythagore, ainsi que nous le verrons dans un instant. Des espaces qui ne sont ni affines, ni euclidiens, interviennent en relativité générale, et ils seront introduits au chapitre 5. Afin d’en donner dès à présent un exemple, mentionnons que la surface d’une sphère est un espace qui n’est ni affine, ni euclidien : si l’on essaie de joindre deux points sur la surface par un vecteur, alors ce vecteur « sort » de cette surface, et si l’on trace un triangle sur la surface en joignant un sommet à l’autre par une ligne correspondant au plus court chemin sur la sphère, alors la somme des trois angles est supérieure à 180o , ou π si l’on mesure les angles en en radians. Pour repérer un point dans notre espace euclidien, il est commode, mais non indispensable, de se donner un système d’axes orthogonaux, ou système de coordonnées orthogonales : imaginons que nous voulions repérer la position dans une pièce d’une ampoule électrique M suspendue au plafond. Nous allons choisir par exemple un axe horizontal Ox dessiné sur le plancher le long d’un mur, un axe horizontal Oy le long d’un mur perpendiculaire et un axe vertical Oz placé à la jonction des deux murs (figure 1.2). La position de
z ez −−→ OM
M ey
y
O ex x
F IGURE 1.2. Repérage d’une ampoule localisée au point M dans l’espace euclidien à trois dimensions à l’aide d’un système d’axes orthogonaux Oxyz ; O est l’origine des coordonnées, e x , ey et ez trois vecteurs de base orthogonaux et de longueur unité. La position de M est étiquetée par les trois nombres, ou −→
coordonnées, x, y et z, qui peuvent être positifs ou négatifs. On a aussi représenté le vecteur OM = x e x + y ey + z ez .
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
3
l’ampoule est donnée par ses deux coordonnées horizontales x et y et par sa coordonnée verticale z. Naturellement, il existe une infinité de systèmes d’axes orthogonaux équivalents : on peut déplacer l’origine des coordonnées O, faire tourner les axes, etc. La distance entre O et M n’est autre que la longueur du segment OM, mesurée par exemple en mètres, c’est la distance euclidienne, et c’est −−→ −−→ aussi la longueur OM du vecteur OM, le segment de droite orienté joignant le point O au point M, longueur souvent appelée la norme du vecteur. Enfin, cette longueur se calcule en fonction des coordonnées grâce au théorème de Pythagore : −−→ OM2 = x2 + y2 + z2 . La correspondance entre notre espace usuel et l’espace euclidien des mathématiciens est sous-tendue par l’idée que nous vivons dans un espace absolu, qui existe indépendamment de la matière qui s’y trouve et s’étend à l’infini. Si l’on enlève cette matière, on obtient un cadre vide et infini, une sorte de scène désertée après le départ des acteurs. Ainsi que nous le verrons à partir du chapitre 5, ces idées intuitives doivent être corrigées, car l’espace et le temps sont déformés au voisinage d’objets comme les étoiles compactes ou les trous noirs, et il faut prendre quelques précautions pour décrire ce qui se passe à des milliards d’années lumière de la Terre en raison de l’expansion de l’Univers. L’idée newtonienne d’un espace statique et immuable jusqu’à l’infini est une vue de l’esprit. Toutefois, cette idéalisation euclidienne est une excellente approximation dans la plupart des situations courantes, et nous nous y tiendrons pour l’instant. Une façon de se repérer dans cet espace est de le quadriller par un système de règles rigides disposées suivant les axes de coordonnées : ce quadrillage permet de spécifier la position d’un objet.
1.2
Temps
Lorsqu’un événement se produit, par exemple l’ampoule de la figure 1.2 éclate en raison d’une surtension, il ne suffit pas de connaître le lieu où l’événement s’est produit, la position de l’ampoule dans la pièce, nous voulons aussi savoir à quel moment il est arrivé. En d’autres termes, nous ne nous contentons pas de poser la question « où ? », nous posons aussi la question « quand ? » La datation de l’événement est donnée par sa coordonnée de temps, ou date, t. En idéalisant quelque peu, car les mesures de position et de temps sont toujours entachées d’une certaine erreur, nous allons appeler événement un point défini dans l’espace par ses coordonnées x, y, z et dans le temps par sa coordonnée t, soit un point dans l’espace-temps de coordonnées t, x, y, z. Un point de l’espace-temps repérant un événement est donc un ensemble de quatre nombres
4
Chapitre 1. L’espace-temps
t, x, y, z, et par la suite, nous identifierons point de l’espace-temps et événement : point de l’espace-temps et événement sont des synonymes. L’espace-temps de la relativité restreinte, que nous allons examiner en détail dans les chapitres 1 à 4, est un espace affine à quatre dimensions : il est formé de points qui peuvent être reliés par des vecteurs, obéissant à la loi d’addition usuelle (figure 1.1), comme dans la figure 1.1. Observons dès à présent que c’est cet énoncé qui fait la différence entre la relativité restreinte et la relativité générale (chapitres 5 à 9), où les points d’espace-temps ne peuvent pas être reliés par des vecteurs : l’espace-temps de la relativité générale n’est pas un espace affine, c’est ce que les mathématiciens appellent une variété, et les vecteurs ne sont définis que dans l’espace tangent en chaque point de la variété, espace qui varie avec le point choisi. Nous y reviendrons au chapitre 5, et nous nous concentrons pour l’instant sur l’espace-temps de la relativité restreinte. Nous introduirons bientôt une différence essentielle entre l’espace euclidien et l’espace-temps : ce dernier n’est pas euclidien. Un ensemble de règles rigides permet de mesurer la position d’un événement dans l’espace, mais comment mesure-t-on le temps ? Le fonctionnement d’une horloge repose toujours sur un phénomène périodique, par exemple l’oscillation périodique du balancier de l’horloge de nos grands-mères. Aujourd’hui, les montres à quartz sont fondées sur les vibrations périodiques d’un cristal, et les horloges les plus précises, celles dont nous allons faire un usage intensif par la suite, sont les horloges atomiques, où la vibration périodique est celle d’un rayonnement électromagnétique défini par deux niveaux d’énergie spécifiques d’un atome ou bien d’un ion – un atome ayant perdu un ou plusieurs électrons. De fait, la seconde est définie aujourd’hui par la vibration d’un rayonnement électromagnétique particulier de l’atome de césium : par définition de la seconde, cette vibration effectue 9 192 631 770 cycles dans une seconde, environ dix milliards, ou 1010 cycles par seconde ; le lecteur qui n’est pas familier avec la notation exponentielle pour les très grands ou très petits nombres peut se reporter à l’annexe 11.1. Autrement dit, la fréquence de la vibration est de 9 192 631 770 Hz. Le hertz (Hz) est l’unité de fréquence, familière en radio : par exemple à Nice, France Culture émet sur une fréquence de 101,9 MHz (mégahertz), soit environ 108 Hz. La précision des horloges à césium est d’environ 10−13 , ce qui correspond à une dérive d’une seconde tous les 300 000 ans. C’est une variante de ces horloges, l’horloge à rubidium, qui est embarquée dans les satellites du GPS. En refroidissant les atomes, on arrive à une précision de 10−15 , soit une dérive d’une seconde tous les 30 millions d’années. Il existe des horloges encore plus précises que nous introduirons au chapitre 3 lorsque nous aborderons les vérifications de la relativité.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
5
Une question importante est celle de la fiabilité des horloges lorsqu’elles sont soumises à des influences brutales. Que se passe-t-il par exemple quand on les met dans une fusée qui accélère ? Il est évident que le fonctionnement d’une horloge à balancier serait profondément perturbé si elle était embarquée dans une fusée ou une station spatiale : en impesanteur, le balancier n’oscillerait plus ! Pour estimer la fiabilité d’une horloge atomique, il faut comparer l’accélération des électrons sur leur orbite dans un atome, à l’origine de la structure des niveaux d’énergie, avec celle d’une fusée : on trouve que l’accélération des électrons sur leur orbite l’emporte par un facteur de l’ordre de 1022 , même si l’accélération de la fusée vaut 10 fois celle de la pesanteur. Les horloges atomiques sont donc insensibles aux accélérations usuelles et fonctionneront sans problème même si leur parcours est un peu chahuté. Nous insistons sur l’idée que c’est le mécanisme des horloges qui n’est pas affecté par les accélérations, car nous verrons bientôt l’influence de la vitesse ou de la gravité sur les indications des horloges telles qu’elles peuvent être lues par différents observateurs.
1.3
Lignes d’univers
Le cadre naturel de la description relativiste, l’objet de ce chapitre et des suivants, est l’espace-temps qui combine les coordonnées d’espace et de temps des événements. Rappelons que nous identifions événement et point de l’espace-temps. Considérons une particule ponctuelle se déplaçant dans l’espace-temps. Elle décrit alors une ligne d’univers. Ce concept peut sembler abstrait, mais il est en fait absolument élémentaire et peut être illustré par un exercice d’école primaire. Le type de graphique que nous introduisons dans la figure 1.3 était familier aux agents de la SNCF, avant que les ordinateurs ne relèguent ces graphiques tracés à la main au rayon des souvenirs. Prenons l’exemple d’un TGV Paris-Bordeaux quittant Paris à 12 h 00 avec une vitesse de 300 km/h et un TER Bordeaux-Paris quittant Bordeaux à 12 h 30 avec une vitesse de 200 km/h. La distance Paris-Bordeaux étant de 400 km, et admettant que les deux trains roulent toujours à vitesse constante, à quelle heure vont-ils se croiser ? Sur la figure 1.3, on a représenté la distance parcourue en fonction du temps, et dans les deux cas on obtient un segment de droite en raison de la vitesse constante. Cependant, contrairement à l’usage courant, et afin de suivre l’usage habituel en relativité, nous avons porté le temps t suivant l’axe vertical (ordonnées) et la distance x suivant l’axe horizontal (abscisses). Les segments de droite PM et BN sont les lignes d’univers respectives du TGV Paris-Bordeaux et du TER Bordeaux-Paris. L’événement E « croisement des deux trains » a pour
6
Chapitre 1. L’espace-temps
t
N
14h00 M
13h00
E B
12h00 P Paris
x 300 km
Bordeaux
F IGURE 1.3. Diagramme d’espace-temps : lignes d’univers du TGV Paris-Bordeaux (rouge) et du TER Bordeaux-Paris (bleu). Les deux trains se croisent à 13 h 00, à 300 km de Paris. L’événement E « croisement des deux trains » a pour coordonnée de temps t = 13 h 00 et pour coordonnée d’espace x = 300 km. Comme le TGV va plus vite que le TER, la pente de sa ligne d’univers est plus faible en valeur absolue que celle du TER. Une ligne d’univers plus réaliste, tenant compte de l’accélération au départ de Paris et du freinage à l’arrivée à Bordeaux, est tracée en noir pour le TGV.
coordonnée de temps t = 13 h 00 et pour coordonnée d’espace x = 300 km, sa distance de Paris. En fait, la vitesse des trains n’est pas constante et les lignes d’univers sont des courbes, et non des droites : figure 1.3. Le diagramme tracé sur cette figure porte un nom savant, c’est un diagramme d’espace-temps, mais le concept est élémentaire. La figure 1.3 illustre un point très important : étant donné que nous avons porté le temps en ordonnées, la pente des lignes d’univers rectilignes du TER et du TGV est l’inverse de leur vitesse en km/h. Plus la pente des lignes d’univers est grande en valeur absolue, et plus la vitesse est faible. Comme le TGV va plus vite que le TER, la pente de sa ligne d’univers en rouge est plus faible que celle du TER en bleu. La ligne d’univers d’un train stationné en gare à Paris est l’axe des temps, qui possède la plus grande pente possible, en fait une pente infinie. En règle générale, les lignes d’univers des objets massifs, dont les « observateurs » sont un cas particulier, ne seront pas des droites, mais des courbes (figure 1.3). Toutefois ces lignes d’univers sont soumises à une restriction cruciale, qui est contenue dans l’énoncé du postulat fondamental de la relativité.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
7
Postulat fondamental.
Il existe une vitesse limite qu’aucune particule massive (de masse différente de zéro) ne peut dépasser (figure 1.4). Cette vitesse limite est celle des signaux électromagnétiques se propageant dans le vide indépendamment de la façon dont ils ont été émis, et c’est en particulier la vitesse de la lumière dans le vide. C’est donc la vitesse des photons, ou « particules de lumière » et c’est aussi celle de toutes les particules de masse nulle. Enfin, les lignes d’univers des photons sont des droites, les droites de lumière, qui ont toutes la même inclinaison par rapport à la verticale : aucune direction d’espace n’est privilégiée, nous avons une situation spatialement isotrope. La vitesse de la lumière dans le vide, notée c, est par définition ( veut dire « approximativement égal à » et ∼ « de l’ordre de ») c = 299 792, 458 km/s 300 000 km/s = 3 × 108 m/s .
C
F IGURE 1.4. Un panneau de limitation de vitesse superflu.
Ce postulat mérite quelques commentaires. Tout d’abord, il n’existe pas de lien logique entre la première et la seconde phrase de son énoncé. La première phrase exprime une propriété géométrique1 de l’espace-temps, la seconde est une conséquence du fait que les photons ont une masse nulle, ainsi que nous le verrons au chapitre 4. Si la masse des photons n’était pas nulle, ils se propageraient, tout comme les signaux électromagnétiques correspondants, à une vitesse inférieure à la vitesse limite, et de plus cette vitesse dépendrait de leur énergie ou, de façon équivalente, de leur fréquence en raison de la loi de Planck (11.2). Comme il n’existe aucune indication en faveur d’une masse non nulle pour le photon, nous nous conformerons à l’usage et identifierons la vitesse limite et la vitesse de la lumière c. Ensuite, étant donné que nous avons précédemment défini la seconde à l’aide de l’horloge à césium, la définition de la vitesse de la lumière fixe l’unité 1 L’existence d’une vitesse limite peut se déduire d’un argument de théorie des groupes : en supposant que les transformations qui relient les référentiels d’inertie (chapitre 2) forment un groupe au sens mathématique du terme, que l’espace est isotrope et qu’il existe une notion de causalité, on montre que les seules transformations possibles sont celles de Galilée (2.8), sans vitesse limite, et celles de Lorentz (2.7), avec une vitesse limite finie. Voir par exemple Lévy-Leblond [1976] ou Lévy-Leblond et Provost [1979].
8
Chapitre 1. L’espace-temps
de longueur : c’est la distance parcourue par la lumière en une seconde, environ 300 000 km. À notre échelle, celle du mètre, l’unité de temps commode est la nanoseconde, ou milliardième de seconde (1 ns = 10−9 s) : voir par exemple la discussion du GPS dans la section 5.1. En une nanoseconde, la lumière parcourt 30 cm, ce qui est un point de repère très utile. En plaisantant, certains physiciens anglo-saxons en déduisent la supériorité de leur système d’unités de mesure, qui donne un résultat particulièrement simple : en une nanoseconde, la lumière parcourt presque exactement « one foot » ! Renoncer aux mesures de longueur à l’aide d’un mètre au profit d’une mesure de temps est aujourd’hui chose courante. Le peintre en bâtiment au coin de la rue possède un télémètre laser qui lui permet de prendre les dimensions d’une pièce à rénover en se passant de son mètre à ruban. La police détermine la vitesse d’une voiture à l’aide de jumelles laser, qui sont des télémètres laser mesurant le temps d’aller-retour entre le policier et la voiture à des instants successifs, ce qui permet d’en déduire sa vitesse. La distance Terre-Lune est déterminée à un millimètre près en réfléchissant un rayon laser sur un miroir posé sur la Lune et en mesurant le temps d’aller-retour de l’impulsion laser. Les mesures de temps sont aujourd’hui les mesures les plus précises en physique, bien plus précises que les mesures directes de longueur, ce qui donne une raison supplémentaire pour abandonner le mètre comme unité de longueur, en fixant une fois pour toutes la valeur de c.
1.4
Plus vite que la lumière ?
Avant de poursuivre l’exposé des bases de la relativité restreinte, examinons les arguments en faveur d’une vitesse limite. Les meilleures vérifications du postulat fondamental proviennent de la physique des particules élémentaires. La construction des accélérateurs de particules et l’analyse des expériences dans ce domaine reposent de façon cruciale sur la validité de la relativité restreinte. Dans l’accélérateur LEP (Large Electron Positron) qui a fonctionné au CERN (Genève) de 1990 à 2000, des électrons et des positrons (antiparticules de l’électron) ont tourné dans un anneau (figure 1.5) à une vitesse de 0, 999 999 999 983 c ; leur vitesse différait de celle de la lumière par moins d’un dixième de milliardième ! Le fonctionnement du LEP dépendait crucialement des lois de la relativité, à un point tel que les déviations observées par rapport au fonctionnement théorique pemettaient de détecter le passage des TGV Paris-Genève ! Le tunnel du LEP est maintenant utilisé par le LHC (Large Hadron Collider) qui a permis la découverte en juillet 2012 du fameux boson BEH (le terme correct pour boson de Higgs). L’énergie des protons du LHC est encore supérieure à celle des
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
9
F IGURE 1.5. Vue aérienne du site du CERN. Le cercle rouge marque le tracé du tunnel de 27 km de circonférence où ont été construits, à quelques dizaines de mètres sous terre, le LEP, puis le LHC. Reproduit avec l’autorisation du CERN.
électrons du LEP, 4 000 GeV (gigaélectronvolts) contre 100 GeV, mais comme les protons sont plus lourds, il vont moins vite, à « seulement » 0, 999 999 97 c ; en 2015, l’énergie des protons du LHC sera portée à 7 000 GeV. En 2011 une expérience menée au CERN, l’expérience OPERA, a cru trouver des neutrinos (des particules de masse très faible, probablement inférieure à 1 eV/c2 ) voyageant plus vite que la lumière, mais il s’agissait d’une erreur expérimentale. Le résultat d’OPERA avait beaucoup surpris les astrophysiciens, en raison de l’observation en 1987 d’une explosion de supernova dans le nuage de Magellan, à 170 000 années lumière de la Terre. Dans une explosion de supernova, l’émission d’une bouffée de neutrinos précède l’effondrement lui-même, lequel correspond à une augmentation considérable de la luminosité de l’étoile. Les neutrinos ont été observés environ 3 heures avant le pic de luminosité, ce qui a permis de fixer une limite à leur vitesse, une limite contredisant le résultat d’OPERA : si ce résultat avait été correct, les neutrinos seraient arrivés plusieurs années, et non quelques heures, avant les photons. Une autre question toujours en débat est celle de la compatibilité de la relativité et de la physique quantique. L’avis d’un certain nombre de physiciens
10
Chapitre 1. L’espace-temps
(avis que je partage mais d’autres physiciens sont d’un avis contraire) est qu’en physique quantique, un événement ne peut pas dépendre uniquement de l’information contenue dans son cône passé (une notion définie dans la section 5). Cela peut se montrer grâce à des expériences réalisées avec des photons dits intriqués. Comme l’écrit Nicolas Gisin, un des fondateurs de la cryptographie et de l’information quantique : « les résultats de ces expériences ne peuvent pas être expliqués par une histoire qui se déroule dans l’espace (localement) et dans le temps (continûment) ». Cependant, ces expériences ne permettent pas de transmettre de l’information à une vitesse supérieure à celle de la lumière. Le fait que la vitesse de la lumière soit une vitesse limite intervient maintenant dans la vie courante : sur les marchés financiers, le « trading haute fréquence » dépend d’opérations qui durent moins d’une milliseconde, et en une milliseconde la lumière parcourt 300 km. Il devient très important pour les traders de communiquer sur des distances les plus courtes possibles afin de passer leurs ordres quelques microsecondes avant leurs concurrents. Cette observation n’implique évidemment en rien une quelconque approbation de l’auteur pour ce type d’activités. Jusqu’à présent, personne n’a trouvé de phénomène qui permette de transmettre de l’énergie ou de l’information à une vitesse supérieure à la vitesse limite. Toute tentative de dépasser cette limite dans des accélérateurs de particules, pourtant impressionnants, s’est toujours heurtée à cette barrière. Il est bien sûr prudent d’éviter toute affirmation définitive, mais il semble très peu probable, au moins à l’auteur, que le postulat d’une vitesse limite soit infirmé dans un avenir proche ou même lointain. Cependant, si tel était le cas, cela modifierait profondément la structure de l’espace-temps tel que nous l’avons exploré sur des distances très petites (aujourd’hui jusqu’à 10−18 m) ou très grandes (les dimensions de l’Univers). Toutefois, toute théorie se substituant éventuellement à la relativité restreinte devrait d’abord être capable d’expliquer l’ensemble des phénomènes dont celle-ci rend compte. Certaines théories très spéculatives prédisent une vitesse des photons inférieure à c, sans remettre en cause l’existence d’une vitesse limite. Mentionnons aussi qu’un autre aspect du postulat fondamental, celui de l’isotropie, a été vérifié récemment avec une grande précision : en mesurant la vitesse de la lumière c1 et c2 dans deux directions orthogonales, on a pu montrer que |c1 − c2 |/c ≤ 10−17 . Il est pourtant possible d’obtenir des phénomènes exhibant des vitesses apparentes supérieures à la vitesse de la lumière, ou vitesses supraluminiques, mais ces phénomènes ne peuvent pas transmettre d’énergie ou d’information.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
11
Bob
Alice Lune
R
Terre
F IGURE 1.6. Laser en rotation et tache se déplaçant sur la surface de la Lune.
Par exemple, un laser en rotation rapide éclaire un mur (figure 1.6). Le laser effectue ses rotations à une fréquence ν et, lorsque le faisceau est perpendiculaire au mur, la tache sur le mur se déplace à une vitesse v 2πRν, où R est la distance du mur. Si le mur est remplacé par la Lune, distante de 380 000 km, et si le laser tourne à plus d’un tour par seconde, alors la tache balaie la Lune à une vitesse plus grande que c. Mais il est impossible d’utiliser ce déplacement pour échanger de l’information, en dehors d’une information préétablie, par exemple celle du dispositif suivant : le faisceau peut avoir deux couleurs, vert ou rouge, et il balaie la surface de la Lune depuis Alice vers Bob, distants par exemple de 100 km. Si le faisceau est rouge, Alice lève le bras droit, et s’il est vert, elle lève le bras gauche. Lorsque la tache lumineuse parvient à Bob, ce dernier sait quel bras Alice a levé, et cette information lui est parvenue à une vitesse supérieure à c (figure 1.6). Mais, à l’évidence, la méthode ne permet pas à Alice de transmettre à Bob des informations qui n’auraient pas été codifiées à l’avance : pour échanger un message, il faut communiquer avec l’opérateur du laser sur la Terre. Un autre exemple est emprunté à l’astrophysique : le mouvement apparent d’un jet relativiste vu par un observateur terrestre. Pour un tel observateur, l’image du jet émis par la galaxie M87 se déplace à une vitesse égale à 6 fois la vitesse de la lumière. 1.5
Temps propre
Après cette digression sur les vitesses supraluminiques, reprenons le fil de notre exposé sur l’espace-temps. Ainsi que nous l’avons mentionné, nous adoptons
12
Chapitre 1. L’espace-temps
un point de vue géométrique : les objets que nous introduisons, lignes d’univers, tangentes à ces lignes d’univers, cônes de lumière etc., sont des entités géométriques, qui ne font pas intervenir un choix de coordonnées. Nous reviendrons aux coordonnées à la fin de la section suivante. Choisissons un point (un événement) E de la ligne d’univers parcourue par notre voyageur extragalactique, représentée sur la figure 1.7a, et supposons qu’en ce point le voyageur émette des photons dans toutes les directions d’espace. D’après le postulat fondamental, les lignes d’univers de ces photons sont des demi-droites issues de E qui, en raison de l’isotropie, ont toutes la même inclinaison par rapport à la verticale et sont tangentes en E à un demi-cône, appelé cône de lumière futur de E (figure 1.7). De même, supposons qu’un ensemble de photons arrive en E : leurs lignes d’univers sont aussi tangentes à un demi-cône, le cône de lumière passé de E, et la réunion des demi-cônes forme le cône de lumière de E. Dans la discussion de la figure 1.3, nous avons observé que la ligne d’univers d’un objet (dans ce cas un train) se propageant en ligne droite à vitesse constante était représentée par une ligne droite dans l’espace-temps, dont la pente était l’inverse de la vitesse ; par conséquent, cette pente était d’autant plus faible que la vitesse était grande. Comme la vitesse d’un objet massif est toujours inférieure à celle de la lumière, la pente en chaque point de sa ligne d’univers sera toujours plus grande que celle des lignes d’univers des photons, et par conséquent la ligne d’univers d’un objet massif comme celle de notre voyageur
t E2
E
E
E1
(a)
(b)
F IGURE 1.7. (a) Ligne d’univers d’un voyageur. On a représenté en rouge le cône de lumière futur de E et son cône passé en bleu. L’événement E2 , situé à l’intérieur du cône futur de E, est postérieur à E, et E1 , situé à l’intérieur du cône passé de E, est antérieur à E. (b) Indépendance des cônes de lumière par rapport aux lignes d’univers : le cône de lumière de E ne dépend que de E, et pas des lignes d’univers passant par E. En termes plus intuitifs, la vitesse de la lumière ne dépend pas de la vitesse de la source.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
13
passant par un point E sera toujours située à l’intérieur du cône de lumière issu de E. Dans un système d’unités où la vitesse de la lumière est prise égale à 1 (on dit souvent : « on pose c = 1 »), système que nous utilisons en général pour les graphiques, les droites de lumière et les génératrices des cônes de lumière sont inclinées à 45o par rapport à la verticale. De façon équivalente, avec le choix de coordonnées de la section 1.3, on peut définir une coordonnée de temps x0 par x0 = ct, ou bien porter sur les graphiques ct en ordonnées. Tous les cônes de lumière sont identiques, et à chaque événement E est associé son cône de lumière. Comme les cônes de lumière sont des structures géométriques intrinsèques de l’espace-temps, ils sont indépendants de la ligne d’univers passant par E, et donc du voyageur (figure 1.7b), et ils sont spatialement isotropes : ils ne peuvent pas définir de direction privilégiée dans l’espace à trois dimensions. Il faut bien comprendre qu’en tant que structures géométriques de l’espace-temps, les cônes de lumière sont indépendants de tout observateur2 . De plus, ils permettent de définir une notion de flèche du temps : les événements situés sur la ligne d’univers du voyageur après E, comme l’événement E2 , sont postérieurs à E, tandis que les événements situés avant E, comme E1 , sont antérieurs à E. Dans les deux premières sections de ce chapitre, nous avions introduit les coordonnées d’espace et de temps usuelles, afin de rendre notre discussion plus intuitive en faisant appel à des concepts familiers, mais nous allons devoir faire marche arrière, car la notion de règle rigide introduite dans la section 1.1 pour quadriller l’espace peut se révéler problématique en relativité. En outre, nous avions supposé plus ou moins implicitement que, si deux horloges pouvaient parfaitement indiquer des heures différentes, il était toujours possible de les synchroniser sur une horloge de référence. En d’autres termes, nous avions admis l’existence d’une horloge maîtresse donnant un temps universel, le temps universel newtonien. Ce que nous souhaitons maintenant, c’est introduire la notion d’un observateur capable de mesurer temps et distances, sans faire d’hypothèses implicites comme dans les deux premières sections. Revenons au voyageur parcourant le système solaire suivant la ligne d’univers de la figure 1.7a et, suivant l’usage, appelons-le désormais observateur. Cet observateur transporte une horloge atomique, qui bat régulièrement 2 Pour le lecteur qui tient absolument à se raccrocher à la notion d’observateur mesurant une vitesse par rapport à son référentiel, il faut préciser les points suivants. Dans la figure 1.7, si un observateur mesure la vitesse de la lumière au voisinage du point E, il va trouver comme résultat c, qu’il soit en mouvement uniforme ou accéléré, car le cône de lumière en E ne dépend pas de sa ligne d’univers (figure 1.7b). En revanche, s’il mesure la vitesse d’un photon éloigné, il ne mesurera pas en général c si son référentiel est accéléré, et de même il constatera que les lignes d’univers des photons ne sont plus nécessairement des droites.
14
Chapitre 1. L’espace-temps
le long de sa trajectoire. Si l’observateur parcourt la ligne d’univers d’un point (ou événement) A à un point B, son horloge va lui donner le temps écoulé entre l’événement A et l’événement B : l’intervalle de temps ainsi mesuré est un intervalle de temps propre pour l’observateur. Supposons maintenant que la ligne d’univers d’un second observateur croise celle du premier au point A (figure 1.8). Les deux observateurs peuvent décider de synchroniser leurs horloges lors de cette première rencontre, c’est-à-dire vérifier que leurs indications concordent, par exemple que les deux horloges indiquent midi. Les deux observateurs se croisent à nouveau en un point B. Leurs horloges seront-elles toujours synchronisées ? En général ce ne sera pas le cas, les intervalles de temps propre mesurés par les deux observateurs seront différents. Le temps propre écoulé dépend non seulement du point de départ et du point d’arrivée sur la ligne d’univers, mais aussi en général du chemin choisi pour aller du point de départ au point d’arrivée. En revanche, ce décalage des temps propres est indépendant du type d’horloge utilisé et du mécanisme à la base de leur fonctionnement. Si les observateurs transportent chacun deux horloges différentes, par exemple une horloge à césium et un maser à hydrogène, les
B t
x
y
A
F IGURE 1.8. Croisement de deux lignes d’univers et temps propres de deux observateurs. La ligne d’univers et l’horloge du premier observateur sont dessinées en bleu, celles du second en rouge. Les deux horloges sont synchroniséees en A, elles ne le sont plus en B.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
15
temps propres mesurés seront identiques pour les deux horloges. Au chapitre 3, nous reviendrons en détail sur ce phénomène souvent appelé « paradoxe des jumeaux » : si deux jumeaux partent du même point A avec le même âge, en général ils se croiseront au point B avec un âge différent3 , et nous donnerons dans un cas simple l’expression explicite de la différence de temps propre au point B. Nous avons donc rejeté la notion de temps universel newtonien : chaque observateur dispose d’un temps qui lui est propre, mesuré par une horloge qu’il transporte au cours de ses déplacements, et ce temps est tout aussi valable que le temps mesuré par n’importe quel autre observateur utilisant sa propre horloge. Si l’on connaît explicitement les lignes d’univers des deux observateurs de la figure 1.8, alors la relativité restreinte permet de relier le temps propre d’un des deux observateurs au temps propre de l’autre. Afin d’éviter toute ambiguïté, il est utile de souligner le point suivant : le temps t introduit précédemment, par exemple dans les sections 1.2 ou 1.3 et les figures 1.3 et 1.7, est fondamentalement un temps-coordonnée qui, joint aux coordonnées d’espace, permet d’étiqueter les points de l’espace-temps et n’est pas nécessairement et immédiatement relié à un temps physique mesurable. Un temps physique est celui mesuré par l’horloge d’un observateur se déplaçant avec celle-ci, et c’est donc un temps propre. Cette distinction temps propre/temps-coordonnée est évidemment sans objet en physique newtonienne où le temps est universel, mais elle sera fondamentale en relativité générale. Le rejet d’un temps universel, ou absolu, est probablement la révolution conceptuelle la plus importante apportée par Einstein, et elle n’est généralement pas appréciée à sa juste valeur, y compris par nombre de physiciens. Bien que Poincaré ait eu en main tous les ingrédients de la relativité restreinte, et en particulier les formules donnant la transformation du temps que nous écrirons au chapitre suivant, il semble qu’il n’ait jamais voulu sauter le pas et abandonner la notion de temps universel. Les implications contenues dans le graphique de la figure 1.8 étaient inconcevables pour le philosophe Henri Bergson dans les années 1920. Encore aujourd’hui, il est facile de trouver sur Internet des réfractaires au caractère relatif du temps. Cependant, ces réfractaires utilisent sans problème le GPS de leur voiture pour s’orienter, alors que si l’on ne tenait pas compte des effets illustrés sur la figure 1.8, ils n’arriveraient jamais à destination ! Toutefois, le GPS doit aussi prendre en compte un effet de relativité générale que nous examinerons au chapitre 5. 3 On sait démontrer aujourd’hui que cette différence d’âge est une conséquence directe de l’existence d’une vitesse limite et d’une notion de flèche du temps, ou plus précisément d’une notion de causalité définie ci-après. Cependant, la preuve mathématique de cette propriété est ardue et ne peut pas être reproduite ici : voir par exemple Grandou et Rubin [2009].
16
Chapitre 1. L’espace-temps
1.6
Espace-temps de Minkowski
Notre observateur de la figure 1.7 restait confiné à sa ligne d’univers, mais il serait logique qu’il s’intéresse aussi à son environnement, à ce qui se passe autour de lui. En particulier, la notion de simultanéité pour deux événements situés en des points d’espace différents pose problème en l’absence d’un temps universel, et il aimerait savoir, lorsque son horloge en E marque une date t, quels sont les événements de son environnement qu’il peut considérer comme simultanés avec E. Plus généralement, comment peut-il dater des événements qui n’appartiennent pas à sa ligne d’univers ? Commençons par un exemple simple, où l’observateur est un peintre en bâtiment disposant d’une horloge, et qui mesure la largeur d’une pièce à rénover avec un télémètre laser. Le télémètre envoie au temps t1 de l’horloge une impulsion laser qui suit un trajet horizontal dans l’espace ordinaire, est réfléchie par le mur en un point M et est reçue au temps t2 . Comme le temps aller est identique au temps retour, le peintre va logiquement attribuer à la réflexion par le mur une date t qui est la moyennne arithmétique de t1 et t2 1 ( t1 + t2 ) . (1.2) 2 Plus précisément, il va conclure que l’impulsion laser a été réfléchie par le mur quand son horloge indiquait le temps t de l’équation (1.2). Le diagramme d’espace-temps de l’opération est dessiné sur la figure 1.9a. Revenons à notre observateur initial, qui suit une ligne d’univers quelconque. Dans l’exemple précédent, nous avions pu identifier temps propre et temps-coordonnée t, car notre peintre en bâtiment était immobile dans le référentiel utilisé, mais une telle identification n’est pas possible dans le cas général. Nous allons donc introduire une notation spécifique, en désignant par τ le temps propre de l’observateur tel qu’il est mesuré par son horloge. L’observateur est muni, en plus de son horloge, d’un radar qui envoie et détecte des impulsions électromagnétiques de très courte durée, de telle sorte qu’il peut mesurer avec précision l’intervalle de temps entre émission et réception. Le radar émet une impulsion à un instant τ1 de son temps propre, ou date τ1 , cette impulsion est réfléchie au point d’espace-temps M (M pour miroir) et revient vers l’observateur qui la détecte à la date τ2 . Comme ci-dessus, nous allons décider que l’événement M est simultané avec l’événement E situé sur la ligne d’univers si le temps propre τ de E est la moyenne arithmétique de τ1 et τ2 : τ = (τ1 + τ2 )/2. L’ensemble des événements simultanés à E forme un sous-espace de dimension 3 de l’espace-temps, et donc une hypersurface, l’hypersurface de simultanéité de E. Comme il est difficile de dessiner un espace à quatre dimensions, nous avons représenté cette hypersurface dans un espace-temps à trois dimensions t=
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
17
τ
2
t2
τ
2
S
t=
t1 + t2 2
M
τ
E
τ
t1
M
1
τ
(a)
M
1
(b)
F IGURE 1.9. (a) Diagramme d’espace-temps pour la mesure de la distance à un mur. L’impulsion laser est réfléchie par le mur au point d’espace-temps M auquel l’observateur attribue par définition la date t = (t1 + t2 )/2. (b) Ligne d’univers d’un observateur et surface de simultanéité S (en rose) d’un événement E sur cette ligne, de date τ selon l’horloge de l’observateur, dans un espace-temps à trois dimensions. Les points M et M appartiennent à cette surface si (τ1 + τ2 )/2 = (τ1 + τ2 )/2 = τ .
(figure 1.9b), où cette hypersurface est une surface ordinaire. Le lecteur qui a du mal à se représenter un espace à quatre dimensions ne doit pas s’inquiéter, l’auteur est dans le même cas ! Il suffit de visualiser les figures dans un espace-temps à trois dimensions, une de temps et deux d’espace, comme dans la figure 1.9b, où l’hypersurface de simultanéité est une surface ordinaire. On peut même utiliser un espace-temps à deux dimensions, une de temps et une d’espace, comme dans la figure 1.9a. La façon dont nous avons défini la simultanéité souligne une différence essentielle entre l’espace-temps ordinaire et l’espace-temps relativiste : la surface de simultanéité de E dépend de l’intégralité de la ligne d’univers, et pas uniquement de l’instant τ. Le lecteur l’aura remarqué, nous faisons jouer un rôle privilégié au temps : l’unité de temps, la seconde, est l’unité de référence, alors que l’unité de longueur est une unité dérivée par l’intermédiaire de la vitesse de la lumière. De plus, nous voulons éviter de passer par l’utilisation de règles pour quadriller l’espace, et nous montrons dans le chapitre suivant, section 2.5, que nous
18
Chapitre 1. L’espace-temps
pouvons nous repérer dans l’espace en mesurant uniquement des temps de départ et d’arrivée de photons. Ce sont donc les mesures de temps qui sont fondamentales. L’espace-temps muni de ses cônes de lumière forme l’espace-temps de Minkowski (figure 1.10b). Dans l’espace-temps newtonien, les surfaces de simultanéité sont des (hyper-) plans t = constante (figure 1.10a) et ces surfaces de simultanéité sont universelles, tout comme le temps qui les définit. Elles ne dépendent que de l’événement, et pas de la ligne d’univers de l’observateur. Dans l’espace de Minkowski, les surfaces de simultanéité dépendent de l’observateur, et on peut seulement associer un cône de lumière à chaque événement. Si un événement E2 se trouve en dehors du cône de lumière de E comme dans la figure 1.10b, alors l’ordre des temps de E et E2 dépend de l’observateur. Cependant, si un événement E3 se trouve à l’intérieur du cône futur de E, par exemple, alors E3 sera postérieur à E pour tout observateur. Cela permet de définir une notion de causalité. En physique newtonienne, un événement ne peut influencer que ceux qui lui sont postérieurs et, inversement, il ne peut avoir été influencé que par les événements antérieurs. En relativité, un événement ne peut influencer que ceux situés dans son cône futur et, inversement, il ne peut avoir été influencé que par les événements de son cône passé.
E3
t t = t3
E E2
t = t2 E1 t = t1
(a)
(b)
F IGURE 1.10. Espaces-temps à trois dimensions de Newton (a) et de Minkowski (b). Dans le cas (a), les surfaces de simultanéité sont des plans, t = t1 par exemple. Dans l’espace de Minkowski (b), à chaque point de l’espace-temps est attaché un cône de lumière. On a représenté un tel cône pour les trois points E, E1 et E2 . Le point E3 est situé à l’intérieur du cône futur de E. Un observateur passant par E possède une surface de simultanéité, qui dépend non seulement du point d’espace-temps, mais aussi de sa ligne d’univers.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
19
Revenons maintenant aux coordonnées pour introduire une notion de distance dans l’espace-temps. C’est ce que les mathématiciens appellent introduire une métrique. Mais attention ! Cette « distance » ne sera pas la distance ordinaire, la distance euclidienne. Considérons un point O de coordonnées (t = x = y = z = 0) dans l’espace-temps affine et un point M de coordonnées (t, x, y, z). Comme dans la figure 1.1, nous pouvons joindre O et M par un vec pour teur, et ce vecteur aura quatre composantes : (t, x, y, z). Nous le notons OM, −−→ bien le différencier d’un vecteur OM de l’espace ordinaire. On utilise souvent la terminologie quadrivecteur pour désigner un vecteur de l’espace-temps, et nous aurons parfois recours à cette terminologie en cas d’ambiguïté possible. −−→ Supposons que OM soit la ligne d’univers d’un photon. La distance OM dans l’espace ordinaire est donnée par le théorème de Pythagore
−−→ −−→ OM2 ≡ OM 2 = x2 + y2 + z2 , et comme cette distance est parcourue à la vitesse de la lumière c en un temps t, il en découle −−→ c2 t2 − OM 2 = c2 t2 − x2 − y2 − z2 = 0. (1.3) Cette équation est celle d’un cône de sommet O, et elle décrit mathématiquement le cône de lumière de O défini ci-dessus. C’est une surface de dimension 3 dans un espace-temps de dimension 4, mais il est facile de la visualiser dans un espace-temps de dimension 3, une de temps et deux d’espace, cas où le cône est une surface ordinaire. Le cône futur de O est donné par l’équation (1.3) pour t > 0 et son cône passé pour t < 0. Comme le cône de lumière est la structure de base dans l’espace-temps, il est logique de définir sur cet espace une métrique, dite métrique de Minkowski, qui s’inspire de (1.3) et où la « longueur » au carré de coordonnées (t, x, y, z) est donnée par d’un vecteur OM
−−→ 2 2 = c2 t2 − OM c2 OM = c2 t2 − x 2 − y2 − z2 .
(1.4)
Tout comme la distance euclidienne définit la géométrie euclidienne dans l’espace ordinaire, la métrique de Minkowski définit la chronogéométrie dans l’espace-temps. Elle permet de distinguer trois types de vecteurs (figure 1.11a) : 2 > 0. Cette terminologie est log1. les vecteurs de genre temps, tels que OM ique, car un vecteur de composantes (t, 0, 0, 0), dont seule la composante 2 = c2 t2 > 0 ; de temps est non-nulle, est tel que OM 2 = 0, qui représentent des lignes 2. les vecteurs de genre lumière, tels que OM d’univers possibles pour les photons ;
20
Chapitre 1. L’espace-temps
genre temps cône futur genre lumière
τ
ct B
genre espace O
y
A
x genre temps cône passé
(a)
(b)
F IGURE 1.11. (a) Cônes de lumière et différents types de vecteurs pour une coordonnée de temps et deux coordonnées d’espace. (b) Ligne d’univers et tangente (représentée en rouge) pour deux événements voisins A et B sur la ligne d’univers.
2 < 0. À nouveau cette terminologie 3. les vecteurs de genre espace, tels que OM est logique, car un vecteur de composantes (0, x, y, z), dont la composante 2 = −( x2 + y2 + z2 ) < 0. de temps est nulle, est tel que OM La condition de causalité peut s’exprimer en fonction du type de vecteur d’espace-temps : si deux événements O et M peuvent être joints par un vec de genre temps ou de genre lumière, alors il existe une possible teur OM est de genre relation causale entre ces deux événements. Si le vecteur OM espace, alors aucune relation causale n’est possible entre ces deux événements. En conclusion de ce chapitre, nous allons écrire la métrique de Minkowski sous une forme qui prépare le terrain pour la relativité générale4 . Soit A et B deux événements voisins sur la ligne d’univers d’une particule massive (figure 1.11b). La particule va de A à B en un intervalle de temps Δt (un tempscoordonnée), et le vecteur d’espace-temps (Δt, Δr ) est approximativement porté par la tangente à la ligne d’univers. Nous montrerons dans la section 2.4 que le 4 L’espace-temps de la relativité générale n’est pas un espace affine, et on ne peut pas définir des vecteurs du type (t,r ), mais seulement des vecteurs (Δt, Δr ) dans le plan tangent en chaque point à cet espace.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
21
2 s’exprime en fonction de l’intervalle de carré de la distance de Minkowski AB temps propre Δτ mesuré par une horloge qui suit le mouvement de la particule. Si un observateur particulier attribue aux points A et B les mêmes coordonnées d’espace, alors Δt = Δτ pour cet observateur. Tout comme la distance euclidienne est indépendante du choix de coordonnées : tous les observateurs s’accordent sur la longueur d’une règle s’ils se sont mis d’accord sur l’unité de longueur, la distance de Minkowski est indépendante du choix de coordonnées. Suivant (1.4), nous écrivons le carré de cette « distance » sous la forme 2 = c2 Δτ 2 = c2 (Δt)2 − (Δr )2 . c2 AB
(1.5)
Tous les observateurs s’accordent sur l’intervalle de temps Δτ entre les événements A et B mesuré par une horloge liée à la particule. En résumé, la quantité définie par (1.5) est indépendante de l’observateur, ou du système de coordonnées, c’est un invariant ou un scalaire. Nous reviendrons sur ce point capital dans la section 2.4.
1.7
Bibliographie
Damour [2005a], chapitres 2 et 3, s’attache avant tout aux aspects historiques, mais contient aussi une introduction élémentaire aux concepts de la relativité restreinte. À un niveau avancé, Spagnou [2012] ou Deruelle et Uzan [2014], sont de bonnes introductions. Gourgoulhon [2010], innovant et exhaustif, est aujourd’hui la « bible » des relativistes, mais le livre exige une bonne culture mathématique. Pour la « non-localité » de la mécanique quantique, voir par exemple le livre grand public de Gisin [2013], et à un niveau avancé Le Bellac [2013], chapitre 11. Parmi les livres en anglais, Taylor et Wheeler [1963] a fêté son cinquantième anniversaire, mais aucun des nombreux autres ouvrages sur le sujet ne lui arrive à la cheville. Des compléments intéressants sont apportés par Mermin [2005] et par le cours de Marolf [2003], disponible en ligne. Les premières mesures par laser de |c1 − c2 |/c ont été effectuées par Brillet et Hall [1979].
22
Chapitre 1. L’espace-temps
2 Principe de relativité Dans un premier temps, nous allons revenir sur nos pas en nous plaçant dans l’espace-temps newtonien, afin de donner une forme intuitive aux lois élémentaires de la mécanique. Ces lois s’énoncent le plus simplement dans une classe de référentiels d’espace appelés référentiels d’inertie, qui sont utilisés dans la présentation habituelle de la relativité. Dans ces référentiels, un objet qui n’est soumis à aucune force suit dans l’espace ordinaire un mouvement sur une droite avec une vitesse constante, aussi appelé mouvement rectiligne uniforme. Cependant, nous constaterons dans la section 2.1 que la notion de référentiel d’inertie ne va pas de soi, et elle sera explicitée dans la section suivante : un référentiel d’inertie sera défini comme un référentiel en chute libre. La section 2.3 énonce le postulat d’équivalence de tous les référentiels d’inertie, et nous écrirons dans la section 2.4 les lois de transformation entre ces référentiels, ou transformations de Lorentz. Enfin, nous poursuivrons dans les deux dernières sections l’approche du chapitre 1, en définissant des référentiels dans l’espace-temps : la section 2.5 traite des référentiels inertiels et la section 2.6 du cas général.
2.1
Forces d’inertie
Aristote pensait que « l’état naturel » des objets était le repos : les objets se mettent en mouvement uniquement lorsque des forces leur sont appliquées, et ils s’immobilisent dès que l’action de ces forces cesse. Cette conception était conforme à l’intuition courante. Aujourd’hui, tout spectateur du film Gravity sait sans aucun doute possible qu’un objet continue sa course dans l’espace dès qu’il
reçoit une impulsion initiale, et qu’ensuite il peut être très difficile à arrêter. Bien avant les stations spatiales, Newton, et avant lui Descartes et Galilée, avaient rejeté les conceptions d’Aristote et admis qu’en l’absence de forces, un objet suivait un mouvement rectiligne uniforme, c’est-à-dire un mouvement sur une droite parcourue à vitesse constante. Un cas particulier d’un tel mouvement est l’état de repos, de vitesse nulle. Cependant, nous savons par expérience qu’un passager qui somnole sur le siège d’une voiture est projeté vers l’avant lorsque le conducteur freine brutalement et le tire de sa somnolence. Par rapport à la voiture, le passager semble soumis à une force qui le projette vers l’avant et l’enverrait droit dans le pare-brise s’il n’était pas retenu par sa ceinture de sécurité. Par rapport à la route, le passager possédait initialement un mouvement à vitesse constante, la vitesse de la voiture, et quand le conducteur freine, le passager tend à conserver ce mouvement, et donc à aller plus vite que la voiture qui elle ralentit : c’est ce qui lui donne l’impression d’être projeté vers le pare-brise, mais en fait c’est le pare-brise qui se projette sur lui ! Il faut donc définir précisément le concept de force, car on peut observer des forces qui ne sont pas dues à une action extérieure, à des interactions avec d’autres objets, mais au fait que l’on se repère par exemple par rapport à une voiture qui freine. De telles forces sont appelées forces d’inertie, et ce pour des raisons évidentes : c’est l’inertie du passager qui le projette vers l’avant car, par rapport à la route, il a tendance à conserver sa vitesse alors que la voiture ralentit. Nous allons appeler référentiel de la voiture un système d’axes lié à la voiture, qui se déplace avec la voiture, et référentiel de la route un système d’axes lié à la route. Notons que nous raisonnons pour l’instant dans l’espace ordinaire à trois dimensions : comme dans la figure 1.2, les vecteurs de base sont les vecteurs de longueur unité de l’espace à trois dimensions, ex , ey et ez . Dans le référentiel de la voiture, on observe des forces d’inertie, mais pas dans celui de la route, qui sera appelé référentiel d’inertie, ou référentiel inertiel. La présentation élémentaire de la mécanique est fondée sur la notion de référentiel d’inertie : ce sont les référentiels où les lois de Newton s’expriment simplement. Par exemple, la première loi de Newton stipule qu’en l’absence de forces une particule suit un mouvement rectiligne uniforme dans un référentiel d’inertie : elle ne subit aucune accélération1 qui la fasse dévier de ce mouvement.
vitesse v est la variation du déplacement orienté Δr pendant un bref intervalle de temps Δt : v = Δr/Δt. L’accélération a est la variation de la vitesse, a = Δv/Δt. Elle peut avoir pour origine une modification de la valeur absolue de la vitesse, tandis que la direction de la vitesse reste fixe, ou une modification de la direction de la vitesse dont la valeur absolue reste constante : c’est le cas du mouvement circulaire uniforme, où la vitesse d’un mobile sur un cercle reste constante en valeur absolue. En général, ce sera une combinaison des deux effets. 1 La
24
Chapitre 2. Principe de relativité
Cependant se pose immédiatement la question : comment se convaincre qu’un référentiel est inertiel ? Le plus simple est de s’assurer que l’absence de force entraîne l’absence d’accélération. Mais comment peut-on savoir que la force est nulle autrement qu’en mesurant une accélération nulle ? On tombe manifestement dans un cercle vicieux. Toutefois, la situation n’est pas aussi désespérée qu’il n’y paraît, car on peut s’appuyer sur les propriétés connues des forces. Supposons par exemple que nous voulions nous assurer de l’absence de forces électriques sur un ion 16 O+ , un atome d’oxygène qui a perdu un électron, de charge unité si l’on prend la charge du proton comme référence, et supposons que nous observions une accélération nulle. Est-ce parce que le champ électrique extérieur est nul, ou parce que la force électrique est exactement compensée par une force d’inertie ? Pour le savoir, il suffit d’utiliser un ion 16 O++ de charge 2 : la force électrique est alors doublée, alors que la force d’inertie ne change pas, car la modification de la masse de l’ion est négligeable. Si l’on observe alors une accélération, c’est que le champ électrique n’est pas nul. Cependant, notre stratégie échoue dans le cas des forces de gravitation. Pour vérifier la présence d’une force électrique, nous avions doublé la charge de l’ion oxygène. Dans le cas de la force de gravitation, nous pourrions penser à doubler la masse, mais la force d’inertie est aussi proportionnelle à la masse, et la stratégie mène à une impasse (voir l’encadré 2.1). Nous pourrions nous en sortir si la masse intervenant dans la force d’inertie était différente de celle intervenant dans la force de gravitation, autrement dit si la masse inertielle mi était différente de la masse gravitationnelle m g . Un énoncé plus précis serait : si le rapport de la masse inertielle à la masse gravitationnelle dépendait de la structure interne ou de la composition chimique des objets. Dans ce cas, on pourrait jouer sur la structure interne ou la composition chimique, de même que dans l’exemple ci-dessus on jouait sur la charge électrique, pour mettre en évidence d’éventuelles forces d’inertie, une possibilité qui avait été envisagée par Newton. De façon générale, la masse inertielle décrit la résistance d’un objet à une modification de son mouvement et la masse gravitationnelle l’action d’une force de gravitation sur cet objet. L’expérience a permis de vérifier que les deux types de masse étaient identiques avec une précision de 10−13 . Rien n’indique aujourd’hui une différence entre les deux types de masse, nous pouvons écrire mi = m g = m, et par conséquent tous les objets, quelles que soient leur masse, leur structure interne ou leur composition chimique, tombent de la même façon et, plus généralement, suivent un mouvement identique sous l’action de forces de gravitation. Il semble donc très difficile de s’assurer de l’absence de forces de gravitation pour vérifier qu’un référentiel est bien d’inertie.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
25
Encadré 2.1. Forces d’inertie.
Pour le bénéfice du lecteur qui possède quelques connaissances élémentaires en mathématiques, il peut être utile de traduire les considérations précédentes en quelques équations simples. Reprenons l’exemple de l’ion oxygène 16 O+ dans un champ élec− → − → − → trique E . L’ion est alors soumis à une force F = q E , et on mesure dans un référen− → tiel d’inertie une accélération a = q E /m, où m est la masse de l’ion et q sa charge. − → Cependant, dans un référentiel non inertiel d’accélération A par rapport à un référentiel d’inertie – en se limitant pour simplifier à des mouvements de translation – − → → on mesure une force F et une accélération − a données par
− → − → − → F = q E − m A = ma ,
(2.1)
− → où −m A est la force d’inertie. Il se pourrait alors que l’on mesure une accélération nulle, non pas parce que la force électrique est nulle, mais parce que cette force est exactement compensée par la force d’inertie. Mais si l’on utilise un ion doublement chargé 16 O++ , on obtient (la modification de la masse de l’ion est négligeable) − → − → − → ma = F = 2q E − m A
− → − − → → F − F =qE.
(2.2)
En comparant le mouvement des deux ions, on peut conclure à l’absence de force électrique si l’on mesure dans les deux cas une accélération nulle. Cette stratégie − → fonctionne parce que l’on peut modifier indépendamment les coefficients de E et de − → A . Cependant, elle échoue dans le cas de forces de gravitation. Si dans un référentiel − → d’inertie la force de gravitation est donnée par F = mg, où g est l’accélération de la pesanteur, dans un référentiel accéléré
− → − → F = mg − m A .
(2.3)
et on ne peut pas, comme dans l’exemple précédent, modifier indépendamment les − → coefficients de g et de − A . . . sauf s’il existe deux types de masse, la masse gravita tionnelle m g , le coefficient de g, et la masse inertielle mi , le coefficient de A.
2.2
Référentiels d’inertie
Étant donné l’égalité entre masse d’inertie et masse gravitationnelle, on ne peut pas distinguer, au moins localement, une force de gravitation d’une force d’inertie, et on est donc incapable de s’assurer de l’absence de forces de gravitation, alors que l’on peut parfaitement s’assurer de l’absence d’autres types de forces, électromagnétiques ou autres : parmi toutes les forces présentes dans la nature, la gravitation joue donc un rôle particulier. Au lieu de s’escrimer à définir un référentiel d’inertie où l’on pourrait écrire les lois de Newton pour
26
Chapitre 2. Principe de relativité
les forces de gravitation, il est plus économique de décider qu’un référentiel d’inertie est un référentiel en chute libre. Un ascenseur en chute libre ou la Station spatiale internationale (ISS : International Spatial Station), pourvu qu’elle n’ait pas de mouvement de rotation sur elle-même afin d’induire une gravité artificielle, seront donc des référentiels d’inertie, à une excellente approximation. Dans le langage courant, on invoque « l’impesanteur » : un individu flotte dans la cabine d’un ascenseur en chute libre, tout comme un astronaute dans une station spatiale. Avec cette définition des référentiels d’inertie, ce n’est pas la pomme qui tombe sur Newton dans un référentiel lié à la Terre, c’est Newton qui monte vers la pomme dans le référentiel en chute libre où la pomme est au repos ! Notre définition d’un référentiel d’inertie est telle que les lois de Newton prennent la forme la plus simple possible, puisque nous y avons annulé les forces de gravitation. Mais une telle annulation ne peut se produire que localement. En effet, la force de gravitation n’est pas en général uniforme, et si l’on peut annuler la gravitation en un point, cela ne sera pas possible en des points éloignés. Le phénomène correspondant est familier, c’est simplement un effet de marée. Considérons un wagon au-dessus du pôle Nord en chute libre radiale vers le centre de la Terre, en admettant que nous l’avons lâché sans vitesse initiale, ce qui est plus facile à dire qu’à faire. La chute du wagon est régie par la chute de son centre de masse G : elle se passe exactement comme si toute la masse du wagon était concentrée2 en G. Un référentiel lié au centre de masse est en chute libre, c’est donc un référentiel d’inertie, et G y reste immobile par définition. Examinons d’abord le cas du wagon vertical (figure 2.1a). Un objet de masse négligeable par rapport à la masse du wagon, ou particule test3 , placé au point A d’altitude minimale, subit de la part de la Terre une accélération plus forte que celle du centre de masse, étant donné qu’il est plus proche du centre de la Terre et que la force est proportionnelle à l’inverse du carré de la distance au centre de la Terre. Au contraire, une particule test placée au point B d’altitude maximale est plus éloignée que G du centre de la Terre, et subit donc une accélération moins forte. En conséquence, les deux particules test placées respectivement en A et B sans vitesse initiale vont s’écarter de G. Les forces auxquelles sont soumises ces deux masses dans le référentiel en chute libre, où G reste immobile, sont des forces de marée. Des forces de marée sont aussi visibles dans le wagon horizontal (figure 2.1b). Des particules test placées aux points C et D du wagon sont soumises à des forces dirigées vers le centre de la Terre qui vont les rapprocher 2 Comme la force sur les différents points du wagon n’est pas uniforme, cela n’est pas exactement vrai, mais les corrections sont négligeables. 3 Une particule test est une particule de masse suffisamment faible pour que son effet sur le champ de gravitation soit négligeable.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
27
B
C
G
D
B
G C
G
D
A A
O
(a)
O
(b)
(c)
F IGURE 2.1. Chute libre radiale d’un wagon vers le centre de la Terre. (a) Wagon vertical, (b) wagon horizontal, (c) forces de marée dans un référentiel en chute libre. En raison de ces forces, les particules test situées aux points A et B ont tendance à s’éloigner de G, et celles situées aux points C et D à se rapprocher de G.
de G. Le référentiel associé à G n’est donc que localement d’inertie, dans un voisinage de G, ce qui est résumé dans la figure 2.1c. On peut regretter qu’il ne soit pas possible de définir un référentiel d’inertie global dans tout l’espace, mais nous avons déjà mentionné qu’un tel référentiel est une vue de l’esprit. Il est facile de calculer les forces de marée dans la situation de la figure 2.1c, une figure qui jouera un rôle important dans l’introduction de la relativité générale au chapitre 5. Le calcul des forces est fait explicitement au chapitre 5, encadré 5.2, et nous nous en servirons au chapitre 7 pour examiner la chute d’un astronaute dans un trou noir. Quelle est l’origine de la terminologie « effet de marée » ? Les marées sont dues à l’effet combiné de la Lune (dominant) et du Soleil, mais nous simplifions outrageusement pour illustrer l’effet en tenant compte uniquement du Soleil. La Terre est en chute libre sur le Soleil, et on retrouve pour les points A et B de la surface de la Terre (figure 2.2a) la même situation que pour les points A et B de la figure 2.1a : A, plus proche du centre du Soleil, subit une accélération plus forte que le centre O de la Terre, tandis que B, plus éloigné du Soleil, subit une accélération plus faible. Dans les deux cas cela se traduit, dans le référentiel de la Terre, par des forces qui ont tendance à faire monter le niveau de la mer aux points A et B diamétralement opposés sur une ligne joignant les centres du Soleil et de la Terre. Compte tenu de la rotation de la Terre en 24 heures, il y a
28
Chapitre 2. Principe de relativité
A
O
B
Soleil (a)
O Soleil (b) F IGURE 2.2. Effets de marée : (a) La Terre est en chute libre sur le Soleil et il y a deux marées par jour. Le schéma des forces pour les points diamétralement opposés A et B est identique à celui de la figure 2.1c, le Soleil jouant maintenant le rôle de la Terre dans cette figure, ce qui fait que le niveau de la mer a tendance à monter en ces deux points. (b) La Terre est maintenue fixe par rapport au Soleil par une intervention extérieure, avec une seule marée par jour.
donc deux marées par jour, et non une seule, comme ce serait le cas si la Terre était maintenue fixe par rapport au Soleil par une intervention extérieure supranaturelle (figure 2.2b). Naturellement, le phénomène des marées est nettement plus complexe, car la Terre n’est pas uniformément recouverte d’eau, on doit tenir compte de la Lune et de la géographie des océans ; en certains points du globe, il n’y a qu’une seule marée par jour.
2.3
Principe de relativité
Nous venons de définir un référentiel d’inertie local, et une bonne approximation d’un tel référentiel est la Station spatiale internationale, ou ISS. Dans un tel référentiel, un objet qui n’est soumis à aucune force obéit à la première loi de Newton, il suit un mouvement rectiligne uniforme, ce que tout spectateur du film Gravity a pu observer4 . Mais un tel référentiel est-il unique ? En fait, tout référentiel se déplaçant suivant un mouvement rectiligne uniforme par rapport à l’ISS et sans mouvement de rotation sur lui-même est aussi un référentiel d’inertie, en raison du principe de relativité que nous énonçons ci-dessous. 4 Bien
évidemment, ces mouvements ont été obtenus à l’aide d’effets spéciaux, et n’ont pas été filmés dans l’espace !
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
29
Principe de relativité.
Si l’on ne peut pas se repérer par rapport à l’extérieur d’un référentiel d’inertie, par exemple si l’on ne peut pas regarder à l’extérieur de l’ISS, il est impossible de déceler le mouvement de ce référentiel et tous les référentiels d’inertie sont équivalents.
Sans aller dans l’espace, il suffit de se placer dans un avion volant à son altitude de croisière en l’absence de turbulences : on peut déambuler dans l’avion, boire son café, etc., exactement comme sur la terre ferme, sans déceler un quelconque mouvement tant que l’on ne regarde pas par les hublots. En revanche, on s’aperçoit immédiatement de toute accélération de l’avion, par exemple quand le pilote effectue un virage. Le principe de relativité a été énoncé pour la première fois en 1632 par Galilée dans son Dialogue sur les deux grands systèmes du monde, en se plaçant dans un cadre mécanique. Dans le cadre de la physique du tout début du XXe siècle, incluant mécanique et électromagnétisme, Poincaré fut le premier à l’énoncer de la façon la plus claire. En 1904, au cours d’une conférence de mathématiques à Saint-Louis, il donne l’énoncé suivant de ce principe5 « d’après lequel les lois des phénomènes physiques doivent êtres les mêmes pour un observateur fixe et pour un observateur entraîné dans un mouvement de translation uniforme, de sorte que nous n’avons pas et ne pouvons avoir aucun moyen de discerner si nous sommes, oui ou non, emportés dans un pareil mouvement. » Pour définir complètement un référentiel d’inertie, nous avons besoin de lui associer un système d’axes permettant de repérer un point dans l’espace, comme dans la figure 1.2, et aussi un ensemble d’horloges synchronisées capable de donner le temps en chaque point d’espace ou, en pratique, dans le voisinage d’un ensemble de points quadrillant l’espace. Toutefois, nous devons être prudents dans la synchronisation des horloges en raison de la vitesse finie de la lumière. La méthode de synchronisation la plus simple est la suivante : une horloge de référence H0 est localisée à l’origine des coordonnées. Au temps t = 0, elle envoie un signal lumineux vers l’horloge à synchroniser H, située à une distance l. L’horloge à synchroniser est bloquée sur le temps t = l/c, et quand l’observateur associé à cette horloge reçoit le signal, il la libère. Une autre méthode, légèrement plus compliquée, a l’avantage de ne pas dépendre d’une mesure préalable des distances. Elle suit le schéma de la section 1.5, 5 Texte
anglais original : « The principle of relativity, according to which the law of physical phenomena must be the same for a stationary observer as for one carried along in a uniform motion of translation, so that we have no means, and can have none, of determining whether or not we are carried along in such motion. »
30
Chapitre 2. Principe de relativité
figure 1.9a : au temps t1 selon H, cette horloge envoie un signal lumineux vers H0 qui réfléchit le signal, lequel est reçu au temps t2 . H0 informe H du temps t (le temps t de H0 !) auquel le signal a été réfléchi. Cette information met bien sûr un certain temps à arriver à H. Mais connaissant t, H peut être synchronisée sur H0 grâce à (1.2) : t = (t1 + t2 )/2. 2.4
Transformations de Lorentz
Nous avons construit un référentiel d’inertie grâce à un ensemble de règles rigides quadrillant l’espace et d’horloges synchronisées disposées en chaque point du quadrillage (figure 2.3). Le système de règles rigides est par exemple fixé sur l’ISS. Par convention, nous appellerons ce système le référentiel R. Soit maintenant une fusée se déplaçant par rapport à l’ISS suivant un mouvement rectiligne uniforme. On peut associer à cette fusée un référentiel R . Pour simplifier, nous supposons que les axes Ox et O x des deux référentiels sont parallèles (figure 2.4), que la vitesse v de R par rapport à R est parallèle à Ox et que les origines des coordonnées O et O coïncident au temps t = t = 0. y
H l
O
H0
x
F IGURE 2.3. Synchronisation des horloges et quadrillage de l’espace. On note qu’aucun observateur ne verrait une telle figure en raison de la vitesse finie de la lumière. Si l’horloge H0 de l’observateur indique t = 0, cet observateur voit une horloge H située à une distance l indiquer le temps t = −l/c.
Étant donné un événement E de coordonnées d’espace-temps (t, x, y, z) dans R, nous nous proposons de déterminer les coordonnées (t , x , y , z ) du même événement dans R . Montrons d’abord que les coordonnées perpendiculaires à la vitesse sont inchangées, par exemple que y = y. Prenons deux règles LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
31
y
O x z
F IGURE 2.4. Référentiels R et R associés à l’ISS et à une fusée. Le référentiel R se déplace par rapport à R avec une vitesse v parallèle à l’axe Ox.
identiques placées suivant Oy et O y . Un physicien de R munit sa règle d’un marqueur situé à une distance y = 1 m de l’origine O , et une physicienne de R fait de même pour sa règle à une distance y = 1 m de O. Lorsque les deux règles se croisent, les marqueurs de chacune des règles laissent une trace sur l’autre. Supposons par exemple que la règle de R apparaisse plus courte à la physicienne de R quand les deux référentiels coïncident à t = t = 0 : nous allons montrer que cela n’est pas possible. En effet, lorsque la règle de R croise celle de R, elle laisse une marque sur l’autre règle, à une distance y < 1 m
y=1m
y 1 m, en contradiction avec le principe de relativité.
32
Chapitre 2. Principe de relativité
L/2 L/2
t = L/c t t= t =0
t = (L / c) /
F IGURE 2.6. Horloge en mouvement dans la Station spatiale internationale et fixe dans une fusée ; le diagramme est tracé dans l’espace euclidien à trois dimensions, dont deux seulement sont représentées. Il est important de remarquer que c’est la même horloge (en bleu) qui mesure les instants de départ et d’arrivée de l’impusion laser dans la fusée (référentiel R ), mais ce sont deux horloges différentes, dessinées respectivement en noir et en rouge, qui mesurent les instants de départ et d’arrivée de l’impulsion dans la station (référentiel R).
(figure 2.5) : selon notre hypothèse, une règle perpendiculaire à la direction du mouvement se contracte. Mais d’après le principe de relativité, un physicien de R doit aussi observer une contraction des règles de R. Examinant la marque laissée sur sa propre règle, il conclut au contraire que la règle de R apparaît plus longue. Or rien ne doit permettre de distinguer les deux référentiels, et la conclusion inévitable est que la longueur des règles placées perpendiculairement au mouvement n’est pas affectée, en d’autres termes que y = y. Passons maintenant à une seconde expérience. Une horloge du référentiel de la fusée est fabriquée de la façon suivante : une impulsion lumineuse effectue dans la fusée un aller-retour entre deux miroirs distants de L/2 et disposés suivant la direction O y (figure 2.6). Dans R , le trajet est parcouru par la lumière en un temps t = L/c, autrement dit l’horloge ne bat pas la seconde mais L/c, du moins est-ce le point de vue d’un physicien de R . Examinons le trajet de l’impulsion laser tel qu’il est vu par une physicienne de R, et appelons t le temps mis par la lumière pour faire son aller-retour, mesuré dans l’ISS. Pendant que la lumière effectue cet aller-retour, la fusée a avancé de vt par rapport à l’ISS, et dans le référentiel correspondant R, la lumière parcourt un trajet plus long que dans la fusée. Utilisant le résultat précédent montrant que les distances perpendiculaires à la vitesse sont invariantes et le fait que la vitesse de la lumière
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
33
est c dans tous les référentiels d’inertie, le temps t tel qu’il est mesuré dans la station est donné par le théorème de Pythagore c2 t2 = L2 + v2 t2 .
(2.4)
La relation entre t et t en découle t= √
L/c 1 − v2 /c2
= γt .
(2.5)
La quantité notée γ est le facteur de Lorentz γ= √
1 1 − v2 /c2
γ ≥ 1.
(2.6)
La conclusion de cette analyse est que l’intervalle de temps entre l’émission et la réception du signal lumineux est plus long dans l’ISS que dans la fusée. Une physicienne de l’ISS qui observe la réception du signal lumineux voit la montre de son collègue de la fusée indiquer le temps t = L/c, alors que sa propre montre indique t = γ( L/c). Autrement dit, elle constate que, de son point de vue, les horloges de la fusée battent trop lentement. N’a-t-on pas là une contradiction avec le principe de relativité, une possibilité de privilégier l’un des deux référentiels ? Ce n’est pas le cas, car un physicien de la fusée constate également que les horloges de l’ISS battent trop lentement ! En fait, la situation est fondamentalement différente de celle qui nous avait permis ci-dessus de conclure à l’invariance des distances perpendiculaires à la direction du mouvement : c’est la même expérience qui nous avait permis de faire la comparaison. Dans le cas de la comparaison des temps, la situation n’est pas symétrique : dans la fusée, l’intervalle de temps entre l’émission et la réception du signal lumineux est mesuré au même point d’espace, alors que dans l’ISS cet intervalle est mesuré par des horloges situées en des points différents, x = 0 et x = vt, dessinées respectivement en noir et en rouge sur la figure 2.6. Un intervalle de temps entre deux événements se produisant au même point dans un référentiel d’inertie est appelé intervalle de temps propre, que nous noterons Δτ. Cette définition est cohérente avec celle de la section 1.5 : un intervalle de temps propre est celui mesuré par une horloge qui se déplace avec l’observateur. Si l’on compare le temps mesuré par un observateur immobile dans un référentiel d’inertie et celui mesuré par un observateur en mouvement par rapport à ce référentiel, l’équation (2.5) montre que le temps propre est toujours le plus court. Revenons sur l’équation (1.5) à la fin du chapitre 1 : dans R , l’intervalle de temps entre l’émission et la réception des impulsions lumineuses est Δt = Δτ = L/c, étant donné que les deux événements ont lieu au même 34
Chapitre 2. Principe de relativité
point d’espace, et cet intervalle de temps est un intervalle de temps propre. Dans R, l’intervalle d’espace-temps est (Δt, Δx = vΔt), mais suivant (2.4), la combinaison c2 (Δt)2 − (Δx )2 = c2 (Δτ )2 est un invariant, ou un scalaire, une quantité indépendante du référentiel. Encadré 2.2. Transformation de Lorentz.
Nous sommes maintenant en possession de tous les ingrédients nécessaires pour écrire les lois de transformation entre deux référentiels R et R , c’est-à-dire exprimer les coordonnées (t , x, y , z ) d’un événement dans R en fonction des coordonnées (t, x, y, z) de ce même événement dans R. La vitesse relative des deux référentiels étant orientée suivant l’axe Ox, nous avons obtenu l’invariance des coordonnées perpendiculaires à cette vitesse, y = y et z = z, et le seul point non évident est la loi de transformation des coordonnées t et x. Celle-ci peut être obtenue à partir de l’invariance de l’intervalle d’espace-temps : c2 t2 − x2 = c2 t 2 − x 2 . Nous nous contenterons de donner le résultat, appelé transformation de Lorentz. En plus de y = y et z = z, la loi de transformation s’écrit x = γ( x − vt)
t = γ(t − vx/c2 ) ,
(2.7)
où γ est donné par (2.6), γ = (1 − v2 /c2 )−1/2 , et v peut être positif ou négatif. Le lecteur peut vérifier a posteriori que c2 t2 − x2 = c2 t 2 − x 2 : la distance de Minkowski est invariante dans une transformation de Lorentz.
Lorsque la vitesse relative des deux référentiels est petite par rapport à celle de la lumière, v/c 1, les formules (2.7) se simplifient et donnent, à la limite c → ∞, la transformation de Galilée x = x − vt
t = t .
(2.8)
La seconde équation exprime le fait que le temps est universel. Au contraire, dans la loi de Lorentz (2.7), le temps et l’espace se transforment l’un dans l’autre ; on lit parfois qu’en relativité « le temps et l’espace fusionnent ». Mais cette formulation peut prêter à confusion : le statut du temps est fondamentalement différent de celui de l’espace. Dans la métrique de Minkowski (1.3), la partie temporelle est affectée d’un signe (+) et la partie spatiale d’un signe (−). 2.5
Référentiels d’inertie dans l’espace-temps
Faisons le lien avec le chapitre précédent en exprimant nos résultats dans l’espace-temps. Quelle est la ligne d’univers d’un observateur inertiel ? Dans
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
35
un référentiel où ses coordonnées d’espace sont constantes, seule change sa coordonnée de temps, et sa ligne d’univers est alors une droite verticale ; de plus, les axes d’espace gardent une direction fixe car le référentiel ne doit pas avoir de mouvement de rotation, et ces axes se déplacent parallèlement à eux-mêmes lorsque l’observateur décrit la ligne d’univers comme le montre la figure 2.7, qui n’est autre que la version à deux dimensions d’espace de la figure 1.9a. Comme les coordonnées spatiales de l’observateur sont constantes, le tempscoordonnée t coïncide avec son temps propre. Si l’observateur émet un photon au temps t1 de sa ligne d’univers et le reçoit au temps t2 après qu’il a été réfléchi par le miroir M, il peut décider que l’événement M « réflexion par le miroir » est simultané à l’événement O de date t sur sa ligne d’univers si, conformément à (1.2), t = (t1 + t2 )/2. Par symétrie, la surface de simultanéité de O est évidemment le plan t = constante. De plus, comme le temps mis par la lumière pour faire l’aller-retour OM est (t2 − t1 ), la distance spatiale L = OM est donnée par
−−→ c L = OM = (t2 − t1 ) . 2
(2.9)
ct = cτ O(t2) Surface de simultan´eit´e de O(t)
eˆ t O(t) eˆy
eˆ x P
M
O(t1)
F IGURE 2.7. Référentiel d’inertie dans l’espace-temps d’un observateur dont les coordonnées ( x, y, z) sont constantes : son temps propre τ est identique au temps-coordonnée t. Le plan perpendiculaire à la ligne d’univers en O de date t est la surface de simultanéité de O. Le système d’axes se déplace parallèlement à lui-même quand le point O se déplace sur la ligne d’univers. Un rayon luminueux tracé en rouge se propage de O(t1 ) à O(t2 ) avec une réflexion en M. La réflexion est simultanée à O(t) de date t si t = (t1 + t2 )/2. Le plan défini par eˆx et eˆy est la surface de simultanéité de O(t).
36
Chapitre 2. Principe de relativité
Nous avons aussi dessiné un référentiel d’espace-temps associé à O. Ce référentiel possède un vecteur de base de genre temps eˆt parallèle à l’axe des temps et trois vecteurs de base spatiaux (eˆx , eˆy , eˆz ), dont deux seulement sont représentés sur la figure tracée pour un espace-temps à trois dimensions ; comme il s’agit d’un référentiel d’espace-temps, les vecteurs sont surmontés d’un chapeau. En effet, suivant notre convention du chapitre 1, les chapeaux désignent les vecteurs de l’espace-temps, les flèches ceux de l’espace ordinaire. On peut attribuer à un point P appartenant au plan perpendiculaire à l’axe du temps à la date t des coordonnées ( x, y, z), de sorte que (figure 2.7) = x eˆx + yeˆy + zeˆz . OP
(2.10)
Ces coordonnées sont relatives à un observateur, et il ne faut pas les confondre avec les coordonnées ( x, y, z) de l’espace de Minkowski, même si elles sont formellement identiques dans ce cas particulier. Nous pouvons maintenant passer à un référentiel d’inertie général. La tangente à la ligne d’univers donne la direction de la vitesse, et cette direction doit être constante : la ligne d’univers est une droite, car un mouvement rectiligne uniforme est représenté dans l’espace-temps par une droite (voir par exemple la droite PM de la figure 1.3 représentant le mouvement d’un TGV de vitesse constante sur une voie ferrée supposée rectiligne). Notez qu’une droite est une entité géométrique : la notion de droite ne fait pas intervenir un système de coordonnées. Prenons un événement O(τ ) particulier sur cette ligne. Dans le cas de la figure 2.7, le temps propre coïncidait avec le temps coordonnée t. Ce n’est plus le cas ici, et il faut donc paramétrer la ligne d’univers par le temps propre τ. Comme le temps propre est indépendant de tout observateur et que la figure 2.8 n’est autre que la figure 2.7 vue par un observateur en mouvement, nous pouvons faire la substitution t1 → τ1 , t → τ, t2 → τ2 . Si l’observateur émet un signal lumineux au temps τ1 de sa ligne d’univers et le reçoit au temps τ2 après réflexion sur le miroir M, alors les relations (1.2) et (2.9) τ=
1 (τ1 + τ2 ) 2
L=
c (τ2 − τ1 ) 2
restent valables en raison du principe de relativité : deux observateurs qui utilisent chacun leur temps propre doivent aboutir au même résultat. De même, = la surface de simultanéité de l’événement O de date τ est l’hyperplan eˆτ · OM 0, perpendiculaire à la ligne d’univers au sens de la métrique de Minkowski (encadré 2.3). Nous avons résolu le problème de la datation d’événements extérieurs à la ligne d’univers, ainsi que celui de la mesure des longueurs, grâce à l’échange de photons. On pourra attribuer à tout point P dans la surface de simultanéité de O(τ ) des coordonnées ( x, y, z) et généraliser (2.10). LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
37
cτ
cτ
ct cτ 2
α
O2
O(τ2)
eˆτ
eˆ τ
ligne de simultan´eit´e de O
eˆ x
β
M
O
β
α
eˆ y
P plan de simultan´eit´e de O(τ )
O(τ1) O1
M
eˆ x
O(τ )
cτ 1 (a)
(b)
F IGURE 2.8. Référentiel d’inertie dans le cas général. (a) La figure est tracée pour une seule dimension d’espace. L’axe eˆτ de composantes (α, β) est porté par la ligne d’univers et l’axe eˆx , symétrique de eˆτ par rapport à la première bissectrice, a pour composantes ( β, α). Le produit scalaire eˆτ · eˆx = 0 au sens de la métrique de Minkowski (encadré 2.3). Le système d’axes se déplace parallèlement à lui-même quand le point O se déplace sur la ligne d’univers. Un rayon luminueux se propage de O(τ1 ) = O1 à O(τ2 ) = O2 avec une réflexion en M ; les lignes d’univers des photons sont représentées en rouge. La réflexion est simultanée à O(τ ) de date τ si τ = (τ1 + τ2 )/2. Sur la figure, nous avons choisi τ = 0 par commodité : comme les triangles O1 OM et O2 OM sont isocèles, on vérifie que τ1 = −τ2 et que la ligne de simultanéité de O est portée par eˆx . (b) Même figure, mais avec deux dimensions d’espace. Le plan défini par eˆx et eˆy est la surface de simultanéité de O(τ ).
En principe, il n’y a rien à ajouter au raisonnement ci-dessus. Cependant, il est instructif de retrouver les résultats en raisonnant sur les coordonnées (t, x, y, z), ce qui permettra au lecteur de se familiariser avec la chronogéométrie et le produit scalaire de Minkowski. On peut associer à la ligne d’univers un axe eˆτ porté par cette ligne, qui conserve une direction fixe, et trois axes d’espace (eˆx , eˆy , eˆz ), dont un seulement est représenté sur la figure 2.8a, et deux sur la figure 2.8b. La condition pour que le référentiel soit d’inertie est à nouveau que ce système d’axes se déplace parallèlement à lui-même comme dans la figure 2.7, sinon on observerait un mouvement de rotation, donc un mouvement accéléré. La figure 2.8a permet d’illustrer les propriétés de la distance de Minkowski et du produit scalaire qui lui est associé. Comme ces notions devront être généralisées au cas de la gravitation, et qu’elles peuvent paraître un peu surprenantes au
38
Chapitre 2. Principe de relativité
premier abord, il vaut la peine de s’attarder sur cette figure. La ligne d’univers porte le vecteur de genre temps eˆτ défini par ses composantes (α, β), avec v = β/α dans un système d’unités où c = 1, et telles que α2 − β2 = 1 pour assurer la normalisation de ce vecteur : eˆ2τ = 1. Les composantes de eˆx sont ( β, α), ce qui donne eˆ2x = β2 − α2 = −1 : eˆx est normalisé et de genre espace, eˆ2x = −1, et il est orthogonal à eˆt au sens de la métrique de Minkowski car eˆτ · eˆx = αβ − βα = 0 . Les deux vecteurs sont symétriques par rapport à la première bissectrice, et la ligne de simultanéité de O est portée par eˆx . Un raisonnement géométrique explicité sur la figure 2.8 permet de retrouver les résultats du paragraphe précédent. Encadré 2.3. Produit scalaire de Minkowski.
La métrique de Minkowski permet de définir un produit scalaire. Soit deux vecteurs uˆ et vˆ de composantes respectives (ut , u x , uy , uz ) et (vt , v x , vy , vz ), par exemple uˆ = ut eˆt + u x eˆx + uy eˆy + uz eˆz . Par définition du produit scalaire uˆ · vˆ uˆ · vˆ = ut vt − u x v x − uy vy − uz vz = ut vt − u · v,
(2.11)
où le produit scalaire u · v est le produit scalaire de l’espace euclidien ordinaire. ˆ Le lecteur attentif aura remarqué La longueur au carré de uˆ n’est autre que uˆ 2 = uˆ · u. que les composantes sont en exposant, mais expliciter les raisons de cette convention nous entraînerait trop loin.
2.6
Observateurs accélérés∗
Revenons comme au chapitre 1 à une ligne d’univers quelconque. Le mouvement de l’observateur sera en général un mouvement accéléré, mais, contrairement à une idée largement répandue, cela ne pose aucun problème de principe : la relativité restreinte sait parfaitement traiter les mouvements accélérés. L’observateur se trouvant en O à une date τ selon son temps propre, nous lui associons un système d’axes, un référentiel de l’espace-temps, en généralisant la section précédente. Le premier vecteur de base, eˆτ , est choisi suivant la tangente à la ligne d’univers au point O et il est donc de genre temps. Nous choisissons ensuite dans l’espace à trois dimensions perpendiculaire en O à la ligne d’univers trois vecteurs de base (eˆx , eˆy , eˆz ), qui permettent de repérer un point P ∗ Cette
section peut être omise en première lecture.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
39
dans cet espace suivant (2.10) : voir la figure 2.9, dessinée pour un espace-temps à trois dimensions, où seuls (eˆτ , eˆx , eˆy ) sont représentés. Les vecteurs de base sont normalisés comme ci-dessus : le vecteur de base eˆτ est de genre temps, eˆ2τ = +1, et les vecteurs (eˆx , eˆy , eˆz ) sont de genre espace, eˆ2x = eˆ2y = eˆ2z = −1, et sont orthogonaux à eˆτ . τ eˆτ O(τ ) eˆ y eˆ x
eˆ τ O(τ ) eˆ y eˆ x P F IGURE 2.9. Système d’axes, ou référentiel, au voisinage du point O à une date τ sur la ligne d’univers d’un observateur accéléré, lui permettant de repérer un point P dans l’espace perpendiculaire à eˆτ ; seuls trois des vecteurs de base ont été représentés dans un espace-temps à trois dimensions. L’évolution du système d’axes a été représentée en bleu à une date ultérieure τ .
Encadré 2.4. Quadrivitesse.
Pendant un court intervalle de temps Δt, l’observateur se déplace de Δr = (Δx, Δy, Δz), tandis que son temps propre varie de Δτ. La quadrivitesse uˆ est alors définie par ses quatre composantes Δt x Δx Δy Δz ,u = , uy = , uz = . (2.12) uˆ = ut = Δτ cΔτ cΔτ cΔτ Cette quadrivitesse est un quadrivecteur, elle est tangente à la ligne d’univers et de longueur de Minkowski unité. En effet, on peut récrire (1.5) sous la forme c2 (Δτ )2 = c2 (Δt)2 − (Δx )2 − (Δy)2 − (Δz)2 et en divisant par c2 (Δτ )2 on en déduit uˆ 2 = 1. La quadrivitesse est une entité géométrique, tout comme la ligne d’univers à laquelle elle est tangente.
40
Chapitre 2. Principe de relativité
Ayant choisi un système d’axes (eˆx , eˆy , eˆz ) en un point de la ligne d’univers à une certaine date τ, on peut maintenant le suivre au cours du déplacement de l’observateur. L’axe des temps sera toujours choisi suivant la tangente à la ligne d’univers, et les axes d’espace seront transportés parallèlement à eux-mêmes (figure 2.9). Cet énoncé intuitif peut être rendu rigoureux : il suffit d’imaginer que chacun des trois axes d’espace est muni d’un gyroscope et que l’axe du gyroscope définit leur orientation à chaque instant, car l’axe d’un gyroscope conserve une direction fixe dans l’espace. Un tel système de coordonnées définit des coordonnées normales de Fermi, et nous y reviendrons au chapitre 5. Dans le cas d’un référentiel d’inertie, l’espace-temps se décompose en chaque point O de la ligne d’univers de l’observateur, dans ce cas une droite, en un axe des temps porté par cette droite et en un espace ordinaire à trois dimensions, qui est l’hyperplan de simultanéité de O : les mathématiciens disent que l’espace-temps est le produit direct d’une ligne unidimensionnelle par un espace tridimensionnel. Si on se limite aux référentiels d’inertie, la décomposition de l’espace-temps est au bout du compte très proche de celle newtonienne de la figure 1.10a. Il est donc instructif de revenir au cas où la ligne d’univers est quelconque et où la décomposition précédente ne se produit pas. Lorsque la ligne d’univers d’un observateur est courbe, les hyperplans orthogonaux à cette ligne d’univers eˆ τ 2 τ
eˆτ 1
(O 2, τ 2 )
(O 1, τ 1 )
P
c2 /a
F IGURE 2.10. Observateur accéléré dans un espace-temps à deux dimensions. Les plans orthogonaux (des droites dans le cas de la figure) au sens de la métrique de Minkowski à la ligne d’univers aux points voisins O1 et O2 , de dates respectives τ1 et τ2 , se coupent en un point P auquel l’observateur peut attribuer soit une date τ1 , soit une date τ2 . Nous avons supposé c = 1 : dans ces conditions, le plan orthogonal à la ligne d’univers au point O2 (ligne verte) est symétrique de la tangente eˆτ2 par rapport à la première bissectrice : voir la figure 2.8a.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
41
en deux points voisins O1 et O2 , de dates respectives τ1 et τ2 , ne sont pas en général parallèles : ceci se voit intuitivement sur la figure 2.10, et on peut prouver que si l’accélération a de l’observateur est non nulle, alors ces hyperplans se coupent à une distance ∼ c2 /a de ces points. L’observateur est donc amené à attribuer à ce point deux dates différentes τ1 et τ2 : autrement dit, le repérage d’un point de l’espace-temps par ses coordonnées n’est pas univoque ! Un observateur accéléré pourra correctement repérer les points de l’espace-temps uniquement dans un voisinage de sa ligne d’univers, et le référentiel de la figure 2.10 ne peut être qu’un référentiel local, qui n’est pas utilisable globalement pour l’ensemble de l’espace-temps. Cette situation est évidemment en totale contradiction avec notre perception intuitive d’un espace-temps absolu, car, selon cette perception, l’espace-temps peut être arpenté indépendamment de la trajectoire d’un observateur. 2.7
Bibliographie
La discussion de la section 1 est inspirée de Taylor et Wheeler [1963]. Une étude très complète des référentiels accélérés est faite par Gourgoulhon [2010]. Voir également Marolf [2003] et Mermin [2005].
42
Chapitre 2. Principe de relativité
3 Le temps relativiste Ce chapitre et le suivant développent quelques exemples et applications illustrant la relativité restreinte. Je traiterai uniquement d’exemples liés à la transformation du temps. Le lecteur a probablement entendu parler de la contraction des longueurs, proposée à la fin du XIXe siècle par Lorentz et Fitzgerald afin d’expliquer le résultat négatif de l’expérience de MichelsonMorley destinée à mettre en évidence le mouvement de la Terre par rapport à « l’éther ». Cependant, j’ai toujours mesuré les longueurs par échange de signaux lumineux, et il serait malvenu d’introduire maintenant des règles rigides, alors que j’en ai déjà souligné les limites. La contraction des longueurs donne lieu à de nombreux pseudo-paradoxes, certes assez amusants, mais qui n’ont aucun intérêt fondamental et qui, à mon avis, présentent peu d’intérêt pédagogique. De plus, cette contraction ne correspond en rien à ce que l’on verrait effectivement : une sphère « contractée de Lorentz » est vue comme une sphère et non comme un ellipsoïde. La section 3.1 est consacrée à une étude assez détaillée du « paradoxe des jumeaux » introduit qualitativement dans la section 1.5. La section 3.2 décrit un certain nombre de vérifications expérimentales classiques, et la section 3.3 une vérification très récente utilisant des horloges atomiques optiques. Le chapitre se conclut par une étude de l’effet Doppler, dont nous aurons à nous servir au chapitre 5 dans le cadre du principe d’équivalence.
3.1
Paradoxe des jumeaux
Nous avons vu dans la section 2.4 que le temps ne s’écoulait pas de la même façon dans deux référentiels d’inertie différents. Cette propriété a de
multiples applications en physique des particules élémentaires. Un cas d’école est le suivant : on souhaite étudier les propriétés d’un type de particule élémentaire appelé méson π chargé, en soumettant cette particule à des collisions dans un hall d’expériences ; ces mésons peuvent aussi servir à produire des faisceaux de neutrinos et sont couramment utilisés à cette fin, par exemple au CERN. Les mésons π sont produits par collisions de protons provenant d’un accélérateur sur une cible nucléaire. Ils ont une durée de vie très brève, ils se désintègrent en moyenne au bout de 2, 6 × 10−8 s, soit 26 ns : on dit que leur vie moyenne est de 26 ns. En une nanoseconde, la lumière parcourt 30 cm, et même en se déplaçant à la vitesse de la lumière, les mésons ne devraient pas parcourir en moyenne plus de 7,8 m. Cela pose problème, car pour de simples raisons d’encombrement, on ne peut pas construire le hall d’expériences trop près du lieu de production des mésons. Heureusement, la relativité introduit une « dilatation du temps » qui vient au secours des physiciens ! En effet, les mésons ont une énergie typique de 30 GeV (gigaélectronvolts) dans le référentiel du laboratoire, ce qui correspond à une vitesse de 0, 999 991 c et à un facteur de Lorentz (2.6) γ 214, pour des raisons qui seront expliquées au chapitre suivant. La vie moyenne est un temps propre mesuré dans le référentiel où les mésons sont au repos. Mais, dans le laboratoire, cette durée de vie est multipliée par le facteur de Lorentz, et les mésons peuvent parcourir en moyenne 7, 8 × 214 1 700 m, ce qui donne largement de la place pour construire le hall d’expériences (figure 3.1) sans perdre beaucoup de mésons en cours de route. Protons Accélérateur
Cible
Mésons π Hall
F IGURE 3.1. Voyage des mésons π entre leur production sur une cible nucléaire et le hall d’expériences.
La dilatation du temps est souvent présentée comme résultant d’un effet de parallaxe, dû au fait que l’on ne peut pas comparer les horloges dans deux référentiels, sauf en un point précis quand ces deux horloges coïncident. Mais la situation change si ces deux horloges coïncident au moins deux fois : on peut alors synchroniser les horloges à la première coïncidence et les comparer à la seconde, comme c’est le cas des deux lignes d’univers de la figure 1.8 qui se croisent deux fois. Cependant, une telle situation ne peut se produire que si au moins un des deux référentiels n’est pas d’inertie, par exemple si l’un d’entre eux reste « fixe », immobile par rapport à la Terre, tandis que l’autre effectue un aller-retour. Un des deux référentiels est nécessairement accéléré, mais, nous
44
Chapitre 3. Le temps relativiste
l’avons déjà souligné, cela ne pose aucun problème de principe. Imaginons la situation suivante : une astronaute intrépide, Alice, part pour un voyage dans la Galaxie à une vitesse égale à 4c/5 = 0, 8 c, tandis que son frère jumeau Bob reste tranquillement sur la Terre. Ce choix de la vitesse permet d’obtenir un facteur de Lorentz simple 1 5 γ= √ = . 3 1 − 16/25 Alice voyage 3 ans suivant son temps propre, soit 5 ans pour un observateur terrestre, et elle s’éloigne donc à (4/5) × 5 = 4 années lumière de la Terre. Elle fait ensuite demi-tour, repart en sens inverse toujours à la même vitesse, et rejoint son jumeau après un voyage qui pour elle a duré 6 ans, mais qui pour son frère jumeau a duré 10 ans. Si Alice a quitté la Terre à 20 ans, elle est âgée de 26 ans à son retour, mais Bob est lui âgé de 30 ans ! Le voyage des jumeaux est représenté par le diagramme d’espace-temps de la figure 3.2, dessiné dans le référentiel de la Terre. La ligne d’univers de Bob est l’axe des temps, étant donné qu’il reste immobile à x = 0. Celle d’Alice est t 10T/3
B
41T/15
5T/3
A
3T/5 O
x 4cT/3
F IGURE 3.2. Le paradoxe des jumeaux. Alice s’éloigne de Bob avec une vitesse v = 4c/5, fait demi-tour en A et rejoint son frère jumeau Bob en B. La ligne d’univers de Bob est tracée en noir, celle d’Alice en bleu. Les lignes de simultanéité de A dans les deux référentiels associés à Alice sont tracées en pointillés. En rouge, une ligne d’univers d’Alice comportant uniquement des accélérations finies.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
45
composée de deux segments de droite, OA et AB : au point A, Alice fait brusquement demi-tour et commence son voyage retour vers son frère Bob qui se termine en B. Si son voyage a duré pour elle un temps 2T = 6 ans (T pour l’aller et T pour le retour), pour Bob il a duré 2γT = (10/3) × 3 = 10 ans. Il est instructif d’identifier les différentes étapes du vieillissement de Bob : juste avant le demi-tour d’Alice, la ligne de simultanéité du point A coupe l’axe des temps au point de date T/γ = 3T/5. Dans cette première phase du voyage, entre O et A, Bob voit Alice vieillir plus vite que lui, ce qui est normal car Alice se déplace par rapport à lui, et Alice fait le même constat pour Bob. Mais lorsqu’Alice effectue son demi-tour, la ligne de simultanéité de A change : dans le référentiel qui revient vers Bob, le point simultané à A a pour date 2γT − T/γ = 41T/15. L’essentiel du vieillissement de Bob provient donc du changement de ligne de simultanéité du point A quand on passe du référentiel s’éloignant de Bob à celui qui revient vers lui. Le schéma de la figure 3.2 est critiquable, car non physique : au départ en O, au demi-tour en A et à son arrivée en B, Alice subit une accélération infinie. Un schéma plus satisfaisant est obtenu en se limitant à des accélérations finies, la ligne d’univers d’Alice étant alors représentée par la courbe en rouge. Le calcul de la différence d’âge est simple, mais cependant trop long pour être reproduit ici. Cette différence d’âge dépend quantitativement des détails du mouvement, mais qualitativement le résultat est toujours le même : le jumeau voyageur est toujours le plus jeune quand il rencontre son homologue terrestre. Ce résultat est parfois appelé « paradoxe des jumeaux », mais il n’a en fait rien de paradoxal, car la situation des deux jumeaux n’est pas symétrique : le jumeau resté sur Terre ne subit aucune accélération, alors que le mouvement du jumeau voyageur est nécessairement accéléré et, comme nous l’avons observé, il est parfaitement possible de déceler un mouvement accéléré sans regarder au-dehors.
3.2
Vérifications expérimentales
La vérification la plus spectaculaire du paradoxe des jumeaux vient de l’observation de muons dans un anneau de stockage, où ils suivent une trajectoire circulaire. Le muon est une particule élémentaire très analogue à l’électron, mais il est environ 200 fois plus lourd et il est instable : il se désintègre en moyenne au bout de 2, 2 × 10−6 s, ou 2,2 microsecondes (μs). Dans une expérience réalisée au CERN (Genève) en 1977, des muons de 3 GeV d’énergie, ce qui correspond à un facteur de Lorentz γ 29, 3, sont stockés dans un anneau de 14 m de circonférence, où ils sont maintenus sur une trajectoire circulaire par un champ
46
Chapitre 3. Le temps relativiste
magnétique perpendiculaire à l’anneau. Une fois le muon inséré dans l’anneau de stockage, il tourne jusqu’au moment où l’on observe sa désintégration. On mesure ainsi une vie moyenne de 64,3 μs, en excellent accord avec la prédiction de la relativité, aux erreurs expérimentales près : 2, 2 μs × 29, 3 = 64, 4 μs. L’accélération des muons sur leur trajectoire est de 1020 m/s2 , et on constate que cette accélération n’a aucune influence sur la vie moyenne. Seule la vitesse intervient dans le résultat final. L’expérience de Hafele et Keating [1972] a consité à embarquer des horloges atomiques à bord d’avions de ligne, à leur faire faire le tour de la Terre dans les deux sens et à les comparer à l’arrivée avec une horloge restée fixe sur la Terre. L’analyse complète de l’expérience est beaucoup plus complexe que dans le cas des muons, en particulier pour les deux raisons suivantes. 1. Un référentiel fixe par rapport à un point pris sur la surface de la Terre n’est pas d’inertie en raison de la rotation de la Terre sur elle-même, et il faut faire les comparaisons par rapport à un référentiel qui suit le mouvement du centre de la Terre, car ce référentiel est lui approximativement inertiel. 2. Les horloges situées en altitude sont décalées par rapport à une horloge située au niveau de la mer, en raison du décalage vers le rouge gravitationnel que nous introduirons au chapitre 5. Néanmoins, une analyse complète tenant compte de ce deux effets montre que l’effet de dilatation du temps est indispensable pour expliquer le décalage entre l’horloge fixe et les horloges voyageuses. On doit également tenir compte de la transformation du temps si l’on veut synchroniser les horloges atomiques embarquées dans les satellites du GPS et les horloges fixes sur la Terre. La vitesse des satellites GPS par rapport à la Terre est d’environ 3,9 km/s, ce qui correspond à v/c 1, 3 × 10−5 et à un facteur de Lorentz donné par γ − 1 v2 /2c2 0, 85 × 10−10 . Cette valeur peut sembler ridiculement faible, mais au bout d’une heure, le décalage dû à la transformation du temps est d’environ 0, 3 μs et en 0, 3 μs, la lumière parcourt 90 m, d’où une erreur de cet ordre sur la position donnée par le GPS si l’on ne fait pas la correction. L’analyse complète est plus complexe en raison des deux effets mentionnés ci-dessus, et nous y reviendrons au chapitre 5. 3.3
Usain Bolt sprinter relativiste ?
Grâce à des horloges atomiques ultraprécises, les horloges atomiques optiques, on a pu mettre en évidence la dilatation du temps pour des vitesses LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
47
typiques d’un sprinter de 100 m. Le recordman du monde, le Jamaïcain Usain Bolt, parcourt cette distance en un peu moins de 10 secondes, soit une vitesse de 10 m/s, ou 36 km/h. Les horloges atomiques optiques à ion aluminium (un ion est un atome qui a perdu un ou plusieurs électrons) sont capables de mesurer le temps avec une précision de 10−17 , soit une dérive d’une seconde sur 3 milliards d’années. Ces horloges reposent sur une transition électromagnétique entre deux niveaux d’énergie de l’ion, de fréquence 1, 121 × 1015 Hz, qui se situe dans le domaine optique. Cette fréquence est environ 105 fois plus élevée que celle utilisée par les horloges à césium, et cette différence de fréquence est à l’origine du gain en précision. Il est d’ailleurs vraisemblable que la définition de la seconde soit modifiée dans un avenir proche, étant donné le gain en précision apporté par les horloges atomiques optiques. Dans une horloge à ion aluminium, un ion unique est confiné dans un piège dont les dimensions sont de l’ordre du millimètre et il est manipulé par un laser. En fonctionnement normal, l’ion responsable de la transition électromagnétique est pratiquement immobile dans le piège. Grâce à un champ de radiofréquences, on peut le mettre en mouvement et lui faire effectuer des allersretours dans le piège, à des vitesses allant de 1 à 40 m/s. L’ion devient donc un jumeau voyageur, mais sur des distances très faibles, de l’ordre du millimètre. Une horloge avec un ion immobile (le jumeau sédentaire) est comparée à celle avec un ion voyageur, et on voit très clairement l’horloge à ion voyageur retarder par rapport à celle à ion immobile. L’effet est visible expérimentalement pour des vitesses de quelques mètres par seconde (figure 3.3). Ainsi Usain Bolt peut-il être légitimement considéré comme un sprinter relativiste, car les effets de la relativité sont visibles pour sa vitesse de pointe ! 3.4
L’effet Doppler
L’effet Doppler pour les ondes sonores est familier : le son de la sirène d’une ambulance est plus aigu, sa fréquence perçue est plus grande si l’ambulance s’approche, et cette fréquence perçue est plus faible si elle s’éloigne. Il est facile de donner une estimation quantitative de l’effet en supposant que l’ambulance émet un signal très bref à des instants t = 0, t = T, t = 2T, . . . , t = nT, . . . : la fréquence de l’émission, mesurée en Hz, est donc ν = 1/T. Pour fixer les idées, on suppose que l’ambulance s’éloigne avec une vitesse v, ce qui est représenté sur le diagramme d’espace-temps de la figure 3.4. Le signal émis au temps T est reçu par l’observateur à un temps T donné en fonction de v et de la vitesse du son cs par v cs ( T − T ) = vT soit T = T 1 + . (3.1) cs 48
Chapitre 3. Le temps relativiste
F IGURE 3.3. Vérification de la dilatation du temps avec une horloge atomique optique. Les ions se déplacent dans le piège de droite avec une vitesse allant de 1 à 40 m/s : la fréquence ν du battement de l’horloge varie avec la vitesse des ions dans le piège. La comparaison avec l’horloge de gauche permet de mettre en évidence la dilatation du temps. Adapté de Chou et al. [2010]. Courtoisie de David Wineland et du NIST.
3T
2T
3T T 2T T T 2 T 3 T
x
F IGURE 3.4. Effet Doppler pour les ondes sonores : l’observateur est fixe en O et l’ambulance s’éloigne avec une vitesse v. Elle émet un signal très bref aux temps t = 0, t = T, t = 2T, . . . , t = nT, . . . Ces signaux sont reçus par l’observateur aux temps t = 0, t = T , t = 2T , . . . , t = nT , . . . Les pointillés rouges représentent la propagation des signaux à la vitesse du son cs .
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
49
Les signaux sont reçus aux temps 0, T , 2T , . . . , nT . . ., et la fréquence observée ν des signaux est inférieure à la fréquence d’émission ν ν =
ν . 1 + v/cs
(3.2)
Passons maintenant à l’effet Doppler pour les signaux lumineux, ou plus généralement pour les signaux électromagnétiques. Il faut d’abord remplacer la sirène de l’ambulance par une source d’impulsions lumineuses et la vitesse du son cs par celle de la lumière, c, mais ce n’est pas tout, il faut aussi prendre en compte la transformation du temps. Reprenons le diagramme d’espace-temps de la figure 3.4 : dans le référentiel de la source des signaux, ceux-ci sont émis aux temps 0, T, 2T, . . . , nT, . . ., mais dans le référentiel de l’observateur, ils le sont aux temps 0, γT, 2γT, . . . , nγT, . . ., et l’équation (3.1) devient 1 + v/c 1 + v/c , (3.3) T = γT (1 + v/c) = T √ =T 2 2 1 − v/c 1 − v /c ce qui donne la loi de transformation des fréquences 1 − v/c ν =ν . 1 + v/c
(3.4)
C’est la formule de l’effet Doppler relativiste. Elle est valable aussi bien pour v > 0 : la source s’éloigne, que pour v < 0 : la source se rapproche. Dans le premier cas, la fréquence est plus faible que la fréquence de la source, dans le second cas elle est plus grande. Notre discussion est limitée au cas où la vitesse des signaux et celle de la source sont colinéaires, mais il existe une formule générale qui s’affranchit de cette limitation. Pour des vitesses faibles, v/c 1, l’équation (3.4) prend la forme approchée plus simple v ν ν 1 − . (3.5) c À la différence de la mesure de vitesse par des jumelles laser, qui repose sur une mesure de distance, la mesure de la vitesse d’une voiture par un radar repose sur l’effet Doppler pour lequel on peut utiliser la forme approchée (3.5), car la vitesse de la voiture est très faible par rapport à celle de la lumière. Si la voiture s’éloigne du radar, elle voit une fréquence ν(1 − v/c), où ν est la fréquence d’émission du radar. Le signal est réfléchi par la voiture et, dans son référentiel, la voiture émet avec cette fréquence. Pour le radar qui voit la voiture s’éloigner, cette fréquence est à nouveau décalée par effet Doppler, si bien que la fréquence mesurée par le radar est ν(1 − 2v/c), en tenant compte de ce que v/c 1.
50
Chapitre 3. Le temps relativiste
L’effet Doppler jouera un rôle majeur dans la discussion du principe d’équivalence au chapitre 5. 3.5
Bibliographie
L’expérience sur la vie moyenne des muons en rotation dans un anneau de stockage a été effectuée par Bailey et al. [1977] et celle des horloges atomiques à bord d’avions de ligne par Hafele et Keating [1972]. La vérification de la dilatation du temps par des horloges atomiques optiques est due à Chou et al. [2010]. Le calcul du décalage temporel pour le paradoxe des jumeaux avec des accélérations finies se trouve dans Gourgoulhon [2010], chapitre 2.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
51
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
4 Masse et énergie Dans ce chapitre, nous abordons la dynamique relativiste. Notre résultat principal sera le suivant : les lois de conservation de l’énergie et de l’impulsion fusionnent en une loi unique, la loi de conservation de l’énergie-impulsion. La section 4.1 rappelle quelques résultats élémentaires sur les collisions en mécanique newtonienne, et la section 4.2 est consacrée à la déduction de la forme de l’impulsion et de l’énergie relativistes. Des applications simples, dont certaines sont d’un intérêt pratique évident, illustrent dans la section 4.3 la célèbre formule E = mc2 . 4.1
Collisions en physique newtonienne
Au cours des XVIIIe et XIXe siècles, deux lois de conservation fondamentales1 se sont progressivement imposées dans la physique classique, c’est-à-dire la physique prérelativiste et préquantique : 1. la conservation de l’impulsion ; 2. la conservation de l’énergie. Cependant, le contenu exact de ces lois n’a été vraiment bien compris qu’à la fin du XIXe siècle, quand les physiciens se sont rendu compte que l’énergie et l’impulsion d’un système physique devaient aussi inclure l’énergie et l’impulsion 1 Il existe une troisième loi de conservation importante, celle du moment angulaire pour les systèmes à symétrie sphérique, que nous utiliserons aux chapitres 6 et 7. Comme l’a montré la mathématicienne allemande Emmy Noether, ces lois sont une conséquence de principes d’invariance : la conservation de l’énergie découle de l’invariance par translation de temps, celle de l’impulsion de l’invariance par translation d’espace et celle du moment angulaire de l’invariance par rotation.
du champ électromagnétique. Il est symptomatique que la première loi de la thermodynamique, qui est en fait la loi de conservation de l’énergie, n’ait été clairement formulée que bien après l’énoncé de la deuxième loi, celle qui interdit la production de travail à partir d’une seule source de chaleur, une loi pourtant beaucoup plus abstraite. La loi de conservation de l’énergie est tellement fondamentale qu’en 1930 Wolfgang Pauli postula à juste titre l’existence d’une nouvelle particule, le neutrino, afin d’assurer la conservation de l’énergie dans la radioactivité β. Le neutrino ne fut mis en évidence directement que 25 années plus tard. Rappelons que l’impulsion2 d’une particule de masse m et de vitesse v, aussi appelée sa quantité de mouvement, est définie en physique newtonienne par
p = mv.
(4.1)
L’impulsion permet une écriture commode de la loi fondamentale de la dynamique ; cette loi énonce que si une particule est soumise à une force F pendant un court intervalle de temps Δt, alors sa variation de vitesse Δv est donnée par Δv = FΔt/m, ce qui peut être immédiatement récrit en fonction de l’impulsion en multipliant les deux membres de cette équation par la masse m Δp = F Δt ou
Δp = F. Δt
(4.2)
La propriété fondamentale de l’impulsion, et en fait la raison profonde pour laquelle on éprouve le besoin de l’introduire, est la loi de conservation suivante. Loi de conservation de l’impulsion.
L’impulsion totale d’un système physique isolé est constante, elle est indépendante du temps.
Par système physique isolé, on entend un système qui n’est soumis à aucune influence extérieure à ce système. Comme c’est généralement le cas en physique, il s’agit d’une idéalisation : il n’existe pas dans la nature de système complètement isolé, en dehors peut-être de l’Univers tout entier, et encore ce n’est même pas certain ! La conservation de l’impulsion est illustrée dans la figure 4.1 par le 2 La
terminologie française n’est pas très heureuse : « quantité de mouvement » est long à dire ou à écrire, et « quadri-vecteur énergie-quantité de mouvement » encore plus. En principe, le mot « impulsion » devrait être réservé à l’action d’une force pendant un court intervalle de temps, et donc à une variation de quantité de mouvement, selon la première forme de (4.2). La terminologie anglaise est bien plus commode : « quantité de mouvement » se dit « momentum » et « quadrivecteur énergie-impulsion » « energy-momentum four-vector ».
54
Chapitre 4. Masse et énergie
F IGURE 4.1. Par conservation de l’impulsion, le gardien de but est projeté dans ses filets.
sort d’un malheureux gardien de but qui essaie de bloquer un tir surpuissant et se trouve projeté dans ses filets : le ballon de masse m possède une impulsion initiale p = mv, et l’ensemble gardien de but + ballon, une fois le ballon bloqué, possède une impulsion (m + M)v , où M est la masse du gardien de but et v la vitesse finale de l’ensemble gardien + ballon (figure 4.1). Le système n’est pas vraiment isolé, car le gardien de but est en contact avec le sol, mais si l’on néglige ce contact, la vitesse finale se déduit de la conservation de l’impulsion
v =
m v. M+m
(4.3)
Prenons un autre exemple, celui d’un « carreau » à la pétanque. On suppose les deux boules identiques, mais au lieu de se placer dans le référentiel où le tireur est immobile, le « référentiel du tireur », on se place dans le référentiel du centre de masse des deux boules, défini comme le référentiel où l’impulsion totale des deux boules est nulle. Comme dans le cas du gardien de but, on néglige le contact avec le sol : on suppose que le seul effet du sol est de maintenir les boules dans un plan horizontal, et on suppose aussi pour simplifier que le mouvement des boules est purement horizontal suivant une droite (figure 4.2). Le référentiel du centre de masse se déplace avec une vitesse v/2 par rapport au référentiel du tireur, et les deux boules arrivent l’une vers l’autre avec des vitesses égales et opposées, v/2 et −v/2 ; comme elles sont de masse égale, la condition d’impulsion totale nulle est bien vérifiée. Par conservation de l’impulsion, elles doivent repartir en sens inverse avec des vitesses de direction opposée, et si la collision est élastique, ce que nous allons admettre, cela entraîne l’égalité des valeurs absolues des vitesses finales et des vitesses initiales.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
55
2
− 2
− 2 (a)
initial 2
Référentiel du centre de masse
final (b) Référentiel du tireur
F IGURE 4.2. Collision de deux boules de pétanque. (a) Collision vue dans le référentiel du centre de masse. (b) Collision vue dans le référentiel où le tireur est immobile : la boule rouge est lancée avec une vitesse v et la boule bleue est initialement immobile. La boule rouge s’arrête après la collision : c’est un « carreau ».
Revenons au référentiel du tireur : si la vitesse de la boule lancée par le tireur est v, nous avons vu que la vitesse du référentiel du centre masse par rapport au tireur est v/2. Comme la boule de droite (bleue) part après la collision avec une vitesse v/2 dans le centre de masse, cette vitesse s’ajoute dans le référentiel du tireur à v/2, et la boule de droite (bleue) part avec une vitesse v. La boule de gauche (rouge), elle, reste sur place : v/2 − v/2 = 0. C’est le principe du « carreau ». La collision des deux boules de pétanque est une collision élastique : l’énergie cinétique initiale dans le référentiel du tireur, mv2 /2, est égale à l’énergie cinétique finale, mais elle a été transférée de la boule rouge à la boule bleue. Au contraire, il semble que l’énergie ne soit pas conservée dans l’exemple du gardien de but, qui est schématisé sur la figure 4.3 par la collision d’une boule légère de masse m qui se colle sur une boule lourde de masse M, initialement immobile. L’ensemble part vers la droite avec une vitesse v donnée par (4.3). 2 L’énergie cinétique initiale est mv2 /2, l’énergie cinétique finale (m + M)v /2, mais elles ne sont pas égales. En effet, la différence entre les énergies cinétiques initiale et finale est : 1 1 1 mM 2 2 mv2 − ( M + m)v = v . 2 2 2 M+m En fait, l’énergie ne disparaît pas, car le choc entre les deux boules a dégagé de la chaleur et la quantité de chaleur dégagée est précisément égale à la différence
Initial
Final F IGURE 4.3. Collision inélastique.
56
Chapitre 4. Masse et énergie
des énergies cinétiques. L’énergie est conservée, c’est un principe fondamental de la physique3 , mais à condition de prendre en compte toutes les formes d’énergie. La loi de conservation de l’impulsion est simple à appliquer4 , mais celle de l’énergie est plus complexe, car il faut prendre en compte les différentes formes d’énergie. La relativité restreinte va nous apporter une simplification considérable : les lois de conservation de l’énergie et de l’impulsion seront rassemblées en une loi unique, la loi de conservation de l’énergie-impulsion.
4.2
Conservation de l’énergie-impulsion
Dans l’annexe 11.3, nous déduisons la forme relativiste de l’énergie et de l’impulsion en utilisant l’exemple d’une collision élastique de deux particules et en prenant comme hypothèse de base la conservation de l’impulsion dans cette collision vue dans différents référentiels d’inertie. Le raisonnement suivi est élémentaire, car il ne fait appel qu’à des identités entre vecteurs, mais il est un peu long, et nous préférons admettre directement l’expression de l’impulsion relativiste, en renvoyant le lecteur intéressé par la démonstration à l’annexe 11.3. Pour une particule isolée de masse m, cette expression doit être nécessairement de la forme p = m f (v)v : en effet, l’impulsion est une quantité vectorielle et comme le seul vecteur dont nous disposons est la vitesse v de la particule, p est nécessairement parallèle à v. La fonction f (v) doit être sans dimension, elle ne peut dépendre que de la valeur absolue v de la vitesse, et pour v c on doit retrouver l’expression newtonienne, donc f (v c) = 1. Considérons donc une particule isolée de vitesse constante dans un référentiel d’inertie, allant d’un point O, choisi comme origine, à un point A en un temps Δt (figure 4.4).
Δ
A Δy
O
Δx
F IGURE 4.4. Particule se propageant de O à A avec une vitesse constante v en un temps Δt.
3 On
parle souvent en économie de la « production d’énergie », mais il s’agit toujours de la conversion d’une forme d’énergie en une autre. 4 Toutefois, il faut éventuellement prendre en compte l’impulsion des champs, par exemple celle du champ électromagnétique.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
57
Le point A ayant pour coordonnées Δr = (Δx, Δy, Δz), la vitesse de la particule est v = Δr/Δt et l’expression newtonnienne de son impulsion
p = m Δv/Δt. Comme nous le montrons dans l’annexe 11.3, pour passer de la physique de Newton à celle d’Einstein, il suffit de remplacer le temps newtonien par le temps propre Δr p = m . (4.4) Δτ √ Étant donné la relation Δτ = Δt 1 − v2 /c2 reliant le temps propre au temps ordinaire pour une particule de vitesse v, on en déduit
p = m
Δr Δt mv =√ = γmv, Δt Δτ 1 − v2 /c2
(4.5)
en utilisant le facteur de Lorentz γ (2.6). La fonction f (v) est donnée par f (v) = γ = (1 − v2 /c2 )−1/2 . Pour obtenir l’expression de l’énergie en relativité restreinte, nous allons observer que Δr est la composante d’espace d’un vecteur de l’espace-temps, ou quadrivecteur. Cette composante d’espace joint l’origine O au point A dans la −→ figure 4.4 : Δr = OA. On peut associer à ce vecteur le temps Δt mis par la particule pour aller de O à A : (cΔt, Δr ) forment un quadrivecteur. Le temps propre Δτ mis par la particule pour aller de O à A est indépendant du référentiel : en effet, c’est le temps indiqué par une horloge attachée à la particule, et c’est ce que l’on appelle une quantité scalaire. Par conséquent, l’ensemble (cΔt/Δτ, Δr/Δτ ) est aussi un quadrivecteur, la quadrivitesse (encadré 2.4), qui se transforme suivant la loi de Lorentz (2.7). Il est donc naturel d’associer aux trois composantes de l’impulsion une composante de temps notée E, qui sera interprétée ultérieurement comme l’énergie de la particule E = mc2
Δt mc2 =√ = γmc2 . Δτ 1 − v2 /c2
(4.6)
On en déduit qu’il est impossible d’accélérer une particule massive au-delà de la vitesse de la lumière car il faudrait lui fournir une énergie infinie. On note également deux relations importantes que l’on vérifie immédiatement E2 − p2 c2 = m2 c4
v =
c 2p . E
(4.7)
La première de ces équations exprime que, tout comme la quantité c2 (Δt)2 − (Δr )2 est un scalaire égal à c2 (Δτ )2 , E2 − c2 p2 est un scalaire, indépendant du 58
Chapitre 4. Masse et énergie
référentiel, et c’est la masse de la particule au carré multipliée par c4 . On trouve dans certains livres l’équation (4.6) écrite comme E = m(v)c2 , avec une « masse dépendant de la vitesse m(v) = γm », mais cette formulation est source de confusion et doit être évitée5 : la masse est un invariant (ou scalaire) alors que γm est la composante de temps d’un quadrivecteur. Enfin, la seconde formule donnant la vitesse est indépendante de la masse : elle s’applique aussi aux photons de masse nulle et, pour les photons, énergie et impulsion sont liées par E = cp. Cette relation se déduit aussi de la première des équations (4.7) en posant m = 0. Dans un changement de référentiel d’inertie de vitesse v parallèle à Ox, la loi de transformation de ( E, p ) est calquée sur celle (2.7) de (t, x, y, z) v py = py E = γ ( E − v p x ) px = γ − 2 E + p x pz = pz . (4.8) c Tout comme les coordonnées perpendiculaires à la vitesse du changement de référentiel, les composantes de l’impulsion perpendiculaires à la vitesse sont inchangées. Nous allons déduire de ce qui précède un résultat majeur, la conservation de l’énergie relativiste (4.6) pour un système isolé. Pour ce faire, nous allons examiner une collision à deux corps générale, où deux particules initiales (1) et (2) donnent N particules finales (i)
(1) + (2) →
N
∑ ( i ).
i =3
La conservation de l’impulsion, que nous avons admise comme hypothèse de base, se traduit par
p1 + p2 =
N
∑ pi .
(4.9)
i =3
Mais les deux membres de l’équation précédente sont les parties spatiales d’un quadrivecteur, et si cette partie spatiale est conservée dans tout référentiel, alors la partie temporelle doit l’être également (figure 4.5), d’où la conservation de l’énergie E1 + E2 =
N
∑ Ei .
(4.10)
i =1
5 De même, on doit éviter « masse au repos » : une particule possède une masse, différente de zéro
ou nulle, point barre ! En 1939, Eugen Wigner a montré qu’en raison de l’invariance par rapport au groupe de Poincaré (combinaison du groupe des transformations de Lorentz et des translations), une particule était caractérisée par sa masse m et son spin (ou moment angulaire propre) j. Une particule massive, m = 0, possède 2j + 1 états de spin et une particule de masse nulle, m = 0, un seul état de spin (deux si la parité est conservée). Voir par exemple Le Bellac [2013], chapitre 19.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
59
y y
Wy W Vy θ
x
V Vx
O
V x = Wx
Wx
x
, non et de W F IGURE 4.5. Égalité de deux vecteurs. Si l’on veut avoir l’égalité des composantes de V seulement dans le référentiel original Oxy, mais aussi dans le référentiel Ox y obtenu par rotation d’un , et par conséquent Vy = Wy . =W angle θ , alors on doit avoir V
La somme des énergies initiales est égale à la somme des énergies finales. En relativité restreinte, nous avons une seule loi de conservation : celle de l’énergie-impulsion. Encadré 4.1. Conservation de l’énergie-impulsion.
Comme le résultat est d’une importance capitale, détaillons sa démonstration. Nous effectuons une transformation de Lorentz suivant Ox pour passer d’un référentiel R à un référentiel R , et nous écrivons la conservation (4.9) de la composante x de l’impulsion dans les deux référentiels :
R : p1x + p2x = R : p1x + p2x =
N
∑ pix ,
i =1 N
∑ pix .
i =1
Compte tenu de la loi de transformation des impulsions (4.8), nous obtenons de la seconde équation
N γv γv N γ( p1x + p2x ) − 2 ( E1 + E2 ) = γ ∑ pix − 2 ∑ Ei , c c i =3 i =1 d’où la conservation de l’énergie (4.10) en comparant avec la première équation.
60
Chapitre 4. Masse et énergie
Interprétons physiquement nos résultats, en commençant par examiner le lien avec la physique newtonienne, lorsque les vitesses sont faibles : v c. Dans ce cas, nous pouvons développer (4.6) en puissances de v2 /c2 E = mc2 +
v4 1 mv2 + termes en 4 . 2 c
Nous reconnaissons dans cette équation la forme standard mv2 /2 de l’énergie cinétique, ce qui justifie notre identification de E à l’énergie de la particule. Cependant, même pour une particule de vitesse nulle, il nous reste une énergie de masse E = mc2 , sans doute la formule la plus médiatisée de la physique. Cette formule suggère d’exprimer les masses des particules élémentaires ou des noyaux atomiques en MeV/c2 ou en GeV/c2 (1 MeV = 106 eV et 1 GeV = 109 eV), car le kilogramme est très mal adapté pour exprimer la masse d’un proton. Quelques ordres de grandeur sont utiles : masse de l’électron 0, 5 MeV/c2 , masse du proton 1 GeV/c2 . Une particule dont la vitesse est faible par rapport à la vitesse de la lumière, v c, est souvent appelée non relativiste. Cette définition dépend bien entendu de la précision disponible. Nous avonc vu dans la section 3.3 que la vitesse d’un sprinter pouvait être considérée comme relativiste, pourvu que les mesures de temps soient suffisamment précises. Le cas opposé est celui des particules dites ultra-relativistes, dont la vitesse est proche de celle de la lumière. Dans ce cas, avec v/c = 1 − ε, ε 1, l’énergie s’écrit 2 mc2 1 mc2 2 2 −1/2 E = mc (2ε − ε ) √ soit ε . 2 E 2ε Dans la section 1.4, nous avions donné la vitesse des électrons de l’anneau de collision LEP au CERN : v = 0, 999 999 999 983 c, soit ε 10−11 . Retrouvons cette valeur : l’énergie des électrons du LEP étant de 100 GeV, cela implique E/(mc2 ) 2 × 105 , car mc2 pour un électron vaut 0,51 MeV. On en déduit ε. Une particule dont la vitesse est proche de c, et donc ultra-relativiste, est telle que E mc2 et son énergie-impulsion se comporte pratiquement comme celle d’une particule de masse nulle. 4.3
Applications simples
Examinons quelques applications simples et d’intérêt pratique pour illustrer la signification de la conservation de l’énergie-impulsion.
1. Énergie de liaison. Considérons une particule A de masse M formée de deux particules A1 et A2 de masses respectives m1 et m2 , par exemple A = deutéron, LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
61
le noyau atomique du deutérium ou « hydrogène lourd », formé d’un proton et d’un neutron. Si la masse M est inférieure à la somme des masses m1 et m2 , alors la particule A ne peut pas se désintégrer en A1 + A2 . En effet, la conservation de l’énergie dans une éventuelle désintégration A → A1 + A2 d’énergies respectives E1 et E2 exigerait, dans le référentiel où la particule A est immobile, que Mc2 = E1 + E2 > (m1 + m2 )c2 . La différence EB = [m1 + m2 − M]c2 est l’énergie de liaison de la particule A. Dans l’exemple du deutéron nous avons : md = 1 875, 6 MeV/c2
m p = 938, 3 MeV/c2
mn = 939, 5 MeV/c2
et l’énergie de liaison vaut 1877, 8 − 1875, 6 = 2, 2 MeV : le deutéron est un noyau atomique stable, il ne peut pas se désintégrer en un proton et un neutron6 .
2. Désintégration du positronium. Le positronium (e+ − e− ) est une sorte d’atome d’hydrogène, où le proton est remplacé par l’antiparticule de l’électron, le positron e+ chargé positivement et de masse égale à celle de l’électron. L’énergie de liaison du positronium, environ 6,8 eV, est négligeable par rapport à l’énergie de masse de l’ensemble, qui est de l’ordre de 1 MeV. Le positronium est un état lié, stable vis-à-vis de la désintégration en un électron et un positron. En revanche, il se désintègre en deux ou trois photons ; nous considérons la désintégration la plus simple, celle en deux photons. Dans un référentiel où le positronium est au repos, la conservation de l’énergie impulsion implique 2me c2 = E1 + E2
0 = p1 + p2 ,
où E1 et E2 sont les énergies des photons, p1 et p2 leurs impulsions, et me la masse de l’électron. Compte tenu de la relation E = cp (4.7) valable pour un photon, l’énergie de chacun des photons est me c2 et leur impulsion me c en valeur absolue. Les photons d’énergie me c2 511 keV d’annihilation des positrons sont détectés en tomographie électron-positron (PET scan), et ils jouent aussi un rôle important en astronomie γ. Suivant une terminologie datée et à éviter, « la matière a été transformée en rayonnement ». . ., mais il n’y a aucune raison d’exclure les photons de la « matière ».
3. Réaction de fission. Dans une fission, qui est la réaction à la base de l’énergie nucléaire, un noyau atomique de masse M possédant A = A1 + A2 nucléons 6 En
fait, nous avons seulement prouvé la stabilité du deutéron vis-à-vis du mode de désintégration en un proton + un neutron. Le neutron dans le deutéron pourrait se désintégrer par radioactivité β en proton + électron + neutrino, et c’est ce que fait un neutron libre, mais md < 2m p + me + mν , et le deutéron est également stable pour ce mode de désintégration, et donc stable tout court.
62
Chapitre 4. Masse et énergie
(protons et neutrons), se désintègre en deux noyaux plus légers ayant respectivement A1 et A2 nucléons, de masses m1 et m2 ainsi que quelques neutrons de masse mn , disons deux neutrons pour fixer les idées. La conservation de l’énergie s’écrit E = E1 + E2 + ε 1 + ε 2 , où E est l’énergie du noyau initial, (E1 , E2 ) celles des noyaux finaux et (ε 1 , ε 2 ) celles des neutrons. Si nous nous plaçons dans un référentiel où le noyau initial est au repos, l’énergie initiale est E = Mc2 , et pour que la désintégration soit possible, nous devons assurer la conservation de l’énergie Mc2 = E1 + E2 + ε 1 + ε 2 > (m1 + m2 + 2mn )c2 . L’énergie disponible dans la fission, qui est convertie en énergie cinétique des particules émises7 , est la différence [ M − (m1 + m2 + 2mn )]c2 . C’est cette énergie qui se retrouve sous forme de chaleur et permet de chauffer l’eau d’un réacteur nucléaire. Les neutrons produits dans la fission sont utilisés pour entretenir la réaction en chaîne : le noyau qui subit la fission est par exemple un noyau d’uranium-235 qui a absorbé au préalable un neutron. Les noyaux provenant de la fission ne sont pas de masse égale, le nombre de nucléons vaut typiquement 95 pour le premier et 140 pour le second. De plus, ces noyaux ne sont pas stables, ils sont radioactifs, et l’énergie dégagée par cette radioactivité, qui est une fraction de l’énergie de masse initiale, continue à chauffer le réacteur même après l’arrêt de celui-ci, ainsi que le combustible nucléaire usagé stocké dans des piscines, un phénomène aujourd’hui bien connu suite aux déboires de la compagnie d’électricité japonaise TEPCO à Fukushima.
4. Énergie thermonucléaire. Dans une étoile comme le Soleil, l’énergie vient de la production de noyaux d’hélium-4 à partir de protons et d’électrons. L’ensemble des réactions qui participent au processus est complexe et est appelé cycle de Bethe, mais le résultat net est que 4 protons + 2 e´ lectrons → 1 noyau d h´elium + 2 neutrinos 4
Les neutrinos s’échappent dans l’espace en emportant en moyenne 0, 25 MeV. La somme des masses des quatre protons et des deux électrons est de 3 754, 2 MeV/c2 , la masse du noyau d’hélium-4 est de 3 727, 1 MeV/c2 et l’énergie dégagée disponible est de 26,9 MeV par noyau d’hélium-4. La production des atomes d’hélium dégage donc de l’énergie, l’énergie thermonucléaire. Une fraction 27/3 700 0, 7 % de l’énergie de masse est convertie en d’autres formes d’énergie, principalement de l’énergie cinétique, qui se traduit par la production 7 Une
petite partie de cette énergie s’échappe du réacteur sous forme de neutrinos.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
63
de chaleur. L’énergie de 26,9 MeV par atome est proche de l’énergie de liaison du noyau d’hélium-4, la différence entre la somme des masses des deux protons et des deux neutrons et la masse du noyau d’hélium, qui est de 28,3 MeV. Nous pouvons déduire de cette discussion une estimation de la durée de vie du Soleil, en admettant que 10 % de sa masse totale de 2 × 1030 kg est convertie en énergie avec un rendement de 0, 7 %. On trouve que la quantité totale d’énergie produite pendant la durée de vie du Soleil est de 1, 3 × 1044 J. Comme la luminosité du Soleil, c’est-à-dire la puissance rayonnée dans tout l’espace, est de 3, 85 × 1026 W, sa durée de vie est de 1, 3 × 1044 = 3, 4 × 1017 s 1010 ann´ees, 3, 85 × 1026 soit environ 10 milliards d’années. Comme le Soleil a été formé il y a 5 milliards d’années environ, il est à mi-parcours.
5. Production des antiprotons. Les antiprotons, antiparticules des protons, ont été produits pour la première fois dans un accélérateur de particules, en bombardant une cible de protons fixe dans le laboratoire avec des protons accélérés (figure 4.6). Quelle est l’énergie minimale nécessaire pour produire des antiprotons, ou énergie du seuil de la réaction ? La réaction utilisée est (figure 4.6a) p + p → p + p + ( p + p ), où p représente un proton et p un antiproton. Si m est la masse du proton, égale à celle de l’antiproton, l’énergie de masse minimale du second membre est 4mc2 , et un raisonnement naïf conclurait que l’énergie cinétique des protons accélérés doit être de 2mc2 au minimum, soit environ 2 GeV. Mais ce raisonnement est incorrect, car il ne conserve pas l’impulsion : l’impulsion du membre de gauche
initial
cm
−
cm
final
(a) Référentiel de la cible fixe
(b) Référentiel du centre de masse
F IGURE 4.6. Production d’antiprotons au seuil de la réaction. Les protons sont représentés en bleu et les antiprotons en rouge. (a) Dans le référentiel du laboratoire, où la cible est fixe. (b) Dans le référentiel du centre de masse où, au seuil de la réaction, l’ensemble des protons et des antiprotons est au repos.
64
Chapitre 4. Masse et énergie
de la réaction est celle du proton accéléré et elle est différente de zéro, alors que nous avons supposé les quatre particules au repos dans le second membre, et donc une impulsion totale nulle. Pour raisonner correctement, il faut se placer dans le référentiel du centre de masse (figure 4.6b), où l’impulsion initiale globale est nulle, et où on peut effectivement produire les quatre particules finales au repos, avec une énergie de 4mc2 . Pour calculer l’énergie minimale, nous utilisons le fait que la combinaison formée avec l’énergie et l’impulsion totales, 2 − c2 p2 , est un invariant de Lorentz : avec E 2 Etot tot = mc + E, où E est l’énergie tot 2 2 2 2 4 totale du proton accéléré, et c ptot = E − m c , on obtient 2 − c2 p2tot = 2mc2 ( E + mc2 ). Etot
La réaction peut se produire si cette quantité est supérieure à (4mc2 )2 , ce qui correspond pour les protons accélérés à une énergie totale de E = 7mc2 , et donc à une énergie cinétique de 6mc2 , environ 6 GeV, et non pas 2 GeV. La conclusion de cette analyse est que l’on perd beaucoup d’énergie en utilisant une cible fixe, et c’est la raison pour laquelle les accélérateurs modernes les plus performants sont des anneaux de collision, où deux faisceaux de particules sont envoyés l’un sur l’autre en venant de directions opposées, et où les collisions se produisent dans le centre de masse. Si l’on avait voulu obtenir la même énergie que celle du LHC, 2 × 4 TeV (1 TeV = 1012 eV) dans le centre de masse avec une cible de protons fixe, il aurait fallu accélérer les protons à 32 000 TeV au lieu de 4 TeV. 4.4
Bibliographie
La déduction de la forme relativiste de l’impulsion dans l’annexe 11.3 suit celle de Taylor et Wheeler [1963].
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
65
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
5 Principe d’équivalence et relativité générale Dans ce chapitre, je quitte la relativité restreinte pour aborder la relativité générale. L’exposé des trois dernières sections demande une certaine attention, car cette théorie n’est pas d’un accès immédiat, et je souhaite donner au lecteur un peu plus qu’un aperçu superficiel. La section 5.1 énonce le principe d’équivalence, l’impossibilité de faire localement la différence entre une force de gravitation et une force d’inertie, et la section 5.2 décrit une application au GPS. La section 5.3 introduit le concept de courbure dans le cas de la sphère, et la section 5.4 généralise ce concept au cas de l’espace-temps, en s’appuyant sur un exemple emprunté à la physique newtonienne. La section 5.5 introduit qualitativement la métrique sur l’espace-temps et les équations d’Einstein. Enfin, le cas de la symétrie sphérique est examiné dans la section 5.6, où la métrique de Schwarzschild est écrite explicitement et appliquée au décalage vers le rouge gravitationnel.
5.1
Principe d’équivalence
En 1915, la relativité générale fut l’aboutissement de dix années d’efforts intenses déployés par Einstein, travaillant pratiquement seul. C’est une théorie classique (c’est-à-dire non quantique), en fait une théorie d’un champ classique, le champ de gravitation. La relativité générale prend comme point de départ le principe d’équivalence qu’Einstein qualifia en 1907 « d’idée la plus heureuse de sa vie ». La validité de ce qui va suivre dépend de façon cruciale de
D
D
g h
h F = −mg
(a)
F = −mg
(b)
S
S
(c)
(d)
F IGURE 5.1. (a) Une fusée éloignée de toute influence est accélérée vers le haut avec une accélération g : l’astronaute est soumis à une force F = −mg dirigée vers le bas. (b) La fusée est posée verticalement sur la Terre : l’astronaute est aussi soumis à une force F = −mg dirigée vers le bas. (c) Émission et réception de photons dans la fusée accélérée. La fréquence ν reçue par le détecteur D est inférieure à la fréquence d’émission ν. (d) Émission et réception de photons dans une fusée posée verticalement sur la Terre. À nouveau, la fréquence ν reçue par D est inférieure à la fréquence d’émission ν.
l’égalité de la masse d’inertie mi et de la masse gravitationnelle m g examinée dans la section 2.1. Comme nous supposons l’égalité des deux types de masse, nous utilisons la notation unique : m = mi = m g . Le principe d’équivalence1 sera introduit à l’aide de l’« expérience théorique » suivante. Un astronaute se trouve dans une fusée située dans l’espace intergalactique, loin de toute influence extérieure. Au temps t = 0, les moteurs de la fusée sont allumés et la fusée est accélérée, avec une accélération égale à celle de la pesanteur g (g = 9, 81 m/s2 , figure 5.1a). L’astronaute est propulsé vers la base de la fusée car, par rapport à la fusée, ou plus précisément par rapport à un référentiel lié à la fusée, il est soumis à une force d’inertie F = −mg, où m est sa masse et le signe moins indique une orientation vers la base de la fusée. Plaçons maintenant ce même astronaute dans une fusée immobile posée verticalement à la surface de la Terre (figure 5.1b), et supposons que le plancher se dérobe sous ses pieds. L’astronaute va chuter vers la base de la fusée, car il est soumis à la force de pesanteur (ou de gravitation) F = −mg. L’astronaute éprouve exactement la même sensation dans les 1 On
définit souvent le « principe d’équivalence » comme l’affirmation de l’égalité de la masse d’inertie et de la masse gravitationnelle. La version de ce principe exposée ci-dessous est en fait une conséquence de cette égalité. Pour un exposé plus détaillé et une revue des vérifications expérimentales, le lecteur peut se reporter à l’article grand public de Giulini [2014], au livre de Poisson et Will [2014], chapitre 5, ou à la revue spécialisée de Will [2014].
68
Chapitre 5. Principe d’équivalence et relativité générale
deux cas : c’est le principe d’équivalence. Sans regarder à l’extérieur de la fusée, l’astronaute est incapable de faire la distiction entre un champ de gravitation et une accélération uniformes2 , indépendants du point d’espace et du temps. Si l’accélération ou le champ de gravitation ne sont plus uniformes, alors l’astronaute observera des effets de marée (section 2.1). En résumé, le principe d’équivalence énonce que dans une région de l’espace-temps suffisamment petite pour que les effets de marée soient négligeables, aucune expérience ne permet de de faire la distiction entre un référentiel accéléré et un champ de gravitation. Il existe une ressemblance superficielle entre les deux principes de relativité, l’équivalence des référentiels d’inertie pour la relativité restreinte et le principe d’équivalence pour la relativité générale : dans les deux cas, l’astronaute doit regarder à l’extérieur de la fusée pour évaluer sa situation. En fait, les deux principes sont fondamentalement différents : le premier est un principe d’invariance (ou de symétrie), il énonce l’invariance des lois de la physique dans un changement de référentiel d’inertie ; le second énonce une propriété des forces de gravitation. Comme l’écrit Thibault Damour « Le principe de relativité générale a un statut physique différent du principe de relativité restreinte. Le principe de relativité restreinte est un principe de symétrie de la structure de l’espace-temps, qui affirme que la physique est la même dans une classe particulière de référentiels, et que donc certains phénomènes « correspondants » se déroulent de la même façon dans des référentiels différents. En revanche, le principe de relativité générale est un principe d’indifférence : les phénomènes ne se déroulent en général pas de la même façon dans des systèmes de coordonnées différents, mais aucun des systèmes de coordonnées n’a de statut privilégié par rapport aux autres. » Le principe d’équivalence, contrairement au principe de relativité, n’est donc pas un principe de symétrie. Une traduction mathématique des énoncés ci-dessus est donnée dans l’annexe 11.4. Le principe d’équivalence s’applique non seulement aux objets massifs, mais aussi à la lumière ou, de façon équivalente, aux photons, et il en découle deux résultats importants. Toujours à l’intérieur de notre fusée, imaginons une source S de photons uniques située à l’altitude z = 0 et émettant vers le haut des photons de fréquence ν (figure 5.1, c et d). Ces photons sont enregistrés par un détecteur D situé à l’altitude z = h, capable de mesurer leur fréquence. 2 Un
champ de gravitation ou une accélération uniformes dans l’espace et le temps sont évidemment des idéalisations non physiques. Il faut donc considérer des régions de l’espace-temps suffisamment petites et remplacer « uniforme » par « localement uniforme ». LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
69
Un photon met un temps t = h/c pour atteindre le détecteur. Dans le cas de la fusée accélérée, la vitesse de la fusée, que l’on prend initialement nulle à t = 0, est au temps t de v = gt = gh/c. Le photon voit alors un détecteur qui s’éloigne avec cette vitesse v, et la fréquence ν mesurée par le détecteur sera, en raison de l’effet Doppler (3.5) que nous utilisons ici sous sa forme simplifiée, égale à v gh = ν 1− 2 . (5.1) ν = ν 1− c c Nous avons supposé t suffisamment petit pour pouvoir négliger les effets de la relativité restreinte, ce qui nous a permis d’utiliser la formule simplifiée de l’effet Doppler3 . La condition nécessaire est que la vitesse acquise par la fusée pendant le temps t soit très petite par rapport à la vitesse de la lumière : gt = gh/c c, soit gh/c2 1. Les corrections de relativité restreinte dans (5.1) sont alors négligeables. Le principe d’équivalence nous dit que le même effet doit être observé dans la fusée immobile sur la Terre : la fréquence du photon détecté est plus faible que celle du photon émis. Cet effet est le décalage vers le rouge gravitationnel, souvent appelé par les relativistes « redshift gravitationnel » car « décalage vers le rouge gravitationnel » est vraiment long à dire ou à écrire ! Cela veut dire (figure 5.2) que les horloges situées à basse altitude retardent par rapport à celles situées à une altitude plus élevée. Cet effet a été vérifié expérimentalement pour la première fois en 1960 par Pound et Rebka sur une hauteur de 20 m. Il existe aujourd’hui des vérifications bien plus précises, et les horloges atomiques optiques que nous avons introduites au chapitre 3 permettent de déceler un décalage entre deux horloges dont l’altitude diffère de 30 cm (figure 5.3). Soit te et te les dates d’émission de deux signaux consécutifs par l’horloge d’altitude inférieure sur la figure 5.2 ; ces signaux sont reçus aux dates tr et tr par l’horloge d’altitude supérieure. En raison de l’invariance par translation de temps, on doit avoir tr − te = tr − te soit tr − tr = te − te = Δt. Ce résultat semble avoir comme conséquence Δt = T = T (voir la figure 5.2), en contradiction avec le décalage vers le rouge gravitationnel T > T et l’expérience. En fait, il n’en est rien, car Δt est un intervalle de temps coordonnée, alors que T et T sont des intervalles de temps propre. Ce que montre notre raisonnement, c’est que la relation entre le temps propre et le temps coordonnée dépend de l’altitude, en contradiction avec la métrique de Minkowski (1.5), 3 Il est possible d’effectuer un calcul exact de relativité restreinte pour une fusée rigide uniformément accélérée : voir par exemple Gourgoulhon [2010], chapitre 12. Le résultat exact, obtenu sans utiliser explicitement l’effet Doppler, est alors ν = ν(1 + gh/c2 )−1 , ce qui coïncide avec (5.1) mais uniquement lorsque gh/c2 1.
70
Chapitre 5. Principe d’équivalence et relativité générale
t
T 0 + 3T
T 0 + 2T 3T
tr
T0 + T
2T
te tr
T
T 0 = h/c
te 0 z=0
z=h
z
F IGURE 5.2. L’horloge à l’altitude z = 0 (rouge) émet des signaux aux temps 0, T , 2T . . . L’horloge à l’altitude z = h (bleu) les reçoit aux temps T0 = h/c, T0 + T , T0 + 2T . . ., avec T = T (1 + gh/c2 ). Pour un observateur à l’altitude z = h, l’horloge à z = 0 retarde. On notera que les temps propres mesurés en z = 0 et z = h le sont par deux horloges différentes, alors que t est un temps coordonnée unique.
F IGURE 5.3. Mesure du décalage gravitationnel vers le rouge par une horloge atomique optique. L’horloge de droite est plus haute de 30 cm que celle de gauche, et elle avance par rapport à cette dernière. Les points bleus correspondent à l’horloge de gauche, les points rouges à celle de droite. D’après Chou et al. [2010]. Courtoisie de David Wineland et du NIST.
qui est une métrique de l’espace-temps plat, parce que les coefficients de (Δt)2 et (Δr )2 dans (1.5) sont indépendants du point d’espace-temps. Comme dans notre cas Δr = Δz = 0, le résultat T = T implique que le coefficient de (Δt)2 dépend du point d’espace-temps et, par conséquent, que l’espace-temps est courbe.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
71
Une deuxième conséquence du principe d’équivalence est qu’un rayon lumineux qui se propage horizontalement en l’absence de gravitation est dévié vers le bas dans le champ de pesanteur terrestre : la lumière « tombe » ! Pour le voir, il suffit d’examiner la propagation de ce rayon dans la fusée accélérée (figure 5.4) : pendant que le photon traverse la fusée horizontalement, celle-ci s’est déplacée verticalement et le point d’impact du photon situé à droite est plus proche de la base de la fusée que le point d’entrée situé à gauche.
A
B
A B d
(a)
d
(b)
F IGURE 5.4. « Chute » de la lumière dans le champ de pesanteur terrestre. (a) Le rayon lumineux, qui suit une droite horizontale dans un référentiel en chute libre, est observé dans la fusée accélérée. Pendant que le photon traverse la fusée de A en B, celle-ci se déplace verticalement. Le point d’impact B du photon sur la fusée dessinée en tiretés est indiqué par un point épais. (b) Le même rayon est observé dans la fusée posée verticalement sur la Terre. La distance d est identique dans les deux figures.
5.2
Application au GPS
Pour expliquer le principe du GPS, nous allons partir d’un exemple simplifié où l’observateur peut se déplacer uniquement sur une droite (figure 5.5). Deux émetteurs de signaux électromagnétiques envoient à partir de satellites des signaux codés, de sorte que l’observateur, lorsqu’il reçoit le signal, peut obtenir à la fois l’information sur l’instant t A où le signal a été émis et sur la position x A de l’émetteur au moment de cette émission. Si l’observateur disposait d’une horloge atomique, il pourrait mesurer exactement le temps t de réception du signal, et il en déduirait alors sa position x en fonction tout simplement du
72
Chapitre 5. Principe d’équivalence et relativité générale
ct
U
SB
SA (ct, x)
(ctB, xB) (ctA, xA)
x
F IGURE 5.5. Explication simplifiée du GPS. Les lignes d’univers S A et S B des deux satellites sont les droites bleues, celle de l’observateur U est la courbe verte, et les lignes d’univers des photons sont représentées par des tirets rouges.
temps mis par la lumière pour voyager de l’émission en x A à la réception en x x − x A = c ( t − t A ). Mais ce n’est évidemment pas très commode de transporter avec soi une horloge atomique, par exemple dans une randonnée en montagne ! L’horloge du récepteur GPS n’est pas assez précise pour une mesure directe de la distance ( x − x A ) au point d’émission x A , mais on s’en sort en utilisant deux satellites, car dans ce cas on dispose de deux équations pour deux inconnues, t et x. Les droites de lumière issues des deux émetteurs se croisent au point d’espacetemps (t, x ) ; un calcul simple donne ces deux inconnues, et en particulier la position recherchée en fonction des instants d’émission t A et t B et des positions correspondantes x A et x B x=
1 [c(t B − t A ) + ( x B + x A )]. 2
(5.2)
Si l’on passe d’un problème à une dimension (une droite) à un problème à trois dimensions de notre espace ordinaire, il faudra quatre satellites au lieu de deux pour déterminer la position d’un point sur la Terre, à savoir sa latitude, sa longitude et son altitude. C’est une constellation de 24 satellites qui envoie les signaux codés, de telle sorte qu’un point sur la Terre ait toujours en vision directe au moins quatre de ces satellites (figure 5.6). La position des satellites est connue à chaque instant par rapport à un référentiel dont l’origine est choisie au centre
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
73
F IGURE 5.6. Constellation de satellites GPS.
de la Terre. Le repérage à chaque instant de la position exacte des satellites est un probème simple en théorie, mais complexe en pratique, et qui sort du cadre de cet ouvrage. Quelle est la précision requise sur les horloges pour obtenir la position à un mètre près ? En une nanoseconde, la lumière parcourt 30 cm, et il faut donc limiter la dérive δt sur le temps à moins de 3 ns. La dérive des horloges atomiques à rubidium embarquées sur un intervalle de temps t est de l’ordre de δt/t 10−13 . On atteint une dérive δt = 3 ns en 10 heures environ, et on doit donc régler les horloges des satellites au minimum toutes les 10 heures. Cela se fait au moyen d’un réseau d’horloges atomiques disposées sur la Terre, qui sont synchronisées entre elles et définissent un Temps Atomique International (TAI). Mais il faut en plus tenir compte de divers effets qui rendraient le GPS inopérant s’ils n’étaient pas corrigés. Nous allons estimer ci-dessous les dérives des horloges dues à la relativité. L’examen des effets relativistes sur les horloges du GPS nécessite un minimum de connaissances de base sur les orbites des satellites, qui nous seront aussi utiles dans les chapitres suivants. Ces orbites sont circulaires à une excellente approximation, et la théorie des orbites circulaires est élémentaire. Tout se passe comme si la masse M de la Terre était concentrée en son centre : le satellite de masse m est soumis de la part de la Terre à une force de gravitation attractive
74
Chapitre 5. Principe d’équivalence et relativité générale
r RT
F IGURE 5.7. Orbite circulaire de rayon r pour un satellite. R T est le rayon de la Terre.
GMm/r2 , où r est le rayon de l’orbite (figure 5.7) et G la constante de gravitation, G = 6, 67 × 10−11 N.m2 /kg2 . D’après l’équation fondamentale de la dynamique, cette force est égale à l’accélération centripète v2 /r multipliée par m, où v est la vitesse du satellite sur son orbite. On en déduit la vitesse v et la période T mv2 GMm GM 2πr r3 T= . (5.3) = =⇒ v = = 2π 2 r r r v GM La quantité Φ = − GM/r est le potentiel gravitationnel de la Terre. La seconde des équations ci-dessus contient la troisième loi de Kepler : la période est proportionnelle à la puissance 3/2 du rayon de l’orbite. On distingue deux types de corrections relativistes au GPS : la première vient de la relativité restreinte, la seconde de la relativité générale. Examinons d’abord l’effet de la relativité restreinte, la dilatation du temps. Les satellites du GPS ont une période de 12 heures, une orbite de rayon r = 4, 16 fois le rayon de la Terre, soit r = 26 561 km, et d’après (5.3) une vitesse v 3, 87 km/s, telle que v/c 1, 3 × 10−5 , d’où un facteur de Lorentz γ − 1 8, 5 × 10−11 qui fixe la dilatation du temps pour une horloge voyageant dans le satellite. Si aucune correction n’est appliquée, on atteint la limite fatidique des 3 ns en 30 s ! L’autre effet relativiste a pour origine la gravitation. Les horloges des satellites sont soumises aux potentiels de gravitation de la Terre et du Soleil. L’effet du potentiel du Soleil est plus important en valeur absolue que celui de la Terre, mais ce potentiel est approximativement constant sur l’orbite, et donne une correction négligeable. Le potentiel de la Terre n’est pas exactement sphérique, car la Terre est un ellipsoïde aplati, et non une sphère. La correction correspondante est faible et elle est facilement prise en compte dans le calcul de l’orbite. Reste la correction la plus importante, celle qui vient de la différence de potentiel gravitationnel entre la surface de la Terre et l’orbite. Si l’on devait équiper une étoile à
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
75
neutrons d’un système GPS – en admettant que l’on puisse survivre aux conditions extrêmes régnant à la surface d’une telle étoile ! – le calcul des corrections serait très complexe. Heureusement, la gravité à la surface de la Terre est faible, un énoncé que nous préciserons quantitativement dans la section 5.6, et des approximations sont possibles. Nous avons vu que la correction δt sur un intervalle de temps t entre l’altitude h = 0 et l’altitude h vaut δt/t = gh/c2 , et ( gh − g × 0) n’est autre que la différence de potentiel gravitationnel entre ces deux altitudes. Dans notre cas, δt/t sera donné par la différence des potentiels gravitationnels à la surface de la Terre, à une distance RT de son centre et à une distance r, divisée par c2 1 δt GM 1 = 2 − . (5.4) t c RT r Le résultat est correct, mais le raisonnement s’appuie sur une généralisation non démontrée à ce stade du principe d’équivalence que nous avons énoncé uniquement pour des forces de gravitation uniformes, ce qui n’est pas le cas ici. Le raisonnement correct sera donné dans la section 5.6. Une estimation numérique montre qu’il suffit maintenant de 6 secondes pour que le GPS soit déréglé ! Cependant, il est malcommode de comparer directement comme dans (5.4) une horloge sur la surface de la Terre et une horloge dans un satellite : en effet, un point sur la surface de la Terre ne peut pas être choisi comme origine des coordonnées d’un référentiel d’inertie, en raison de la rotation de la Terre sur elle-même. On passe par un référentiel intermédiaire ayant pour origine le centre de la Terre, auquel on peut, à une excellente approximation, associer un référentiel d’inertie dont les axes ont une direction fixe par rapport aux étoiles, que l’on appelle système de référence céleste géocentré. Tous les mouvements, celui d’un point sur la Terre comme celui de l’horloge d’un satellite, seront repérés par rapport à ce référentiel. Dans ces conditions, on montre que le temps propre t mesuré dans ce référentiel d’inertie à la surface de la Terre est donné en fonction du temps propre τ d’un satellite par t
3 GM 1+ 2 rc2
τ avec
3 GM 3 v2 = 2, 5 × 10−10 . 2 rc2 2 c2
(5.5)
Cette formule tient compte des deux effets, dilatation du temps et gravitation, qui peuvent être combinés dans une formule unique car la vitesse intervenant dans la dilatation du temps se calcule en fonction de G et de M d’après l’équation (5.3). Les expériences de Vessot et Levine [1979] ont permis de vérifier la prédiction théorique du décalage vers le rouge gravitationnel avec une précision de
76
Chapitre 5. Principe d’équivalence et relativité générale
7 × 10−5 . Les horloges atomiques à atomes froids du projet ACES (Atomic Clock Ensemble in Space) devraient permettre de porter cette précision à 2 × 10−6 en 2016. Nous avons distingué les effets dus à la relativité restreinte de ceux dus à la gravitation, mais remarqué qu’ils n’étaient pas vraiment indépendants dans la mesure où la vitesse du satellite est fixée par la force de gravitation. Cette distinction est possible dans une situation de gravité faible mais, dans une situation de gravité forte, on ne pourra pas séparer les deux effets, et la relativité générale va les traiter globalement. Bien sûr, il peut arriver que les vitesses soient proches de c avec une gravitation négligeable, par exemple si l’on traite un problème de physique des particules élémentaires. Mais dans une situation de gravité forte, étant donné que GM/(rc2 ) ∼ (v/c)2 , les deux effets seront a priori indissociables. 5.3
Espaces courbes
Le principe d’équivalence, tel que nous venons de l’énoncer, est limité aux situations où le champ de gravitation est constant, ou varie très lentement. Nous pouvons par exemple affirmer qu’un rayon lumineux est courbé par la gravitation (figure 5.4), mais nous ne pouvons pas déduire du seul principe d’équivalence le calcul de la déviation d’un rayon lumineux par une étoile. Il est nécessaire d’aller au-delà de ce principe et de faire des hypothèses supplémentaires pour établir une véritable théorie de la gravitation. La relativité générale relie gravitation et courbure de l’espace-temps : dans cette théorie, la gravitation n’est pas une force, mais une propriété géométrique de l’espacetemps. Cependant, on doit noter qu’il existe des théories autres que la relativité générale, comme la théorie dite de Brans-Dicke (due en fait à Jordan et Fierz dans un travail datant des années 1930), qui sont compatibles avec le principe d’équivalence, mais semblent contredites par l’expérience. Avant de plonger dans l’espace-temps, nous devons introduire la notion de courbure, ce que nous allons faire dans le cas le plus simple, celui de la sphère. Un point sur une sphère de rayon r peut être repéré par sa latitude et sa longitude : voir la figure 5.8a, où la latitude est notée θ et la longitude φ. La longitude varie entre 0 et 2π, mais, contrairement aux géographes, les mathématiciens la font croître d’Ouest en Est. La latitude est aussi définie de façon un peu différente de la convention habituelle : la latitude θ varie de 0 à π, elle vaut 0 au pôle Nord, π/2 à l’équateur et π au pôle Sud ; en fait, cette définition est celle de la colatitude. Prenons sur la sphère de rayon r deux points voisins, un point A de coordonnées (θ, φ) et un autre point B de coordonnées θ + Δθ, φ + Δφ. On a aussi porté sur la figure 5.8b les points C de coordonnées LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
77
Pôle Nord r sin H
C
A
A B D
´equateur Pôle Sud (a)
(b)
F IGURE 5.8. (a) Coordonnées θ et φ sur une sphère de rayon r. Le rayon horizontal H A a pour longueur H A = r sin θ . On a également représenté deux vecteurs tangents, l’un eθ tangent à un méridien et l’autre eφ tangent à un parallèle. Ces deux vecteurs définissent le plan tangent à la sphère au point A. (b) Rectangle ACBD de côtés AC = r sin θ Δφ et AD = r Δθ .
(θ, φ + Δφ) et D de coordonnées (θ + Δθ, φ). Si Δθ et Δφ sont suffisamment petits, le quadrilatère ACBD est approximativement un rectangle : pour le voir, il suffit d’imaginer que la sphère est la Terre et que les distances AC et AD sont de quelques mètres : à une excellente approximation, nous pouvons admettre que nous traçons le quadrilatère sur un plan, qui est en fait le plan tangent à la sphère au point A (figure 5.8). C’est exactement la procédure suivie lorsque l’on dessine la carte d’une région sur le plan tangent à la Terre au centre de cette région. Si celle-ci n’est pas trop étendue, la courbure de la Terre peut être négligée. Mathématiquement, il faut d’ailleurs toujours passer par ce plan tangent : on ne peut pas joindre deux points sur la sphère par un vecteur. La sphère n’est pas un espace affine et les vecteurs sont définis uniquement dans les plans tangents. Dans la figure 5.8, le plan tangent au point A est défini par deux vecteurs tangents respectivement à un méridien et à un parallèle, eθ et eφ . La distance AD est donnée par rΔθ et AC par r sin θΔφ : en effet, le rayon du cercle horizontal tracé sur la sphère à la latitude θ est r sin θ. La distance AB est donnée par le théorème de Pythagore AB = 78
AC2
+
AD2
=r
(Δθ )2 + sin2 θ (Δφ)2 .
(5.6)
Chapitre 5. Principe d’équivalence et relativité générale
Cette équation définit une distance ou, en termes plus mathématiques, une métrique sur la sphère. La distance au carré (Δs)2 entre les deux points voisins A et B est
(Δs)2 = r2 (Δθ )2 + sin2 θ (Δφ)2 = r2 ΔΩ2 .
(5.7)
L’équation précédente définit ΔΩ2 , dont nous nous servirons dans la section 5.5. Si nous joignons deux points quelconques A et B sur la sphère, pas nécessairement voisins, par une courbe continue, nous obtiendrons la distance entre ces deux points en décomposant la courbe en segments suffisamment petits pour que (5.6) s’applique et en additionnant tous ces segments. Une notion importante sur une surface courbe est celle de géodésique : une géodésique est une courbe qui minimise la distance entre deux points A et B sur cette surface. Dans le cas d’une sphère, les géodésiques sont les grands cercles : étant donné deux points A et B sur la surface de la sphère, on trace le cercle ayant pour centre celui de la sphère et qui passe par ces deux points (figure 5.9). Cette propriété est bien connue pour les vols long-courriers : Paris et Montréal sont approximativement à la même latitude, mais en décollant de Paris, le pilote ne met pas cap à l’Ouest, mais plutôt au Nord-Ouest, afin de suivre le grand cercle passant par les deux villes. Évidemment, les géodésiques de l’espace ordinaire sont des droites : la droite est le plus court chemin d’un point à un autre, mais on ne peut pas tracer de droite sur une sphère !
A
B O
F IGURE 5.9. Géodésique sur une sphère pour aller de A vers B : c’est le grand cercle de centre O passant par les points A et B. Pour se convaincre qu’il s’agit bien de la géodésique tracée sur la sphère entre A et B, il suffit d’appliquer une rotation amenant les points A et B sur l’équateur.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
79
La courbure R de la sphère est définie comme l’inverse du carré de son rayon : R = 1/r2 . Dans le cas d’une surface plus compliquée, la courbure peut varier d’un point à l’autre. On peut aussi avoir des surfaces à courbure négative, comme les surfaces en forme de selle de cheval (figure 5.10).
F IGURE 5.10. Surface à courbure négative en forme de selle de cheval.
Encadré 5.1. Courbure d’une sphère.
Pour déterminer la courbure de la sphère, les fourmis peuvent tracer sur sa surface un cercle dont le rayon tend vers 0, et obtenir la courbure R = 1/r2 par 6 circonf´erence . courbure = lim 1− 2π × rayon rayon→0 (rayon)2 Rayon et circonférence sont évidemment mesurés sur la surface de la sphère. Pour le lecteur qui souhaite démontrer cette équation : tracer avec le pôle Nord comme centre un cercle de rayon rθ de circonférence 2πr sin θ et utiliser pour θ → 0 sin θ θ −
1 3 θ . 6
La métrique est une caractéristique intrinsèque de la sphère, ou de toute autre surface courbe. On peut imaginer des fourmis mathématiciennes se déplaçant uniquement sur la surface d’une sphère, sans aucun accès à la dimension perpendiculaire à cette surface. En arpentant la surface, ces fourmis seraient capables de déterminer l’expression de la métrique ; en traçant un triangle formé de morceaux de géodésiques, elles s’apercevraient que la somme des trois angles est supérieure à 180o (ou π radians), et elles en déduiraient qu’elles ne vivent pas dans un espace euclidien. Elles seraient enfin capables de calculer en chaque point le rayon de courbure de leur espace (encadré 5.1) et de conclure qu’elles vivent sur une sphère de rayon r. Il faut bien comprendre que les propriétés de la sphère sont intrinsèques, et qu’il n’est pas nécessaire de l’imaginer comme une surface plongée dans un espace à trois dimensions. On peut accéder à toutes
80
Chapitre 5. Principe d’équivalence et relativité générale
ses propriétés sans jamais sortir de sa surface. Des humains devraient procéder comme les fourmis pour déterminer les propriétes géométriques de leur espace si la Terre était entourée d’un épais brouillard empêchant de voir au delà de quelques kilomètres en altitude, à supposer que la vie ait pu se développer dans ces conditions. De plus, contrairement aux fourmis sur une sphère idéale, ils seraient handicapés par le relief dans leur détermination de la géométrie de la Terre.
5.4
Déviation géodésique
Après cette digression sur la géométrie de la sphère, reprenons la gravitation dans l’espace-temps à quatre dimensions. Dans les sections 1 et 2, nous nous sommes limités au cas des faibles vitesses, v/c 1, et aux champs de gravitation peu intenses. Si nous voulons établir une théorie de la gravitation allant audelà de ces situations simples, il est nécessaire d’affiner notre approche. L’idée fondamentale d’Einstein est que la gravitation est d’origine géométrique : en dernière analyse, c’est la courbure de l’espace-temps qui régit les mouvements que nous attribuons à la gravitation. Une telle hypothèse est envisageable car, nous l’avons vu dans la section 2.1, le mouvement d’un objet soumis uniquement à des forces de gravitation est indépendant de sa masse, de sa structure interne ou de sa composition chimique. Avant de passer à la relativité générale, revenons un instant sur la théorie newtonienne. Reprenons le schéma de la figure 2.1c et examinons le mouvement de particules test placées en A et C, en calculant les accélérations de ces particules relativement au centre de masse, noté G afin d’éviter toute confusion avec la constante de gravitation. En d’autres termes, nous calculons les accélérations dans un référentiel en chute libre ayant G pour origine. La forme explicite des accélérations relatives est donnée dans l’encadré 5.2, où l’on utilise la physique newtonienne4 . Elles s’expriment en fonction des distances d A et dC des particules au centre de masse et de la distance r entre celui-ci et le centre de la Terre par a A (t) =
2GM d A (t) r3
aC ( t ) = −
GM d C ( t ). r3
(5.8)
On observe que ces accélérations dépendent de la direction : l’accélération est deux fois plus importante en valeur absolue pour la particule A que pour la particule C, et elle est de signe opposé. La particule A a tendance à s’éloigner de G , 4 Ce
résultat nous permettra aussi de décrire dans le chapitre 7 la chute d’un astronaute dans un trou noir.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
81
et la particule C à s’en rapprocher, conformément à la discussion qualitative de la section 2.2. Ce résultat est typique d’une loi tensorielle : la réponse (ici l’accélération) à une excitation extérieure (ici l’orientation de la droite reliant G à la particule test) dépend de la direction de cette dernière. Nous pouvons écrire l’équation (5.17), ou déviation géodésique en physique newtonienne, sous la forme schématique acc´el´eration relative = (tenseur) × (distance relative). Encadré 5.2. Effets de marée ou déviation géodésique dans une chute libre.
Examinons en physique newtonienne les forces de gravitation dans le cas de la figure 2.1c, en plaçant en A et C des particules test sans vitesse initiale ; rappelons qu’une particule test est une particule dont la masse est suffisamment faible pour que son influence sur le champ de gravitation soit négligeable. Soit r la distance du centre de gravité G au centre de la Terre, r = OG , et d la distance entre G et A : d = G A. La différence d’accélération a A entre la particule test placée en A et celle du centre de masse est, compte tenu de la distance (r − d) de A au centre de la Terre, aA =
GM r2
1 − 1 . (1 − d/r )2
Comme d/r 1, on utilise 1 2d 1+ , 2 r (1 − d/r ) d’où le résultat aA =
2GM d. r3
(5.9)
Dans le référentiel en chute libre vers le centre de la Terre, cette accélération est dirigée vers le bas : elle tend à écarter A et G . Un calcul analogue montre que la gravité tend à rapprocher C de G : aC = − a A /2, ce qui implique une contraction suivant la direction horizontale et une dilatation suivant la direction verticale. Si une personne est en chute libre verticale, l’accélération de ses pieds est plus grande que celle de son centre de masse, et celle de sa tête plus faible. Elle a tendance à être dilatée verticalement dans le référentiel de sa chute. Si elle étend les bras, l’accélération de ses mains est dirigée vers le centre de forces et elle a tendance à être contractée horizontalement. C’est un effet de marée typique.
82
Chapitre 5. Principe d’équivalence et relativité générale
Un tenseur est donc un objet capable de décrire une situation d’anisotropie, où la réponse à une excitation extérieure dépend de la direction de celle-ci5 . Revenons maintenant à l’espace-temps courbe de la relativité générale. Un espace-temps courbe n’est a priori ni affine, ni euclidien (voir la section 1.1), et il est différent de l’espace de Minkowski, souvent appelé espace-temps plat, la métrique de Minkowski (1.4) étant la métrique de l’espace-temps plat. Une première différence vient de ce que l’espace-temps de la relativité générale n’est pas un espace affine, et une combinaison de quatre coordonnées comme (ct, x, y, z) ne forme pas un vecteur. Les vecteurs ne sont définis que dans les plans tangents en chaque point et on ne peut pas additionner comme dans un espace affine (figure 1.1) des vecteurs définis en des points différents. Comme les vecteurs ne sont pas des objets définis globalement, mais seulement localement, nous utiliserons une notation de la forme (cΔt, Δx, Δy, Δz), en généralisant celle de la section précédente. Avec cette notation, la métrique de Minkowski (1.5) s’écrit c2 (Δs)2 = c2 (Δt)2 − (Δx )2 − (Δy)2 − (Δz)2 = c2 (Δt)2 − (Δr )2 .
(5.10)
Dans l’espace-temps courbe, cette métrique sera remplacée par une métrique plus complexe, qui définit une distance, et donc des géodésiques. En effet, comme sur la sphère, nous pouvons chercher à joindre deux points A et B de l’espace-temps par une géodésique. Pour fixer les idées, nous allons supposer que la ligne d’univers joignant A à B peut être parcourue par une particule massive ou un observateur. Mais attention ! Cette fois, les géodésiques vont maximiser la distance entre ces deux points, telle qu’elle est définie par la métrique de l’espace-temps courbe. Pourquoi doit-on rechercher un maximum ? La réponse est donnée par la figure 3.2 qui illustre le paradoxe des jumeaux. Le temps propre maximum est celui du jumeau sédentaire Bob, et toute ligne d’univers autre que celle de Bob joignant A et B conduit à un temps propre inférieur : c’est le jumeau sédentaire qui est le plus âgé au point B. Or Bob suit manifestement une géodésique de l’espace de Minkowski : son mouvement est le plus simple possible car il reste immobile, Δs = Δτ. Le cas des photons est différent de celui des particules massives, car les lignes d’univers des photons sont de longueur au carré nulle : les trajectoires des photons seront des géodésiques de longueur nulle. En l’absence de forces autres que de gravitation, et si le champ de gravitation est uniforme, le principe d’équivalence nous dit que les trajectoires des particules massives et des photons sont, dans l’espace, des droites parcourues à vitesse constante, et donc des droites dans l’espace-temps (section 2.5), pourvu 5 Un
exemple classique est le tenseur diélectrique : si l’on applique un champ électrique à un milieu diélectrique anisotrope, la réponse, dans ce cas la polarisation du milieu, dépend de l’excitation externe, à savoir l’orientation du champ électrique, et cette polarisation n’est pas en général parallèle au champ. LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
83
que l’on se place dans un référentiel en chute libre : autrement dit, dans l’espace de Minkowski d’un référentiel en chute libre, les géodésiques sont des droites. La relativité générale postule qu’un objet qui n’est soumis à aucune force autre que de gravitation est par définition en chute libre et suit une géodésique de l’espace-temps. Si la gravitation est uniforme, deux particules voisines suivront des lignes d’univers parallèles si leurs vitesses initiales sont identiques. Mais un champ de gravitation uniforme est une idéalisation, et cet énoncé ne peut être valable que dans une région limitée de l’espace-temps : on dit qu’il est valable localement. Si la gravitation est non uniforme, les lignes d’univers des deux particules vont se courber et progressivement diverger (comme pour les particules A et B de la figure 2.1c) ou converger (comme pour les particules C et D de cette même figure) sous l’effet de forces de marée. Pour écrire la généralisation de la déviation géodésique à l’espace-temps courbe, nous partons d’un observateur en chute libre qui examine le mouvement d’une particule test voisine, également en chute libre (figure 5.11). La séparation quadridimensionnelle δ(τ ) entre l’observateur et la particule est paramétrée par le temps propre τ de l’observateur, et l’accélération relative est calculée par rapport à ce temps propre. Seul le mouvement relatif de deux objets peut avoir un sens, il n’existe pas de référentiel absolu par rapport auquel repérer un mouvement ! Nous choisirons un système de coordonnées dont l’origine est centrée sur l’observateur, et tel que la métrique soit aussi proche que possible de celle de Minkowski, que nous appellerons référentiel localement inertiel (ou localement plat), défini mathématiquement dans l’encadré 5.3. Une façon explicite de construire les coordonnées d’un référentiel localement inertiel consisterait à échanger des photons pour
êτ δ
O ê1
P ê2
F IGURE 5.11. Déviation géodésique pour une particule test P vue par un observateur O. Tout comme le centre de masse G et les particules test A ou B de la figure 2.1c, l’observateur et la particule test suivent deux géodésiques de l’espace-temps.
84
Chapitre 5. Principe d’équivalence et relativité générale
mesurer temps et distances, en suivant la procédure expliquée dans la section 2.5. Nous choisissons l’axe des temps suivant la tangente à la géodésique parcourue par l’observateur et des axes de coordonnées d’espace orthogonaux qui généralisent ceux décrits dans la figure 2.9 se déplaçant parallèlement à euxmêmes. Dans un tel système de coordonnées6 , que nous appellerons référentiel en chute libre, la généralisation relativiste de la déviation géodésique newtonienne est (l’équation est écrite explicitement dans (11.11)) acc´el´eration relative = c2 × (tenseur de Riemann) × (s´eparation). Suivant la théorie établie par Riemann dans les années 1850, l’objet mathématique qui décrit en détail l’ensemble des propriétés de courbure d’un espace est précisément le tenseur qui porte son nom et peut être calculé à partir de la métrique. Qualitativement, une comparaison avec l’équation (5.9) montre que dans la situation de la figure 2.1, la courbure de l’espace-temps, à une distance r d’une masse M plus grande que le rayon de la distribution de masse, est de l’ordre de GM/(c2 r3 ), qui est bien l’inverse d’une longueur au carré7 . Dans le cas de l’espace-temps, le tenseur de Riemann est un objet mathématique quelque peu intimidant à la première rencontre, et même aux suivantes, un tableau de 256 fonctions en chaque point de l’espace-temps ! Heureusement, nous n’aurons pas à le manipuler explicitement. C’est un objet à quatre indices8 , qui sont notés conventionnellement par des lettres grecques λ, μ, ν . . . Par exemple, dans le cas de λ, la valeur λ = 0 désigne une composante de temps, λ = 1, 2, 3 des composantes d’espace, et notre fameux tenseur s’écrit Rσμλν : il n’épuise pas à lui seul l’alphabet grec, mais il en prend le chemin ! Ce tenseur semble avoir 44 = 256 composantes indépendantes mais, en raison de symétries, il en a « seulement » 20. Il est obtenu à partir de la métrique en utilisant des dérivées d’ordre 2 au maximum et une débauche de lettres grecques. Cela dit, si l’on passe sur son aspect un peu intimidant dû à la prolifération des indices, la relativité générale n’est pas une théorie conceptuellement très complexe, moins complexe par exemple que la chromodynamique quantique en physique des particules élémentaires, ce qui ne veut pas dire que la résolution ou même l’interprétation de ses équations ne pose pas parfois des problèmes redoutables en raison de leur non-linéarité. 6 On
peut donner un sens mathématique précis à ce choix de coordonnées, souvent appelées « coordonnées normales de Fermi » : voir la section 2.6 et la figure 2.9. 7 L’argument n’est pas dimensionnel, car par exemple 1/r2 ou ( GM )2 / (rc )4 ont aussi les dimensions de l’inverse d’une longueur au carré. 8 Deux indices seulement interviennent dans un référentiel en chute libre, car deux des indices sont identiques et égaux à l’indice du temps : voir l’annexe 11.5. Dans un référentiel quelconque, les quatre indices sont nécessaires pour écrire la déviation géodésique.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
85
Pour conclure cette section, énonçons ce qui est parfois appelé principe d’équivalence fort : dans un référentiel localement inertiel, les lois de la relativité restreinte sont (localement) valables pour toutes les interactions non gravitationnelles.
5.5
Équations d’Einstein
Les référentiels localement inertiels sont commodes pour traiter un certain nombre de problèmes, mais ils ont l’inconvénient d’être locaux : ils ne sont valables que dans le voisinage d’un point de l’espace-temps. Il est souvent préférable d’utiliser des systèmes de coordonnées globaux, qui couvrent l’ensemble de l’espace-temps9 . Le prix à payer est que des coordonnées ainsi définies, par exemple (t, x, y, z), ne pourront pas être directement interprétées comme des temps ou des positions physiques, mais seulement comme des étiquetages de points de l’espace-temps, contrairement aux coordonnées des référentiels localement inertiels où temps et distances sont des quantités physiquement mesurables, par exemple par échange de photons. Mais, comme le disent les économistes : « there is no free lunch », on ne peut pas tout avoir en même temps. Étant donné que la relativité générale est indifférente au système de coordonnées choisi, un système global sera en général plus commode. Comme nous allons nous intéresser à des problèmes présentant une symétrie sphérique, il est commode d’utiliser pour l’espace ordinaire une coordonnée radiale r et des coordonnées θ et φ sur une sphère de rayon r : un point de l’espace ordinaire est donc repéré par ses coordonnées (r, θ, φ). Pour un point sur la Terre, ces coordonnées seraient sa distance r au centre de la Terre, sa latitude θ et sa longitude φ, et un point de l’espace-temps sera repéré par (t, r, θ, φ). Soulignons à nouveau que les coordonnées t et r sont des étiquetages de points dans l’espace-temps, qui ne doivent pas en général être interprétées comme des temps et des longueurs physiques, tels qu’ils peuvent être mesurés par un observateur. Le lien entre (t, r ) et des temps et des longueurs physiques peut bien sûr être établi, et des exemples seront donnés ci-dessous, mais il n’est pas toujours immédiat. Nous avons donc choisi un système de coordonnées particulier. Ce choix n’est pas unique, c’est le plus commode a priori dans le cas de la symétrie sphérique, mais il existe une infinité de possibilités. La description des phénomènes dans des systèmes de coordonnées différents sera différente, mais
9 Cependant,
il peut arriver qu’un système de coordonnées qui semble couvrir a priori l’ensemble de l’espace-temps n’en couvre en fait qu’une partie. Nous en verrons un exemple au chapitre 7.
86
Chapitre 5. Principe d’équivalence et relativité générale
les résultats physiques, ceux qui peuvent être confrontés à l’expérience, seront bien sûr identiques. Nous allons procéder à deux simplifications, qui correspondent à des cas physiques importants. En premier lieu, nous supposons que la situation est à symétrie sphérique, ce qui sera le cas si l’on s’intéresse à l’équivalent en relativité générale du potentiel de gravitation d’une distribution de masse à symétrie sphérique, centrée pour simplifier les notations à l’origine des coordonnées d’espace. Il n’y aura donc pas de dépendance par rapport aux coordonnées θ et φ, et il nous suffira de prendre en considération uniquement les coordonnées t et r. Pour écrire la métrique, procédons comme dans le cas de la sphère, en prenant dans l’espace-temps deux points (ou événements) voisins de coordonnées respectives (t, r ) et (t + Δt, r + Δr ), dont les latitudes et longitudes sont identiques. Avec la métrique de Minkowski (5.10), le carré de l’intervalle d’espacetemps (Δs)2 entre ces deux points serait c2 (Δs)2 = c2 (Δt)2 − (Δr )2 . En relativité générale, les coefficients de (Δt)2 et (Δr )2 , au lieu d’être constants, sont des fonctions de t et de r. Notre seconde hypothèse, qui suffira pour traiter de cas physiques intéressants comme le mouvement des planètes autour du Soleil ou les trous noirs sphériques, est celle d’une situation statique, indépendante du temps. Compte tenu de ces deux invariances, la métrique de l’espace-temps courbe est indépendante de t, θ et φ, et nous pouvons l’écrire en introduisant deux fonctions positives a priori inconnues a(r ) et b(r ) c2 (Δs)2 = c2 a(r )(Δt)2 − b(r )(Δr )2 − r2 ΔΩ2 .
(5.11)
On pourrait imaginer ajouter un terme en Δt Δr, mais un tel terme serait incompatible avec le caractère statique de la métrique, car il changerait de signe dans la transformation t → −t. À t et r fixés, la géométrie de l’espace est celle d’une sphère, ce qui explique le dernier terme de (5.11) : ΔΩ2 est déterminé par la métrique sur la sphère (5.7) que nous rappelons ci-dessous ΔΩ2 = (Δθ )2 + sin2 θ (Δφ)2 . La métrique permet de calculer les temps et les distances physiques en fonction des coordonnées : par exemple pour la métrique (5.11), l’intervalle de √ temps propre entre deux événements lorsque Δr = ΔΩ = 0 est Δτ = √a Δt. Soulignons à nouveau que r n’est pas une distance à une origine, c’est b Δr qui est la distance physique entre deux sphères voisines. En revanche, 4πr2 est bien l’aire de la sphère de rayon r. La forme générale de la métrique est
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
87
donnée dans l’encadré 5.3 : avec les notations de cet encadré, la métrique (5.11) est donnée par gtt (r ) = a(r )
grr (r ) = −b(r )
gθθ (r ) = −r2
gφφ (r ) = −r2 sin2 θ,
tous les autres coefficients étant nuls. Encadré 5.3. Forme générale de la métrique.
On ne suppose aucune symétrie et on note les composantes des vecteurs par des lettres grecques, λ, μ, ν . . . : par exemple dans le cas de λ, λ = 0 désigne une composante de temps, λ = 1, 2 ou 3 une composante d’espace, et on définit x0 = ct. L’expression générale au point d’espace-temps x est c2 (Δs)2 =
3
∑
μ,ν=0
gμν ( x ) Δx μ Δx ν ,
(5.12)
où gμν est la métrique au point x. Les quantités Δx μ et Δx ν sont des composantes de vecteurs du plan tangent au point x. Comme nous l’avons observé ci-dessus, l’espace-temps courbe n’est pas affine, et les vecteurs ne sont définis que dans les plans tangents en chaque point (voir la discussion de la sphère et la figure 5.8). Un système de cordonnées localement inertiel est tel qu’à l’origine gμν = métrique de Minkowski + termes quadratiques en Δx μ . Les coefficients des termes quadratiques sont directement liés au tenseur de Riemann au point x = 0. Le produit scalaire en un point généralise celui de Minkowski (encadré 2.3). Soit deux vecteurs uˆ et vˆ appartenant au plan tangent en x, de coordonnées uμ et vμ . Leur produit scalaire uˆ · vˆ est défini par uˆ · vˆ =
3
∑
μ,ν=0
uμ gμν vν .
Par exemple, dans le cas de la métrique (5.11) où μ, ν = (t, r, θ, φ) uˆ · vˆ = a(r ) ut vt − b(r ) ur vr − r2 uθ vθ − r2 sin2 θ uφ vφ . Les deux vecteurs sont orthogonaux si uˆ · vˆ = 0.
L’équation (5.11) donne un exemple de métrique sur l’espace-temps, qui nous permet de disposer d’une notion de « distance », avec les mêmes réserves que pour la métrique de Minkowski : le carré de la distance n’est pas nécessairement positif. Étant donné deux points A et B de l’espace-temps, nous pouvons tracer une ligne d’univers allant de A à B. Pour fixer les idées, et parce que ce cas est le plus important en pratique (avec celui des géodésiques de longueur nulle), nous supposerons comme ci-dessus que cette ligne d’univers est celle d’une particule massive, ou d’un observateur. Dans ce cas, si nous la découpons en 88
Chapitre 5. Principe d’équivalence et relativité générale
petits éléments, chacun de ces éléments vérifie (Δs)2 = (Δτ )2 > 0 et c’est donc un élément de temps propre. En sommant ces petits éléments, exactement comme nous l’avons fait pour la sphère, nous pouvons calculer la « distance » cτ entre A et B. Cette distance cτ a une signification très concrète : τ est un intervalle de temps, celui mesuré par une horloge transportée par l’observateur allant de A à B le long de la ligne d’univers, tout comme dans la figure 1.8. Ainsi que nous l’avons vu, la géodésique allant de A à B est la ligne d’univers qui maximise la distance (ou le temps propre) entre les deux points A et B. Comme dans l’espace de Minkowski, les lignes d’univers des photons obéissent à (Δs)2 = 0, et par conséquent Δt b (r ) c =
= 1. Δr a (r ) Les cônes de lumière ne sont plus nécessairement à 45o (si l’on pose c = 1), mais cela ne veut pas dire que les photons ne voyagent plus à la vitesse de la lumière ! Les photons suivent toujours des géodésiques de longueur nulle, mais leurs lignes d’univers sont courbées dans l’espace (t, r ) : un exemple est donné dans la figure 5.12. t horizon
Δt
rS
r1
r2
r
F IGURE 5.12. Décalage vers le rouge gravitationnel. La trajectoire des photons est en tirets rouges. L’ouverture des cônes de lumière diminue lorsque la coordonnée r diminue, ce qui conduit à une courbure des rayons lumineux dans l’espace (t, r ). Le rayon de Schwarzschild (ou horizon, voir le chapitre 7) r = rS est représenté en bleu.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
89
Le fait que des particules test massives suivent des géodésiques est l’équivalent des équations de Newton en mécanique élémentaire. Encore faut-il être capable de déterminer la métrique dans la configuration physique qui nous intéresse. Par exemple, si les particules test sont les planètes, que sera la métrique correspondant à la présence du Soleil ? Établir les équations pour la métrique fut la partie la plus ardue du travail d’Einstein et lui prit près d’une dizaine d’années. On construit à partir du tenseur de Riemann deux quantités fondamentales pour les équations d’Einstein, le tenseur de Ricci Rμν , qui est un tenseur symétrique à dix composantes Rμν = Rνμ , et le scalaire de courbure R (encadré 5.4), qui est une quantité scalaire, indépendante du système de coordonnées. Dans le cas de la sphère, R est exactement la courbure ou l’inverse du carré du rayon : R = 1/r2 . Encadré 5.4. Tenseur de Ricci et courbure.
Le tenseur de Ricci et le scalaire de courbure sont donnés en fonction du tenseur de Riemann par Rμν =
3
∑ Rλμλν
λ =0
R=
3
∑
μν=0
gμν Rμν ,
(5.13)
où gμν est l’inverse de gμν 3
μ
∑ gμλ gλν = δ ν ,
(5.14)
λ =0 μ
μ
μ
et δ ν est le delta de Kronecker : δ ν = 1 si μ = ν et δ ν = 0 si μ = ν.
Les équations d’Einstein sont la traduction mathématique de l’énoncé suivant. La géométrie de l’espace-temps est déterminée localement par son contenu en énergie-impulsion.
Les résultats énoncés dans cette section et la précédente ont été résumés de façon imagée par John Wheeler « l’espace-temps dit à la matière comment se déplacer. La matière dit à l’espace-temps comment se courber. » La première phrase reprend la section 5.4 : les particules massives et les photons suivent des géodésiques déterminées par la métrique. La seconde phrase reprend l’énoncé encadré ci-dessus.
90
Chapitre 5. Principe d’équivalence et relativité générale
Pour donner un contenu précis à ces idées, il faut faire des hypothèses supplémentaires. La première est que la géométrie ne doit pas contenir de dérivées de la métrique d’ordre supérieur à 2, ce qui est bien vérifié par le tenseur de Riemann, et donc par celui de Ricci et la courbure qui s’en déduisent. Si nous revenons un instant à la mécanique classique, nous notons une similitude avec les équations de Newton10 , qui sont aussi d’ordre 2 par rapport au temps : l’accélération est une dérivée seconde de la position par rapport au temps. On sait depuis les travaux du mathématicien russe Ostrogradski en 1850 que des dérivées d’ordre supérieur à deux introduiraient dans le mouvement des instabilités fatales. Il en serait de même pour la relativité générale si la géométrie contenait des dérivées de la métrique d’ordre supérieur à 2, ce qui permet de limiter la complexité des équations. Bornons-nous pour l’instant au cas d’une région d’espace vide, par exemple l’espace-temps extérieur au Soleil, en négligeant les contribution des planètes à la gravitation. Dans ce cas, le membre de droite de l’équation encadrée ci-dessus, la partie énergie-impulsion, s’annule, et les équations d’Einstein sont alors données en fonction du tenseur de Ricci sous la forme Rμν = 0.
(5.15)
Le tenseur de Ricci étant symétrique, il a dix composantes, et (5.15) correspond donc à dix équations. Toutefois, seulement six des ces équations sont indépendantes, en raison de la possibilité d’effectuer des changements de coordonnées (annexe 11.4) : cela donne quatre redondances dans les équations, une par coordonnée. Les équations d’Einstein sont en général compliquées, même avec un second membre nul. D’une part, elles font intervenir les dérivées d’ordre 1 et 2 de la métrique, mais surtout elles sont non linéaires, car le tenseur de Ricci dépend quadratiquement de la métrique. Elles n’ont de solution exacte que si l’on peut faire appel à des symétries. En l’absence de symétries, on doit avoir recours aux solutions numériques des équations d’Einstein, un sujet aujourd’hui en plein développement. Résumons la stratégie : de l’équation (ou plutôt du système d’équations) (5.15), on déduit un système d’équations différentielles pour la métrique. Dans les cas favorables, et en particulier en présence de symétries, ces équations différentielles peuvent être résolues, ou bien on peut deviner leur solution et la vérifier après coup. Une fois la métrique obtenue, on en déduit les propriétés de l’espace-temps, et en particulier ses propriétés de courbure sous la forme du
10 Plus précisément, la limite non relativiste des équations d’Einstein est l’équation de Poisson pour
le potentiel gravitationnel et, nous l’avons vu, la limite non relativiste de la déviation géodésique est l’équation de Newton.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
91
tenseur de Riemann qui se calcule à partir de la métrique. Ainsi que nous l’avons déjà mentionné, il n’est heureusement pas nécessaire en général de calculer explicitement ce tenseur, car on peut établir directement la forme des géodésiques des particules massives et des photons à partir de la métrique et des symétries (annexe 11.5). Il est utile d’ajouter le commentaire suivant : si le tenseur de Riemann s’annule, il en est bien sûr de même pour le tenseur de Ricci. Mais l’inverse n’est pas vrai ! Si le tenseur de Ricci s’annule conformément à (5.15), cela ne veut pas dire que celui de Riemann s’annule. On pourra parfaitement observer un espacetemps courbe dans une région vide de matière. Cela n’est pas possible pour des espaces-temps à deux ou trois dimensions, où l’annulation du tenseur de Ricci entraîne celle du tenseur de Riemann. Il n’y a donc pas de relativité générale dans des espaces-temps à deux ou trois dimensions. C’est une mauvaise nouvelle, car il arrive souvent que les solutions analytiques ou numériques soient plus faciles à obtenir quand le nombre de dimensions est petit. Par exemple, en physique statistique, le modèle d’Ising pour le ferromagnétisme peut être résolu exactement à deux dimensions d’espace, ce qui donne des indications précieuses pour trois dimensions, où il n’est pas exactement soluble. Il en est de même pour les approches numériques : si l’on veut résoudre un système d’équations aux dérivées partielles par une méthode de différences finies dans un carré de côté L en divisant chaque côté en 100 intervalles, nous obtenons sur le carré un réseau de 100 × 100 = 10 000 points, mais si nous passons à un cube, nous aurons 1 000 000 de points, ce qui va considérablement allonger le temps de calcul. Malgré tout, l’augmentation spectaculaire de la puissance de calcul des ordinateurs permet à la « relativité numérique », c’est-à-dire la résolution numérique des équations d’Einstein, d’être aujourd’hui un sujet en pleine expansion.
5.6
Métrique de Schwarzschild
Dans cette dernière section, nous examinons la métrique dans une situation simple, mais très importante : nous supposons comme ci-dessus que la situation physique est (i) indépendante du temps, ou statique, et de plus (ii) à symétrie sphérique autour d’un point O. Concrètement, cela veut dire que nous allons trouver l’équivalent en relativité générale du potentiel gravitationnel − GM/r d’une masse M ponctuelle située en O. Les deux applications fondamentales sont le mouvement des planètes et des photons dans le système solaire (chapitre 6) et les trous noirs sans rotation (chapitre 7)11 . 11 L’histoire des deux physiciens qui ont obtenu l’expression de la métrique est assez triste. Celle-ci
fut écrite pour la première fois en 1915 par l’astrophysicien allemand Karl Schwarzschild, alors
92
Chapitre 5. Principe d’équivalence et relativité générale
Rappelons les données du problème : nous souhaitons écrire la métrique, que l’on devrait appeler métrique de Schwarzschild-Droste, dans la région r > r0 , où r0 est le rayon de la distribution de masse qui crée les forces de gravitation, par exemple le rayon du Soleil si nous nous intéressons au mouvement des planètes. Cette région r > r0 ne contient pas de matière, et nous pouvons donc utiliser les équations d’Einstein sous la forme (5.15). Ces équations se réduisent alors à des équations différentielles du second ordre pour les fonctions a(r ) et b(r ) (5.11), car le tenseur de Ricci se calcule à partir des dérivées de ces deux fonctions. Enfin nous devons retrouver la théorie de Newton pour des grandes distances, quand la gravitation devient faible. Dans ce chapitre, nous utilisons les coordonnées les plus naturelles, celles de Schwarzschild-Droste (t, r, θ, φ), mais ce ne sont pas les seules coordonnées possibles pour écrire la métrique (5.16) : nous en verrons d’autres au chapitre 7. La solution des équations différentielles a comme résultat la métrique Schwarzschild dans les coordonnées (t, r, θ, φ), souvent appelée plus brièvement, mais avec un léger abus de langage, métrique de Schwarzschild12 rS 1 c2 (Δs)2 = c2 1 − (Δt)2 − (Δr )2 − r2 (ΔΩ)2 , (5.16) r 1 − rS /r soit a(r ) = (1 − rS /r ) et b(r ) = (1 − rS /r )−1 . La quantité rS est le rayon de Schwarzschild, rS = 2GM/c2 . Ce rayon de Schwarzschild ne doit surtout pas être confondu avec le rayon r0 de la distribution de masse, il vaut par exemple 3 km pour le Soleil alors que r0 = 7 × 105 km. En ordre de grandeur, le rapport rS /r0 vaut 10−9 pour la Terre, 10−6 pour le Soleil, 10−4 pour une naine blanche et 10−1 pour une étoile à neutrons. Le rayon de Schwarzschild va jouer un rôle majeur dans le cas des trous noirs (chapitre 7). On note une propriété importante de la métrique (5.16) : elle est asymptotiquement plate, ce qui veut dire qu’elle se réduit à la métrique de Minkowski pour r → ∞. Une conséquence cruciale qu’il se trouvait sur le front russe comme officier de l’armée allemande et avait tout juste reçu une copie de l’article d’Einstein. Schwarzschild devait mourir quelques mois plus tard d’une maladie contractée sur le front. Cette métrique fut aussi découverte indépendamment en 1916 par le physicien néerlandais Johannes Droste, étudiant de Lorentz, mais pour des raisons qui n’ont jamais été élucidées, Lorentz ne communiqua pas le résultat à Einstein. Droste abandonna la recherche pour devenir professeur de lycée. Contrairement à une légende largement répandue, il y avait donc plus de trois personnes capables de comprendre Einstein, et ce dès 1916 ! Cette légende a pour origine l’anecdote suivante, réelle ou apocryphe. Un physicien, Ludwig Silberstein, affirma vers 1920 au célèbre astronome anglais Eddington :« Il y a seulement trois personnes au monde capables de comprendre la relativité générale », sous-entendu Einstein, Eddington. . .et lui-même, ce à quoi Eddington répondit « Ah bon, quelle est la troisième ? ». 12 Il est curieux qu’Einstein n’ait pas découvert lui-même cette métrique. Cela s’explique vraisemblablement par le fait qu’Einstein se concentrait sur les solutions perturbatives de la relativité générale, reposant sur des développements en puissances de v/c.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
93
de cette observation est la suivante : en relativité générale, le temps, ou plus exactement le temps-coordonnée t, n’a pas de signification physique immédiate, mais à grande distance il se réduit au temps propre d’un observateur à l’infini et au repos par rapport à la masse M. C’est ce temps qui est utilisé pour les observations astronomiques. Un résumé de la relativité générale.
Le chemin a sans doute paru un peu ardu au lecteur, mais nous avons atteint l’objectif fixé : exposer les bases de la relativité générale, dont l’essentiel peut se comprendre à partir d’une comparaison entre une sphère et l’espace-temps, avec une correspondance entre les points 1, 2, 3 et 4 de chaque cas. Sphère. 1. La distance (ordinaire) entre deux points sur la sphère est déterminée par la métrique (5.6). 2. La distance minimale entre deux points sur la sphère est donnée par la longueur de la géodésique joignant ces deux points. 3. En l’absence de contraintes (interdictions de survol ou vents contraires par exemple), un vol long-courrier suit une géodésique sur une sphère, la Terre. La trajectoire optimale d’un long-courrier est une propriété de la sphère. 4. En tout point de la sphère, on peut choisir un référentiel localement euclidien, par exemple des coordonnées euclidiennes dans le plan tangent en ce point. Espace-temps. 1. La distance (généralisant celle de Minkowski) sur l’espace-temps est déterminée par la métrique. Dans une situation statique et à symétrie sphérique, et en l’absence de matière, cette métrique est celle de Schwarzschild (5.16). 2. La distance maximale entre deux points de l’espace-temps sur une ligne d’univers de genre temps est donnée par la géodésique joignant ces deux points. 3. En l’absence de forces autres que de gravitation, les particules massives et les photons suivent des géodésiques de l’espace-temps. La trajectoire d’une particule massive ou d’un photon est une propriété de l’espace-temps. 4. En tout point de l’espace-temps, on peut choisir un référentiel localement inertiel où la métrique est celle de Minkowski.
Il est possible de visualiser la courbure des rayons lumineux dans la métrique de Schwarzschild, où le rapport Δt/Δr est donné explicitement par Δt 1 . c = Δr 1 − rS /r Il en découle que les cônes de lumière se ferment quand r diminue. L’effet est très faible pour le Soleil, de l’ordre du millionième, mais il est de 10 % pour une
94
Chapitre 5. Principe d’équivalence et relativité générale
étoile à neutrons. Comme on le constate sur la figure 5.12, cela se traduit par la courbure des rayons lumineux dans l’espace (t, r ) : les lignes d’univers des photons ne sont plus des droites. Nous pouvons déduire de cette métrique le décalage vers le rouge gravitationnel (figure 5.12). Prenons un observateur situé à r = r1 qui émet des impulsions lumineuses à intervalles réguliers dans une direction (θ, φ) fixée, impulsions qui sont reçues par un second observateur situé à r = r2 . Appelons Δτ1 l’intervalle de temps propre entre deux impulsions pour le premier observateur, et Δτ2 l’intervalle de temps propre correspondant pour le second en r = r2 . Reprenons un raisonnement de la section 5.1 : soit te et te les temps d’émission d’un signal et du signal suivant, tr et tr les instants de réception. En raison de l’indépendance par rapport au temps, tr − te = tr − te , et donc tr − tr = te − te = Δt. Étant donné que Δr = 0 pour chaque observateur, nous en déduisons, avec i = 1, 2 Δτi = a(ri ) Δt = (1 − rS /ri )1/2 Δt. La forme complètement générale du décalage vers le rouge gravitationnel en découle 1 − rS /r2 1/2 Δτ2 = . (5.17) Δτ1 1 − rS /r1 Si r1 tend vers le rayon de Schwarzschild, r1 → rS , ce décalage vers le rouge tend vers l’infini : la surface r = rS est appelée surface de décalage vers le rouge infini. Nous pouvons aussi déduire de (5.17) le décalage vers le rouge gravitationnel entre la Terre (r1 = R T ) et le satellite (r2 = r) dans le cas du GPS. Dans ce cas, nous sommes dans une situation de gravité faible, car le rayon de Schwarzschild rS est très petit par rapport au rayon de la Terre R T : rS /R T 1, et nous retrouvons le résultat (5.4) : voir l’encadré 5.5. De façon générale, la gravité est faible à une coordonnée r si rS /r 1. Deux dernières observations pour clore ce chapitre. (i) Au lieu de supposer une situation statique, nous aurions pu admettre une dépendance de la métrique par rapport au temps, avec des fonctions a(t, r ) et b(t, r ), tout en maintenant strictement la symétrie sphérique13 . Le résultat remarquable, connu sous le nom de théorème de Birkhoff, est que les fonctions a(t, r ) et b(t, r ) sont en fait indépendantes du temps et données par (5.16) à l’extérieur de la distribution de masse. Si par exemple la densité de matière responsable de la gravité présente des ce cas, un terme en Δt Δr serait possible dans la métrique, mais il peut être éliminé par un changement de coordonnées.
13 Dans
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
95
oscillations radiales, alors la métrique reste celle de Schwarzschild, et il n’y a pas d’émission d’ondes gravitationnelles. (ii) Le lecteur mathématicien sera peutêtre déçu de ne pas trouver une « démonstration » des équations d’Einstein, mais seulement des arguments de plausibilité. On ne peut pas plus démontrer les équations d’Einstein que celles de Newton, car en physique, à un certain moment, on doit poser des principes a priori. Le critère de validité de ces principes est l’accord avec l’expérience, et de ce point de vue, le score de la relativité générale est plutôt excellent, ainsi que nous allons le constater dans les chapitres suivants. Encadré 5.5. Corrections de relativité générale au GPS.
Compte tenu de rS /ri 1 et de
(1 − ε)±1/2 (1 ∓ ε/2) si ε 1, nous obtenons la formule approximative Δτ2 = Δτ1
1 − rS /r 1 − rS /R T
1/2
1+
1 rS 1 rS . − 2 RT 2 r
(5.18)
En écrivant Δτ2 /Δτ1 = 1 + δt/t et rS = 2GM/c2 , nous retrouvons l’expression (5.4).
5.7
Bibiographie
En plus de sa discussion des aspects historiques, Damour [2005a], chapitre 3, donne une introduction élémentaire à la relativité générale ; on trouvera également une telle introduction dans Thorne [2009] et Luminet [2010]. L’histoire de la relativité générale est relatée en détail par Eisenstaedt [2002]. Des introductions en anglais sont Geroch [1978] ou Marolf [2003], disponible en ligne. À un niveau avancé, le lecteur pourra consulter en français Damour [2005b], dont est extraite la citation de la section 5.1, Hobson et al. [2009], Moore [2014], Deruelle et Uzan [2014], ou le cours de Gourgoulhon [2009], disponible en ligne. Il existe de nombreux livres en anglais, et parmi les livres récents on peut citer Hartle [2003] et Zee [2013]. Voir également Poisson et Will [2014], chapitre 5. Ma préférence personnelle va au livre de Hartle en raison de ses qualités pédagogiques.
96
Chapitre 5. Principe d’équivalence et relativité générale
6 Vérifications dans le système solaire Ce chapitre et les trois chapitres suivants sont consacrés aux applications de la relativité générale. Le chapitre 7 utilise les résultats du présent chapitre, mais le lecteur qui le souhaite peut passer directement aux chapitres 8 ou 9. À l’intérieur du système solaire, la théorie reproduit correctement les observations avec une précision meilleure que 0, 01 %. Le système solaire est très bien balisé, ce qui donne un excellent contrôle de la comparaison entre l’observation et la théorie. Cependant, les effets de la relativité générale sont peu importants car la gravité est faible (section 5.6). On peut effectuer des vérifications dans des conditions de gravité forte en examinant les orbites d’étoiles compactes doubles dans des conditions qui sont encore bien contrôlées, ce qui sera fait au chapitre 8. Les incertitudes sont plus importantes dans les applications aux trous noirs (chapitre 7) et à la cosmologie (chapitre 9), où l’on pourra éventuellement rencontrer des idées encore très spéculatives. Un bref rappel est utile sur les mesures d’angles utilisées en astrophysique. Le degré est l’unité la plus courante, mais les mathématiciens lui préfèrent le radian : 1 degré = π/180 0, 017 4 radian. Le degré est divisé en 60 minutes d’arc : la Lune et le Soleil sont vus sous un angle de 30 minutes. Dans le cas du Soleil, le diamètre vaut ΔL 1, 4 × 109 m et la distance à la Terre d 1, 5 × 1011 m. Il est donc vu sous un angle donné par Δθ = ΔL/d 0, 009 3 radians, soit 0,54 degré. La minute est elle-même divisée en 60 secondes d’arc : en ordre de grandeur, la seconde d’arc est l’angle sous lequel on voit une distance de 2 km sur la Lune.
Le présent chapitre traite des applications au système solaire. La métrique de Schwarzschild permet de déterminer les trajectoires des particules test massives (dans ce cas les planètes) et des photons dans une configuration à symétrie sphérique. Dans la section 6.1, je rappelle quelques notions élémentaires de mécanique newtonienne appliquée au mouvement des planètes, et j’introduis dans la section 6.2 les modifications apportées par la relativité générale aux orbites des planètes, en particulier celle de Mercure. Le cas des photons est étudié dans les sections 6.3 et 6.4 : déviation d’un rayon lumineux par le Soleil et « retard » Shapiro. Enfin la section 6.5 examine la précession géodésique : les effets de la relativité générale sur le mouvement d’un gyroscope.
6.1
Théorie de Newton des orbites planétaires
Avant de passer au mouvement des planètes en relativité générale, rappelons quelques données de base de la théorie newtonienne, qui s’applique aussi bien au mouvement des planètes autour du Soleil qu’à celui des satellites autour de la Terre. L’utilisation d’un exemple, celui des montagnes russes (figure 6.1), V (x)
x
O
x
x2
x+
x3
x1
x−
F IGURE 6.1. Montagnes russes. Cas (i), tirets bleus : la vitesse initiale du chariot est suffisante pour que celui-ci franchisse la bosse. Cas (ii), tirets rouges : le chariot fait demi-tour au point x = x1 . Cas (iii) : le chariot effectue des allers-retours entre les points x = x2 et x = x3 . Cas (iv), point noir : le chariot est en équilibre instable au sommet de la bosse au point x = x− . Il est en équilibre stable (point vert) au fond de la cuvette, au point x = x+ . Les dimensions du chariot ont été exagérées, et il serait plus réaliste de le remplacer par une bille de petite dimension.
98
Chapitre 6. Vérifications dans le système solaire
permettra d’introduire simplement les notions sur l’énergie dont nous aurons besoin. Un chariot est lancé de la gauche vers la droite avec une vitesse v. La position du chariot est repérée par son abscisse x suivant un axe horizontal, et nous négligeons toute force de frottement. Comme il se doit avec des montagnes russes, le parcours du chariot est chahuté : d’abord une cuvette, ensuite une bosse. L’énergie potentielle gravitationnelle du chariot à une altitude h est mgh, où m est sa masse et g l’accélération de la pesanteur, g 9, 81 m/s2 . L’altitude est donnée en fonction de la position x du chariot par la forme du parcours, et on définit gh = V ( x ), où V ( x ) est le potentiel gravitationnel du chariot quand son abscisse est x, conformément à notre définition de la section 5.1. Suivant un résultat fondamental de la mécanique newtonienne, l’énergie E du chariot, la somme de son énergie cinétique mv2 /2 et de son énergie potentielle mV ( x ), est constante 1 1 (6.1) E = mv2 + mgh = mv2 + mV ( x ) = constante. 2 2 Afin de simplifier les formules, nous choisirons le potentiel nul sur la partie horizontale du trajet : V ( x = 0) = 0. Deux mouvements sont possibles pour le chariot partant de la gauche, qui suit d’abord une trajectoire horizontale. (i) La vitesse initiale du chariot, ou de façon équivalente son énergie cinétique initiale, est suffisamment grande : v2 /2 est plus grand que le potentiel V ( x− ) au sommet de la bosse, dans ce cas le chariot franchit la bosse et subit une chute catastrophique en partant vers la droite. (ii) La vitesse initiale du chariot est trop faible pour franchir la bosse. Le chariot fait demi-tour au point x1 tel que V ( x1 ) = v2 /2. Il existe deux autres situations intéressantes. (iii) Le chariot est lâché sans vitesse initiale au point x = x2 dans la cuvette : dans ce cas il effectue des allers-retours entre ce point et un autre point x3 tel que V ( x3 ) = V ( x2 ). Le fond de la cuvette est un point d’équilibre stable en x = x+ . (iv) Le chariot est posé sans vitesse initiale au sommet de la bosse, au point x = x− : il est en équilibre, mais cet équilibre est manifestement instable, car il suffit d’une petite perturbation pour faire basculer le chariot d’un côté ou de l’autre de la bosse. Nous allons rencontrer quatre situations analogues au cours de ce chapitre et du suivant, et cet exemple des montagnes russes permettra de les visualiser concrètement, dans la mesure où nous avons une bonne intuition du mouvement du chariot, de même que de celui d’une bille sur un relief ondulé.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
99
Le mouvement des planètes est plus complexe que celui du chariot, car il s’effectue dans l’espace, et non suivant un axe. Cependant, le potentiel de gravitation du Soleil (ou de la Terre pour les satellites) est indépendant du temps et, comme ci-dessus, l’énergie est aussi indépendante du temps. De plus, le problème présente une symétrie sphérique autour du centre du Soleil (ou de la Terre pour les satellites). Dans ce cas, on montre que le moment angulaire (ou moment cinétique), défini ci-dessous, est aussi indépendant du temps, et on en déduit que le mouvement s’effectue dans un plan. Selon la première loi de Kepler, les planètes décrivent des ellipses dont le Soleil est un des foyers situé en O sur la figure 6.2. En un point M de cette ellipse, la vitesse se décompose en une vitesse radiale vr le long de OM et une vitesse vφ suivant un axe perpendiculaire. Pour une masse m = 1, le moment angulaire est = rvφ et il est, on l’a mentionné, indépendant du temps. Le mouvement suivant r s’effectue entre une distance minimale rm entre la planète et le Soleil, ou périhélie, et une distance maximale r M , ou aphélie : rm ≤ r ≤ r M . N (r ), où M est la masse Ce mouvement radial est régi par un potentiel effectif Veff du Soleil et l’exposant N renvoie à la théorie de Newton ; ce potentiel effectif vaut (encadré 6.1) GM 2 N Veff (r ) = − + 2. (6.2) r 2r
r
M
r
φ
rM
N
rm
O
P
F IGURE 6.2. Orbite elliptique d’une planète. Le Soleil est situé au point O, un des deux foyers de l’ellipse, et la planète au point M, avec r = OM. La distance maximale entre le Soleil et la planète (aphélie) est ON = r M et la distance minimale (périhélie) est OP = rm . La vitesse v de la planète est tangente à l’orbite, et elle se décompose en une vitesse radiale vr , orientée suivant OM, et une vitesse vφ perpendiculaire à OM.
100
Chapitre 6. Vérifications dans le système solaire
Encadré 6.1. Potentiel effectif.
L’énergie E s’écrit E=
1 mGM 1 mGM mv2 − = m(v2r + v2φ ) − 2 r 2 r
Mais v2φ = 2 /r2 , d’où E=
1 mGM m2 1 N mv2r − + 2 = mv2r + mVeff (r ) . 2 r 2 2r
On en déduit le potentiel effectif en fonction du rayon de Schwarzchild rS = 2GM/c2 N Veff (r ) = −
2 2 GM c2 r + 2 =− S+ 2. r 2r 2r 2r
(6.3)
Au potentiel − GM/r qui correspond à la force de gravitation s’ajoute un terme 2 /(2r2 ) qui a pour origine la force centrifuge, et s’appelle d’ailleurs terme de barrière centrifuge. Ce potentiel effectif est tracé sur la figure 6.3. Il s’annule pour r → ∞ et tend vers l’infini pour r → 0 : dans ce dernier cas, c’est le terme de barrière centrifuge qui domine, il a un effet répulsif et tend à éloigner la planète du centre de forces, le point r = 0. Nous nous sommes donc ramenés à un mouvement le long d’une droite fictive, tout comme dans le cas des montagnes russes. Évidemment, le mouvement a aussi une composante de rotation, N V eff (r)
r1
rm
r+
rM
r
N (r ). Le mouvement d’une planète sur une orbite F IGURE 6.3. Allure qualitative du potentiel newtonien Veff elliptique s’effectue entre rm et r M (tirets verts). Lorsque r = r+ , l’orbite est circulaire. Les tirets bleus représentent le mouvement d’un astéroïde qui arrive de l’infini et repart vers l’infini dans une autre direction. La courbe en tirets rouges représente le potentiel effectif incluant la correction due à la relativité générale, qui a été très exagérée pour la clarté de la figure.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
101
et la composition du mouvement suivant la droite fictive et du mouvement de rotation va donner l’orbite. Deux mouvements sur la droite sont possibles, le premier correspondant à la situation (iii) ci-dessus où la distance de la planète au Soleil varie entre rm et r M , et l’orbite est une ellipse. Le minimum du puits de potentiel à r = r+ dans la figure 6.3 correspond à une coordonnée r constante, et donc à une orbite circulaire. Le second mouvement correspond à (ii) : la planète, ou plus exactement dans ce cas un astéroïde, arrive de l’infini, s’approche du Soleil à une distance minimale r1 et repart à l’infini en suivant une trajectoire hyperbolique. 6.2
Particules massives
En relativité générale, le mouvement des planètes s’obtient en recherchant les géodésiques de la métrique de Schwarzschild. Pour déterminer ces géodésiques, il est nécessaire d’entrer dans le détail des calculs, mais le résultat N (6.2), on doit final est simple (annexe 11.5) : au potentiel effectif newtonien Veff simplement ajouter un terme proportionnel à 1/r3 écrit en rouge dans l’équation ci-dessous GM2 c2 r 2 r 2 N (r )− 2 3 = − S + 2 − S 3 (6.4) Veff (r ) = Veff c r 2r 2r 2r où nous avons introduit le rayon de Schwarzschild rS = 2GM/c2 . On retrouve le potentiel newtonien lorsque la vitesse de la lumière devient infinie, c → ∞, ou lorsque = 0. Bien que cette équation apparaisse comme une simple correction au potentiel newtonien, il faut prendre garde à l’interprétation de la coordonnée r qui n’est pas une distance à l’origine, mais une simple coordonnée. Toutefois, l’interprétation de r comme distance à l’origine est approximativement valable dans une situation de gravité faible, comme c’est le cas pour les planètes. Il est facile de tracer Veff (r ) : la nouveauté par rapport au cas newtonien est le terme en 1/r3 , écrit en rouge dans l’équation (6.4), qui est dominant pour r → 0 : dans cette limite Veff (r ) → −∞. L’influence de ce terme est représentée par la courbe en tirets rouges dans la figure 6.3. Si une particule arrive dans la région où ce terme en 1/r3 domine, elle se trouve dans une situation analogue à celle (i) du chariot, et elle subit une chute catastrophique vers la région r → 0. En mécanique newtonienne, une particule ne peut pas tomber sur la masse centrale supposée ponctuelle si son moment angulaire est non nul, en raison du terme de barrière centrifuge, qui est répulsif. Mais, en relativité générale, le terme en −1/r3 dans (6.4) l’emporte sur celui de barrière centrifuge pour les petites valeurs de r, et ce terme est attractif : il conduit à une chute sur la masse centrale. En raison du mouvement de rotation qui se combine au mouvement
102
Chapitre 6. Vérifications dans le système solaire
radial, cette chute ne se fait pas en ligne droite, mais suivant une spirale. Toutefois, une telle situation ne se rencontre pas dans le cas du Soleil, car la métrique de Schwarzschild n’est valable que dans l’espace vide de matière, et sa validité est donc limitée à r > r0 , où r0 est le rayon du Soleil qui, rappelons-le, est très grand par rapport à son rayon de Schwarzschild : r0 rS . L’allure qualitative de Veff (r ) est tracée dans la figure 6.4. Ce potentiel présente un minimum et un maximum lorsque le moment angulaire est suffisamment grand
2 ≥ 3c2 rS2 . Si cette condition est satisfaite, le potentiel présente un minimum et un maximum à 2 2 2 (6.5) ± − 3rS c . r± = r S c2 Veff (r)
rISCO
rm
r+
rM
r
r–
F IGURE 6.4. Allure qualitative du potentiel effectif Veff (r ) en relativité générale. Le code couleur correspond √ à celui de la figure 6.1. La courbe en noir correspond à > 3 c rS ; elle présente un maximum à r = r− et un minimum à r = r+ . Le point noir à r = r− correspond à une orbite circulaire instable. Un mouvement possible (tirets verts) vérifie rm ≤ r ≤ r M : la planète reste à « distance » finie r de la source de gravitation. Le point vert à r = r+ correspond à une orbite circulaire stable. D’autres mouvements sont possibles : la planète vient de l’infini (tirets bleus) et tombe sur la masse centrale, ou bien la planète venant aussi de l’infini√repart à l’infini comme dans le cas d’un astéroïde (tirets rouges). La courbe en rouge correspond à = 3 c rS , et le point rouge correspond à la coordonnée r de la dernière orbite circulaire stable possible, r = rISCO ; cependant, cette orbite est seulement marginalement stable √ car le potentiel présente un point d’inflexion, et non un minimum. La courbe en bleu correspond à < 3 c rS .
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
103
(point noir pour r− et point vert pour r+ sur la figure 6.4), et sinon il décroît uniformément de√l’infini à rS . Lorsque ≥ 3 c rS , on retrouve une configuration analogue à la configuration newtonienne de la figure 6.3, où la valeur de r est comprise entre un minimum√rm et un maximum r M : la planète reste à « distance » finie du Soleil. Pour = 3 crS , il est possible d’avoir une orbite circulaire de rayon r = 3rS (point rouge sur la figure 6.4), mais cette orbite est seulement marginalement stable. Une différence cruciale avec les trajectoires newtoniennes est que les orbites ne se referment pas. Dans le cas du mouvement des planètes, la gravité est faible, rS /r 1, une condition déjà rencontrée dans l’étude du GPS. Dans ces conditions, on montre qu’après une révolution complète, l’angle φ a varié de 2π + Δφ, et non de 2π, avec 3πrS a Δφ = rm r M où a est le grand axe de l’ellipse, a = (rm + r M )/2 (figure 6.5). C’est ce que l’on appelle un mouvement de précession, l’orbite ne se referme pas et elle s’écarte de l’orbite elliptique képlérienne ; l’écart est d’autant plus important que la planète est proche du Soleil, car la gravité est d’autant plus forte que la distance au Soleil est faible. L’effet est donc le plus visible pour Mercure, où la précession est de 574, 1 ± 0, 4 secondes d’arc par siècle. La partie principale de cette précession est due à des perturbations comme celles provenant des autres planètes ou de la forme non sphérique du Soleil. Une fois ces perturbations soustraites, il reste à
Δφ
F IGURE 6.5. Orbite elliptique avec précession. Le grand axe de l’ellipse tourne de Δφ quand la planète effectue une révolution complète. L’effet a été considérablement exagéré pour la clarté de la figure.
104
Chapitre 6. Vérifications dans le système solaire
expliquer 43, 1 ± 0, 4 secondes d’arc par siècle, ce dont la relativité générale s’acquitte parfaitement, puisqu’elle prédit 43 secondes d’arc par siècle. Ce résultat, obtenu par Einstein dès 1916, fut le premier test de la relativité générale. Hors du système solaire, cette précession du périhélie a été observée pour des étoiles doubles compactes, où l’effet est beaucoup plus important (section 8.3). La discussion de la fin de cette section est dans le droit fil des développements précédents, mais nous nous plaçons maintenant dans une situation où les effets de la relativité générale sont importants, avec des résultats qui nous seront utiles dans le√chapitre suivant sur les trous noirs. Lorsque atteint sa valeur critique c = 3 crS , le minimum du potentiel effectif Veff (r ) disparaît, et pour = c le potentiel effectif présente un point d’inflexion à r = 3rS = rISCO . Ce point correspond à la dernière orbite circulaire stable possible, qui est en fait à la limite de la stabilité et appelée conventionnellement orbite ISCO (Innermost Stable Circular Orbit). Le rayon de cette orbite est porté sur la figure 6.4 (point sur la courbe rouge). Pour ces valeurs de r et de , le potentiel effectif vaut Veff (r = rISCO ) = c
2
1 3 3 c2 − + − =− . 3 9 27 9
En tombant depuis l’infini et en perdant de l’énergie et du moment angulaire par des processus dissipatifs, une particule va atteindre des orbites d’énergie inférieure à mc2 et convertir la différence d’énergie gravitationnelle entre celle à l’infini et celle de cette orbite, par exemple sous forme de rayonnement électromagnétique. Elle continuera à perdre de l’énergie gravitationnelle jusqu’au moment où elle atteindra l’orbite ISCO ; ensuite elle va plonger rapidement en spirale vers la masse centrale. L’orbite ISCO joue un rôle important, car elle est à la base de la formation du disque d’accrétion autour d’un trou noir (chapitre 7). L’énergie sur cette orbite se déduit du potentiel effectif et elle vaut (annexe 11.5) mc
2
√
√ 2 2 2 mc 0, 943 × mc2 . 1 − 1/9 = 3
La fraction de l’énergie de masse convertie en rayonnement ou en d’autres formes d’énergie quand la particule tombe de l’infini jusqu’à l’orbite ISCO se déduit de la conservation de l’énergie, et ce n’est pas autre chose que l’énergie de liaison qui vaut √
2 2 mc2 1 − 0, 06 × mc2 3 ce qui peut sembler faible, mais est près de dix fois plus efficace qu’une réaction thermonucéaire produisant de l’hélium à partir d’hydrogène, cas où cette
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
105
fraction n’est que √ de 0, 007, ainsi que nous l’avons montré dans la section 4.3. Lorsque c < 3 crS , le potentiel effectif décroît uniformément depuis l’infini jusquà rS . 6.3
Photons
On détermine la trajectoire des photons en étudiant les géodésiques de longueur nulle dans la métrique de Schwarzschild. Les équations qui régissent les trajectoires des photons diffèrent dans le détail de celles des particules massives, mais sont finalement assez proches qualitativement. Elle font intervenir phot la « vitesse radiale1 » vr et un potentiel effectif pour les photons, Veff (r ) v2r 1 phot + Veff (r ) = 2 2 b
phot
Veff (r ) =
1 rS − 1 r2 r
(6.6)
où b est le paramètre d’impact, défini dans la figure 6.6. C’est la distance d’approche minimale au centre du Soleil par le photon venant de l’infini en l’absence de gravitation. La forme du potentiel (figure 6.7) montre qu’il existe une orbite circulaire, mais cette orbite est instable. Le phénomène le plus intéressant est la déviation par le Soleil des rayons lumineux provenant d’une étoile, la déviation étant de 2πrS Δφ = (6.7) b soit 1, 75 seconde d’arc pour la déviation d’un rayon lumineux en incidence rasante sur le Soleil. Cette valeur est le double de celle obtenue dans une théorie
r
φ
b
Δφ Soleil
F IGURE 6.6. Trajectoire d’un photon passant au voisinage du Soleil. La figure donne la définition du paramètre d’impact b. La déviation Δφ a été considérablement exagérée pour la clarté de la figure. 1 Pour
un photon, la vitesse radiale est la dérivée de la coordonnée r par rapport à un « paramètre affine » (annexe 11.5), qui paramètre la ligne d’univers de ce photon.
106
Chapitre 6. Vérifications dans le système solaire
phot Veff (r)
r
F IGURE 6.7. Potentiel effectif pour les photons. Dans le cas des tirets bleus, le photon venant de l’infini tombe en spirale sur la masse centrale, et dans le cas des tirets rouges, il repart à l’infini comme dans la figure 6.6.
newtonienne, si l’on assimile (abusivement) un photon à une particule de masse m = E/c2 . La mesure de cette déviation par deux équipes d’astronomes anglais dirigés par l’astronome royal Sir Frank Dyson, avec la participation d’Arthur Eddington lors d’une éclipse de Soleil en 1919, fut un grand triomphe pour Einstein, même si certains spécialistes doutent de la précision revendiquée par les astronomes. Aujourd’hui, des mesures beaucoup plus précises de radioastronomie interférométrique à très longue base (VLBI) utilisent la déviation des ondes radio émises par des quasars (section 7.4) passant près du Soleil et la théorie a été testée avec une précision de l’ordre de 10−4 : en effet, la précision dans les mesures d’angle peut atteindre 100 microsecondes d’arc. Une application importante de cette déviation est l’effet de lentille gravitationnelle : dans ce cas, la déviation (6.7) n’est pas utilisée comme vérification de la relativité générale, mais pour estimer la masse M située entre la Terre et l’objet observé. Si la masse M est ponctuelle, la formule (6.7) est le seul ingrédient de la relativité générale utilisé pour les calcul des images. 6.4
L’effet Shapiro
L’effet Shapiro, du nom du physicien qui en a eu l’idée en 1964, repose sur la mesure du temps d’aller-retour d’une impulsion radar passant au voisinage du Soleil entre la Terre et une sonde spatiale. La figure 6.8 donne le schéma de l’expérience : les coordonnées radiales de la Terre et de la sonde sont
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
107
B
B
r2
r2 C
O
r1
r1
O
rT
rT A
A
F IGURE 6.8. L’effet Shapiro. (a) Trajectoire d’un rayon lumineux à l’approximation newtonienne : le trajet
AB est un segment de droite. (b) Trajectoire en relativité générale : l’effet de courbure a été exagéré.
respectivement r T et r2 , et la distance minimale entre le Soleil et la trajectoire du signal radar est r1 . Dans l’espace-temps newtonien, cette distance est le paramètre d’impact b, et le temps d’aller-retour serait (figure 6.8) N TAR
2 = c
r2T
− r12
+
r22
− r12
(6.8)
en utilisant le théorème de Pythagore pour les triangles rectangles AOC et BOC. Mais, comme l’espace-temps n’est pas newtonien, les ondes électromagnétiques ne se propagent pas en ligne droite, et elles suivent une trajectoire déterminée par le potentiel effectif (6.6). On relie le paramètre d’impact b à r1 en écrivant que r1 est la distance minimale d’approche du Soleil, ce qui permet d’en déduire le temps d’aller-retour TAR du signal radar. Le résultat final est TAR =
N TAR
4r T r2 2rS ln + +1 c r12
(6.9)
où ln désigne un logarithme népérien. Le décalage par rapport au résultat newtonien est souvent appelé improprement « retard de la lumière », mais il faut
108
Chapitre 6. Vérifications dans le système solaire
bien comprendre que la lumière se propage toujours à la vitesse c ! La vérification la plus précise à ce jour a été effectuée en 2003 en utilisant la sonde Cassini, et l’expérience a montré un accord avec la relativité générale avec une précision de 2 × 10−5 . Hors du système solaire, le retard Shapiro a été observé sur des étoiles à neutrons, en particulier le pulsar J1614-2230, l’effet étant alors beaucoup plus important.
6.5
Précession géodésique
La précession géodésique est liée au mouvement d’un gyroscope en relativité générale. En physique newtonienne, l’axe d’un gyroscope en rotation rapide garde une direction fixe dans l’espace, par rapport à des directions repérées par des étoiles lointaines. C’est la propriété utilisée pour la navigation inertielle des avions, bien que les gyroscopes soient progressivement remplacés aujourd’hui par des gyrolasers. On place un gyroscope soigneusement isolé de toute influence extérieure dans un satellite sur une orbite circulaire de rayon r, en supposant, pour fixer les idées, que l’axe du gyroscope est orienté suivant un rayon (figure 6.9). En physique newtonienne, l’axe conserverait son orientation initale après un
642 km
effet Lense-Thirring
étoile guide précession géodésique F IGURE 6.9. Précession géodésique. Le gyroscope est placé dans un satellite sur une orbite circulaire polaire de rayon r. Initialement, l’axe du gyroscope est aligné sur un rayon. Après un tour complet, son orientation a changé d’un angle Δφ. À cette rotation s’ajoute l’effet Lense-Thirring, l’entraînement des référentiels d’inertie par la rotation de la Terre (section 7.3), qui fait tourner l’axe dans une direction perpendiculaire.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
109
tour complet, mais en relativité générale, l’axe tourne d’un angle Δφ 3rS 1/2 3πrS Δφ = 2π 1 − 1 − 2r r
(6.10)
où la deuxième expression est valable en situation de gravité faible, rS /r 1. Au bout d’une année, et avec une orbite de 640 km au-dessus de la Terre, l’axe aura tourné d’environ 6,6 secondes d’arc. Il existe une deuxième source de rotation de l’axe, provenant de l’entraînement de l’espace-temps par la rotation de la Terre, ou effet Lense-Thirring, qui est environ 180 fois plus faible dans les conditions du satellite Gravity Probe B. Si le satellite suit une orbite circulaire polaire (figure 6.9), les changements de direction de l’axe de rotation du gyroscope dus aux deux effets sont perpendiculaires entre eux. Les deux effets ont été mesurés par la mission de la NASA Gravity Probe B, qui a connu un certain nombre de déboires. Il s’est écoulé un demi-siècle entre la conception de l’expérience et sa réalisation, qui a coûté 760 millions de dollars, le défi principal étant de construire des gyroscopes aussi proches que possible de la symétrie sphérique. Le satellite a été lancé en avril 2004 et les données ont été récupérées en 2005. L’exploitation des résultats, publiés en 2011, a pris encore cinq années supplémentaires. Il a fallu combiner les résultats de quatre gyroscopes indépendants, le résultat final étant de 6 602 ± 18 millisecondes d’arc par an pour la précession géodésique et de 37, 2 ± 7, 2 millisecondes d’arc par an pour l’effet Lense-Thirring, à comparer aux valeurs théoriques respectives de 6 606 et 39,2 millisecondes d’arc par an. 6.6
Bibliographie
Les vérifications de la relativité générale dans le système solaire sont exposées à un niveau grand public dans Will [1989]. À un niveau avancé, voir Hobson et al. [2009], chapitre 9, Moore [2014], chapitres 9 à 13, Gourgoulhon [2009], chapitre 3, et en anglais, Hartle [2003], chapitres 10 et 14, ou Zee [2013], chapitre VI, ainsi que l’article de revue très complet de Will [2014] et le site web maintenu par T. Damour : http ://pdg.lbl.gov/2013/reviews/rpp2013-rev-gravity-tests.pdf. Pour l’effet Shapiro dans le cas des étoiles à neutrons, voir Schwarzschild [2011].
110
Chapitre 6. Vérifications dans le système solaire
7 Trous noirs Les trous noirs offrent à la relativité générale un champ d’application dans des conditions extrêmes, dans des situations où la gravité est très forte, contrairement aux cas examinés dans le chapitre précédent, ceux des planètes ou des satellites, où la gravité était toujours faible. Une bonne mesure de l’intensité de la gravité dans le voisinage d’un objet astrophysique est la vitesse de libération. Pour qu’une fusée échappe à l’attraction terrestre et puisse s’éloigner à l’infini, il faut lui communiquer une vitesse minimale de 11 km/s, qui est la vitesse de libération. Cette vitesse se calcule facilement si l’on suppose que la fusée de masse m est soumise à l’attraction d’un objet de masse M à symétrie sphérique et qu’elle est lancée verticalement depuis sa surface, à une distance r0 du centre de cet objet. En physique newtonienne, l’énergie mécanique de la fusée, somme de son énergie cinétique initiale mv2 /2 et de son énergie potentielle − GmM/r0 , doit être positive pour que la fusée puisse s’échapper à l’infini, ce qui donne une √ vitesse minimale, la vitesse de libération, égale à v L = 2GM/r0 . Il est instructif de récrire cette vitesse en fonction du rayon de Schwarzschild rS de l’objet astrophysique, et on obtient aisément le rapport de la vitesse de libération à celle de la lumière sous la forme v L /c = (rS /r0 )1/2 . Pour le Soleil, rS = 3 km et r0 = 7 × 105 km, ce qui donne v L /c 0, 002. Pour une naine blanche ayant la masse du Soleil et un rayon égal à celui de la Terre, v L /c 0, 02, tandis que pour une étoile à neutrons de masse identique et de 10 km de rayon, v L /c 0, 5. On appelle étoile compacte une étoile dont le rayon est proche de son rayon de Schwarzschild : r0 > ∼ rS . Son paramètre de compacité est le rapport rS /r0 : plus ce paramètre est proche de un, et plus l’étoile est compacte. Le cas d’une vitesse de libération égale à celle de la lumière, v L = c, avait été envisagé il y a plus de deux cents ans par Mitchell, puis par Laplace, dans le cadre de la physique newtonienne. Un photon de vitesse c ne peut échapper à
l’attraction de la masse M que si r0 > rS . Si la distribution de masse est confinée à une distance r < r0 et que r0 < rS , alors les photons ne peuvent pas s’échapper à l’infini depuis la surface de l’objet massif : cet objet est invisible pour un observateur à l’infini. La relativité générale confirme qualitativement les intuitions heuristiques de Mitchell et Laplace, mais elle modifie considérablement la vision newtonienne, dans laquelle il est possible d’échapper à l’attraction de n’importe quel objet massif à condition de disposer de propulseurs suffisamment puissants. C’est impossible en relativité, où la vitesse est limitée par celle de la lumière. Nous verrons qu’un trou noir est caractérisé par un horizon des événements : la terminologie vient de ce qu’aucun événement situé à l’intérieur de cet horizon n’est visible pour un observateur à l’infini. Tout objet, particule massive ou photon, situé à l’intérieur de cet horizon, non seulement ne peut pas s’échapper à l’infini, mais s’y retrouve définitivement piégé. Les deux premières sections sont consacrées aux trous noirs dans la géométrie à symétrie sphérique de Schwarzschild-Droste : la section 7.1 traite de la région extérieure au rayon de Schwarzschild, r > rS , et la section 7.2 de celle de la région intérieure, r < rS . Nous verrons que la surface r = rS est l’horizon des événements du trou noir. Les trous noirs en rotation sont examinés dans la section 7.3 et la section 7.4 donne quelques exemples astrophysiques plausibles de trous noirs. Enfin la section 7.5 fait appel à des considérations étrangères à la relativité générale, thermodynamique et physique quantique, afin d’introduire sommairement la thermodynamique des trous noirs et le rayonnement de Hawking. 7.1
À l’extérieur du rayon de Schwarzschild
À l’extérieur du rayon de Schwarzschild, r > rS , on retrouve la situation du chapitre précédent, avec la différence cruciale que cette fois la plongée du potentiel effectif pour les petites valeurs de r ne s’arrête pas à r = r0 , le rayon de la distribution de masse. Au lieu de nous limiter comme dans le chapitre précédent à la région r > r0 rS , dans un régime où les coordonnées de Schwarzschild-Droste (t, r ) sont valables, nous allons devoir nous poser la question : quel est le sort des objets massifs et des photons qui tentent de s’approcher de la région r = rS ? Nous serons alors confrontés au fait que la métrique écrite dans les coordonnées de Schwarzschild-Droste est singulière à r = rS : la fonction b(r ) = − grr = (1 − rS /r )−1 devient infinie à r = rS . Ces coordonnées ne peuvent être utilisées que pour r > rS , et c’est pour cette raison que nous allons, dans cette section, nous limiter à cette région. Nous verrons dans la section suivante comment « traverser » le rayon de Schwarzschild et explorer la région r < rS . 112
Chapitre 7. Trous noirs
Nous avons observé dans la section 5.5 que les cônes de lumière dans les coordonnées de Schwarzschild-Droste se referment lorsque la coordonnée radiale r diminue (figure 5.12), et nous en avons déduit l’effet qui y est directement relié, le décalage vers le rouge gravitationnel. L’examen des cônes de lumière permet de tracer qualitativement les trajectoires des photons et des particules massives, par exemple la trajectoire d’un astronaute dans une fusée qui s’approche du centre d’un trou noir. Afin de fixer les idées, nous supposons que cet astronaute est en chute libre radiale, avec une vitesse initiale négligeable. Sur la figure 7.1, nous avons tracé la trajectoire de cet astronaute qui s’est donné comme mission l’exploration du voisinage d’un trou noir. Afin de communiquer ses relevés à un observateur terrestre, il envoie des impulsions radar à intervalles réguliers. L’intervalle de temps Δτ entre deux impulsions radar, c’est-à-dire la périodicité de ses messages, est déterminé par les battements de son horloge : τ est le temps propre de l’astronaute. Le signal est envoyé depuis la coordonnée radiale r de l’astronaute, et si l’on suppose que l’observateur terrestre est situé à une distance très grande du trou noir, robs rS , alors l’observateur terrestre recevra les signaux avec une période plus grande, d’abord en raison du singularité horizon
O
rS
r
F IGURE 7.1. Lignes d’univers de photons sortants (en vert) et de photons entrants (en bleu) avec leurs cônes de lumière dans les coordonnées de Schwarzschild. On a aussi représenté en noir la ligne d’univers d’un astronaute en chute libre radiale vers un trou noir, et en tiretés verts l’émission de photons par cet astronaute.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
113
décalage vers le rouge gravitationnel (5.17), et ensuite en raison de la vitesse de l’astronaute en chute libre radiale vers le trou noir, qui l’éloigne de l’observateur terrestre. Dans ces conditions, on peut montrer que la relation entre la périodicité des signaux émis et celle des signaux reçus par l’observateur terrestre est Δτobs =
Δτ √ . 1 − rS /r
(7.1)
Le décalage est encore plus important que le simple décalage vers le rouge gravitationnel, ce qui n’est pas étonnant car, nous l’avons noté, il faut le combiner avec l’effet Doppler dû au fait que la fusée s’éloigne de la Terre. Lorsque la coordonnée radiale r de l’astronaute se rapproche du rayon de Schwarzschild rS , le temps de l’astronaute semble se figer pour l’observateur terrestre et les mouvements de l’astronaute lui paraissent de plus en plus lents. Quant à l’astronaute, qui est en chute libre vers le trou noir, il considère que tout se passe sans accrocs, mais cette situation confortable ne va pas durer éternellement : il finira déchiré par des forces de marée, ainsi que nous le verrons dans la section suivante. Pour l’observateur terrestre qui reçoit les impulsions radar, la chute de l’astronaute vers le rayon de Schwarzschild dure un temps infini. En revanche, le temps propre Δτ mesuré par l’astronaute pour atteindre rS dans sa chute radiale est fini. Donnons un exemple qui nous servira dans la section 7.5 : l’astronaute part de la coordonnée radiale r = rS + ε, ε rS , avec une vitesse nulle. On trouve alors pour le temps de sa chute
√ cΔτS 2 rS ε.
(7.2)
Examinons maintenant le sort des photons qui suivent une trajectorie radiale : la fermeture des cônes de lumière montre que les photons sortants, c’està-dire ceux qui se propagent dans la direction des r croissants, ont d’autant plus de mal à s’échapper à l’infini qu’ils sont émis près du rayon de Schwarzschild. Les coordonnées de Schwarzschild-Droste ne permettent pas de décider du sort des photons entrants, c’est-à-dire de ceux qui se propagent dans la direction des r décroissants, et dont les lignes d’univers ont la droite r = rS pour asymptote dans ces coordonnées (figure 7.1). 7.2
À l’intérieur du rayon de Schwarzschild
Jusqu’à présent, nous n’avons pas pu explorer la région r ≤ rS en raison de la singularité dans les coordonnées de Schwarzschild-Droste à r = rS : le coefficient 114
Chapitre 7. Trous noirs
b = − grr de la métrique devient infini pour r → rS . Deux raisons peuvent expliquer la présence d’une singularité de la métrique en un point donné. (i) L’espace-temps lui-même est singulier en ce point. (ii) La singularité est due à un choix malheureux de coordonnées. En fait, dans le cas de la singularité à r = rS , c’est l’énoncé (ii) qui s’applique, ce que l’on montre en exhibant des coordonnées où la métrique est régulière en ce point. Une autre façon de procéder est d’examiner des quantités scalaires, qui sont indépendantes du système de coordonnées. Si une telle quantité est régulière à r = rS , alors il y a de bonnes chances pour que (ii) s’applique. Avec le tenseur de Riemann, on peut former la courbure scalaire R (section 5.5) et une autre quantité scalaire R , quadratique dans le tenseur de Riemann et appelée scalaire de Kretschmann. La courbure scalaire R ne donne aucune information, car elle est de toute façon identiquement nulle en l’absence de matière, mais le second scalaire R est proportionnel à 1/r6 , et il est parfaitement régulier à r = rS . Cela suggère l’existence de coordonnées régulières à r = rS , qui permettront de pénétrer dans la région r < rS . Les coordonnées régulières les plus simples ont été découvertes en 1924 par Eddington, qui ne les a pas vraiment exploitées, puis redécouvertes en 1958 par Finkelstein, qui s’en est servi pour traverser le rayon de Schwarzschild. Ces coordonnées sont appelées coordonnées d’Eddington-Finkelstein. Le lecteur curieux trouvera leur forme explicite dans l’encadré 7.1, mais il suffit d’examiner qualitativement leurs conséquences sur la propagation des photons : c’est le comportement des rayons lumineux radiaux qui donne la clé pour comprendre la structure d’un trou noir sphérique. Le schéma des lignes d’univers des photons radiaux est dessiné sur la figure 7.2, dans un système de coordonnées (t˜, r ), où t˜ est une coordonnée de type temps, définie de façon précise dans l’encadré 7.1. On constate sur la figure 7.2 que les lignes d’univers des photons se propageant de la droite vers la gauche, dans le sens des r décroissants, sont des droites : ces photons sont appelés, pour des raisons évidentes, « photons entrants ». Cependant, contrairement à ce qui se passe pour les coordonnées de Schwarzschild, l’axe des cônes de lumière est incliné par rapport à la verticale. Mais le point le plus important est que nous pouvons maintenant traverser sans encombre la ligne r = rS . Les photons entrants se propagent suivant des droites sans ressentir d’aucune manière la traversée de la ligne r = rS . En revanche, si les photons se propageant de gauche à droite, ou « photons sortants », s’échappent sans problème à l’infini lorsqu’ils sont émis avec une coordonnée r > rS , ceux qui sont émis avec r < rS sont piégés à l’intérieur de la région r < rS en raison de l’inclinaison des cônes de lumière, et il en est de même pour toute particule massive, dont la ligne
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
115
t˜ singularité horizon
O
rS
r
F IGURE 7.2. Lignes d’univers de photons dans les coordonnées d’Eddington-Finkelstein (t˜, r ) : encadré 7.1. Comme sur la figure 7.1, les lignes d’univers des photons sortants sont tracées en vert et celles des photons entrants en bleu. On remarquera un cône de lumière tangent à l’horizon. Si l’on compare à la figure précédente dessinée en coordonnées (t, r ), on constate que les lignes d’univers des photons entrants sont maintenant des droites et que les cônes de lumière sont inclinés par rapport à la verticale. Pour r < rS , l’inclinaison des cônes de lumière piège les photons émis en un point r < rS à l’intérieur de l’horizon.
d’univers doit se trouver à l’intérieur de ces cônes. Une fois passé r = rS , ni les particules massives ni les photons ne peuvent s’échapper à l’infini : la droite r = rS est une ligne de non-retour. Dans l’espace-temps à deux dimensions de la figure 7.2, r = rS définit une ligne, qui devient une hypersurface à trois dimensions dans un espace-temps à quatre dimensions ; cette hypersurface est appelée horizon des événements, ou simplement horizon. Cet horizon est une hypersurface de genre lumière : la figure 7.2 montre qu’elle est tangente à des cônes de lumière, et c’est, nous l’avons vu, une surface de non-retour. Un des vecteurs tangents à l’horizon en un point, eˆt , est de longueur nulle, eˆ2t = 0, et par conséquent à la fois tangent et perpendiculaire à l’horizon. Il est immédiat de vérifier que le vecteur eˆt = (1, 0, 0, 0) possède bien cette propriété pour la métrique (7.4) lorsque r = rS , car en ce point gtt = 0 (voir l’encadré 7.1). L’horizon est tissé par les rayons lumineux qui d’une part ne peuvent pas s’échapper à l’infini, et d’autre part ne rejoignent pas le point r = 0 : les rayons lumineux radiaux à r = rS font du 116
Chapitre 7. Trous noirs
surplace ! Il existe deux autres vecteurs tangents à l’horizon, qui sont de genre espace et sont orthogonaux à eˆt : on peut choisir par exemple les vecteurs (0, 0, 1, 0) et (0, 0, 0, 1). L’aire A de l’horizon s’obtient en écrivant r = rS dans les coordonnées d’Eddington-Finkelstein et en intégrant sur θ et φ, avec pour résultat A = 4πrS2 , l’aire d’une sphère de rayon rS . La lumière, ou toute particule localisée à l’intérieur de l’horizon des événements, est irrémédiablement piégée et ne peut plus s’échapper : aucune information sur un événement localisé à l’intérieur de l’horizon n’est accessible à un observateur à l’infini. Comme le décalage vers le rouge à r = rS est infini, l’horizon est aussi une surface de décalage vers le rouge infini, mais ceci est une spécificité de la symétrie sphérique, ainsi que nous le verrons dans la section suivante. Afin d’éviter toute ambiguïté, insistons sur le fait que l’horizon est une membrane parfaitement immatérielle, et d’ailleurs on le traverse sans s’en apercevoir dans le sens des r décroissants si le trou noir est suffisamment massif, mais sans espoir de retour. En revanche, alors que la relativité générale est au départ une théorie locale, par exemple les équations d’Einstein relient courbure et densité d’énergie-impulsion dans le voisinage d’un point, l’horizon des événements est un concept global. En effet, pour déterminer sa position, il faut disposer de la métrique sur la totalité de l’espace-temps afin de construire l’ensemble des géodésiques de lumière. Il peut même arriver que la localisation de l’horizon à un certain instant dépende de la géométrie de l’espace-temps dans le futur de cet instant. Il est impossible de détecter la présence d’un horizon par des observations locales, car rien ne distingue l’horizon de son voisinage. Encadré 7.1. Coordonnées d’Eddington-Finkelstein.
On passe d’abord des coordonnées (t, r ) aux coordonnées (v, r ) en définisssant v par r ct = v − r − rS ln − 1. (7.3) rS Il est immédiat de calculer la métrique r c2 (Δs)2 = 1 − S (Δv)2 − 2Δv Δr − r2 (ΔΩ)2 , r
(7.4)
expression qui est parfaitement régulière à r = rS . Il est aussi utile de définir une variable t˜ par t˜ = v − r. Les lignes d’univers des photons entrants sont données par les droites t˜ + r = cste, tandis que celles des photons sortants le sont par ˜t = −r + 2 r + rS ln r − 1 + cste. rS Lorsque r rS , cette dernière équation devient approximativement celle de droites t˜ − r = cste, car le logarithme devient négligeable.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
117
Les coordonnées d’Eddington-Finkelstein ont éliminé la singularité à r = rS , mais la métrique reste singulière à r = 0. Cette singularité est une vraie singularité de l’espace-temps, correspondant à une courbure qui devient infinie, et cette singularité ne peut pas être éliminée par un changement de coordonnées astucieux. En effet, le scalaire de Kretschmann R mentionné ci-dessus est proportionel à 1/r6 , et il est donc singulier au point r = 0, indépendamment du système de coordonnées. Pour mieux comprendre le caractère de cette singularité, observons qu’une surface r = cste est, lorsque r < rS , une surface de genre espace. En effet, on constate que pour Δr = 0 les trois coefficients de la métrique (7.4) sont négatifs. Le « point » r = 0 correspond en fait à une surface de genre espace, et c’est un instant dans le temps, non un point dans l’espace. Pour r < rS , la coordonnée r est de genre temps, et de même que pour r > rS le temps ne peut s’écouler que dans un seul sens, pour r < rS la coordonnée r ne peut se diriger que dans un seul sens. Soulignons enfin que c’est l’existence d’un horizon qui caractérise un trou noir, et non l’existence d’une singularité centrale. L’examen de l’effondrement gravitationnel d’une étoile massive permet de mieux cerner la configuration d’un trou noir. Si la masse d’une étoile est suffisamment importante, il arrive un moment où la pression interne ne peut plus s’opposer efficacement à la gravitation, et l’étoile va s’effondrer sur son centre. La figure 7.3 représente schématiquement cet effondrement dans une géométrie à symétrie sphérique. Cette figure montre la ligne d’univers d’un point sur la surface de l’étoile, lequel émet périodiquement des photons. Tant que la surface ne croise pas l’horizon, les photons peuvent s’échapper à l’infini. Mais dès que ce croisement a eu lieu, ils vont rejoindre la singularité de courbure. La métrique à l’intérieur de l’étoile n’est pas celle de Schwarzschild, car cet intérieur n’est pas vide. On peut se représenter l’horizon comme l’histoire d’une « bulle de lumière » émise au point P sur la figure. Toutefois, cette figure est un peu problématique, car la propagation d’un photon à l’intérieur de l’étoile est complexe. D’une part elle n’est pas régie par la métrique de Schwarzschild, et d’autre part la propagation s’effectue dans un milieu dense : rappelons qu’un photon émis au centre du Soleil met environ 100 000 années à s’échapper jusqu’à la surface, et quelques heures dans le cas d’une supernova. Si l’on voulait éviter ce dernier effet, il serait préférable de choisir comme parcours entre le point P et la surface celui d’un neutrino, à condition de pouvoir négliger sa masse. Revenons pour clore cette section à l’astronaute en chute libre radiale vers le centre du trou noir. Dans un référentiel en chute libre, la théorie newtonienne de l’encadré 5.2 montre que les forces de marée sont proportionnelles à 1/r3 . Deux objets séparés par une distance d, en chute libre le long d’un même rayon, comme les objets A et B de la figure 2.1c, sont soumis, en vertu de (5.9), à une accélération c2 drS /r3 qui tend à les écarter. Dans la direction perpendiculaire, 118
Chapitre 7. Trous noirs
t˜
singularité à r = 0
r horizon
observateur lointain
P surface de l’étoile qui s’effondre
F IGURE 7.3. Effondrement gravitationnel d’une étoile montrant la ligne d’univers décrite dans le plan (t˜, r ) par un point sur la surface de l’étoile (ligne continue rouge) et l’émission de photons (tirets verts). Lorsque la surface croise l’horizon (en bleu), les photons émis partent verticalement en suivant l’horizon, et ensuite tous les photons rejoignent la singularité à r = 0. L’horizon peut être vu comme l’histoire d’une « bulle » de lumière émise depuis le point P. Dans la région intérieure à l’étoile, la métrique n’est pas celle Schwarzschild en raison de la présence de matière.
l’accélération est c2 drS /(2r3 ) et tend à rapprocher les objets. Ces résultats se transposent à la relativité générale à condition d’utiliser un référentiel en chute libre et de remplacer le temps newtonien par le temps propre (annexe 11.5). Les forces de marée au voisinage de l’horizon sont proportionnelles à la courbure 1/rS2 , et plus le trou noir est massif, plus la traversée de l’horizon est indolore. Si le trou noir est supermassif (voir la section 7.4), le rayon de Schwarzschild est grand et les forces de marée sont tout à fait supportables au voisinage de rS . Un calcul numérique simple montre que pour un trou noir galactique de masse 1 million de masses solaires, le rayon de Schwarzschild vaut environ 3 × 109 m, et la force entre la tête et les pieds de l’astronaute correspond à une accélération d’un millième de celle de la pesanteur terrestre, autant dire indétectable. Pour un trou noir stellaire dont la masse vaut 10 masses solaires, cette accélération serait de 109 fois celle de la pesanteur. Notre intrépide astronaute peut donc traverser sans encombre l’horizon d’un trou noir supermassif, mais toute communication avec l’observateur terrestre sera coupée après cette traversée. Ensuite, il sera irrésistiblement attiré par la singularité à r = 0 qu’il rejoindra en moins d’une minute de son temps propre et il sera soumis à des forces
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
119
de marée devenant infinies : s’il plonge la tête la première dans le trou noir, la différence entre les forces sur sa tête et celles sur ses pieds deviendra infinie, il sera écartelé suivant cette direction tout en étant infiniment comprimé dans la direction perpendiculaire, et il sera finalement déchiqueté avant de rejoindre la singularité. Cette déchirure due aux forces de marée a probablement été observée lors du passage d’étoiles au voisinage d’un trou noir.
7.3
Trous noirs en rotation
Le cas d’un trou noir à symétrie sphérique est (relativement) simple à traiter, mais c’est une idéalisation. En pratique, les objets de l’astrophysique, étoiles ou galaxies, possèdent des mouvements de rotation, et donc un moment angulaire (ou moment cinétique). Rappelons la définition du moment angulaire : si une masse ponctuelle m suit une orbite circulaire de rayon r avec une vitesse v autour d’un centre O, elle possède un moment angulaire par rapport à O qui est un vecteur dirigé perpendiculairement au plan de l’orbite et dont la norme est J = mrv. Étant donné que les trous noirs absorbent une quantité énorme de matière en rotation, on s’attend à ce que les trous noirs eux-mêmes soient en rotation avec un moment angulaire J. Le paramètre qui caractérise le moment angulaire par rapport à la masse M du trou noir est une longueur, le paramètre de Kerr, a = J/Mc, et le paramètre sans dimension correspondant est a/rS = cJ/(2GM2 ). Il existe de bonnes raisons de penser que pour beaucoup de trous noirs a est proche, mais toujours inférieur à la moitié du rayon de Schwarzschild : a/rS < ∼ 1/2. Comme précédemment, la masse M du trou noir peut se déduire de l’observation d’objets en orbite à grande distance. En théorie, le moment angulaire J pourrait se déduire de l’observation de l’axe de rotation de gyroscopes à grande distance, comme dans la section 6.5, de sorte que M et J sont en principe des quantités parfaitement mesurables par un observateur à l’infini. En pratique, on déduit la vitesse angulaire de rotation d’un trou noir en observant les décalages Doppler et gravitationnel du rayonnement émis par des objets du disque d’accrétion en orbite autour du trou noir. La distorsion de l’espace au voisinage d’un trou noir s’imprime sur l’émission de rayonnement à partir de régions proches de l’horizon, et nous verrons que le rayon minimal de l’orbite ISCO peut être six fois plus petit dans le cas d’un trou noir en rotation que dans celui d’un trou noir sphérique : dans le premier cas, l’émission peut s’effectuer beaucoup plus près de l’horizon. Une raie d’émission particulièrement utilisée est celle du fer au voisinage de 6,4 keV, et le profil observé de cette raie modifié par décalages Doppler et gravitationnel nous donne des informations sur le voisinage de l’horizon. Comme précédemment, nous définissons
120
Chapitre 7. Trous noirs
le rayon de Schwarzschild par rS = 2GM/c2 . À l’orientation du moment angulaire est associé un sens de rotation : si le moment angulaire est orienté suivant l’axe vertical Oz et dans le sens de cet axe, alors ce sens de rotation dans un plan perpendiculaire horizontal est le sens inverse des aiguilles d’une montre, ou sens trigonométrique, et le sens des aiguilles d’une montre si l’orientation est inversée. La métrique d’un trou noir en rotation est supposée indépendante du temps, comme celle de Schwarzschild, mais elle n’est plus à symétrie sphérique. La symétrie qui survit est celle des rotations autour de l’axe du trou noir, parallèle à la direction du moment angulaire que nous choisirons suivant la verticale Oz. Nous sommes en présence d’une situation stationnaire, car rien ne change en un point donné de l’espace-temps, mais la situation n’est pas pas statique, puisque le trou noir tourne. Pour comprendre la distinction entre stationnaire et statique, on peut prendre l’exemple d’un courant électrique continu d’intensité constante : en un point donné du fil électrique, rien ne change en fonction du temps, et pourtant des charges sont en déplacement. La situation est stationnaire, mais pas statique. Il est tout à fait remarquable que le physicien mathématicien néo-zélandais Roy Kerr ait pu écrire en 1963 la métrique correspondant à un trou noir en rotation, la métrique de Kerr. Un trou noir en rotation est d’ailleurs souvent appelé trou noir de Kerr. La métrique de Kerr est beaucoup plus compliquée que celle de Schwarzschild, et il n’est pas utile de l’écrire dans ce livre, même en annexe. Cette métrique se réduit à celle de Schwarzschild lorsque J = 0, et c’est aussi une métrique asymptotiquement plate, qui tend vers la métrique de Minkowski lorsque r → ∞. L’axe de rotation est pris conventionnellement suivant la direction verticale θ = 0 et θ = π, et la rotation correspond donc à une variation de φ. Un point important est que cette métrique introduit un terme en Δt Δφ : autrement dit, le coefficient gtφ de la métrique est non nul. On peut comprendre la présence de ce terme en remarquant que la situation physique est invariante par les changements simultanés t → −t et φ → −φ : si l’on inverse le sens du temps et simultanément le sens de rotation, rien ne change, et un terme en Δt Δφ est compatible avec cette invariance1 . L’existence d’un coefficient non nul gtφ (r, θ ) dans la métrique conduit à un effet d’entraînement des référentiels d’inertie. En effet, en raison de ce terme, une particule en chute libre qui part de l’infini avec une vitesse nulle, et que nous prenons pour simplifier dans le plan de symétrie θ = π/2, ne suit pas une trajectoire radiale comme pour le trou noir de Schwarzschild, mais elle invariance permet d’exclure dans la métrique des termes en Δt Δr, Δt Δθ, Δr Δt, Δr Δφ ; un terme en Δr Δθ peut être éliminé par un changement de coordonnées. Seuls les coefficients gtt , grr , gtφ sont donc non nuls, et ils ne dépendent que de r et θ.
1 Cette
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
121
acquiert un mouvement de rotation dont le sens est déterminé par l’orientation du moment angulaire du trou noir, et donc un moment angulaire de même orientation que celui du trou noir. Cet effet n’est pas spécifique d’un trou noir, il est lié à la rotation de la distribution de masse qui crée le champ de gravitation, et il est connu sous le nom d’effet Lense-Thirring dans le cas de la rotation de la Terre (section 6.5). surface de redshift infini S−
singularité z
horizon r = r−
surface de redshift infini S+
y
x
ergorégion
horizon r = r+ F IGURE 7.4. Structure spatiale d’un trou noir de Kerr en coordonnées ( x, y, z). Les surfaces de décalage vers le rouge infini sont tracées en rouge et les horizons en bleu. La singularité en anneau de rayon a est située dans le plan horizontal θ = π/2. L’ergorégion est la région en rouge.
La structure du trou noir découle de la métrique de Kerr (figure 7.4). Comme dans le cas à symétrie sphérique, il existe un horizon des événements : c’est la surface tissée par les rayons lumineux qui, d’une part, ne peuvent pas s’échapper à l’infini et, d’autre part, ne rejoignent pas la région r = 0. Le vecteur de genre lumière tangent (et perpendiculaire) à l’horizon possède cette fois une composante φ. Il est de la forme2 eˆt = (1, 0, 0, Ω), avec Ω = ac/(rS r+ ), où 1 (7.5) r+ = rS + rS2 − 4a2 , 2 est la coordonnée radiale de l’horizon. Ω est la vitesse angulaire de rotation du trou noir pour un observateur à l’infini. Pour se représenter intuitivement 2 Pour
122
montrer que eˆ2t = 0, il faut utiliser la forme explicite de la métrique de Kerr.
Chapitre 7. Trous noirs
l’horizon d’un trou noir en rotation, il est commode de se placer dans un espacetemps à trois dimensions : dans ce cas, les rayons lumineux qui tissent l’horizon tournent autour de l’axe des temps avec la vitesse angulaire Ω et décrivent une hélice tracée sur un cylindre de rayon r+ . On peut calculer l’aire de l’horizon qui est donnée par A = 4πrS r+ , ce qui coïncide avec le résultat de la symétrie sphérique lorsque a = 0. Contrairement au cas du trou noir de Schwarzschild, cet horizon ne coïncide pas avec la surface de décalage vers le rouge infini. Cette surface, notée S+ , est appelée surface limite stationnaire, et elle est caractérisée par la condition gtt = 0. L’examen de sa coordonnée radiale montre qu’elle se trouve entièrement à l’extérieur de l’horizon, sauf pour θ = 0, π où les deux surfaces sont tangentes. La dénomination surface limite stationnaire vient de la propriété suivante : à l’extérieur de cette surface, un photon peut tourner dans les deux sens, par exemple dans le plan équatorial, mais à l’intérieur il peut tourner uniquement dans le sens de rotation du trou noir. Juste sur la surface, un seul sens de rotation est possible, et un photon qui voudrait tourner dans l’autre sens ferait du surplace, d’où le terme stationnaire. Il existe d’autres surfaces à l’intérieur de l’horizon dessinées sur la figure 7.4, qui sont probablement non pertinentes physiquement. On notera simplement la singularité en anneau de rayon a dans le plan θ = π/2. La région entre la surface stationnaire limite S+ et l’horizon à r = r+ est appelée ergorégion et sa fontière est l’ergosphère (figure 7.4). Il est impossible à une particule ou à un photon de s’échapper de la région r < r+ , et donc de traverser l’horizon pour partir à l’infini. En revanche, une particule dans l’ergorégion peut encore s’échapper à l’infini, à condition de disposer de propulseurs suffisamment puissants, mais même dans ce cas elle ne peut pas y rester immobile. L’effet d’entraînement l’oblige à tourner dans le sens défini par le moment angulaire du trou noir. Cela se voit en montrant que les photons sont obligés de tourner dans ce sens, ils ne peuvent pas tourner dans le sens opposé. En physique classique, un trou noir sphérique peut seulement augmenter sa masse en absorbant de la matière extérieure, mais il ne peut pas en perdre, sauf par rayonnement de Hawking (section 7.5). Ceci est un effet quantique : classiquement, l’échange d’énergie est à sens unique, de l’extérieur vers le trou noir. Ce n’est pas le cas pour un trou noir en rotation, qui peut échanger de l’énergie et du moment angulaire avec le milieu extérieur dans les deux sens. Pour s’en convaincre, nous allons décrire un mécanisme (pour l’instant entièrement théorique !) imaginé par Roger Penrose (figure 7.5), appelé processus de Penrose. Faisons traverser l’ergosphère à une particule incidente instable venant de l’infini, dont l’énergie-impulsion, ou quadri-impulsion, est pˆ inc. . Cette particule se désintègre dans l’ergorégion en une particule de quadri-impulsion pˆ tn , qui rejoint le centre du trou noir, et une particule de quadri-impulsion pˆ sort. , qui LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
123
inc. ergorégion sort. tn
ergosphère
Ω
horizon
F IGURE 7.5. Le processus de Penrose dans un plan θ = cste. Le code couleur est identique à celui de la figure 7.4.
s’échappe à l’infini. La quadri-impulsion doit être conservée dans cette désintégration, car elle l’est nécessairement dans un référentiel localement inertiel où la relativité restreinte est valable pˆ inc. = pˆ sort. + pˆ tn . En suivant des géodésiques pour les particules incidente et sortante, on déduit la conservation de l’énergie sous la forme (annexe 11.5) Esort. (∞) = Einc. (∞) − Etn . Si la particule tn devait partir à l’infini, son énergie serait nécessairement positive, et donc celle de la particule sortante nécessairement inférieure à celle de la particule entrante. Mais l’ergosphère est précisément la surface où gtt change de signe : le rôle des énergies et des impulsions est échangé. Comme une impulsion suivant une direction donnée peut être positive ou négative, il est possible d’avoir dans l’ergorégion Etn < 0, et dans ce cas la particule sortante possède une énergie supérieure à celle de la particule entrante : le milieu extérieur a gagné de l’énergie ! La conservation globale de l’énergie est assurée par une diminution de la masse du trou noir. Le processus correspond également à un échange de moment angulaire. On peut en effet montrer (annexe 11.5) l’inégalité Etn ≤ Ωobs Ltn , où Ωobs est la vitesse angulaire d’un observateur au voisinage du point de désintégration et Ltn le moment angulaire de la particule tombant dans le trou noir. Comme Etn est négative, il en est de même pour Ltn ; le moment 124
Chapitre 7. Trous noirs
angulaire du trou noir diminue dans le processus de Penrose. Autrement dit, le milieu extérieur s’approvisionne en énergie et en moment angulaire sur le dos du trou noir ! Ce qui précède conduit à une observation d’une grande importance : dans le processus de Penrose, l’aire A de l’horizon ne peut qu’augmenter. En effet, la variation de masse du trou noir est ΔM = Etn /c2 et la variation de son moment angulaire ΔJ = Ltn . La variation de l’aire de l’horizon se calcule aisément ΔA = 16π ( G/c4 )(rS2 − 4a2 )−1/2 rS r+ [Δ( Mc2 ) − ΩΔJ ]. Mais nous avons noté que Δ( Mc2 ) ≥ Ωobs ΔJ, et la vitesse angulaire limite d’un observateur est Ω. Par conséquent, l’aire de l’horizon ne peut que croître. Cette propriété sera commentée à la fin de la section 7.5, quand nous examinerons l’entropie d’un trou noir. Un trou noir de masse et moment angulaire initiaux M et J peut en principe perdre de l’énergie et du moment angulaire jusqu’à se transformer en un trou noir sphérique de « masse irréductible » Mirr. donnée par 2 = M2 + M4 − c2 J 2 /( GM)2 . 2Mirr. Comme dans le cas des trous noirs de Schwarzschild, il est possible de déterminer les trajectoires des particules massives ou des photons autour du trou noir. Cependant, l’analyse relève de méthodes numériques car, en l’absence de symétrie sphérique, le moment angulaire n’est pas conservé : le mouvement ne s’effectue pas dans un plan et une approche analytique est impossible. La seule exception concerne les orbites situées dans le plan de symétrie équatorial θ = π/2, perpendiculaire à l’axe de rotation. Si une particule massive (ou un photon) est localisée initialement dans un tel plan avec une vitesse également dans ce plan, alors elle y restera : la composante suivant l’axe de rotation du moment angulaire est conservée. Nous allons donc nous placer dans ce plan équatorial. Dans ces conditions, on peut écrire pour les particules massives un potentiel effectif qui généralise (6.4), et ce potentiel est donné pour une masse m = 1 par Weff (r ) = −
c2 r S 2 − a2 (ε2 − c2 ) rS ( − aε)2 + − , 2r 2r2 r3
(7.6)
où ε est l’énergie de la particule à l’infini (ε = c2 pour une particule au repos : E = mc2 avec m = 1) et a = J/Mc est le paramètre de Kerr introduit ci-dessus. Si a = 0, on retrouve le potentiel effectif (6.4) du trou noir de Schwarzschild. Contrairement au cas de la symétrie sphérique, le potentiel effectif Weff (r ) est une fonction de ε, ce qui rend ce potentiel effectif moins utile car on ne LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
125
peut pas en tracer une courbe unique indépendante de ε. Cependant, on peut se servir de (7.6) pour discuter graphiquement les orbites en suivant la méthode exposée dans la section 6.1. De plus, le potentiel effectif dépend non seulement de la valeur absolue du moment angulaire , mais aussi de son signe, ce qui est logique car le moment angulaire du trou noir définit un sens de rotation privilégié. Le potentiel n’est pas le même selon que > 0 : la particule tourne dans le même sens que le trou noir, ou < 0 : la particule tourne en sens contraire. Comme dans le cas du trou noir de Schwarzschild, il est intéressant d’examiner les orbites circulaires. Pour un même rayon, on trouve deux types d’orbites stables selon le sens de rotation de la particule. L’orbite dont le sens de rotation est celui du trou noir possède l’énergie la plus basse, elle est la plus liée. Quand on diminue le rayon de l’orbite, on rencontre, comme dans la section 6.2, la dernière orbite circulaire stable, ou orbite ISCO. Pour r = rISCO et une particule tournant dans le même sens que le trou noir, et dans le cas limite a = rS /2, on obtient les valeurs suivantes de l’énergie, en rétablissant m rISCO =
rS 2
cr = √S 3
mc2 ε= √ . 3
On peut déduire des caractéristiques de cette orbite la fraction de l’énergie gravitationnelle dissipée sous différentes formes (chaleur, rayonnement. . .) par une particule √ qui part de l’infini pour tomber sur une orbite ISCO. Elle peut atteindre 1 − 1/ 3 0, 42, soit 42 %, à comparer à 6 % pour un trou noir de Schwarzschild (section 6.2) et 0, 7 % pour une réaction thermonucléaire (section 4.3). Il est également possible d’écrire un potentiel effectif dans le cas des photons, en fonction du paramètre d’impact b et du signe de , /|| a 2 r 1 a 2 phot S . (7.7) Weff = 2 1 − − 1− r b r || b À nouveau, le potentiel dépend du sens de rotation par l’intermédiaire du signe de et il se réduit à (6.6) pour a = 0. À l’intérieur d’un trou noir sphérique, de même que dans un trou noir de Kerr, on rencontre des singularités de l’espace-temps. Cependant, ces singularités sont localisées à l’intérieur de l’horizon, et donc non observables : si un mathématicien décide d’en avoir le cœur net et d’explorer la nature de la singularité, il pourra éventuellement faire des observations, mais il ne pourra jamais en rendre compte à ses collègues restés sur Terre, car le résultat de ses recherches ne peut pas être transmis à travers l’horizon. Une singularité qui ne serait pas entourée d’un horizon serait « singularité nue ». La conjecture de censure cosmique de Penrose, conjecture plausible mais dont il n’existe pas aujourd’hui de
126
Chapitre 7. Trous noirs
démonstration rigoureuse, affirme que tout effondrement gravitationnel doit conduire à un trou noir, et non à une singularité nue. On peut montrer par exemple qu’il est impossible de dépasser la valeur a = rS /2 en ajoutant de la matière à un trou noir. Si a dépassait la valeur limite a = rS /2, alors il n’existerait plus d’horizon (la formule (7.5) n’est plus définie), et on observerait une singularité nue, en contradiction avec la conjecture de Penrose. Fort heureusement, les moments angulaires observés pour les trous noirs sont toujours inférieurs à la valeur limite, bien qu’ils s’en approchent parfois de très près. Nous avons attribué à un trou noir une masse M et un moment angulaire J. Un trou noir peut encore avoir une caractéristique supplémentaire, une charge électrique3 Q et c’est tout ! Un trou noir est entièrement caractérisé par sa masse, son moment angulaire et sa charge. Ceci est absolument remarquable : un trou noir n’a pas de structure, ce qui est souvent résumé par la phrase : « un trou noir n’a pas de cheveux ». On peut par exemple imaginer un trou noir formé par la fusion de deux étoiles à neutrons. L’état initial est très complexe et dépend de nombreux paramètres : masses et moments angulaires des deux étoiles, orientation et distance relatives, champs magnétiques etc. Pourtant, après fusion, il ne reste plus que deux nombres et une orientation, définissant la masse et le moment angulaire totaux. 7.4
Trous noirs astrophysiques
Il est bien sûr impossible d’avoir une vision directe d’un trou noir car, contrairement à une étoile ou une galaxie, un trou noir ne peut, par définition, émettre ni photons ni particules d’aucune sorte. Un trou noir isolé est invisible, et c’est seulement par ses effets sur son environnement que la présence d’un trou noir devient plausible. On peut par exemple observer des étoiles en orbite autour d’un candidat trou noir. Si un extraterrestre malveillant transformait par magie le Soleil en trou noir, l’orbite de la Terre et celles des planètes ne seraient pas modifiées, mais la vie sur Terre deviendrait problématique en l’absence de lumière solaire. En observant les orbites de planètes, un astrophysicien extraterrestre pourrait déduire l’existence du Soleil et déterminer sa masse grâce à (5.3). De façon générale, la masse d’un candidat trou noir sera déduite de l’observation des trajectoires d’objets en mouvement autour de celui-ci. Il y a de sérieux arguments en faveur de l’existence des trous noirs, mais il faut néanmoins se souvenir que le principal argument est le suivant : aucun autre objet astrophysique, connu ou plausible, ne peut raisonnablement expliquer certains 3 Cependant,
la charge électrique éventuelle d’un trou noir serait rapidement neutralisée par des charges opposées de son environnement et en pratique les trous noirs sont électriquement neutres.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
127
phénomènes observés, tels qu’un mouvement d’étoiles ou un rayonnement X très intense. Les astrophysiciens ont été capables de mettre en évidence deux types de trous noirs4 : (i) les trous noirs stellaires, du type « étoile effondrée », dont la masse varie entre 5 et 20 masses solaires, et (ii) les trous noirs situés au centre de galaxies, dont les masses vont de 1 million à 10 milliards de masses solaires. Commençons par le cas (i). Très schématiquement, lorsqu’une étoile a épuisé son carburant thermonucléaire, la pression due à la chaleur dégagée par les réactions thermonucléaires diminue brutalement et ne peut plus contrebalancer l’attraction gravitationnelle, ce qui provoque l’effondrement de l’étoile. Trois stades finaux sont possibles. 1. Si la masse de l’étoile est inférieure à environ 8 masses solaires, une fraction importante de la masse est perdue par vent stellaire, et on obtient une étoile finale de masse très inférieure. Si cette masse finale est inférieure à 1,4 masse solaire, ou masse de Chandrasekhar, le résultat est une naine blanche, où la pression qui s’oppose à l’effondrement gravitationnel est due aux électrons. Le rayon d’une naine blanche est de l’ordre du rayon de la Terre. 2. Si la masse de l’étoile finale est supérieure à 1,4 masse solaire et inférieure à 2–3 masses solaires, alors on obtient une étoile à neutrons, où la pression qui s’oppose à l’effondrement gravitationnel est due aux neutrons. Le rayon d’une étoile à neutrons est de l’ordre de 10 km, et sa densité, voisine de 1018 kg/m3 , est de l’ordre de celle d’un noyau atomique, voire même supérieure. 3. Si la masse initiale est trop importante, rien ne peut s’opposer à l’effondrement gravitationnel (figure 7.3), et l’étoile termine sa vie comme un trou noir. Il existe deux méthodes principales, complémentaires, qui sont susceptibles de rendre plausible l’existence d’un trou noir stellaire. Dans la première méthode, on utilise le fait que le trou noir forme un système lié avec une étoile associée, son compagnon, en général une étoile à neutrons. Les étoiles doubles sont nombreuses : on estime que 50 % des étoiles de l’Univers vivent en couple, et elles ont été abondamment étudiées, mais dans notre cas seule une des deux étoiles est visible. L’orbite de cette étoile peut être observée directement et, dans des conditions favorables, on en déduit la masse de l’étoile invisible. Si cette masse est plus grande que 3 masses solaires, c’est nécessairement un trou noir, 4 On
a observé récemment des trous noirs de masse intermédiaire, par exemple un trou noir dont la masse vaut 400 masses solaires dans la galaxie M82.
128
Chapitre 7. Trous noirs
car la théorie de l’effondrement gravitationnel montre que l’on ne peut pas avoir des naines blanches ou des étoiles à neutrons aussi lourdes. Dans la seconde méthode, on observe le rayonnement électromagnétique émis par le système double dans le domaine des rayons X. Bien évidemment, le trou noir n’émet aucun rayonnement, mais la matière qui est aspirée vers le trou noir en provenance de son compagnon en émet abondamment (figure 7.6). En effet, les particules s’échappant du compagnon ne tombent pas directement dans le trou noir, mais elle forment autour de celui-ci un disque d’accrétion. Elles vont ensuite chuter en spirale depuis l’extérieur de ce disque vers l’orbite ISCO, et après avoir passé cette orbite, elles plongent très rapidement vers le centre du trou noir avec une vitesse angulaire croissante, en raison de la conservation du moment angulaire. La chute dans le disque d’accrétion s’accompagne de phénomènes dissipatifs qui puisent leur énergie dans la conversion d’énergie gravitationnelle en d’autres formes d’énergie, en particulier électromagnétique ; l’accrétion conduit à des températures élevées et à l’émision de rayons X observés grâce à des télescopes à rayons X embarqués dans des satellites. Cependant, la modélisation
8.82e-06
1.76e-05
2.65e-05
3.54e-05
4.43e-05
5.31e-05
6.19e-05
7.08e-05
7.96e-05
F IGURE 7.6. Simulation numérique du disque d’accrétion d’un trou noir sphérique. Reproduit de Vincent et al. [2011]. Courtoisie d’Éric Gourgoulhon.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
129
des disques d’accrétion est complexe et comporte des incertitudes. Elle fait intervenir plusieurs domaines de la physique : gravitation, électromagnétisme, hydrodynamique visqueuse, magnétohydrodyamique. . . Un grand nombre de processus intervient dans la conversion d’énergie gravitationnelle en chaleur et d’autres formes d’énergie, dont le rayonnement électromagnétique que nous pouvons observer. Grâce à ces observations, on a mis en évidence dans notre galaxie une vingtaine de trous noirs stellaires, dont les masses vont de 5 à 20 masses solaires. Dans le cas (ii), un exemple de trou noir galactique est celui qui se trouve au centre de notre galaxie. La figure 7.7 montre l’orbite elliptique d’une étoile autour de ce trou noir, qui a été suivie sur plusieurs années. La masse de « notre » trou noir est d’environ 4 millions de masses solaires : les masses des trous noirs galactiques vont de 1 million à 10 milliards de masses solaires. Le rayon de Schwarzschild du trou noir de notre galaxie est d’environ 1010 m. L’observation des étoiles autour de cet objet central, quel qu’il soit, montre que son rayon est inférieur à 6 × 1014 m, soit 1 000 fois le rayon de Schwarzschild en ordre de grandeur. On peut faire mieux, car l’objet est un puissant émetteur d’ondes radio, et des méthodes interférométriques permettent de montrer que son diamètre est inférieur à environ 30 rS . Contrairement au cas des trous noirs stellaires dont le
F IGURE 7.7. Trou noir au centre de notre galaxie et orbite d’une étoile autour de ce trou noir. D’après Genzel et al. [2010].
130
Chapitre 7. Trous noirs
mécanisme de formation fait consensus, dans le cas des trous noirs supermassifs le mécanisme de formation fait toujours débat aujourd’hui. Les quasars sont les plus puissants émetteurs de rayonnement électromagnétique dans l’Univers. Ils correspondent vraisemblablement à des régions compactes situées au centre de galaxies, qui entourent un trou noir supermassif. Les quasars exhibent un décalage vers le rouge cosmologique (section 9.1) très élevé, avec un z compris entre 0,06 et 7. Ils sont donc localisés à très grande distance, certains même aux confins de l’Univers observable. Leur luminosité peut atteindre 4 × 1012 fois celle du Soleil. Ils sont utiles comme points de référence dans le ciel, car leur position peut être obtenue à partir de leur émission d’ondes radio avec une précision de 0,001 seconde d’arc, une précision meilleure par plusieurs ordres de grandeur que celle des mesures optiques. Les test ultime de l’existence d’un trou noir serait l’observation directe de son horizon des événements grâce à l’ombre portée par l’horizon sur son environnement. On aurait ainsi un accès direct à la la propriété caractéristique d’un trou noir, son horizon. Grâce à l’inteférométrie à très longue base (VLBI), une telle observation n’est pas impossible dans les années à venir. Les meilleurs candidats potentiels pour une telle observation sont le trou noir au centre de notre galaxie, situé à 26 000 années lumière, dont l’horizon couvre 55 microsecondes d’arc, et le trou noir supermassif de 6 milliards de masses solaires situé dans la galaxie géante M87 à 55 millions d’années lumière, dont l’horizon couvre 40 microsecondes d’arc. La résolution actuelle est de 100 microsecondes d’arc, ce qui laisse espérer une observation dans un avenir pas trop lointain. 7.5
Rayonnement de Hawking et thermodynamique
∗
En physique quantique, le vide n’est pas un milieu où rien ne se passe. Bien au contraire, le vide est le siège d’une intense activité de création et de destruction de paires particules-antiparticules, par exemple des paires électron (e− )positron (e+ ). On comprend que ceci est possible grâce à un raisonnement fondé sur l’inégalité de Heisenberg temporelle. Celle-ci énonce qu’un processus physiquement observable doit obéir à la condition ΔE Δt ≥ h¯ /2, où ΔE est l’écart quadratique moyen sur l’énergie, Δt un temps caractéristique du processus et h¯ la constante de Planck divisée par 2π, h¯ = 1, 05 × 10−34 J.s, qui fixe l’échelle caractéristique des processus quantiques. Une fluctuation spontanée ΔE de l’énergie peut se produire pourvu qu’elle dure un intervalle de temps Δt au maximum de l’ordre de h¯ /ΔE. ∗ La
lecture de cette section suppose quelques connaissances de base en physique quantique et en thermodynamique. Toutefois, cette section peut être omise sans problème, car les deux chapitres suivants sont totalement indépendants des résultats qui y sont énoncés.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
131
Il peut arriver qu’une fluctuation d’énergie ΔE se produise spontanément dans le vide, ce qui viole la conservation de l’énergie, mais cette violation est admissible, nous l’avons vu, pourvu qu’elle se passe sur un intervalle de temps Δt suffisamment court pour ne pas être observable. Un tel processus est appelé processus virtuel. Par essence, les processus virtuels ne sont pas directement observables, mais ils peuvent influencer des processus physiques parfaitement réels : par exemple, la masse du quark le plus lourd, le quark top, ou quark t (173 GeV/c2 , 180 fois la masse du proton), a été prédite avec une précision de quelques GeV/c2 en prenant en compte des processus virtuels, bien avant que ce quark ne soit produit dans un accélérateur en 1995. On possédait aussi des indications, quoique moins précises, sur la masse du fameux boson BEH avant sa découverte au CERN en 2012. Imaginons qu’une paire virtuelle électron-positron soit produite au voisinage de l’horizon d’un trou noir, que nous supposons sphérique afin de simplifier, avec une coordonnée radiale rS + ε. À une distance ε > 0 du rayon de Schwarzschild, l’énergie typique d’une paire sera de l’ordre de h¯ /Δτ, où Δτ est estimé de la façon suivante : on suppose qu’une des deux particules, par exemple l’électron, initialement au repos à rS + ε, tombe sur l’horizon, et le temps propre caractéristique Δτ est celui mis par cet électron pour atteindre en chute libre le rayon de Schwarzschild. Ce temps propre a été donné en (7.2) : cΔτ ∼ 2(rS ε)1/2 . L’énergie correspondante E est, en vertu de la relation de Heisenberg h¯ h¯ c E∼ ∼ . Δτ (rS ε)1/2 Cependant, nous avons pour l’instant un processus virtuel, et il ne peut devenir physiquement réel que si l’énergie est conservée. Cette conservation de l’énergie est possible si l’électron traverse l’horizon dans le sens des r décroissants alors que le positron s’échappe à l’infini. D’un point de vue technique, le processus est possible parce que le coefficient gtt de la métrique (7.4) change de signe à la traversée de l’horizon, et la coordonnée de temps devient une coordonnée d’espace. En conséquence, une énergie devient la composante d’une impulsion qui peut être positive ou négative et la conservation de l’énergie, avec une particule d’un côté de l’horizon et une antiparticule de l’autre, devient possible. On remarquera sur ce point une parenté avec le processus de Penrose. On en déduit l’énergie E du positron telle qu’elle est mesurée par un observateur à√l’infini en tenant compte du décalage vers le rouge gravitationnel, qui est ∼ ε E=E
132
ε rS
1/2
=
h¯ c3 . 4GM
(7.8)
Chapitre 7. Trous noirs
√ √ Les facteurs 1/ ε et ε se compensent, et l’énergie observée à l’infini est indépendante de ε : la particule est toujours produite avec une énergie voisine de cette énergie typique. Cette énergie typique est très faible par rapport à l’énergie de masse d’un électron ou même d’un neutrino, et en pratique les seules particules émises sont des photons produits par paires au voisinage de l’horizon5 : les photons sont leurs propres antiparticules. Dans ce cas, on peut comprendre le résultat en observant que la seule longueur à notre disposition est le rayon de Schwarzschild, et la longueur d’onde d’un photon émis par le trou noir doit être ∼ rS ; son énergie est donc h¯ c/rS , ce qui reproduit (7.8). En résumé, grâce aux fluctuations quantiques, le trou noir ne l’est pas vraiment, car il rayonne des photons à l’infini : il va finir par s’évaporer et disparaître. En mécanique statistique, on associe une température T (T est la température absolue, obtenue en ajoutant 273 à la température en degrés Celsius) à une énergie E grâce à la relation E = kB T, où kB est la constante de Boltzmann, kB = 1, 38 × 10−23 J/K, 1 K= 1 degré kelvin, et la température corrrespondant à (7.8) est T = h¯ c3 /(4kB GM). Hawking a montré qu’en fait le spectre d’énergie des particules émises par un trou noir obéissait à une loi de corps noir (qui n’a rien à voir avec un trou noir : encadré 7.2) avec une température égale à la température de Hawking TH , où kB TH est bien, à un facteur numérique près, l’énergie typique obtenue ci-dessus TH =
h¯ c3 . 8πkB GM
(7.9)
La démonstration de Hawking6 permet de fixer les coefficients numériques. On notera que l’équation (7.9) fait intervenir trois constantes fondamentales de la physique : la vitesse de la lumière c, la constante de Planck h¯ caractéristique de l’échelle des processus quantiques, et la constante de gravitation G. La température de Hawking est très basse pour les trous noirs astrophysiques : elle est de 6, 4 × 10−8 K pour un trou noir de masse solaire, et un million à dix milliards de fois plus faible pour un trou noir supermassif. Le processus d’évaporation d’un trou noir astrophysique par rayonnement de Hawking est extraordinairement lent, cette évaporation prend de 1070 à 1080 années, à comparer avec l’âge de l’Univers, de l’ordre de 1, 4 × 1010 années.
5 Ces
photons sont produits dans un état dit intriqué (voir par exemple Le Bellac [2013], chapitre 11) ; cette intrication jointe au fait que l’un des photons rejoint le trou noir tandis que l’autre s’échappe, est à l’origine des difficultés pour assurer la conservation de l’information que nous mentionnons à la fin du chapitre. 6 Ce rayonnement est aussi valable pour les gravitons quantiques.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
133
Encadré 7.2. Rayonnement du corps noir.
Un corps noir est par définition un objet qui absorbe l’intégralité de tout rayonnement électromagnétique incident. Une bonne réalisation d’un corps noir est une boîte dont l’intérieur est peint en noir, avec une petite ouverture de sorte qu’un rayon lumineux entrant n’ait pratiquement aucune chance de ressortir (figure 7.8a). L’ouverture de la boîte est un corps noir, à une excellente approximation. La densité d’énergie du rayonnement électromagnétique à l’intérieur de la boîte, ρ( T ), ne peut dépendre que de la température absolue T, de la constante de Planck h¯ et de la vitesse de la lumière c. Un argument dimensionnel, où l’on écrit que cette densité est de la forme (e´ nergie)α h¯ β cγ = e´ nergie/volume, montre que α = 4, β = −3, γ = −3. Le résultat exact est (on rappelle que kB T est une énergie) ρ( T ) =
π 2 ( k B T )4 15¯h3 c3
.
(7.10)
Une pression a la même dimension qu’une densité d’énergie, une force par unité de surface, et un calcul simple permet d’obtenir la pression de rayonnement sur les parois de la boîte, P ( T ) = ρ( T )/3. La densité ρ( T ) donne aussi le flux d’énergie du corps noir, c’est-à-dire la quantité d’énergie émise par l’ouverture de la boîte (figure 7.8a), par unité de surface et de temps. La puissance émise par le corps noir dépend de la longeur d’onde λ, ou de la fréquence ν = c/λ, et elle passe par un maximum pour une longueur d’onde caractéristique de la température (figure 7.8b). L’émission de lumière par le Soleil suit approximativement une loi de corps noir, avec une température d’environ 6 000 K.
Cette valeur de la température permet de calculer l’entropie d’un trou noir, en partant de la relation classique en thermodynamique entre l’énergie E, ici Mc2 , et l’entropie S d( Mc2 ) = TH dS =
h¯ c3 dS. 8πkB GM
On en déduit S = 4πGM2 /¯hc ou, en fonction du rayon de Schwarzschild rS S=
4kB πrS2 c3 k Ac3 = B 4¯h G 4¯h G
(7.11)
où A = 4πrS2 est l’aire de l’horizon. Ceci est l’entropie de Bekenstein-Hawking, qui se généralise au trou noir de Kerr. Sa propriété remarquable est d’être proportionnelle à une aire, alors qu’en thermodynamique l’entropie est proportionnelle au volume. Le lien avec la section 7.3 est le suivant : comme l’aire de l’horizon ne peut que croître, on observe la même propriété qu’en thermodynamique, où l’entropie d’un système isolé peut seulement augmenter. Notons également que la démonstration de Hawking n’implique en rien une quantification de la gravité : on écrit une théorie des champs quantiques dans un espace courbe,
134
Chapitre 7. Trous noirs
f lux 3
2
1
1,5 (a)
(b)
3 4,5 fréquence en 1011 Hz
F IGURE 7.8. Rayonnement du corps noir. (a) Tout rayonnement lumineux entrant est absorbé. En revanche, l’ouverture de la boîte émet un rayonnement, le rayonnement d’un corps noir. (b) Graphique donnant en ordonnées le flux d’énergie émis par un corps noir en unités 10−21 W/m2 /Hz/sr en fonction, en abscisses, d’une fréquence mesurée en unités de 1011 Hz pour une température de 2,7 K, celle du rayonnement du fond diffus cosmologique (chapitre 9). Pour cette température, le flux passe par un maximum à une fréquence de 160 GHz.
cet espace courbe est traité classiquement et la métrique n’est pas quantifiée. Il existe un large consensus sur la validité de la démonstration de Hawking. Cependant, même si l’évaporation d’un trou noir est très lente, cette évaporation par rayonnement de Hawking pose des problèmes théoriques redoutables liés à la conservation de l’information, problèmes qui ne sont pas vraiment compris aujourd’hui (voir la note 5). 7.6
Bibliographie
Il existe quatre excellents livres de vulgarisation sur les trous noirs, Luminet [2006], Collin-Zahn [2009], Thorne [2009] et Lasota [2010]. Voir également Lasota [2012] (1), (2) et (3) ainsi que Broderick et Loeb [2012] et Weaver [2012]. À un niveau avancé, on pourra consulter Moore [2014], chapitres 14 à 16 et 36 à 39, Gourgoulhon [2009], chapitre 5, Deruelle et Uzan [2014], chapitres III-6 à III-10, ou Hobson et al. [2009], chapitres 11 et 13. En anglais, on pourra consulter Hartle [2003], chapitres 12, 13 et 15 ou Zee [2013], chapitre VII. Sur la conservation de l’information dans l’évaporation d’un trou noir par rayonnement de Hawking, voir par exemple Susskind [2010], Parentani [2012], Giddings [2013] et Riazuelo [2014].
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
135
7KLVSDJHLQWHQWLRQDOO\OHIWEODQN
8 Ondes gravitationnelles Les ondes électromagnétiques font partie de notre environnement quotidien : ondes lumineuses, ondes radio, ondes infrarouges des télécommandes, etc. Ainsi que je l’expliquerai ci-dessous, une onde électromagnétique correspond à une oscillation qui se propage dans l’espace et on peut choisir le champ électrique comme la quantité qui oscille dans l’espace-temps. Au contraire, les ondes gravitationnelles, prédites par Einstein dès 1916 (mais non sans quelques hésitations !), ne sont pas des oscillations d’une quantité physique dans l’espacetemps, ce sont des oscillations de l’espace-temps lui-même qui se propagent à la vitesse limite c. Dans la section 8.1, je reviendrai sur la description et la génération des ondes électromagnétiques. En effet, ces ondes nous sont familières et nous en avons une bonne intuition ; il me semble utile d’y revenir comme étape préliminaire à l’exposé des ondes gravitationnelles. La section 8.2 décrit la structure des ondes gravitationnelles, et en particulier leur polarisation, qui permet de comprendre leur action sur un système de masses pendant leur passage. La section 8.3 est consacrée à la génération des ondes gravitationnelles, avec une focalisation sur le rayonnement gravitationnel d’un système d’étoiles doubles compactes. La diminution au cours du temps de la période d’étoiles doubles en orbite l’une autour de l’autre permet une vérification directe de l’existence des ondes gravitationnelles. Enfin la section 8.4 décrit brièvement les détecteurs d’ondes gravitationnelles, qui permettront éventuellement d’ouvrir une nouvelle fenêtre d’observation de l’Univers.
8.1
Ondes électromagnétiques
Avant d’introduire les ondes gravitationnelles, il est utile de revenir sur le cas plus simple et familier des ondes électromagnétiques, ce qui permettra de mesurer les analogies, mais aussi les différences, entre les deux types d’onde. Une onde électromagnétique est une vibration se propageant dans le vide à la vitesse limite c, et elle est d’abord caractérisée par sa direction de propagation et sa fréquence angulaire que nous noterons ω : cette fréquence angulaire est reliée à la fréquence usuelle ν par ω = 2πν, cette définition permettant de minimiser le nombre de facteurs 2π dans les formules. Une autre caractéristique importante d’une onde électromagnétique est sa polarisation. En effet, l’oscillation correspondant à cette onde possède un caractère vectoriel : contrairement à une onde sonore dans un gaz où la vibration s’effectue parallèlement à la direction de propagation, car l’onde sonore correspond à une compression périodique du gaz le long de cette direction1 , la vibration électromagnétique se passe dans un plan perpendiculaire à la direction de propagation. Une onde électromagnétique est composée d’un champ électrique E et d’un champ magnétique B qui sont perpendiculaires entre eux et perpendiculaires à la direction de propagation (figure 8.1) ; de plus leurs normes sont reliées par E = cB, de sorte qu’il est commode de décrire l’onde en se donnant un seul des deux champs, par exemple le champ électrique. C’est donc ce vecteur E qui décrira la polarisation. Le cas le plus simple est celui de la polarisation linéaire : le vecteur champ électrique Ex
x
E B
k
O z
λ z
y
(a)
(b)
F IGURE 8.1. (a) Configuration du champ électrique et du champ magnétique dans une onde électromagnétique se propageant suivant la direction Oz : le vecteur d’onde k de l’onde est parallèle à Oz. (b) La composante Ox du champ électrique à un instant donné oscille avec une période spatiale qui n’est autre que la longueur d’onde λ. 1 Les
ondes sonores dans un solide sont soit des ondes de compression longitudinales, soit des ondes de cisaillement transversales dans un plan perpendiculaire à la direction de propagation. Tout comme les ondes électromagnétiques, les ondes de cisaillement ont une polarisation. Les vitesses de propagation des deux types d’onde, compression et cisaillement, sont en général différentes.
138
Chapitre 8. Ondes gravitationnelles
oscille le long d’une direction fixe, perpendiculaire à la direction de propagation. Dans le cas d’une onde lumineuse, une vibration de ce type est obtenue grâce à un polaroïd, qui est un matériau possédant une direction privilégiée. Supposons qu’un rayon lumineux se propage dans une direction horizontale. Un polaroïd dont l’axe est vertical transmet uniquement la lumière vibrant le long de cet axe, et l’on obtient à la sortie du polaroïd une lumière polarisée verticalement (figure 8.2). Si l’on place après le premier polaroïd un second polaroïd d’axe horizontal, ce second polaroïd ne transmet aucune lumière : deux polaroïds croisés arrêtent tout rayon lumineux. Les lunettes polaroïd fonctionnent suivant ce principe : normalement orientées sur le nez de leur propriétaire, elles transmettent uniquement la lumière polarisée verticalement et absorbent la lumière polarisée horizontalement. Cela permet d’éliminer les réflexions gênantes, par exemple sur la neige, car la lumière réfléchie est principalement polarisée horizontalement. θ
F IGURE 8.2. Obtention d’une lumière polarisée linéairement et polaroïds croisés. Pour fixer les idées, nous avons choisi une lumière initialement polarisée linéairement suivant une direction θ . Le premier polaroïd sélectionne une polarisation verticale, le second arrête toute la lumière incidente.
La polarisation linéaire n’est pas la seule possible, et d’autres types de polarisation peuvent être obtenus expérimentalement. Dans le cas de la polarisation circulaire (figure 8.3b), le vecteur champ électrique tourne dans un plan perpendiculaire à la direction de propagation et l’extrémité de ce vecteur décrit un cercle. Pour un observateur qui reçoit la lumière et qui voit le champ électrique tourner dans le sens inverse des aiguilles d’une montre, la polarisation est circulaire droite, et elle est circulaire gauche si le champ électrique tourne en sens inverse. Le cas général est celui de la polarisation elliptique, où l’extrémité du champ électrique décrit une ellipse qui peut être parcourue dans un sens ou dans l’autre. Les ondes lumineuses sont générées par des charges accélérées. En effet, une charge électrique immobile ne rayonne pas d’énergie, et il en est de même pour une charge en mouvement uniforme d’après le principe de relativité. Il faut donc qu’une charge soit accélérée pour rayonner et, de fait, le champ électrique généré à grande distance d’une charge est proportionnel à son accélération.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
139
x E
E
E
y
(a)
(b)
(c)
F IGURE 8.3. Polarisations linéaire (a), circulaire droite (b) et elliptique (c).
Il est instructif d’examiner deux cas simples, en supposant dans les deux cas que la vitesse des charges est très petite par rapport à c.
1. Mouvement harmonique le long d’un axe. Une charge q effectue un mouvement périodique suivant l’axe Oz avec une fréquence angulaire ω : elle oscille entre les points z = − R et z = + R (figure 8.4a). On a aussi placé en z = 0 une charge −q immobile, de sorte que la charge totale est nulle. Un tel système s’appelle un dipôle électrique, et c’est en fait une antenne dipolaire : dans une antenne, les ondes électromagnétiques sont générées par un courant oscillant, la charge totale de l’antenne étant nulle. Le système de charges accélérées qui génère le rayonnement est appelé source du rayonnement. Les dipôles électriques sont la source principale de rayonnement électromagnétique : voir la note 2. z
z
x
x
E
E
M
M
y
O
O
y
y
x
x
(a)
y
(b)
F IGURE 8.4. Génération d’ondes électromagnétiques par une charge accélérée. (a) Charge en mouvement périodique le long de l’axe Oz oscillant entre z = − R et z = + R. Le champ électrique rayonné par la charge −→
au point d’observation M se trouve dans le plan défini par r = OM et Oz, et il est dirigé le long de e x . (b) Charge en mouvement circulaire uniforme dans un plan sur un cercle de rayon R.
140
Chapitre 8. Ondes gravitationnelles
La figure 8.4a montre le champ électrique à grande distance de l’antenne : ce −−→ champ est perpendiculaire à la direction d’observation OM = r, il est polarisé linéairement le long de la direction ex dans le plan formé par l’axe Oz et r, et il décroît en 1/r. Par conséquent, E2 , et donc la densité d’énergie, décroît en 1/r2 pour r → ∞, ce qui permet de rayonner une puissance finie dans l’espace. En effet, si l’on intègre la puissance émise dans toutes les directions d’espace sur une sphère de grand rayon r, la décroissance de la densité d’énergie en 1/r2 est compensée par un facteur 4πr2 venant de la surface de la sphère. Avec une décroissance du champ électrique plus rapide que 1/r, il n’y aurait pas d’émission d’énergie dans l’espace, et la puissance P rayonnée par le dipôle serait nulle. Cette puissance P est non nulle et donnée par une formule classique du rayonnement des antennes (ε 0 est la permittivité du vide) P=
e2 2 4 R ω 3c3
e2 =
q2 . 4πε 0
(8.1)
Elle est proportionnelle au carré ( Rω 2 )2 de l’accélération. Encadré 8.1. Champ électrique d’un dipôle oscillant.
L’expression du champ électrique à une distance r >> R de la charge accélérée est donnée par la projection de son accélération a sur la direction e x perpendiculaire à r dans le plan formé par r et a (figure 8.4a) q r E(t) = ex . a t = t − · e (8.2) ret. x c 4πε 0 rc2 Le dipôle est pris au temps retardé tret. = t − r/c, car l’effet d’une variation du dipôle tel qu’il est mesuré en M à l’instant t met un temps r/c pour se propager depuis le point O. En ordre de grandeur, et en prenant en compte seulement les facteurs physiquement pertinents 1 1 (8.3) E ∼ 2 qz¨ = 2 d¨ rc rc où z¨ désigne l’accélération (ou dérivée seconde par rapport au temps de la position) de la charge suivant Oz et d¨ la dérivée seconde du dipôle d = qz par rapport au temps.
2. Charge en mouvement circulaire uniforme. Cette fois, la charge q parcourt un cercle de rayon R avec une fréquence angulaire ω, donc avec une vitesse v = ωR, et on a placé une charge −q immobile à l’origine afin d’assurer la neutralité électrique de l’ensemble (figure 8.4b). L’accélération de la charge en mouvement est l’accélération centripète usuelle, v2 /R = Rω 2 , et à nouveau la LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
141
puissance rayonnée est proportionnelle au carré de l’accélération P=
2e2 2 4 R ω . 3c3
(8.4)
La puissance rayonnée est le double de celle du cas précédent, car un mouvement circulaire uniforme dans le plan xOy est la superposition de deux oscillateurs harmoniques linéaires indépendants, l’un oscillant suivant Ox et l’autre suivant Oy. La polarisation du rayonnement est plus compliquée que dans le cas précédent et elle est en général elliptique, le seul cas simple étant la direction Oz où, par symétrie, la polarisation est circulaire et tourne dans le sens de rotation de la charge si q > 0. Le rayonnement électromagnétique dominant d’un ensemble de charges accélérées est en général dipolaire électrique2 . Revenons brièvement sur la caractérisation d’une distribution de charges électriques : la première caractérisation est la charge totale de la distribution, aussi appelée moment monopolaire, et ensuite vient son moment dipolaire. Donnons un exemple simple : une charge −q est située sur l’axe Ox à x = − a et une charge positive +q au point x = + a. La charge totale de la distribution est nulle, mais cette distribution possède un moment dipolaire, qui est un vecteur d dirigé suivant l’axe reliant la charge −q à la charge +q, et dont la norme vaut 2qa (figure 8.5a). Le moment dipolaire de la distribution de charge de la figure 8.5b est nul, car les deux dipôles que l’on peut former se compensent. En revanche, cette distribution de charges possède un moment quadrupolaire, une notion fondamentale pour le rayonnement des ondes gravitationnelles, et c’est la raison pour laquelle nous l’introduisons ici. Le moment dipolaire est un vecteur, caractérisé par ses trois composantes, un tableau de trois chiffres, mais le moment quadrupolaire est donné par un tableau de cinq chiffres3 . Dans le cas de la configuration de la figure 8.5b, il suffit d’un tableau de trois chiffres car toutes les charges sont dans le plan xOy. Si les charges q a sont situées aux points de coordonnées ( x a , y a ), ces 2 Lorsque R/λ 1, où R est une dimension caractéristique de la source et λ la longueur d’onde émise, le rayonnement dipolaire électrique est dominant, à moins qu’il ne soit nul en raison d’une symétrie. Dans ce dernier cas, on pourra observer un rayonnement dipolaire magnétique dû à une distribution de courants, ou un rayonnement quadrupolaire électrique, etc. 3 Si l’on tient compte de la dimension perpendiculaire au plan xOy, il faut ajouter les composantes Q xz , Qyz et Qzz , soit en tout six composantes. Mais la combinaison
Tr Q = Q xx + Qyy + Qzz est invariante par rotation et ne contribue pas au rayonnement, ce qui réduit à cinq le nombre de composantes indépendantes du moment quadrupolaire.
142
Chapitre 8. Ondes gravitationnelles
−q
+d
+q d
−d
(a)
(b)
(c)
(d)
F IGURE 8.5. Exemples de distributions de charges et de masses. Dans tous les cas, l’origine, marquée d’une croix, est au centre de la distribution de charges ou de masses. (a) Dipôle électrique formé par deux charges de signes opposés. (b) Distribution de charges possédant un moment quadrupolaire : la charge totale est nulle, le moment dipolaire également, mais le moment quadrupolaire est non nul. (c) Configuration analogue pour une distribution de masses ponctuelles. (d) Système de deux masses en rotation.
trois nombres sont donnés par Q xx =
∑ x2a qa
Q xy = Qyx =
a
∑ xa ya qa
Qyy =
a
∑ y2a qa .
(8.5)
a
Dans le cas de la configuration de la figure 8.5b, cela donne Q xx = 2a2 q
Q xy = 0
Qyy = −2a2 q.
Dans le cas de la gravitation, le rôle des charges sera joué par des masses, avec la différence cruciale que les masses, à la différence des charges, sont toujours positives. Le moment dipolaire de la distribution de masses ponctuelles de la figure 8.5c est nul4 , mais son moment quadrupolaire vaut Q xx = 2a2 m
Q xy = 0
Qyy = 2a2 m
Un autre exemple intéressant est celui de la figure 8.5d : deux masses ponctuelles identiques m tournent autour de l’axe vertical avec une fréquence angulaire ω et forment une haltère en rotation autour d’une direction perpendiculaire à son axe. Dans ce cas, on trouve pour le moment quadrupolaire, compte tenu de x = R cos ωt et y = R sin ωt Q xx = 2mR2 cos2 ωt = mR2 (1 + cos 2ωt) Q xy = Qyx = 2mR2 sin ωt cos ωt = mR2 sin 2ωt
(8.6)
Qyy = 2mR2 sin2 ωt = mR2 (1 − cos 2ωt) 4 Le moment dipolaire d’une distribution de masses est égal à la masse totale multipliée par le vecteur joignant l’origine au centre de masse G. Si l’on prend l’origine en G, alors le moment dipolaire est nul. On obtient le même résultat dans le cas de charges électriques si elles sont toutes du même signe.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
143
un résultat qui nous servira ultérieurement. Le moment quadrupolaire d’une distribution de masses a la dimension d’une masse que multiplie le carré d’une longueur, et donc la dimension d’un moment d’inertie5 . 8.2
Description des ondes gravitationnelles
La discussion des ondes gravitationnelles n’est (relativement) simple que si l’on se limite au cas où la métrique diffère peu de celle de l’espace-temps plat, ou métrique de Minkowski (1.5) : dans ces conditions, l’onde gravitationnelle est seulement une petite perturbation à l’espace-temps de la relativité restreinte. Cette perturbation est décrite par un tableau de dix nombres hμν = hνμ tels que |hμν | 1. La dynamique des coefficients hμν est donnée dans le vide par l’équation d’Einstein (5.15). Grâce à une série de considérations assez techniques (encadré 8.2), on peut réduire ces dix coefficients à deux seulement, et ces deux coefficients, que l’on peut représenter dans un plan perpendiculaire à la direction de propagation, vont décrire la polarisation de l’onde gravitationnelle. Si l’onde se propage par exemple suivant la direction Oz, il suffit de deux coefficients du plan xOy, h xx et h xy , pour définir l’onde. La situation est donc très semblable à celle des ondes électromagnétiques : il suffit de deux degrés de liberté dans un plan transverse à la direction de propagation6 . De plus, on montre que ces deux composantes obéissent dans le vide à des équations analogues à celles des ondes électromagnétiques, et elles se propagent donc dans le vide à la vitesse c. Comme l’onde gravitationnelle est une perturbation de la courbure de l’espace-temps, elle agit sur des masses test disposées sur son passage, ce qui va éventuellement permettre de la détecter. Une seule masse test ne donne aucune information, car on peut toujours se placer dans un référentiel où cette masse est en chute libre, et où ses coordonnées (mathématiques) ne changent pas. En revanche, l’onde modifie les distances physiques entre deux ou plusieurs masses test, et cette modification dépend du caractère de la polarisation : avec un choix déterminé des axes x et y (en effet, la figure 8.6 montre que les deux 5 De
fait, le moment quadrupolaire d’une distribution de masses est directement lié à son tenseur d’inertie. 6 Le fait qu’une onde gravitationnelle ait seulement deux polarisations indépendantes se comprend à partir de l’analyse de Wigner : note 5 du chapitre 4. Le photon, particule associée aux ondes électromagnétiques, est une particule de spin 1, car le champ électromagnétique est un champ vectoriel. Le graviton, particule associée aux ondes gravitationnelles, est une particule de spin 2, car le champ de gravitation est un tenseur symétrique d’ordre 2. Mais, comme les ondes gravitationnelles se propagent avec la vitesse limite, le graviton a une masse nulle et possède donc, tout comme le photon, seulement deux états de polarisation indépendants.
144
Chapitre 8. Ondes gravitationnelles
polarisations se déduisent l’une de l’autre par une rotation7 de π/4), elle est différente selon que la polarisation est du type h xx ou h xy . Pour représenter l’effet du passage d’une onde, nous avons montré sur la figure 8.6 huit masses ponctuelles disposées régulièrement sur un cercle avant le passage de l’onde. Cet ensemble de masses voit passer une onde gravitationnelle périodique du type h xx = h+ cos ωt ou h xy = h× cos ωt, ω = 2π/T, et il se déforme de façon différente suivant le type de polarisation de l’onde. Encadré 8.2. Composantes indépendantes de la métrique.
En électromagnétisme, au lieu des champs E et B, il est souvent commode d’introduire le couple (potentiel scalaire, potentiel vecteur) ; le potentiel scalaire, mesuré en volts, est tout simplement ce que fournit une prise de courant électrique. Cependant, des transformations appelées transformations de jauge peuvent modifier les potentiels sans modifier les champs, et donc la physique, qui elle ne dépend que des champs (toutefois, ce dernier énoncé est à nuancer en physique quantique). On a donc une certaine liberté sur les potentiels, liberté que l’on peut restreindre en imposant une condition de jauge. L’analogue des champs en relativité générale est le tenseur de Riemann (encadré 5.3), et l’analogue des potentiels est la métrique. Dans le cas de la relativité générale, imposer une condition de jauge réduit de dix à six le nombre de hμν indépendants. En effectuant un « choix de jauge » adéquat, on montre qu’il est possible de mettre les équations d’Einstein dans le vide sous la forme (∇2 est le laplacien) 1 ∂2 2 hμν = 0 − ∇ (8.7) c2 ∂t2 c’est-à-dire exactement l’équation que vérifient les potentiels électromagnétiques. Ensuite, un changement de coordonnées permet de restreindre à deux le nombre des composantes de hμν indépendantes.
8.3
Génération d’ondes gravitationnelles
De même que les ondes électromagnétiques sont générées par des charges accélérées, les ondes gravitationnelles sont générées par des masses accélérées. Nous allons nous limiter au cas où la vitesse des masses est faible par rapport à celle de la lumière, et où la métrique diffère peu de celle de Minkowski. Comme dans le cas électromagnétique, il n’y a pas de rayonnement monopolaire : ainsi que nous l’avons vu, le théorème de Birkhoff implique qu’une distribution de 7 À l’attention du lecteur qui possède des notions de physique quantique : dans le cas du spin 1/2, l’angle entre une direction de polarisation et la direction orthogonale est π, dans le cas du spin 1 (photon) il est de π/2, et dans le cas du graviton (spin 2), de π/4 : l’angle π/2 est divisé par la valeur du spin pour passer d’une polarisation à la polarisation orthogonale.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
145
y
x
t=0
t = T/4
t=0
t = T/ 4
t = T/2
t = 3T / 4
t=T
t = 3T / 4
t=T
y
x
t = T/2
F IGURE 8.6. Effet du passage d’une onde gravitationnelle sur un ensemble de masses ponctuelles disposées régulièrement sur un cercle avant le passage de l’onde. Ce passage déforme la distribution des masses. La distribution de masses est montrée aux temps t = 0, t = T/4, t = T/2. t = 3T/4 et t = T , où T est la période de l’onde. Figure du haut : polarisation du type h xx . Figure du bas : polarisation du type h xy .
masse à symétrie sphérique ne peut pas produire d’ondes gravitationnelles, car la métrique engendrée à l’extérieur de la distribution de masses est celle de Schwarzschild, qui est statique. Il est aussi facile de comprendre intuitivement qu’il ne peut pas y avoir de rayonnement dipolaire, ce qui constitue une différence majeure avec l’électromagnétisme. Prenons par exemple deux masses ponctuelles identiques qui oscillent de part et d’autre d’un point O, de telle sorte que leur centre de masse se trouve en O, ce qui correspond à un moment dipolaire nul (note 4). On peut toujours trouver un système de coordonnées en chute libre tel que ce centre de masse reste fixe en O, et le système ne peut donc pas rayonner (voir aussi la note 4). De façon générale, en électromagnétisme, l’impossibilité du rayonnement monopolaire est liée à la conservation de la charge électrique, et en gravitation, l’impossibilité des rayonnements monopolaire et dipolaire est liée à la conservation de la masse et de l’énergie-impulsion8 . Le rayonnement d’ondes gravitationnelles est en général dominé par le moment 8
L’impossibilité du rayonnement dipolaire est liée au principe d’équivalence (section 2.1). Dans des théories alternatives à la relativité générale, un rayonnement dipolaire est possible car la masse m g qui génère les ondes gravitationnelles peut être différente de la masse inertielle mi qui définit la position du centre de masse. Si le rapport m g /mi est identique pour toutes les masses, alors le rayonnement dipolaire est interdit.
146
Chapitre 8. Ondes gravitationnelles
quadrupolaire de la distribution de masse qui rayonne : pour un rayonnement efficace, il faut que le moment quadrupolaire de la distribution de masses soit non nul. Tout comme le rayonnement dipolaire électrique est en général dominant pour les ondes électromagnétiques, le rayonnement quadrupolaire est en général dominant pour les ondes gravitationnelles, et la condition de cette dominance a une origine identique : le rapport de la dimension de la source R à la longueur d’onde émise λ doit être très petit par rapport à 1, R/λ 1. La production d’ondes gravitationnelles se déduit des équations d’Einstein : courbure de l’espace temps au voisinage de la source des ondes ⇐⇒ contenu en énergie-impulsion de cette source. Pour écrire les équations d’Einstein, on suppose que la distribution des masses à l’origine du rayonnement gravitationnel, ou source du rayonnement, est localisée dans une région finie de l’espace de dimension caractéristique R, on se place à une distance r R, et on obtient alors pour la métrique hμν une équation très analogue à celle de l’électromagnétisme, à condition de substituer le moment quadrupolaire de la distribution de masses au moment dipolaire de la distribution de charges. À grande distance r R de la source, la métrique est donnée par la dérivée seconde par rapport au temps Q¨ du moment quadrupolaire Q de la source ; très schématiquement, et comme nous l’avons écrit en (8.3) pour le champ électrique h(t) ∼
G ¨ r . Q t = t − ret. c c4 r
(8.8)
À grande distance, il ne reste que le terme dominant proportionnel à 1/r. Le temps tret. = t − r/c est le temps retardé : comme dans le cas de l’électromagnétisme, l’effet d’une variation de la source ne peut pas être instantané, il lui faut un temps r/c pour se propager de la source en r ∼ R 0 au point d’observation r. Un exemple typique de source d’ondes gravitationnelles est l’ensemble des deux masses en rotation de la figure 8.5d. Compte tenu de l’expression (8.6) du moment quadrupolaire, on voit que h est proportionnel à R2 ω 2 , où le facteur R2 a pour origine le moment quadrupolaire, alors que le champ électrique d’une charge en rotation est proportionnel à Rω 2 , où le facteur R a pour origine le moment dipolaire. Mais, en fait, il faut se souvenir que hμν est l’équivalent des potentiels (encadré 8.2), et non des champs, et pour passer aux champs, il faut encore prendre une dérivée, ce qui introduit un facteur ω supplémentaire et donc un facteur R2 ω 3 pour les champs. De même que l’on déduit de l’expression du champ électrique la puissance rayonnée dans l’espace par un dipôle oscillant, on déduit de l’expression de hμν la puissance rayonnée dans l’espace par une source localisée d’ondes gravitationnelles. Une application importante est le rayonnement des étoiles doubles compactes, telles que des naines blanches, des étoiles à neutrons ou même des trous
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
147
z M
m O y
R
ωt m
x
F IGURE 8.7. Système formé de deux étoiles en rotation sur une orbite circulaire autour de leur centre de masse. Ce cas est l’analogue gravitationnel de celui de la figure 8.4b, mais le champ à grande distance au point M est en R2 ω 3 , au lieu de Rω 2 .
noirs. La figure 8.7 montre le schéma d’un système d’étoiles doubles. Dans un souci de simplification, nous avons choisi une orbite circulaire de rayon R, et les masses des étoiles identiques et égales à m. Rappelons une des hypothèses de validité de (8.8) : la vitesse des étoiles sur leur orbite doit être petite par rapport à c, v/c 1. Cette hypothèse est souvent remplacée par une hypothèse équivalente : l’énergie de liaison des étoiles sur leur orbite doit être très petite par rapport à leur énergie de masse. En toute rigueur, la démonstration élémentaire de (8.8), qui est calquée sur celle donnant l’émission de rayonnement électromagnétique, suppose que le mouvement est dû à des interactions non gravitationnelles, ce qui n’est pas le cas des étoiles doubles compactes en orbite. Un calcul plus élaboré, fondé sur un développement systématique en puissances de v/c, permet de justifer cette formule. Comme le montre l’équation (8.6), la fréquence du rayonnement émis, 2ω, est le double de la fréquence angulaire de rotation. Afin de donner un ordre de grandeur, considérons un système binaire situé à 30 années lumière de la Terre, dont les deux compagnons ont une masse égale à la masse solaire, avec une orbite de 106 km de rayon et une période de 10 heures. L’amplitude des ondes émises au niveau de la Terre est h ∼ 10−21 . On peut calculer la puissance émise dans tout l’espace sous forme d’ondes gravitationnelles, avec comme résultat P=
148
128 G 2 4 6 m R ω . 5 c5
(8.9)
Chapitre 8. Ondes gravitationnelles
Si l’on compare avec la puissance (8.4) émise par une charge en rotation sur un cercle, on observe que le facteur important est R4 ω 6 = ( R2 ω 3 )2 , au lieu de R2 ω 4 = ( Rω 2 )2 . Le facteur R2 au lieu de R vient de ce que le rayonnement gravitationnel est quadrupolaire et non dipolaire. L’origine du facteur ω 6 au lieu de ω 4 a été expliquée ci-dessus. Par conservation de l’énergie, l’émission d’énergie dans l’espace doit être compensée par une diminution de l’énergie du système binaire : ceci est clair en électromagnétisme, et permet de trouver la rétroaction sur l’orbite de l’émission d’ondes électromagnétiques9 , mais ce n’est pas évident en relativité générale, où la définition de l’énergie d’un système est subtile. À nouveau, un calcul plus élaboré prenant correctement en compte une partie dissipative dans l’interaction gravitationnelle permet de justifier que la rétroaction sur l’orbite de l’émission d’ondes gravitationnelles est correctement donnée par cette conservation de l’énergie. L’énergie du système binaire est − Gm2 /(2R) à l’approximation newtonienne, ce qui montre que le rayon de l’orbite doit diminuer, et il en est de même de la période T d’après la troisième loi de Kepler (5.3). L’effet est analogue à celui observé pour un satellite qui est freiné par les collisions avec les molécules de la haute atmosphère : il perd de l’énergie par frottement, et le rayon de son orbite diminue. La décroissance au cours du temps de la période d’un système binaire a été observée en 1974 par Rusell Hulse et Joseph Taylor (ce qui leur a valu un prix Nobel) grâce à un système binaire dont l’une des composantes est un pulsar. Un pulsar est une étoile à neutrons, dont la masse est de 1 à 2 masses solaires, et dont le rayon est de 10 km environ. C’est donc une étoile compacte, dont le paramètre de compacité rS /r0 ∼ 0, 3 − 0, 5. Les étoiles à neutrons sont fortement magnétisées et en rotation rapide, et ce sont de puissants émetteurs d’ondes radio. Comme l’axe magnétique n’est pas aligné sur l’axe de rotation, le rayonnement émis balaie la Terre comme le faisceau d’un phare, et on observe sur la Terre des impulsions dont la période est fixée par la vitesse de rotation de l’étoile (figure 8.8). Un pulsar isolé constitue une horloge très stable, comparable à une horloge atomique. Le système double découvert par Hulse et Taylor est formé d’un pulsar, dont la masse vaut 1,4 masse solaire, appelé PSR B1913+6, et d’un compagnon invisible, probablement un pulsar inactif. La période de l’orbite est T = 7, 75 h. En raison de l’émission d’ondes gravitationnelles, cette période diminue de 10 μs par an, en parfait accord avec la relativité générale. Bien entendu, il est nécessaire d’aller au-delà de la formule approchée (8.9) : il faut tenir compte du caractère elliptique de l’orbite et de corrections à l’approximation newtonienne. 9 Une conséquence de ce rayonnement est l’instabilité du modèle planétaire de l’atome, proposé par Rutherford en 1908 : si l’on prend l’atome le plus simple, celui d’hydrogène pour fixer les idées, l’électron, au lieu de rester sur une orbite spécifique, finit par tomber sur le noyau.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
149
F IGURE 8.8. Schéma d’un pulsar. Le cône d’émission d’ondes radio est situé autour de l’axe magnétique.
De fait, les sytèmes d’étoiles compactes doubles, dont l’une au moins est un pulsar, permettent des tests très contraignants de la relativité générale. En effet, dans le cas de ces étoiles compactes doubles, le rapport des vitesses orbitales à celle de la lumière est de l’ordre de 10−3 , plus grand par un facteur 10 que ce rapport dans le système solaire. En plus de la période de l’orbite, il existe plusieurs autres paramètres de l’orbite qui sont calculables par la relativité générale, comme le taux moyen de l’avance du périhélie (figure 6.5) ou l’amplitude des retards dans l’arrivée des impulsions électromagnétiques émises par les pulsars : ces paramètres, tout comme le taux de ralentissement de la période, sont appelés post-newtoniens, car ils sont nuls à l’approximation newtonienne, et ils peuvent tester la théorie qui a été développée jusqu’à l’ordre (v/c)5 . La combinaison de trois paramètres au minimum permet de déterminer avec précision la masse des deux étoiles et de confirmer la cohérence des résultats, étant donné que l’on dispose de trois paramètres pour seulement deux masses (figure 8.9) : en effet, la dépendance par rapport aux masses est différente pour ces divers paramètres, ce qui donne dans le plan (m1 , m2 ) des deux masses des courbes se coupant idéalement en un point unique si la théorie est correcte. Cette analyse a été effectuée non seulement pour le système de Hulse et Taylor, mais aussi pour une dizaine d’autres systèmes, et il a été possible de mesurer jusqu’à sept paramètres post-newtoniens, et donc de réaliser jusqu’à cinq tests
150
Chapitre 8. Ondes gravitationnelles
F IGURE 8.9. Cette figure donne quatre paramètres post-newtoniens en fonction des masses m1 et m2 des deux étoiles en orbite. La dépendance par rapport aux masses est différente pour ces divers paramètres, et en conséquence le point d’intersection des courbes permet de les déterminer. La figure est tracée pour le pulsar binaire PSR J1141-6545, et elle montre que les masses valent environ 1 et 1,5 masse solaire. Trois des paramètres post-newtoniens sont : P˙ , la variation de la période par unité de temps, ω˙ , lié à l’avance du périhélie (figure 6.5), et γ à divers retards relativistes de l’arrivée des signaux, par exemple celui dû à l’effet Shapiro (section 6.4). Le fait que les courbes se coupent en un point unique, aux erreurs expérimentales près, est un test contraignant de la relativité générale. Reproduit de Damour [2013], courtoisie de Thibault Damour et Gilles Esposito-Farèse.
indépendants, avec des résultats toujours en accord avec la relativité générale et une précision supérieure à 1 %. Les travaux des astrophysiciens, et en particulier en France ceux de l’équipe de Nathalie Deruelle et Thibault Damour, ont donc permis des vérifications impressionnantes de la relativité générale en situation de gravité forte. Il s’agit aussi d’une vérification directe du phénomène des ondes gravitationnelles, car ces résultats dépendent de la propagation à la vitesse de la lumière de l’interaction gravitationnelle entre les deux étoiles, et on observe directement la réalité du phénomène de propagation de la gravitation par ondes à une vitesse égale à celle de la lumière, avec un accord de l’ordre de 10−3 . 8.4
Détection des ondes gravitationnelles
Les ondes gravitationnelles, lorsque l’on réussira à les détecter, offriront une nouvelle fenêtre pour l’exploration de l’Univers en permettant d’accéder à des phénomènes pour lesquels les ondes électromagnétiques donnent peu ou pas
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
151
d’information. En effet, les ondes gravitationnelles traversent la matière sans être absorbées et leur détection éventuelle étendrait notre domaine d’observation à des régions de l’Univers qui ne sont pas transparentes électromagnétiquement. Les sources principales d’ondes gravitationnelles sont les fusions d’étoiles compactes ou de trous noirs, les explosions de supernovæ et les tout débuts de l’Univers. On peut uniquement donner des estimations grossières de l’amplitude h sur la Terre des ondes gravitationnelles ainsi générées : ces estimations conduisent à h ∼ 10−21 pour des événements se produisant à quelques dizaines de millions d’années lumière. Si l’on essaie de les détecter en utilisant leur action sur deux masses suspendues à une distance L en l’absence d’ondes gravitationnelles, la modification de la distance est δL ∼ hL. Prenant L = 1 km et h = 10−21 , on trouve δL ∼ 10−18 m, le millième du rayon d’un noyau atomique ! Un tel déplacement ne peut être mesuré que par des méthodes interférométriques. Nous nous contenterons de décrire le détecteur VIRGO situé près de Pise en Italie (figure 8.10). La base de ce détecteur est un interféromètre de Michelson, semblable dans son principe à l’interféromètre utilisé à la fin du XIXe siècle par Michelson et Morley pour essayer de mettre en évidence le
F IGURE 8.10. Le site de VIRGO. On remarquera les deux bras perpendiculaires de l’interféromètre, d’une longueur de 3 km. Courtoisie de Patrice Hello et du Laboratoire de l’Accélérateur Linéaire à Orsay.
152
Chapitre 8. Ondes gravitationnelles
déplacement de la Terre par rapport à l’« éther ». On choisit les deux bras de l’interféromètre à angle droit (figure 8.9), de façon à maximiser l’effet de l’onde gravitationnelle : en effet, la figure 8.6 montre qu’un étirement dans une direction correspond à une contraction dans la direction perpendiculaire. Un faisceau laser est envoyé sur une lame séparatrice suspendue afin de la découpler des vibrations extérieures, qui le divise en deux sous-faisceaux d’égale intensité (figure 8.11). Les deux faisceaux sont réfléchis par des miroirs également suspendus qui, tout comme la lame, jouent le rôle des masses soumises aux ondes gravitationnelles. Les faisceaux sont donc renvoyés sur la lame qui les recombine en deux faisceaux, l’un émergeant vers la gauche, vers le laser, et l’autre vers le bas, vers un détecteur de photons. L’intensité des faisceaux dépend de la phase des faisceaux réfléchis par les miroirs, et on s’arrange pour qu’en l’absence d’ondes gravitationnelles, l’intensité du faisceau renvoyé vers le détecteur de photons soit nulle. On dit que l’on positionne le détecteur sur une frange sombre. L’intensité totale du faisceau incident est alors renvoyée vers le laser, ce qui permet de le recycler. Des cavités résonantes de Fabry-Pérot sont disposées dans les deux bras de l’interféromètre, ce qui permet d’allonger la longueur
F IGURE 8.11. Schéma optique du détecteur d’ondes gravitationnelles VIRGO. On remarque les cavités de Fabry-Pérot, qui permettent de multiplier par 30 le trajet de la lumière. Le miroir de recyclage sert à augmenter la puissance lumineuse circulant dans l’interféromètre et les cavités « mode cleaner » à filtrer les modes. La source laser est continue et délivre une puissance de 20 W dans le proche infrarouge. Courtoisie de Patrice Hello et du Laboratoire de l’Accélérateur Linéaire à Orsay.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
153
effective des deux bras d’un facteur 30. Les bras ayant une longueur de 3 km, le trajet effectif de la lumière dans chaque bras est de 90 km, et c’est la distance L effective. Il faut bien sûr être capable d’éliminer toute source de bruit autre que celui des ondes gravitationnelles : bruits sismique, thermique et quantique en particulier. VIRGO (de même que LIGO) est actuellement arrêté afin d’augmenter sa sensibilité par un facteur de l’ordre de 10, ce qui permettra de détecter des événements se produisant à des centaines de millions d’années-lumière. On remarquera qu’augmenter la sensibilité d’un détecteur par un facteur 10 permet d’explorer un volume d’Univers plus grand par un facteur 1 000. En dehors de VIRGO, il existe dans le monde d’autres détecteurs semblables dans leur principe à VIRGO, opérationnels ou en projet, mais aucun signal n’a encore été observé aujourd’hui. Aux États-Unis en particulier, le détecteur LIGO est composé de deux détecteurs de 4 km et 2 km dans l’état de Washington et d’un troisième de 4 km en Louisiane10 . Leur conception, comme celle de VIRGO, permet d’espérer une sensibilité h ∼ 5 × 10−23 dans le cas le plus favorable d’une fréquence de 100 Hz, et tous ces détecteurs seront mis en réseau. Le bruit sismique ainsi que les fluctuations de la gavité newtonienne terrestre limitent les détecteurs terrestres à des fréquences supérieures à 1 Hz. Pour éliminer ce bruit, il faudrait construire un interféromètre dans l’espace : c’est le projet eLISA. 8.5
Bibliographie
VIRGO est décrit dans Cavalier et al. [2010]. À un niveau avancé, le lecteur pourra consulter Damour [2005b], Hobson et al. [2009], chapitres 17 et 18, Moore [2014], chapitres 30 à 34, Deruelle et Uzan [2014], chapitres III-13 à III-15, ou Gourgoulhon [2009] et en anglais Hartle [2003], chapitres 16 et 23 ou Poisson et Will [2014], chapitres 11 et 12.
10 Un
154
détecteur de plus petite dimension (600 m), GEO, est situé en Allemagne.
Chapitre 8. Ondes gravitationnelles
9 Cosmologie La cosmologie offre à la relativité générale un champ d’application très vaste, puisqu’il s’agit de décrire l’Univers dans son ensemble. Aux confins de l’Univers, à des distances de l’ordre de la dizaine de milliards d’années lumière, les conceptions newtoniennes de l’espace et du temps deviennent inopérantes, et la relativité générale est indispensable, par exemple pour comprendre comment mesurer ces très grandes distances. Un des premiers arguments scientifiques sur la cosmologie, qui permet de toucher du doigt l’insuffisance d’une vision naïve, est probablement le « paradoxe d’Olbers », énoncé en 1826 par l’astronome allemand Heinrich Olbers, en fait pressenti auparavant par Galilée, Kepler et Halley, et étudié quantitativement dès 1744 par Jean-Philippe Loys du Chéseaux. Comme la plupart des astronomes de son époque, Olbers pensait que l’Univers était statique, immuable et homogène. Dans ces conditions, si l’on regarde le ciel nocturne dans une direction déterminée, la ligne de visée du regard doit nécessairement rencontrer une étoile. Une analogie souvent utilisée est la suivante : au centre d’une clairière entourée d’une forêt dense, où que se porte le regard, il finira toujours par rencontrer le tronc d’un arbre. Comme la densité d’étoiles est uniforme en raison de l’homogénéité supposée de l’Univers, la luminosité du ciel nocturne devrait être uniforme et égale à celle d’une étoile, autrement dit le ciel nocturne devrait être uniformément lumineux ! En fait, l’Univers n’est pas immuable, les étoiles n’existent pas depuis un temps infini, elles ont une durée de vie finie, et nous ne voyons que celles dont la lumière a eu le temps de nous parvenir depuis leur création. De plus, l’Univers est en expansion, et cela diminue encore la luminosité des étoiles par rapport à une estimation naïve, ainsi que nous le verrons dans la section 9.3.
Ce chapitre s’ouvre sur une description qualitative des propriétés globales de l’Univers : matière sombre, isotropie et homogénéité à grande échelle, expansion et Big Bang. La section 9.2 définit le décalage vers le rouge gravitationnel et la métrique de Friedmann-Lemaître, qui décrit un Univers en expansion par l’intermédiaire d’un facteur d’échelle dépendant du temps. La section 9.3 traite de la mesure des distances dans l’Univers et introduit le problème de l’horizon. La conservation de l’énergie et les équations d’Einstein sont utilisées dans la section 9.4 pour déterminer l’évolution temporelle du facteur d’échelle. Enfin la section 9.5 retrace brièvement les différentes étapes du Big Bang et l’empreinte qu’il a laissée sur l’Univers actuel. 9.1
Description qualitative de l’Univers
L’Univers de la cosmologie est quelque peu idéalisé par rapport à l’Univers réel, dans la mesure où nous nous intéressons uniquement à sa structure à grande échelle, et non aux détails. Afin de ne pas être sensibles aux fluctuations locales (étoiles, galaxies) et de lisser les irrégularités, nous effectuerons des moyennes sur des distances de l’ordre de 100 millions d’années lumière (a.l.). Il est aujourd’hui admis que l’Univers ne contient pas uniquement de la matière visible, sous forme d’étoiles, de galaxies ou de nuages de gaz, mais qu’il contient également de la matière sombre non visible, qui n’interagit pratiquement pas avec la matière ordinaire et le rayonnement électromagnétique, et une forme d’énergie encore plus exotique, l’énergie sombre, que nous introduisons dans la section 9.4. Énumérons quelques données de base nécessaires pour aborder la cosmologie.
1. Matière sombre. La matière visible ordinaire (étoiles, nuages de gaz. . .) ne représente, nous l’avons vu, qu’une très faible partie de la densité d’énergie de l’Univers, au plus quelques pourcents. Une composante essentielle est la matière sombre. Cette matière sombre est mise en évidence par l’étude de la rotation d’étoiles ou de de nuages de gaz autour du centre de galaxies. Par exemple, la figure 9.1 montre la vitesse de rotation v(r ) d’étoiles et de nuages de gaz dans la galaxie du Triangle M33 en fonction de la distance r au centre de cette galaxie. Si l’étoile ou le nuage sont situés à une distance r du centre de la galaxie, et si M(r ) est la masse contenue à l’intérieur de l’orbite, alors, d’après la loi de Newton que nous avons déjà rencontrée sous cette forme dans la section 5.2, on peut relier la masse M(r ) et la vitesse v(r ) par v2 (r ) GM(r ) . = r2 r
156
(9.1)
Chapitre 9. Cosmologie
F IGURE 9.1. Vitesse de rotation d’étoiles et de nuages de gaz en fonction de leur distance au centre d’une galaxie, ici la galaxie du Triangle M33. La courbe en pointillés donne la vitesse attendue en km/s si la masse centrale était uniquement la masse visible. La courbe en traits pleins donne les résultats observés : dans la partie gauche, proche du centre de la galaxie, les résultats sont obtenus à partir d’étoiles, dans la partie droite, plus excentrée, à partir de nuages de gaz détectés grâce à la raie 21 cm de l’hydrogène. L’existence de matière sombre permet d’expliquer cette courbe. Reproduit de Denegri et al. [2013], courtoisie de Claude Guyot.
Si l’essentiel de la masse était concentré au voisinage de r = 0, ce qui est suggéré par l’observation de la matière visible, on en déduirait que la vitesse v(r ) sur l’orbite est proportionnelle à r −1/2 . En fait, on trouve v(r ) ∼ cste, ce qui indique la présence d’une matière non visible importante. Une confirmation indépendante de l’existence de cette matière sombre vient de l’observation d’effets de lentille gravitationnelle (section 6.3).
2. Isotropie et homogénéité de l’Univers ou principe cosmologique. Si l’on fait abstraction des fluctuations locales (galaxies, amas de galaxies. . .), l’observation montre que l’Univers est homogène et isotrope : il a les mêmes propriétés en tout point et dans toutes les directions1 . Il faut moyenner sur des distances suffisamment grandes pour que l’homogénéité soit valable et l’échelle de transition entre la répartition homogène et la structure granulaire est, nous l’avons vu, de l’ordre de 108 années lumière. Un autre argument convaincant est donné par l’observation de l’isotropie du rayonnement cosmologique fossile, ou fond diffus cosmologique : ainsi que nous le verrons en détail dans la section 9.5, environ 1 En
fait, l’isotropie en tout point entraîne l’homogénéité.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
157
380 000 ans après le début de l’Univers, les photons se sont découplés de la matière et se sont retrouvés hors équilibre thermodynamique. Depuis cette époque, leur longueur d’onde a varié en proportion de l’expansion de l’Univers, et ils forment aujourd’hui le fond diffus cosmologique qui obéit à une loi de corps noir (encadré 7.2 et figure 7.8), à une température de 2,725 K. Les résultats des satellites COBE (1992), WMAP (2003) et Planck (2013) montrent qu’en dehors d’une asymétrie due à l’effet Doppler provenant du mouvement de notre galaxie et du système solaire dans celle-ci, ce qui donne au Soleil une vitesse de 370 km/s par rapport au fond diffus cosmologique, ce rayonnement est isotrope avec des fluctuations qui ne dépassent pas quelques fractions de millikelvins, soit environ 10−5 en valeur relative. L’accord entre la courbe donnant l’intensité du fond diffus cosmologique en fonction de sa fréquence et la courbe théorique du rayonnement du corps noir est bien meilleur que pour toute courbe mesurée dans un laboratoire ! Le point de départ de la cosmologie standard est donc l’hypothèse que l’Univers est homogène et isotrope à grande échelle, hypothèse qu’Einstein fut le premier à formuler en 1917, à une époque où il s’agissait d’une pure spéculation théorique sans le moindre fondement expérimental.
3. Expansion de l’Univers. Comme on le sait depuis Hubble2 (1929), le décalage Doppler de la lumière émise par les galaxies est proportionnel à leur distance d : pour une galaxie s’éloignant de la nôtre avec une vitesse v, le décalage Doppler Δλ, exprimé en fonction de la longueur d’onde λ de la lumière observée, est suivant (3.5) pour v/c 1 v Δλ = ≡ z. c λ
(9.2)
Une définition plus précise de z sera donnée ultérieurement. La loi de proportionnalité « établie » par Hubble (voir la note 2) est v = H0 d, où H0 est la constante de Hubble, dont la valeur numérique est, selon les derniers résultats du satellite Planck en 2013 H0 = 67, 3 ± 1, 2 km.s−1 /Mpc = 2, 08 ± 0, 04 × 10−18 s−1 , 1 = 4, 80 × 1017 s = 15, 2 × 109 ans. tH = H0
(9.3)
Le temps de Hubble est défini par t H = 1/H0 et le rayon de Hubble est la distance ct H parcourue par la lumière dans cet intervalle de temps. Rappelons que 2 En
réalité, l’histoire est plus complexe. Le premier modèle d’Univers en expansion fut proposé par Friedmann en 1922 ; en 1927, Lemaître redécouvrit les équations et les interpréta dans le cadre d’un modèle cosmologique d’expansion de l’Univers. En se fondant sur les observations de Slipher et Hubble, il en déduisit la loi de « Hubble » v = H0 d. Il semble que jusqu’à la fin de sa vie Hubble n’ait jamais cru en l’expansion de l’Univers.
158
Chapitre 9. Cosmologie
1 parsec (pc) vaut 3, 09 × 1016 m, ou 3,26 année lumière (a.l.), et la convention des cosmologistes est d’attribuer un indice 0 aux quantités mesurées aujourd’hui : H0 est la constante de Hubble mesurée le 10 février 2014 ! Le temps t est mesuré à partir du Big Bang, et le temps aujourd’hui, t0 , est donc l’âge de l’Univers. Le temps de Hubble donne une première approximation de cet âge : t0 ∼ t H . En effet, en supposant que les galaxies ont conservé une vitesse uniforme depuis les débuts de l’Univers, la distance à la galaxie qui s’éloigne est donnée par d = vt0 . En tenant compte d’autre part de la loi d = v/H0 , on déduit t0 = t H = 1/H0 . En fait, ainsi que nous le verrons ultérieurement, la vitesse d’expansion n’a pas été uniforme : l’Univers a connu une phase de ralentissement de l’expansion pendant la première moitié de son existence, suivie d’une phase d’accélération. Contrairement à la constante de Hubble, l’âge de l’Univers n’est pas une donnée observationnelle, et pour le déterminer à partir de cette constante, il faut disposer d’un modèle précis de l’expansion de l’Univers. En première approximation, dans un modèle réaliste, les effets de décélération et d’accélération se compensent ainsi que nous le verrons sur la figure 9.13, et l’âge de l’Univers est proche de 1/H0 : t0 13,8 milliards d’années. Pour vérifier la loi de Hubble, on doit mesurer la distance qui nous sépare de galaxies lointaines. Celle-ci est obtenue en utilisant des « chandelles standard », c’est-à-dire des étoiles dont la luminosité L, l’énergie envoyée par seconde dans tout l’espace, est connue (ou supposée telle !) ; L est mesurée en watts (W). Si f est le flux d’énergie recueilli par un détecteur sur la Terre, ce flux est relié à L et à la distance d par (figure 9.2) L . (9.4) f = 4πd2 Nous verrons ultérieurement une version plus précise de cette formule ; f est mesuré expérimentalement, et si l’on connaît L, on en déduit d. Une application simple de cette équation est donnée par le cas du Soleil : la luminosité du Soleil est L = 3, 85 × 1026 W, la distance Terre–Soleil d = 1, 5 × 1011 m, et le flux d’énergie reçu sur la Terre 1 366 W/m2 , une donnée fondamentale de la climatologie. 4. Big Bang. Comme l’Univers est en expansion, il est logique d’admettre que si nous remontons le temps, l’Univers va devenir de plus en plus « petit », et qu’à l’origine il pouvait être quasiment ponctuel. Nous verrons qu’il est effectivement plausible qu’à son tout début l’Univers ait été très petit et très chaud. C’est l’hypothèse du Big Bang3 . La grande surprise, en 1998, a été de constater que l’expansion de l’Univers s’accélérait. Il convient de mettre le lecteur (la lectrice) en garde contre une confusion possible : il ne faut pas interpréter le Big Bang comme une explosion à partir 3 Cette
dénomination a été introduite dans les années 1950 par l’astronome britannique Fred Hoyle, qui voulait ainsi ridiculiser cette théorie.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
159
σ d
F IGURE 9.2. Flux d’énergie f à une distance d d’une galaxie de luminosité L. La galaxie envoie dans l’espace une énergie L par seconde. Le flux d’énergie mesuré à une distance d est obtenu en divisant L par la surface 4πd2 de la sphère de rayon d. Sur une surface σ tracée sur la sphère, l’observateur reçoit une énergie f σ par seconde.
d’un centre. L’Univers n’a pas de centre, chaque galaxie voit les autres galaxies s’éloigner suivant la loi v = H0 d. Une image classique (à deux dimensions) est celle d’un ballon que l’on gonfle : des points marqués sur la surface du ballon s’éloignent les uns des autres, sans que l’on puisse identifier un point central sur cette surface, tous les points jouant un rôle équivalent (figure 9.5). 9.2
Décalage vers le rouge gravitationnel
Arpenter l’Univers n’est pas un problème évident pour deux raisons principales : 1. l’Univers est en expansion ; 2. l’espace ordinaire à un temps fixé n’est pas nécessairement euclidien. Il en résulte que l’on peut définir plusieurs types de distances, qui ont toutes leur utilité, mais il faut bien préciser le type de distance utilisé en fonction de la question posée. Nous allons nous débarrasser de la complication 2 ci-dessus en remarquant qu’en ce qui concerne l’espace ordinaire à un temps fixé, seulement trois options sont compatibles avec l’isotropie et l’homogénéité de l’Univers. Le choix le plus simple, et c’est celui que nous allons faire, est l’espace euclidien ordinaire
160
Chapitre 9. Cosmologie
à trois dimensions décrit dans la section 1.1, où les distances sont données par le théorème de Pythagore. Fort heureusement, ce choix est compatible avec les observations, ainsi que nous le verrons dans la section 9.5, ce qui justifie notre choix a posteriori ; le cas des deux autres options, qui correspondent à des espaces courbes, est renvoyé à l’annexe 11.6. Si l’on veut vérifier que l’espace est bien euclidien, il faut être capable de procéder à des mesures instantanées de longueur à des distances très grandes. On peut par exemple observer un objet de taille ΔL petite par rapport à sa distance d. Il sera vu sous un angle Δθ = ΔL/d dans un espace euclidien de courbure nulle, ainsi que nous l’avons vu dans l’introduction du chapitre 6, mais pour une même ouverture angulaire, l’objet sera plus petit (plus grand) dans un espace à courbure positive (négative) : figure 9.3.
Δθ Δ LP Δ LS
F IGURE 9.3. Distance angulaire dans un espace à courbure positive, une sphère à deux dimensions dans le cas de la figure. Pour une même ouverture angulaire Δθ , la taille ΔL de l’objet est plus grande dans l’espace euclidien que sur la sphère : ΔL P > ΔLS .
Ayant disposé du problème de l’espace, passons à celui de l’espace-temps. L’hypothèse d’isotropie et d’homogénéité permet de décomposer l’espacetemps en une famille d’hypersurfaces à trois dimensions de genre espace qui, compte tenu du choix fait ci-dessus, sont de simples espaces euclidiens. Ces hypersurfaces sont paramétrées par un scalaire que l’on peut appeler le temps t et elles sont notées Πt (figure 9.4). On a donc une « foliation » de l’espacetemps en tranches t = cste, tout comme dans la figure 1.10a. Mais nous sommes toujours confrontés au problème de la synchronisation d’horloges éloignées. Considérons la ligne d’univers d’une galaxie qui traverse l’hyperplan Πt au temps t : elle est en chute libre dans l’espace-temps et suit par conséquent une
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
161
G
G1
G2
Πt 0 Πt
F IGURE 9.4. Hyperplans Πt et lignes d’univers (géodésiques) de galaxies G, G1 et G2 en coordonnées (t, X, Y, Z ). Les lignes d’univers des galaxies sont orthogonales aux hyperplans t = cste pour la métrique dans ces coordonnées. On observe l’expansion de l’Univers entre t et t0 : les galaxies s’éloignent les unes des autres. Des points épais sur la courbe joignant G et G1 représentent des observateurs qui « conspirent » pour mesurer la distance d(t0 ) (9.8) entre les deux galaxies G et G1 .
géodésique. Pour chaque galaxie, on est libre de choisir comme coordonnée de temps son temps propre t = τ et, en raison de l’homogénéité, ce temps, appelé temps comobile, peut être choisi identique pour toutes les galaxies. Ce temps est celui mesuré par l’horloge d’un observateur voyageant avec la galaxie, et on peut se le représenter intuitivement comme le temps indiqué par une horloge démarrant à t = 0 à l’instant du Big Bang. Au voisinage de chaque galaxie, on mesure au temps t une densité d’énergie ρ(t) qui, en raison de l’homogénéité, est la même pour toutes les galaxies. Essayons maintenant d’établir la forme de la métrique : si au temps t une galaxie G a pour coordonnées euclidiennes ( X, Y, Z ) dans un système d’axes ayant notre galaxie comme origine, la distance d(t) à cette galaxie sera, d’après le théorème de Pythagore d(t) = [ X 2 + Y 2 + Z2 ]1/2 .
(9.5)
En raison de l’expansion de l’Univers, cette distance d(t) dépend du temps : la galaxie G s’éloigne de la nôtre et d(t) croît avec le temps. Il est commode d’inclure cette dépendance par rapport au temps dans un coefficient d’expansion
162
Chapitre 9. Cosmologie
de l’Univers, un nombre sans dimension noté conventionnellement a(t), en écrivant d(t) = a(t)dcom , (9.6) où dcom est appelée distance comobile qui est indépendante du temps. Les coordonnées ( x, y, z) définies par X = a(t) x
Y = a(t)y
Z = a(t)z,
(9.7)
sont les coordonnées comobiles, qui sont indépendantes du temps. Tout l’effet de l’expansion est contenu dans a(t), appelé facteur de dilatation ou facteur d’échelle. Comme ce facteur d’échelle est sans dimension, il pourra être commode de le normaliser par a(t0 ) = a0 = 1 : avec cette convention, dcom est la distance à la galaxie G aujourd’hui. Notons que nous pouvons indifféremment adopter le point de vue correspondant aux coordonnées ( X, Y, Z ), où les galaxies s’éloignent les unes des autres, ou bien le point de vue des coordonnées comobiles, où c’est l’espace qui est en expansion. Ainsi que nous l’avons mentionné dans la section 5.1, la relativité générale est indifférente au choix des coordonnées, mais la description physique est différente selon les coordonnées utilisées. Choisir des coordonnées comobiles est uniquement une question de commodité. Il est instructif de revenir à l’exemple du ballon gonflable : un point sur le ballon est défini par des coordonnées fixes, par exemple (θ, φ), ce sont ses coordonnées comobiles, mais évidemment le point ne reste pas immobile dans l’espace environnant quand on gonfle le ballon (figure 9.5). L’expansion du ballon est décrite par le facteur d’échelle. Si deux galaxies sont séparées au temps t par un intervalle de coordonnées comobiles (Δx, Δy, Δz), leur distance au temps t sera
1/2 d(t) = a(t) (Δx )2 + (Δy)2 + (Δz)2 = a(t)dcom , (9.8) Ce résultat nous conduit directement à la métrique de Friedmann-Lemaître pour l’espace-temps (voir la section 5.5 pour la définition de la métrique)
(9.9) c2 (Δs)2 = c2 (Δt)2 − a2 (t) (Δx )2 + (Δy)2 + (Δz)2 . C’est la généralisation la plus simple possible de la métrique de l’espace-temps plat : à un temps fixé, l’espace est plat, mais l’espace-temps ne l’est pas en raison de la dépendance en temps du facteur d’échelle. Rappelons que pour détecter la courbure de l’espace-temps, un observateur en chute libre place autour de lui un ensemble de particules test ayant la même vitesse initiale que lui. Si ces particules test s’éloignent ou se rapprochent de lui, alors la courbure de l’espace-temps est non nulle. Il faut bien faire la distinction entre la courbure
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
163
φ φ θ
θ
t t0 F IGURE 9.5. Coordonnées comobiles pour un univers en expansion dans un espace-temps à trois dimensions entre un temps t < t0 et t = t0 . Pour des raisons de clarté de la figure, nous avons choisi le cas où l’espace, qui est donc de dimension 2, possède une courbure positive : c’est la sphère S2 . La sphère de gauche est tracée à un temps t antérieur à t0 , celle de droite représente l’espace aujourd’hui, au temps t0 . Les rayons des deux sphères sont dans le rapport a(t)/a(t0 ), avec a(t) < a(t0 ). Les points rouges représentent des galaxies. Les coordonnées (θ, φ) d’une galaxie donnée sont identiques pour les deux sphères, ce sont ses coordonnées comobiles, indépendantes du temps. On a aussi représenté un élement de surface (un volume dans un espace-temps à quatre dimensions) au voisinage du point (θ, φ).
de l’espace, qui se mesure sur de grandes distances à t fixé, et la courbure de l’espace-temps, qui se mesure localement dans une petite région de l’espacetemps, comme expliqué dans le cas de la déviation géodésique de la section 5.4. Étant donné la métrique de Friedmann-Lemaître, comment mesurer la distance entre deux galaxies ? Notre définition de la distance suppose que les deux galaxies sont prises au même instant, et donc que Δt = 0. Comme la simultanéité n’est pas une notion absolue en relativité, ainsi que nous l’avons observé aux chapitres 1 et 2, toute mesure de distance repose, nous l’avons dit, sur une convention de synchronisation des horloges des galaxies. Une convention possible et naturelle consiste à utiliser la définition (9.8) de la distance d(t) à t fixé. Une technique de mesure envisageable pour mesurer d(t) serait alors de placer un grand nombre d’observateurs disposés entre les deux galaxies, qui déterminent chacun la distance entre eux-mêmes et leur plus proche voisin au même temps t (figure 9.4). La somme de ces distances donne d(t). Inutile de dire que cette « conspiration cosmique », comme l’appelle Steve Weinberg, n’est pas très pratique à mettre en œuvre, et nous allons procéder de façon indirecte dans la section suivante pour évaluer cette distance.
164
Chapitre 9. Cosmologie
Lorsque nous observons une galaxie éloignée, nous ne la voyons pas telle qu’elle est aujourd’hui. S’il n’y avait pas d’expansion, nous la verrions telle qu’elle était à une date t0 − d/c, où d est la distance à la galaxie : objet lointain implique passé lointain. La situation est plus complexe en raison de l’expansion, mais on peut néanmoins penser à utiliser le temps de vol d’un photon émis par la galaxie pour mesurer sa distance. Cela sera nettement plus pratique que la méthode « conspirationniste » exposée ci-dessus, mais la distance ainsi mesurée dépendra de l’expansion et sera contrôlée par le facteur d’échelle. Dans ce qui suit, nous aurons à nous servir des notions de dérivée première et seconde de ce facteur d’échelle. Un exemple simple permettra d’introduire ces notions de façon intuitive : une fusée est lancée vers le haut depuis la surface de la Terre avec une certaine vitesse intiale. Dans une première phase, t < T, son mouvement est libre et son altitude y(t) varie suivant une loi parabolique représentée graphiquement sur la figure 9.6. La vitesse de la fusée est donnée au temps t par la pente de la courbe, qui n’est autre que la dérivée première, notée y˙ (t). L’accélération4 de la fusée est donnée par la dérivée seconde notée y¨ (t), qui est égale dans ce cas à l’accélération de la pesanteur : y¨ (t) = − g. Dans une seconde phase, t > T, on suppose que le projectile est propulsé vers le haut avec une accélération g > g, et dans ces conditions son accélération vaut y¨ (t) = g − g > 0. Les propriétés d’expansion de l’Univers sont résumées par le facteur d’échelle a(t). Un comportement plausible de ce facteur d’échelle est illustré sur la figure 9.7. Si la vitesse d’expansion avait été constante depuis le Big Bang à t = 0, nous avons vu que l’âge de l’Univers serait simplement l’inverse de la constante de Hubble t0 = t H = 1/H0 . Sur la figure 9.7, la vitesse d’expansion varie avec le temps, et la concavité de la courbe est orientée vers le bas, ce qui veut dire que l’expansion de l’Univers ralentit entre le Big Bang et aujourd’hui. Dans ce cas, on observe sur la figure que le temps de Hubble t H est plus grand que l’âge t0 de l’Univers. En fait, il est intuitivement évident (et ce sera montré dans la section 9.4) que la gravité ne peut que ralentir l’expansion de l’Univers : une pierre lancée vers le haut est toujours freinée par la gravité terrestre, même si on la lance avec une vitesse supérieure à la vitesse de libération, et la dérivée seconde par rapport au temps du facteur d’échelle est négative : a¨ (t) < 0, ce qui 4 Attention donc à ne pas confondre vitesse et accélération ! La vitesse donne la variation de la position pendant un court intervalle de temps, et l’accélération la variation de la vitesse pendant cet intervalle : voir la note 1 du chapitre 2. Quand une pierre lancée vers le haut passe par son altitude maximale, sa vitesse est nulle, mais pas son accélération, qui est égale à celle de la pesanteur. La légende veut qu’un ancien ministre de l’Éducation nationale ait affirmé : « si l’on creuse un tunnel à travers la Terre passant par son centre et que l’on y laisse tomber une pierre, au centre de la Terre la vitesse de la pierre est nulle ». Cette fois, c’est l’accélération qui est nulle, mais pas la vitesse !
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
165
y
−g
T
t
F IGURE 9.6. Altitude y(t) en fonction du temps d’une fusée lancée verticalement avec une vitesse initiale v0 ; on a également représenté en unités arbitraires sa vitesse (trait plein bleu) et son accélération (tiretés bleus). Dans une première phase du mouvement, représentée en rouge, la fusée est en chute libre, mais dans une seconde phase, représentée en vert pour t > T , elle est propulsée verticalement avec une accélération g > g, où g est l’accélération de la pesanteur, avec une transition continue entre les deux cas. La pente de la courbe au temps t est la vitesse de la fusée donnée par sa dérivée première y˙ (t) et la concavité de la courbe est contrôlée par la dérivée seconde y¨ (t), qui est l’accélération de la fusée. Le signe de cette dérivée seconde donne l’orientation de la concavité : si y¨ (t) > 0, la concavité est dirigée vers le haut et le projectile accélère verticalement, ce qui est le cas dans la seconde phase du mouvement pour t > T . Si y¨ (t) < 0, l’accélération est dirigée vers le bas et la fusée ralentit. En résumé, en dehors de la période de transition entre les deux phases, l’accélération est y¨ (t) = − g < 0 dans la première phase du mouvement et y¨ (t) = g − g > 0 dans la seconde phase. On observe le changement de concavité de la courbe à t = T lorsque l’accélération change de signe.
veut dire géométriquement que la concavité de la courbe représentative de a(t) est dirigée vers le bas, d’où le comportement qualitatif tracé sur la figure 9.7. Une conséquence de cette concavité est que t0 ≤ t H . Cependant, on verra que la prédiction simple et remarquable, la concavité de a(t) est dirigée vers le bas, n’est pas vérifiée expérimentalement : une phase d’accélération de l’expansion suit la phase initiale au cours de laquelle l’expansion ralentit. Nous allons maintenant généraliser le résultat de Hubble, qui n’est valable que pour des galaxies pas trop éloignées, en établissant la formule du décalage vers le rouge cosmologique compte tenu de l’expansion définie par le facteur d’échelle. Au lieu des coordonnées comobiles ( x, y, z), il sera commode d’utiliser dans l’espace des coordonnées comobiles sphériques5 (r, θ, φ) (section 5.3) et de 5 La notation est adaptée au cas simple de l’espace plat, et c’est la raison pour laquelle nous l’utilisons, mais elle est trompeuse : r est en fait une coordonnée angulaire, ainsi que nous l’expliquons dans le cas des espaces courbes à l’annexe 11.6.
166
Chapitre 9. Cosmologie
a(t)
t0
t
tH F IGURE 9.7. Un comportement plausible du facteur d’échelle a(t). La pente de la tangente au point t = t0 donne la vitesse d’expansion aujourd’hui. Si cette vitesse était restée constante, l’âge de l’Univers serait t H . En raison de la concavité de la courbe orientée vers le bas, ce qui correspond à un ralentissement de l’expansion, on constate que l’âge de l’Univers t0 est inférieur dans ce cas au temps de Hubble t H .
récrire la métrique de Friedmann-Lemaître (9.9)
c2 (Δs)2 = c2 (Δt)2 − a2 (t) (Δr )2 + r2 ((Δθ )2 + sin2 θ (Δφ)2 ) .
(9.10)
Comme nous avons choisi le facteur d’échelle sans dimension, r a les dimensions d’une longueur. Soit deux galaxies, de coordonnées comobiles r = 0 (la nôtre !) et r = rcom , et un photon se propageant depuis la galaxie lointaine vers nous. La propagation d’un photon implique (Δs)2 = 0, mais à cause du facteur a(t) dans la métrique, les lignes d’Univers d’un photon ne sont pas des droites (figure 9.8). Si les instants d’émission par la galaxie de deux photons succcessifs à r = rcom sont te et te + Δte , et les temps de réception sur la Terre t0 et t0 + Δt0 , nous allons montrer que Δte et Δt0 sont liés par Δt0 /a(t0 ) = Δte /a(te ). La figure 9.8a montre la propagation des photons entre la galaxie lointaine et la nôtre dans les cordonnées (t, r ). Dans la figure 9.8b, nous utilisons une autre coordonnée de temps6 η définie par Δη = cΔt/a(t). Comme cΔt/a(t) = Δr, les lignes d’Univers des photons sont maintenant des droites inclinées à 45o (avec c = 1) et Δt0 /a(t0 ) = Δte /a(te ). Comme a(t0 ) > a(te ), ce qui traduit l’expansion de l’Univers, cette relation montre que l’intervalle entre deux réceptions de signaux est plus grand que celui entre deux émissions, Δt0 > Δte , et elle donne un décalage de fréquence entre photons émis (νe ) et reçus (ν0 ), qui est le décalage vers le rouge cosmologique, ou coordonnée de temps sans dimension η est définie explicitement par η = c est appelée « temps conforme ».
6 La
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
t te
dt /a(t ). Elle
167
η
ct t0 + Δt0 cΔte a(te)
cΔt = Δr a(t)
t0 te + Δte cΔt0 a(t0)
te rcom
0
Δr
0
(a)
rcom r
(b)
F IGURE 9.8. Propagation de photons de r = rcom à r = 0 entre une galaxie lointaine et la nôtre. (a) Propagation dans les coordonnées (ct, r ) : en raison de la dépendance en temps du facteur d’échelle, les lignes d’Univers des photons ne sont pas des droites. (b) Propagation dans les coordonnées (η, r ) : comme Δη = cΔt/a(t) = Δr, les lignes d’univers des photons sont des droites à 45o et il en résulte que Δt0 /a(t0 ) = Δte /a(te ).
redshift cosmologique : le rapport des facteurs d’échelle est l’inverse de celui des fréquences et il est donc identique à celui des longueurs d’onde, étant donné que λ = c/ν. On définit le facteur z par 1+z =
a ( t0 ) λ0 νe = = . a(te ) λe ν0
(9.11)
La longueur d’onde d’un photon se dilate par le même facteur que l’Univers lui-même. La fréquence reçue ν0 est plus faible que la fréquence émise νe , et la longueur d’onde λ0 plus grande que λe , parce que l’Univers est en expansion, et donc que a(te ) < a(t0 ) : c’est bien un décalage vers le rouge. En fait, la meilleure définition opérationnelle de la distance à une galaxie lointaine est la donnée de son z, qui est une donnée observationnelle non ambiguë, alors que le temps te d’émission d’un photon, ou bien la distance d’émission, dépendent du modèle d’Univers choisi et de la définition de cette distance. On dira par exemple que le découplage des photons du fond diffus cosmologique s’est produit à z 1 100, ou que les objets les plus lointains que l’on a pu observer aujourd’hui sont à z ∼ 11. Une des grandes vertus de ce décalage vers le rouge est qu’il transforme
168
Chapitre 9. Cosmologie
une carte du ciel, qui est une image à deux dimensions, en une carte à trois dimensions. Deux galaxies dont la distance angulaire est proche peuvent avoir un décalage vers le rouge très différent : elles sont pratiquement sur la même ligne de visée, mais elles sont en fait très éloignées. Le décalage vers le rouge cosmologique donne de la profondeur aux cartes du ciel. Afin de relier le résultat général (9.11) et la loi de Hubble, il suffit de remarquer que la vitesse d’une galaxie proche de la nôtre est donnée par v = a˙ (t0 )dcom et que compte tenu de la loi de Hubble v = a˙ (t0 )dcom = H0 a(t0 )dcom soit H0 = a˙ (t0 )/a(t0 ). Pour un temps arbitraire t, on définira la « constante » de Hubble H (t) par a˙ (t) H (t) = . (9.12) a(t) Comme cette constante ne l’est pas, nous l’appellerons plutôt paramètre de Hubble. Le rayon de Hubble au temps t est c/H (t). Pour progresser dans l’exposé, nous aurions besoin de la forme explicite du facteur d’échelle a(t). Cette forme dépend du contenu en énergie de l’Univers, et elle sera examinée dans la section suivante, mais il est instructif d’utiliser dès à présent une expression simple de ce facteur, qui correspond à un Univers de courbure spatiale nulle dont le contenu en énergie est dominé par de la matière non relativiste. Dans ce cas, les particules ont des vitesses faibles par rapport à celle de la lumière, qu’elles fassent partie de la matière ordinaire ou de la matière sombre. Dans ces conditions, on montre dans la section 9.4 que le facteur d’échelle a(t) est donné par une loi de puissance (a0 = 1) a(t) = (t/t0 )2/3 .
(9.13)
C’est cette loi qui est représentée sur la figure 9.7. Son avantage est de permettre des estimations analytiques simples, tout en n’étant pas trop éloignée du comportement plus réaliste de la figure 9.13. Avant de passer dans la section suivante au problème des distances dans l’Univers, précisons un point d’une grande importance : par commodité, nous avons introduit un « âge de l’Univers » et donc un « instant zéro » pour le temps comobile. En fait, l’instant t = 0 ne fait pas partie de l’histoire de l’Univers : cet instant correspond à une singularité de la métrique où la courbure de l’espacetemps devient infinie. On peut d’ailleurs utiliser d’autres coordonnées de temps que le temps comobile, par exemple le facteur d’échelle a(t) ou son logarithme qui tend vers −∞ aux débuts du Big Bang. De plus, ainsi que nous le soulignons
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
169
dans la section 9.5, toute théorie du Big Bang pour des temps antérieurs à t ∼ 10−11 s, même largement médiatisée, est au minimum spéculative (inflation), voire hautement spéculative (univers quantiques, multivers). 9.3
Distances dans l’Univers et problème de l’horizon
Nous allons maintenant évaluer la distance à une galaxie lointaine. Supposons que nous observions une galaxie de redshift z. Est-il possible d’estimer sa distance telle qu’elle a été définie en (9.8) ? Nous disposons de deux paramètres observationnels, z et la constante de Hubble H0 , mais cela ne suffit pas pour notre estimation : nous avons besoin de la forme explicite du facteur d’échelle a(t), et donc d’un modèle d’Univers. Pour fixer les idées, prenons le modèle d’expansion défini par (9.13). Dans ce modèle, on montre aisément que le paramètre de Hubble au temps t, a˙ (t)/a(t), est donné en fonction de z par H (z) = H0 (1 + z)3/2 . Cette expression permet d’estimer la distance d’une galaxie de redshift z. Sur la figure 9.9, nous avons représenté la ligne d’univers de photons en utilisant le modèle d’expansion (9.13) qui conduit à des expressions analytiques simples. Sur cette figure, nous avons porté la coordonnée comobile rcom en abscisses et le rapport a(t)/a0 = (1 + z)−1 en ordonnées. Si nous recevons aujourd’hui la lumière d’une galaxie de redshift z, on montre que la distance comobile de la galaxie au moment de l’émission était rcom (z) =
2c 1 − (1 + z)−1/2 . H0
(9.14)
Par définition, cette coordonnée n’a pas varié depuis l’émission, et la distance comobile à la galaxie est rcom , compte tenu de notre choix a0 = 1. La figure montre aussi la distance des objets les plus éloignés dont la lumière nous parvient aujourd’hui : cette distance est appelée l’horizon des particules, ou tout simplement horizon, quand il n’y a pas de confusion possible avec l’horizon des événements des trous noirs. En supposant l’Univers transparent, c’est la distance maximale que peut avoir parcouru un photon qui nous arrive aujourd’hui ; elle est notée dhor (t0 ) ou dhor (z = 0). Aucun photon émis à une distance supérieure à cette distance n’a pu nous parvenir. La région de l’Univers à laquelle on peut (en principe) accéder aujourd’hui est donc limitée par cette distance. Dans notre modèle simple, l’horizon est obtenu en faisant tendre z vers l’infini dans (9.14) : dhor (t0 ) = 2c/H0 : en raison de l’expansion, l’horizon est plus éloigné que l’estimation naïve dhor (t0 ) = c/H0 . La figure montre également la distance 170
Chapitre 9. Cosmologie
1,0 1 1+ z 0,8
0,6
0,4
rcom (z = 1)
0,2
rcom (z = 0) 0
0
0,5
1,0
1,5
rcom
2,0
F IGURE 9.9. Lignes d’univers de photons dans le plan [ a(t) = (1 + z)−1 , rcom ], où rcom est mesuré en unités de c/H0 et l’expansion de l’Univers suit la loi (9.13). On a représenté en rouge la ligne d’univers d’un photon émis à l’instant du Big Bang et reçu par nous aujourd’hui : z = rcom = 0, et en bleu celle d’un photon reçu par notre galaxie quand elle √était située dans le temps à z = 1. Les tangentes au point rcom = 0 ont pour pentes respectives 1 et 1/ 2.
comobile pour une galaxie de redshift z, qui reçoit de la lumière émise à t = 0. La coordonnée comobile du point d’émission est rcom (z) =
2c (1 + z)−1/2 . H0
Cependant, il faut noter que nous ne recevons pas de photons émis à t = 0, car l’Univers est opaque jusqu’au découplage des photons, qui s’effectue au bout de 4 × 105 ans environ après le Big Bang, et l’horizon effectif est plus petit que celui déterminé ci-dessus. Nous avons illustré le calcul des distances et de l’horizon à l’aide du modèle simple (9.13), mais on peut bien sûr écrire des formules générales. Celles-ci sont données dans l’encadré 9.1. Avec les données du modèle standard actuel qui correspond à 30 % de matière non relativiste (ordinaire et sombre) et 70 % d’énergie sombre, on obtient les estimations suivantes : dhor (t0 ) 3 ct0
3c 45 milliards a.l.. H0
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
171
tandis que l’âge de l’Univers est estimé à 13,8 milliards d’années. On peut comprendre ainsi la différence entre ct0 et l’horizon aujourd’hui, ou rayon de l’Univers : les objets les plus éloignés dont nous recevons la lumière aujourd’hui (en ignorant l’opacité pré-découplage) ont émis cette lumière il y a 13,8 milliards d’années, mais depuis cette émission ils se sont éloignés de nous en raison de l’expansion et sont maintenant situés à environ 45 milliards d’années lumière. Encadré 9.1. Décalage vers le rouge et horizon.
Dans cet encadré, nous donnons l’expression mathématique de la distance comobile rcom à une galaxie et celle de l’horizon. De la condition (Δs)2 = 0 pour la propagation d’un photon et de Δθ = Δφ = 0 dans (9.9), nous déduisons la distance comobile parcourue par un photon émis au temps te et reçu au temps t0 rcom = c
t0 dt te
a(t)
.
(9.15)
En écrivant la même équation pour un second photon émis à te + Δte et reçu à t0 + Δt0 , on obtient directement (9.11). L’horizon rhor (t) au temps t est donné en coordonnées comobiles par t dt . (9.16) rhor (t) = c 0 a(t ) La distance physique dhor (t) à l’horizon au temps d’observation t est dhor (t) = a(t)rhor (t) = ca(t)
t dt 0
a(t )
.
Ces équations sont souvent écrites en fonction du redshift z, a(t) = a0 (1 + z)−1 .
Ainsi que nous le verrons dans la section 9.5, les photons du fond diffus cosmologique ont été émis7 lorsque l’Univers était environ 1 100 fois plus petit que l’Univers actuel. Appelant tdec le temps correspondant (l’indice dec signifie découplage, voir la section 9.5), nous avons donc zdec = a(t0 )/a(tdec ) 1 100. Nous en déduisons le schéma de la figure 9.10 : les photons du fond diffus cosmologique qui nous parviennent aujourd’hui ont été émis depuis une sphère dont le rayon est de l’ordre de c/H0 . Comme nous l’avons vu ci-dessus, la distance comobile parcourue à t = tdec par un photon émis au Big Bang est de l’ordre de cH0−1 (1 + zdec )−1/2 , et cette distance est vue par nous sous un angle de l’ordre de θ (1 + zdec )−1/2 ∼ 1 degr´e. 7 Plus
précisément, les photons ont été diffusés pour la dernière fois par des particules chargées, voir la section 9.5.
172
Chapitre 9. Cosmologie
Cette observation nous confronte à l’un des problèmes de la théorie du Big Bang, le problème de l’horizon. Considérons (figure 9.10) deux photons que nous recevons aujourd’hui, émis par deux régions de la sphère de rayon ∼ c/H0 , dont la distance angulaire Δθ est grande par rapport à 1 degré. La figure montre que les régions incluses dans le rayon de Hubble du point de départ de chaque photon ne peuvent pas avoir interagi, et il est difficile de comprendre que ces deux régions aient des propriétés identiques, par exemple que la température soit la même dans les deux régions. Autrement dit, l’isotropie du fond diffus cosmologique pose problème dans la théorie du Big Bang. Pour conclure cette section, revenons sur la mesure des distances. Nous avons vu que la distance à une galaxie pouvait être mesurée si l’on connaissait sa luminosité L, et il est intéressant de comprendre comment on peut généraliser l’équation (9.4). On définit une distance effective deff entre une galaxie lointaine et la nôtre de la façon suivante : l’aire de la sphère, lieu des points ayant la même distance à la source que le point d’observation, est 4πd2eff , et deff se déduit des
photons dans le proche infrarouge photons micro-ondes t = t0
Δθ
rcom (zdec)
t = tdec rcom (zdec)
surface de dernière diffusion F IGURE 9.10. Le problème de l’horizon. Les deux photons du fond diffus cosmologique ont été émis depuis une sphère dont le rayon est de l’ordre de c/H0 , mais pour t = tdec , le rayon de Hubble était beaucoup plus petit. Les deux régions hachurées ne peuvent pas avoir interagi depuis le Big Bang si la distance angulaire Δθ est plus grande que 1 degré. Les photons du fond diffus cosmologique ont été émis dans le proche infrarouge avec une longueur d’onde λ 1, 7 μm, et ils sont reçus par nous avec une longueur d’onde λ 1, 9 mm. Les irrégularités de la surface de dernière diffusion représentent les fluctuations du fond diffus cosmologique : section 9.5.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
173
déterminations du flux et de la luminosité. On observe une réduction du flux d’énergie par rapport à (9.4) pour deux raisons. 1. La fréquence des photons, et donc leur énergie en raison de la loi de Planck-Einstein (11.2) E = 2π¯hν, est plus faible à cause du décalage vers le rouge cosmologique (9.11) ν0 =
νe . (1 + z )
2. Comme l’intervalle Δt0 entre la réception de deux photons successifs est plus grand que l’intervalle Δte entre leur émission, on compte moins de photons par unité de temps Δt0 = Δte (1 + z). Le rapport f /L définit la distance de luminosité d L , qui est donc f 1 1 1 = = . 2 2 L 4πdeff (1 + z) 4πd2L
(9.17)
La figure 9.11 illustre les considérations précédentes dans le cas de deux dimensions d’espace. Le calcul explicite de deff pour une courbure spatiale quelconque est donné dans l’annexe 11.6. Une autre distance communément utilisée est la distance angulaire d A : considérons un objet que nous voyons sous un angle Δθ. Les photons se sont propagés t
Δt0 t0 aire 2 4πdeff
Δte te
F IGURE 9.11. Relation flux/luminosité dans un espace-temps à trois dimensions. Adapté de Hartle [2003].
174
Chapitre 9. Cosmologie
depuis cet objet jusqu’à nous à θ et φ constants. La taille de l’objet au moment de l’émission était ΔL = a(t)rcom Δθ, et comme l’angle n’a pas varié, on a aujourd’hui dans un espace plat Δθ =
ΔL ΔL(1 + z) ΔL = = a(t)rcom a(t0 )rcom dA
par définition de la distance angulaire d A . La distance angulaire d A et la distance de luminosité d L sont donc reliées par d A = a(t0 )rcom (1 + z)−1 = d L (1 + z)−2 . Il est facile de comprendre géométriquement l’effet de la courbure sur la distance angulaire. Prenons le cas le plus intuitif, celui d’une sphère de courbure positive (figure 9.3). Si nous traçons à partir du pôle Nord deux grands cercles faisant un angle Δθ, les tangentes à ces grands cercles vont intercepter une longueur ΔL plus grande dans un espace plat que sur la sphère. Pour un même angle, la taille de l’objet sera plus grande dans l’espace plat, et l’inverse sera vrai pour un espace de type hyperbolique de courbure négative ΔLcourb.>0 < ΔLcourb.=0 < ΔLcourb. 0, ce que suggèrent les observations : en effet, si le volume augmente de δV, on ajoute de l’énergie ρv δV au système, contrairement au cas usuel où l’énergie augmente quand le volume diminue. Le signe de ρv n’est pas fixé par la théorie, et le fait que ρv > 0, ce qui conduit à l’accélération de l’expansion, est une observation expérimentale, de même que la valeur absolue de ρv . Le calcul théorique le plus naïf de cette énergie du vide à partir de la théorie des champs quantiques diffère d’un facteur 10120 du résultat observé, le pire résultat, et de très loin, jamais obtenu par des physiciens ! Des calculs moins naïfs réduisent la différence à un facteur 1050 « seulement ». On peut inclure cette énergie du vide dans les équations d’Einstein sous forme d’une constante cosmologique8 . Nous avons bien progressé, mais il nous manque encore une information essentielle pour obtenir l’évolution temporelle du facteur d’échelle. Cette information est contenue dans les équations d’Einstein. Nous n’allons pas en donner la forme mathématique, mais seulement redonner son énoncé en mots. La géométrie de l’espace-temps est déterminée localement par son contenu en énergie-impulsion.
Les équations d’Einstein permettent d’établir l’équation donnant la dérivée a˙ (t) du facteur d’échelle, ou équation de Friedmann
a˙ (t) a(t)
2
−
8π kc2 Gρ(t) = − 2 2 3 R a (t)
k = 1, 0, −1.
(9.24)
L’équation de Friedmann a été écrite ci-dessus pour un espace homogène courbe : R est le rayon de courbure, le rayon de la sphère dans le cas d’un espace à symétrie sphérique, et la courbure est 1/R2 . La valeur k = +1 correspond à un espace à courbure positive, k = −1 à un espace à courbure négative, tandis que k = 0 (ou R → ∞) correspond à un Univers spatialement plat, le cas 8 Initialement,
Einstein avait introduit cette constante cosmologique en 1917 afin de stabiliser l’Univers. En effet, on pensait à l’époque que l’Univers était statique, mais la gravité avait tendance à le faire s’effondrer sur lui-même. La constante cosmologique, agissant pour contrecarrer la gravité, permettait en théorie d’obtenir un Univers statique. . .sauf que la solution était instable. Quand l’expansion de l’Univers est devenue évidente, Einstein a abandonné la constante cosmologique, qui devait faire un retour fracassant en 1998, lorsque les observations ont montré l’accélération de l’expansion. La légende veut qu’Einstein ait qualifié la constante cosmologique de « plus grosse gaffe de sa vie » (the biggest blunder in my life). Mais il ne semble pas qu’Einstein ait jamais dit ou écrit quoi que ce soit d’approchant, et c’est probablement George Gamow, bien connu pour son goût du canular, qui est à l’origine de la légende.
178
Chapitre 9. Cosmologie
que nous avons examiné jusqu’ici. On déduit de l’équation (9.24) prise à t = t0 et k = 0 la densité d’énergie aujourd’hui en tenant compte de ce que H0 = a˙ 0 /a0 ρ0 = ρ c =
3H02 . 8πG
(9.25)
La densité ρc est la densité critique : pour ρ0 ≤ ρc , l’expansion se poursuit indéfiniment, pour ρ0 > ρc l’Univers finit dans le Big Crunch, l’inverse du Big Bang, ce qui correspond à un Univers fermé, sauf toutefois si la densité d’énergie du vide est suffisamment grande. Il est remarquable que le caractère fermé (k = +1) ou ouvert (k = −1) de l’Univers soit lié à sa densité d’énergie : si la densité est plus grande que ρc , alors l’Univers est fermé, si elle est plus petite, alors il est ouvert. Si ρ0 = ρc , l’espace est plat, k = 0, mais il peut être infini (espace euclidien) ou fini, en adoptant par exemple la géométrie d’un tore qui est un espace de courbure nulle : la question est aujourd’hui entièrement ouverte. Il en est de même dans le cas k = −1 : la relativité générale ne fixe pas la topologie cosmique. La densité critique correspond à environ 5 atomes d’hydrogène par m3 . Mais attention ! La matière ordinaire ne représentant que 5 % environ du contenu en énergie de l’Univers, la densité de protons est plutôt de 0,25 par m3 . Les cosmologistes ont l’habitude de définir les rapports des différents types de densité d’énergie aujourd’hui à la densité d’énergie critique (m = matière, r = rayonnement, v = vide) Ωm =
ρm0 ρc
Ωr =
ρr0 ρc
Ωv =
ρv0 , ρc
(9.26)
et Ωm + Ωr + Ωv = 1 pour un Univers spatialement plat (ρ0 = ρc ). Il faut noter que la matière sombre est comprise dans Ωm : cette matière sombre est supposée « froide », les vitesses des particules qui la composent sont petites par rapport à c. En prenant la dérivée de l’équation de Friedmann (9.24) par rapport au temps et en combinant le résultat avec (9.20), on obtient une équation pour la concavité de a(t) 4πG a¨ =− (3P + ρ ). (9.27) a 3 et par conséquent a¨ < 0 si (3P + ρ) > 0, ce qui est le cas en particulier si la pression et l’énergie sont positives : s’il n’y a que de la matière et/ou du rayonnement, l’expansion est ralentie par la gravité, conformément à l’argument intuitif donné précédemment, même dans le cas où elle se poursuit indéfiniment. L’observation expérimentale a¨ > 0, obtenue à partir des vitesses et des luminosités de « chandelles standard », implique donc une physique non conventionnelle.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
179
On observe aussi que le membre de droite de (9.27) ne fait pas intervenir la courbure k : la concavité de a(t) ne dépend que du signe de (3P + ρ). Ce signe est positif pour la matière ordinaire et le rayonnement, et la concavité de a(t) est alors obligatoirement orientée vers le bas : l’expansion de l’Univers ralentit. En revanche, dans le cas de l’énergie du vide, P = −ρ < 0 et la concavité de a(t) est orientée vers le haut : l’expansion de l’Univers s’accélère si l’énergie du vide domine. Pour fixer les idées, et parce que ce choix est compatible avec les observations, poursuivons avec l’Univers spatialement plat. On déduit des équations précédentes le comportement de l’Univers, déterminé par celui du facteur d’échelle a(t) en fonction des paramètres Ωi . Examinons quelques cas particuliers illustrant ce comportement. 1. Univers dominé par la matière : Ωm = 1, Ωr = Ωv = 0. Dans ce cas, on trouve un comportement en t2/3 pour a(t), déjà écrit en (9.13), et donc t0 = 2t H /3. 2. Univers dominé par le rayonnement : Ωm = Ωv = 0, Ωr = 1. Dans ce cas, on trouve une loi en t1/2 a(t) = a(t0 ) (t/t0 )1/2 .
(9.28)
Comme t1/2 emporte sur t2/3 pour les petites valeurs du temps, on en déduit qu’à l’approche du Big Bang, l’Univers était dominé par le rayonnement : photons et particules massives ultra-relativistes, dont la vitesse est proche de c. 3. Univers dominé par le vide : Ωm = Ωr = 0, Ωv = 1. Dans ce cas, on trouve une loi exponentielle pour a(t) a ( t ) = a ( t 0 ) e H ( t − t0 ) .
(9.29)
Comme une exponentielle l’emporte sur une loi de puissance pour les grandes valeurs du temps, si l’énergie du vide est non nulle, elle finit toujours par dominer. Nous avons illustré sur la figure 9.13 le comportement de a(t) pour les valeurs actuellement admises, Ωm 0, 3, Ωv 0, 7 et Ωr 0. Pour de petites valeurs de t, le facteur d’échelle a(t) est dominé par le rayonnement et se comporte en t1/2 ; le rayonnement et la matière contribuent également à la densité d’énergie pour z = zeq ∼ 3 000, et ensuite l’influence du rayonnement devient négligeable pour des valeurs de z plus petites que zeq . La matière non-relativiste prend le dessus avec un comportement en t2/3 : dans les deux cas, on observe une concavité de la courbe orientée vers le bas, et donc un ralentissement de
180
Chapitre 9. Cosmologie
a (t) 1,6 1,4 1,0 0,8 0,6 0,4 0,2 0
0
5
10
t0
15
20
t (109 années)
F IGURE 9.13. Le facteur d’échelle a(t) en fonction du temps illustré dans un modèle semi-réaliste : Ωm 0, 3, Ωv 0, 7. L’expansion de l’Univers est ralentie jusqu’à t = T 1010 années (courbe rouge), mais l’orientation de la concavité de la courbe change en ce point, correspondant à un point d’inflexion, et ensuite on observe une phase d’expansion accélérée (courbe verte). Il est instructif de comparer cette figure avec la figure 9.6 qui utilise le même code couleur. On constate que la tangente à la courbe tracée pour t = t0 passe approximativement par l’origine, et donc t0 1/H0 . Adapté de Moore [2014].
l’expansion. Finalement, c’est l’énergie sombre qui l’emporte en donnant une expansion accélérée, correspondant à une concavité de la courbe orientée vers le haut.
9.5
Une brève histoire du Big Bang
Rassemblons les résultats des sections précédentes afin d’écrire une histoire simplifiée du Big Bang. Au tout début de l’Univers, le facteur d’échelle est très petit et le rayonnement, photons et particules ultrarelativistes de vitesses très proches de c, est dominant, la densité d’énergie est très grande et la température très élevée, voir (9.22) et la figure 9.14. Rappelons que l’énergie est directement liée à la température absolue T en raison de la relation E = kB T, où kB est la constante de Boltzmann (encadré 7.2). Un point de repère utile est que 1 eV correspond à environ 104 K (plus précisément 11 400 K). Un autre point de repère utile est la température au centre du Soleil, environ 1, 5 × 107 K, soit 1,4 keV ; on notera également que 1 GeV, l’énergie de masse du proton, correspond à 1013 K. Une particule dont
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
181
Aujourd’hui to La vie apparaît sur Terre Formation du système solaire
t = 15 milliards d’années T = 3 k (1 meV)
Formation des galaxies Formation des atomes Moment du découplage (CBR)
t = 400,000 ans T = 3000 k (1 eV)
Nucléosynthèse Apparition d’éléments légers - D, He, Li Les quarks se lient pour former les hadrons
t = 3 minutes t = 1 seconde T = 1 MeV t = 10-6 s T = 1 GeV
Transition de phase électrofaible Toutes les particules, à l’exception du photon, deviennent massives
Une transition de phase vers une théorie d’une grande symétrie L’ère de Planck La gravité quantique domine
t = 10-11 s
T = 103 GeV
t = 10-35 s T = 1015 GeV
t = 10-43 s T = 1019 GeV
F IGURE 9.14. Histoire schématique du Big Bang (courtoisie de Jean Iliopoulos).
l’énergie de masse mc2 est très petite par rapport à kB T se comporte comme une particule de masse nulle dans le bain thermique du Big Bang. La probabilité de trouver de telles particules est donnée par la loi de Boltzmann ; elle est proportionnelle à exp(−mc2 /kB T ). Lorsque kB T mc2 , ces particules figurent en abondance dans le bain thermique et elles sont produites sous forme de paires particule-antiparticule, mais elles disparaissent progressivement lorsque la température diminue : si mc2 = 10 kB T, la probabilité donnée par la loi de Boltzmann est seulement de e−10 5 × 10−5 . La loi de Boltzmann est une loi d’équilibre thermique, et elle doit être complétée par un facteur de non-équilibre. En effet, les particules sont produites et détruites dans des réactions caractérisées par un
182
Chapitre 9. Cosmologie
temps de réaction τ, mais l’expansion de l’Univers inhibe ces réactions, en diminuant la densité, et par voie de conséquence la probabilité qu’ont les particules d’entrer en contact. Le temps caractéristique de l’expansion est l’inverse du paramètre de Hubble (9.12) au temps t, H (t), et une réaction de temps caractéristique τ ne peut se produire que si elle se passe sur un intervalle de temps court par rapport à l’inverse du temps de Hubble : τ 1/H (t). Si cette condition n’est pas satisfaite, les particules sortent de l’équilibre thermique : elles se découplent du bain thermique. C’est ce qui arrive aux neutrinos pour une température de l’ordre de 1 MeV. En effet, les interations faibles ne sont plus efficaces en dessous de cette température pour maintenir les neutrinos en équilibre avec le reste du bain thermique, dont ils se découplent. Leur évolution ultérieure est régie uniquement par l’expansion de l’Univers, avec une température qui est égale à (4/11)1/4 de celle des photons du fond diffus cosmologique. L’histoire du Big Bang que nous pouvons décrire avec confiance commence à une époque où nous maîtrisons la physique grâce à nos connaissances sur les particules élémentaires, à une température de l’ordre de 103 GeV, soit un temps de 10−11 s. On peut essayer de remonter encore plus loin dans le temps, comme sur la figure 9.14, mais on entre alors dans une région où l’on ne maîtrise pas la physique et tout énoncé devient spéculatif. À 103 GeV se produit la transition de phase électrofaible : les bosons de jauge W ± et Z0 des interactions électrofaibles, qui étaient jusque-là de masse nulle, acquièrent une masse, tout comme le boson BEH (ou de Higgs). Ces particules existent pendant un court intervalle de temps, puis elles disparaissent car leur masse devient grande par rapport à kB T et elles se désintègrent avec une vie moyenne de l’ordre de 10−23 s. Elles quittent alors l’Univers, pour n’y revenir que lorsqu’elles sont créées au CERN, en 1982 pour le W et le Z, en 2012 pour le boson BEH. Vers 200 MeV, on observe une seconde transition de phase, celle du confinement : les quarks et les gluons9 , qui jusque-là se propageaient librement dans un plasma quarkgluon, se retrouvent confinés dans les nucléons, protons et neutrons. Après cette transition de confinement, nous sommes en présence d’un plasma composé de protons, de neutrons, d’électrons, de positrons, de neutrinos et de photons, en équilibre thermique grâce aux interactions faibles. Mais, en raison de l’expansion de l’Univers, ce plasma se dilue, ce qui peut rompre l’équilibre thermique, et conduit par exemple au « gel » des neutrinos, comme nous l’avons mentionné ci-dessus. matière ordinaire est composée de deux types de quark, le quark up de charge +2/3 en unités de la charge du proton, et le quark down de charge −1/3. Le proton est une combinaison up/up/down et le neutron up/down/down. Ces quarks sont liés entre eux par échange de gluons, qui jouent pour les interactions fortes le même rôle que les photons pour les interactions électromagnétiques.
9 La
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
183
Cependant, pour comprendre la composition du plasma primordial pour T ∼ 1 MeV, il faut introduire une donnée supplémentaire : lorsque la température était de l’ordre de 1 GeV, on observait des paires quark-antiquark en grand nombre. Mais si nous nous contentons de cette observation, nous allons en déduire qu’après la transition de confinement, certes les antiprotons (composés d’antiquarks) vont disparaître, mais aussi les protons (composés de quarks), ce qui serait très ennuyeux pour la formation des atomes. Heureusement ce n’est pas le cas, et il reste un excès de protons, ou plus exactement un excès de baryons = protons et neutrons. Il faut donc qu’il y ait eu au départ, peu de temps après le Big Bang, un excès de quarks par rapport aux antiquarks, une prédominance initiale de la matière sur l’antimatière, car on n’observe pas d’antimatière dans l’Univers. Ce phénomène n’a pas aujourd’hui d’explication satisfaisante, et on doit introduire « à la main » dans le Big Bang un ingrédient, la densité de baryons, sous la forme du rapport de la densité en nombre des baryons à celle des photons, n B /nγ 5 × 10−10 , environ un baryon pour deux milliards de photons. En raison de la neutralité électrique, la densité des électrons doit être identique à celle des protons dès que la production thermique de paires électron-positron devient négligeable, pour T 1 MeV. Lorsque la température descend aux environs de 70 keV, les noyaux atomiques commencent à se former, mais cette formation s’arrête assez vite, dès T 30 keV, et seuls les noyaux légers ont le temps de se former. Le noyaux plus lourds seront formés ultérieurement dans les étoiles. On peut calculer que l’abondance globale d’hélium-4 est d’environ 24 %, et on peut aussi calculer l’abondance des noyaux de deutérium, d’hélium-3 et de lithium, en excellent accord avec l’observation. La proportion de 24 % d’hélium-4 se déduit du rapport du nombre de neutrons à celui des protons, qui est voisin de 1/7 : en effet, au moment du découplage des neutrinos qui assuraient l’équilibre thermique, ce rapport se fige et reste égal à celui donné par la loi de Boltzmann10 en fonction des deux masses, soit 1/6. Le passage de 1/6 à 1/7 vient de la désintégration des neutrons libres, ce qui diminue le nombre de neutrons. Le chiffre de 24 % s’obtient en admettant que tous les neutrons entrent dans l’hélium-4. Ce phénomène de formation de noyaux légers est appelé nucléosynthèse primordiale, et la prédiction correcte de l’abondance des noyaux légers dans l’Univers, due à George Gamow11 et à ses étudiants Ralph Alpher et Robert Herman, est un grand succès du Big Bang. La température continue à baisser, et lorsque l’on atteint environ 3 000 K (0,3 eV), les atomes légers, et en particulier les atomes d’hydrogène, commencent 10 Le
rapport du nombre des neutrons au nombre des protons à l’équilibre thermique est donné par exp[−(mn − m p )c2 /kB T ], où T est la température de découplage des neutrinos, mn et m p les masses du neutron et du proton. 11 Cependant, le calcul initial de Gamow contenait quelques erreurs.
184
Chapitre 9. Cosmologie
à se former : les électrons se lient aux protons, ce qui est appelé improprement « recombinaison », car aucun atome n’a existé auparavant ! À partir de cet instant, les photons n’interagissent plus avec la matière. En effet, les photons se couplent fortement aux particules chargées, électrons et protons, mais très peu aux particules électriquement neutres comme les atomes. Il en résulte que l’équilibre thermique des photons est rompu : en raison de la faiblesse de l’interaction photon-atome et de l’expansion de l’Univers, les photons forment désormais un gaz de particules libres, régi uniquement par l’expansion de l’Univers. Leur longueur d’onde croît en proportion du facteur d’échelle a(t). Comme la température de ce découplage est de 3 000 K, et que la température aujourd’hui est de 3 K environ, le rapport des températures est aussi celui des longueurs d’onde, ce qui fixe le z (9.11) du découplage12 : zdec 1 100, qui correspond à 380 000 années après le Big Bang. La valeur de 3 000 K, ou 0,3 eV en énergie, peut sembler faible par rapport à l’énergie d’ionisation de l’hydrogène, environ 105 K, que l’on aurait pu penser à prendre comme température du découplage. En fait, d’une part la distribution de Planck (figure 7.8) possède une queue de distribution de photons plus énergiques que la moyenne et qui sont efficaces pour l’ionisation et, d’autre part, compte tenu de la neutralité électrique, on compte environ deux milliards de photons pour un électron. La température de 3 000 K est obtenue à partir de calculs numériques sophistiqués. La région de l’espace-temps correspondant au découplage est appelée surface de dernière diffusion (figure 9.10) : elle correspond à la dernière fois où les photons ont été diffusés par la matière, et la durée du découplage est estiméee à 50 000 ans. La température du fond diffus cosmologique n’est pas uniforme dans toutes les directions d’observation. Les satellites COBE (1992), WMAP (2003) et Planck (2013) ainsi que des expériences terrestres ont mesuré avec une précision croissante des fluctuations de température dépendant de la direction d’observation (figure 9.15), qui sont de l’ordre de 10−5 en valeur relative. Ces fluctuations nous renseignent sur les fluctuations de densité qui ont donné naissance aux galaxies. Quelle est l’origine de ces fluctuations ? Les interactions qui régissent l’évolution de l’Univers avant le découplage sont celles familières en physique des particules élémentaires : interactions fortes, électromagnétiques et faibles. Les interactions gravitationnelles sont intrinsèquement très faibles : la force de gravitation entre un électron et un proton dans un atome d’hydrogène est 10−39 fois plus faible que la force électrostatique, et la gravitation ne joue un rôle que par l’intermédiaire de l’expansion de l’Univers. Cependant, les interactions 12 Ce
découplage et le rayonnement fossile correspondant sont aussi des prédictions de Gamow, qui avait calculé une température de 6 K. Le rayonnement fut découvert accidentellement en 1965 par Penzias et Wilson, qui ignoraient totalement la prédiction de Gamow.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
185
F IGURE 9.15. Le fond diffus cosmologique vu par le satellite Planck. C’est une image de l’Univers figée il y a 13,4 milliards d’années. L’image est bien entendu en fausses couleurs. Les zones oranges correspondent à des régions où la température est supérieure à la moyenne, les zones bleues à une température inférieure. Reproduit de Denegri et al. [2014], courtoisie de Claude Guyot.
gravitationnelles ont la propriété unique d’être toujours attractives, et en dépit de leur faiblesse intrinsèque, elles peuvent devenir dominantes lorsque s’accumule une grande quantité de matière. Cela conduit, comme l’avait déjà remarqué Newton, à une instabilité, appelée instabilité de Jeans, du nom du physicien anglais qui en a fait l’étude à la fin du XIXe siècle. Supposons que se produise une fluctuation telle que la densité soit plus grande que la densité moyenne dans une région de l’espace. Cette zone de forte densité aura tendance à attirer de la matière autour d’elle, ce qui en retour va augmenter l’attraction gravitationnelle de la fluctuation, et ainsi de suite, de sorte que la fluctuation croît en principe indéfiniment : c’est l’instabilité de Jeans. On observe un effet cumulatif : les fluctuations deviennent de plus en plus fortes, la matière s’accumule dans certaines régions de l’espace et disparaît dans les autres. Cependant, deux effets s’opposent à cette instabilité. D’une part l’expansion de l’Univers tend à contrecarrer l’accumulation de matière, qui a tendance à se diluer en raison de l’expansion, et d’autre part la pression du rayonnement est très forte jusqu’au découplage. Jusqu’au découplage, l’instabilité gravitationnelle est inhibée, mais ensuite seule l’expansion de l’Univers peut la contrecarrer. Les physiciens soviétiques Evgeni Lifshitz et Yakov Zeldovich ont montré que l’instabilité est certes inhibée par l’expansion, mais qu’elle reste suffisamment efficace pour agréger de la matière. La formation d’une galaxie commence par l’accumulation de matière autour d’une fluctuation de densité. On estime que cette phase de formation des galaxies correspond à z = 10 environ (figure 9.14). Pour que des instabilités gravitationnelles puissent se développer, il faut partir de fluctuations initiales :
186
Chapitre 9. Cosmologie
la gravité peut seulement amplifier des fluctuations, elle ne peut pas les créer à partir de rien. Les fluctuations du fond diffus cosmologiques sont connues, mais elles ne sont pas d’une amplitude suffisante pour la formation des galaxies en l’absence de matière sombre, laquelle est donc un ingrédient indispensable de la théorie du Big Bang. Reste évidemment à expliquer les fluctuations du fond diffus cosmologique lui-même.
0,6 0.4 0,2
z = 82 500 mati`ere sombre baryons photons neutrinos
480 m´ega-ann´ees lumi`ere
Pour comprendre la distribution des fluctuations de température visibles dans la figure 9.15, et dont l’histoire est résumée dans la figure 9.16, il faut
0
z = 1 440
0.4 0,2 0
(a) 0,6
0,6
(b) z = 1 080
0,6
0.4
0.4
0,2
0,2
0
0
(c)
z = 80
(d)
F IGURE 9.16. Ondes sonores primordiales, avec en abscisses la distance et en ordonnées l’amplitude de la fluctuation. (a) z = 82 000 : 110 années après le Big Bang. Une fluctuation crée une surdensité à un temps proche de l’origine, où toutes les particules suivent la même perturbation. (b) z = 1 440 : 0, 2 × 106 années. Les photons et les protons sont fortement couplés dans une onde sonore qui se propage vers la droite. La matière sombre et les neutrinos sont affectés uniquement par l’attraction gravitationnelle de cette onde, qui va élargir le pic initial. (c) z = 1 080 : 0, 38 × 106 années. Les protons et les photons se découplent, et l’onde sonore s’arrête : la surdensité des protons est bloquée. (d) z = 80 : 23, 4 × 106 années. Toute pression de rayonnement a disparu, et il ne reste que les interactions gravitationnelles. En raison de ces interactions, la distribution de matière sombre se rapproche de la surdensité des protons. Le pic des deux distributions est situé à 480 millions d’années lumière en coordonnées comobiles. Adapté de Eisenstein et Bennett [2008].
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
187
revenir sur la composition de l’Univers avant le découplage, disons à une température de 105 K. La composition du plasma est principalement la suivante : • des photons, de très loin dominants en nombre ; • des baryons, protons et neutrons, environ un baryon pour 2 × 109 photons ; • des électrons et des neutrinos, mais ces derniers sont découplés ; • de la matière sombre, qui n’a pas d’interactions électromagnétiques ou fortes, mais se comporte comme une masse ordinaire en ce qui concerne les interactions gravitationnelles. Le point essentiel est l’existence d’ondes sonores dues au couplage entre les photons et les protons, qui ont laissé une empreinte caractéristique sur l’Univers à ses débuts (figure 9.16). Ces ondes √ sonores sont des ondes de pression, qui se propagent à une vitesse cs = c/ 3. Cette valeur de cs peut se comprendre, car la vitesse des ondes sonores est proportionnelle à la racine carrée de la pression qui, dans un gaz de photons, est égale à la densité d’énergie divisée par 3 (encadré 7.2). Supposons qu’une fluctuation se produise à un temps t très proche de l’origine. Elle va se propager à la vitesse du son, mais seuls les protons et les photons vont voyager de concert, car les neutrinos et la matière sombre ne sont que très faiblement couplés aux photons. Pour z = zdec. 1 000, les photons et les protons se découplent, et il reste un excès de protons, appelé « pic acoustique », qui est entièrement découplé vers z 500 et de ce fait arrête de progresser vers la droite et reste bloqué : cette valeur de z correspond en coordonnées comobiles à 480 millions d’années lumière. On devrait observer ce pic dans la distribution des galaxies, et on le trouve effectivement (figure 9.17). Ce pic acoustique se reflète aussi dans les fluctuations de température du fond diffus cosmologique (figure 9.15), et il correspond à un maximum pour une distance angulaire de 0,6o (figure 9.18). Pour calculer la position du pic acoustique, nous avons d’abord besoin de la distance d entre la surface de dernière diffusion et nous-mêmes. En première approximation, on peut admettre que l’Univers se comporte depuis le découplage comme s’il était dominé par la matière, et la loi (9.13) en t2/3 donne d = 3ct0 (encadré 9.1). Le second ingrédient est la distance l parcourue par une onde sonore entre t = 0 et le découplage (figure 9.16), qui donne l’échelle caractéristique des fluctuations13 . Avec les mêmes approximations que ci-dessus, cette √ distance vaut, en coordonnées 1/2 comobiles, l = ct0 [3/(1 + zdec. )] , où le 3 au lieu de 3 vient du passage de la vitesse de la lumière à celle du son. Avec t0 1, 4 × 1010 a.l., la valeur 13 En fait, la situation est plus complexe, car il y a évidemment plusieurs points de départ possibles
pour les ondes sonores. Si l’on fait une analogie avec une pierre lancée dans une mare initialement calme, on observe dans ce cas une onde se propageant à partir du point de chute. Si on lance plusieurs pierres, on obtient un système d’ondes plus complexe, mais il est possible d’analyser ce système d’ondes et d’en déduire les échelles caractéristiques.
188
Chapitre 9. Cosmologie
F IGURE 9.17. L’empreinte du pic acoustique dans la distribution des galaxies : on a représenté la distribution des distances entre galaxies lointaines pour tous les appariements possibles. La valeur de h (un fossile de l’astrophysique venant de l’époque où la valeur de la constante de Hubble était incertaine par un facteur 2) est h = 0, 71, et le pic de la distribution correspond à 480 millions d’années lumière en coordonnées comobiles. Reproduit de Denegri et al. [2014], courtoisie de Claude Guyot.
F IGURE 9.18. Analyse angulaire des fluctuations de température à partir des données du satellite Planck. On observe un pic pour θ 0, 6 degré. Reproduit de Denegri et al. [2014], courtoisie de Claude Guyot.
numérique est l 7, 3 × 108 a.l., et un calcul numérique précis prenant en compte la composition de l’Univers donne l = 4, 8 × 108 a.l., voir la figure 9.16. Le rapport l/d donne l’angle caractéristique des fluctuations de température
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
189
observées dans cette figure, θ [3(1 + zdec. )]−1/2 , soit environ 1 degré. Cette échelle caractéristique est bien celle observée par les satellites WMAP et Planck. On en déduit des limites sur la courbure de l’Univers : en effet, la position du pic à θ 0, 6o dans un espace plat serait décalée par une courbure éventuelle. Enfin, il faut mentionner le phénomène de réionisation : environ 400 millions d’années après le découplage (z ∼ 10), les premières étoiles ont commencé à se former. Ces étoiles étaient beaucoup plus massives et plus chaudes que les étoiles actuelles, et cela a entraîné une ionisation importante et rapide de la matière. L’Univers est devenu légèrement opaque aux photons, ce qui a rendu un peu floue la carte du fond diffus cosmologique. L’histoire de l’Univers semble se dérouler sans accrocs, mais il reste deux problèmes (au moins !). Le premier est celui de l’horizon décrit sur la figure 9.10 : comment se fait-il que deux régions de la surface de dernière diffusion puissent se trouver à la même température alors qu’elles n’ont jamais été en contact causal ? Le second problème est que, si l’Univers est aujourd’hui compatible avec un espace plat, cela veut dire que les paramètres initiaux ont dû être ajustés avec une précision millimétrique (fine tuning). Pour le voir, revenons à l’équation de Friedmann (9.24) que nous écrivons sous la forme (cf. (9.26)) Ω(t) − 1 =
kc2 R2 a˙ 2 (t)
Ω(t) =
8πGρ(t) . 3H 2 (t)
(9.30)
Si nous prenons par exemple la loi (9.13) pour a(t), qui est approximativement valable depuis le découplage à aujourd’hui, nous en déduisons Ω ( t ) − 1 = ( Ω0 − 1)
a(t) . a ( t0
Si Ω0 − 1 10−2 , il en découle qu’au moment du découplage, nous avions Ωdec − 1 10−5 , et un calcul plus précis montre qu’au moment de la formation de l’hélium, nous avions Ω − 1 ∼ 10−16 ! Ces très petits nombres ne semblent pas naturels pour un physicien, car en l’absence d’une explication plausible, on peut seulement invoquer un hasard miraculeux. Ces deux problèmes, horizon et ajustement millimétrique, sont résolus en admettant que l’Univers a connu une phase d’expansion très rapide, d’un facteur de l’ordre de 1025 : a(t) a crû de 1025 en moins de 10−30 seconde, à un temps de l’ordre de 10−36 seconde à partir de l’origine. Cette période d’expansion est appelée inflation. La théorie est séduisante, mais ses réalisations dans des modèles concrets ne sont pas très convaincantes. En rassemblant tous les résultats, aussi bien ceux des mesures du fond diffus cosmologique que des résultats de mesures directes de l’expansion de l’Univers ou des résultats astrophysiques sur la matière sombre (vitesses de rotation
190
Chapitre 9. Cosmologie
comme dans les figure 9.1, lentilles gravitationnelles, etc.), on aboutit à une histoire de l’Univers cohérente, résumée dans ce que l’on appelle le « modèle de concordance », ou aussi le « modèle ΛCDM », où Λ désigne la constante cosmologique, équivalente de l’énergie du vide, et CDM est l’acronyme de Cold Dark Matter, matière sombre froide. Dans ce modèle, les proportions en densité d’energie des différents composants de l’Univers sont (figure 9.19) :
• matière ordinaire, ou baryonique : 5 % ; • matière sombre : 25 % ; • énergie sombre : 70 %.
Matière noire 26.8% Energie noire 68.3%
Matiere ordinaire (baryonique) 4.9%
F IGURE 9.19. Proportions des différents composants de l’Univers.
Il est assez remarquable que ces pourcentages soient en accord avec des observations faites sur des objets astrophysiques a priori très différents. Compte tenu de ce que le Big Bang a correctement prédit la nucléosynthèse primordiale et le fond diffus cosmologique bien avant leur observation effective, on pourrait conclure que la théorie du Big Bang est validée, au moins dans ses grandes lignes. Cette conclusion est plausible, mais il ne faut pas oublier que nous n’avons aujourd’hui pas la moindre idée sur l’origine de 95 % de la composition de l’Univers : 25 % de matière sombre et 70 % d’énergie sombre. Tant que cette origine ne sera pas élucidée, il subsistera un doute sur la validité du Big Bang. Nous y reviendrons dans le chapitre de conclusion. 9.6
Bibliographie
Les bases de la physique des particules élémentaires sont expliquées dans deux ouvrages de cette collection : Denegri et al. [2014] et Iliopoulos [2015]. Le dossier Pour la Science d’avril–juin 2014 contient plusieurs articles consacrés à
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
191
la cosmologie, en particulier celui de Riazuelo [2014] sur les résultats de Planck, celui de Luminet [2014a] sur la topologie cosmique et celui de Steinhardt [2014] sur l’inflation. Voir également Luminet [2006], Springel [2014], Defayet [2014] et Taillet [2014]. Pour une introduction aux idées encore très spéculatives (multivers), on peut consulter Tegmark [2014]. À un niveau avancé, il existe trois livres en français sur la cosmologie : Rich [2002], Bernardeau [2007] et Peter et Uzan [2012]. Voir également Bouchet [2005], Hobson et al. [2009], chapitres 14 à 16, et Moore [2014], chapitres 24 à 29, et en anglais, Hartle [2003], chapitres 18 et 19, ou Zee [2013], chapitre VIII. Les aspects historiques sont discutés par Luminet [2014b] et Nussbaumer [2014].
192
Chapitre 9. Cosmologie
10 Conclusion On peut distinguer trois phases dans l’histoire de la relativité générale. De 1915, date de l’article fondateur d’Einstein, à 1960 environ, la relativité générale est avant tout un sujet de théoriciens car on ne dispose que de deux tests observationnels : la précession du périhélie de Mercure et la déviation des rayons lumineux par le Soleil. En dépit de progrès théoriques importants, comme l’écriture de la métrique de Friedmann-Lemaître qui décrit un Univers en expansion, ou la théorie des étoiles à neutrons de Tolman-OppenheimerVolkoff, la relativité générale connaît une longue traversée du désert. Tout s’accélère à partir des années 1960, date à laquelle Pound et Rebka mesurent pour la première fois le décalage vers le rouge gravitationnel. Théorie et expérience progressent à un rythme accéléré entre 1960 et 1980, période qui correspond à la deuxième phase. D’une part les vérifications dans le système solaire atteignent une précision de l’ordre de 0, 01 %, et d’autre part on découvre des objets astrophysiques fascinants : étoiles à neutrons, quasars, et on anticipe l’existence des trous noirs. Cette période a été parfois qualifiée d’« âge d’or de la la relativité générale ». La troisième période va des années 1980 à aujourd’hui : la relativité générale est devenue un outil incontournable en astrophysique. Dans le système solaire, la gravité est faible : une mesure de son intensité est le rapport de la vitesse v de la Terre sur son orbite à celle de la lumière : v/c ∼ 10−4 . À partir des années 1980, on commence à pouvoir comparer théorie et observation dans des conditions de gravité plus forte, par exemple v/c ∼ 10−3 pour les étoiles compactes doubles, avec un accord entre théorie et observation de l’ordre de 0, 1 %. On observe une gravité encore plus forte au voisinage des trous noirs, et dans ce cas la relativité générale permet d’expliquer qualitativement nombre
de phénomènes astrophysiques comme les quasars. Toutefois, dans ces conditions, la physique est nettement moins bien contrôlée et la comparaison théorieobservation doit s’apppuyer sur des modélisations numériques complexes, par exemple celles des disques d’accrétion. Dans les prochaines années, on peut espérer tester des phénomènes extrêmes comme la fusion de deux étoiles compactes ou de deux trous noirs en détectant les ondes gravitationnelles associées. Toutefois, les prédictions théoriques seront de plus en plus fondées sur les simulations numériques des équations d’Einstein. L’autre domaine où la relativité générale joue un rôle majeur est la cosmologie. Le modèle standard du Big Bang fondé sur la relativité générale, ou modèle ΛCDM, est en parfait accord avec les observations, mais ce modèle comporte des zones d’ombre. Tant que la nature de la matière sombre et celle de l’énergie sombre n’auront pas été élucidées, il subsistera un doute sur la validité du modèle. Les théories alternatives comme MOND soulèvent plus de difficultés qu’elles ne résolvent de problèmes. Nous célébrons cette année le centenaire de la relativité générale. On peut affirmer sans risque que cette théorie élaborée par Einstein a, en un siècle d’existence, rempli son contrat bien au-delà de tout ce que son auteur pouvait envisager.
194
Chapitre 10. Conclusion
11 Annexes 11.1
Notation exponentielle
Les physiciens, tout comme d’autres scientifiques (ou même les économistes) ont besoin de manipuler des nombres très grands ou très petits, et, plutôt que d’aligner des séries de zéros, ils utilisent la notation exponentielle. Un exemple familier de grand nombre est la capacité de mémoire informatique : capacité d’un CD, d’un DVD, d’une clé USB ou d’un disque dur. L’unité de base en informatique est le bit, qui peut prendre deux valeurs, conventionnellement 0 ou 1. Avec deux bits, on peut représenter 2 × 2 = 4 nombres différents, et avec 8 bits 2 × 2 × 2 × 2 × 2 × 2 × 2 × 2 = 28 = 256 nombres. Dans l’équation précédente, 28 (2 à la puissance 8) est une notation exponentielle ; 8 bits forment un octet. Compte tenu des progrès de l’informatique, un octet est une toute petite unité, et il faut le multiplier par des puissances de 10 pour donner la capacité de mémoire de dispositifs usuels :
• • • •
1 kilooctet (ko) = mille octets = 103 octets ; 1 mégaoctet (Mo) = 1 million d’octets = 106 octets ; 1 gigaoctet (Go) = 1 milliard d’octets = 109 octets ; 1 téraoctet (To) = 1 000 milliards d’octets = 1012 octets.
Pour un document de quelques pages, il faut quelques ko. Un CD stocke environ 700 Mo, un DVD environ 5 Go, et la capacité des disques durs actuels se mesure en To. Les préfixes kilo-, méga-, etc., sont aussi utilisés pour d’autre unités, par exemple de longueur : kilomètre, mégamètre, ou de puissance : mégawatt, térawatt.
La notation exponentielle est aussi commode pour écrire des nombres très petits : ainsi un centième de milliardième, soit 0,000 000 000 01 s’écrit 10−11 ; L’exposant 11 est égal au nombre de zéros situés après la virgule, plus 1. De même 0,125 milliardième devient 0, 000 000 000 125 = 0, 125 × 10−9 = 1, 25 × 10−10 . Il est également commode de définir des unités pour le millième (10−3 ), le millionième (10−6 ), le millardième (10−9 ), etc., qui donnent respectivement le milli-, le micro-, le nano- de l’unité considérée. Par exemple, les sous-multiples de l’unité de longueur, le mètre (m) sont :
• • • • •
le millimètre (mm) = 10−3 m ; le micromètre (μm) = 10−6 m, autrefois appelé micron ; le nanomètre (nm) = 10−9 m ; le picomètre (pm) = 10−12 m ; le femtomètre (fm) = 10−15 m, autrefois appelé fermi.
On définirait de même la nanoseconde comme étant 10−9 s, etc. Il est instructif d’utiliser cette notation pour donner dans le tableau ci-dessous des ordres de grandeur de longueurs typiques, en partant de l’Univers pour descendre jusqu’aux particules élémentaires (table 11.1). On retiendra que la taille d’un atome est voisine de 0,1 nanomètre = 10−10 m, une unité appelée autrefois angström, et que celle d’un noyau atomique est de quelques femtomètres (10−15 m). En astrophysique, deux unités de longueur jouent un rôle important : 1. l’année lumière (a.l.) : 1 a.l. = 9, 45 × 1015 m 1016 m ; 2. le parsec (pc) : 1pc = 3, 09 × 1016 m = 3, 26 a.-l.
Univers connu
Rayon de Distance Rayon de la Galaxie Terre–Soleil la Terre
Homme
Insecte
4, 5 × 1026
5 × 1020
1, 5 × 1011
6, 4 × 106
1, 7
0, 01 à 0, 001
Bactérie E. coli
Virus HIV
Fullerène C60
Atome
Noyau de plomb
Proton
2 × 10−6 1, 1 × 10−7
0, 7 × 10−9
10−10
7 × 10−15
0, 8 × 10−15
TABLEAU 11.1. Ordres de grandeur en mètres de quelques distances typiques.
196
Chapitre 11. Annexes
11.2
Ondes électromagnétiques et photons
Les ondes électromagnétiques vont des ondes radio jusqu’aux ondes de la radioactivité gamma (γ). Comme l’aspect particulaire est particulièrement évident dans ce domaine, on parle en général de photons gamma, et pas d’ondes gamma. En revanche, « photon radio » est plutôt rare ! La longueur d’onde décroît quand on passe des ondes radio aux ondes de la radioactivité gamma, comme on le voit dans la figure 11.1. En dépit de ces différences apparentes, toutes ces ondes sont identiques. Vue par un observateur se déplaçant à très grande vitesse par rapport à la Terre, une onde radio pourrait apparaître par effet Doppler comme un rayon γ et vice versa.
F IGURE 11.1. Spectre du rayonnement électromagnétique. Les longueurs d’onde les plus courtes sont celles des rayons γ, puis viennent les rayons X et les rayons ultraviolets (UV). On passe ensuite dans le domaine visible qui va du violet au rouge. Augmentant encore la longueur d’onde, on entre d’abord dans l’infrarouge (IR), puis dans le domaine des micro-ondes, et enfin dans celui des ondes radio. La longueur d’onde est donnée en nanomètres (nm), 1 nm = 10−9 m.
Les ondes lumineuses se propagent dans le vide à la vitesse limite, c 300 000 km/s = 3 × 108 m/s : il faudrait environ 0,13 s (un peu plus d’un dixième de seconde) à une onde lumineuse pour faire le tour de la Terre. Les ondes lumineuses sont un cas particulier des ondes électromagnétiques dont le spectre, qui s’étend des rayons γ aux ondes radio, est donné sur les figures 11.1 et 11.2. Une caractéristique importante d’une onde électromagnétique est sa période T. Il est plus habituel de caractériser une onde
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
197
108
104
γ
X
10−14
10−10
E (eV) 1
UV
IR 10−6 λ (m)
10−4
micro 10−2
10−8
radio 102
F IGURE 11.2. Longueur d’onde de rayonnements électromagnétiques et énergie des photons correspondants. La boîte hachurée représente le domaine visible. Les frontières entre les différents types de rayonnement (par exemple la frontière entre les rayons γ et les rayons X) ne sont pas définies de façon stricte. Un photon d’énergie E = 1 eV dans le proche infrarouge a une longueur d’onde λ = 1, 24 × 10−6 m, une fréquence ν = 2, 42 × 1014 Hz et une pulsation ω = 1, 52 × 1015 rad.s−1 .
électromagnétique par sa fréquence ν, qui est l’inverse de la période : ν = 1/T. Cette fréquence est mesurée en hertz (symbole Hz). Par exemple, on trouve France Culture à Nice sur une fréquence de 101,9 MHz, ou 101, 9 × 106 Hz, ou encore 1, 019 × 108 Hz. Une onde se répète périodiquement dans l’espace, et la périodicité spatiale est la longueur d’onde λ = cT = c/ν : c’est la distance qui sépare deux crêtes successives d’une onde qui se propage. Les ondes lumineuses ont une longueur d’onde comprise entre λ = 0, 4 μm (violet) et λ = 0, 7 μm (rouge). Comme dans la figure 11.1, on mesure souvent les longueurs d’onde en nanomètres (nm). Pour λ < 0, 4 μm, on entre dans le domaine de l’ultraviolet (UV) et pour λ > 0, 7 μm, on entre dans l’infrarouge (IR), voir les figures 11.1 et 11.2. L’énergie E d’un photon correspondant à une onde électromagnétique de longueur d’onde λ est donnée par E=
hc λ
h = 6, 62 × 10−34 J.s,
(11.1)
où h est la constante de Planck et c la vitesse de la lumière dans le vide. Plus la longueur d’onde est courte, et plus l’énergie est grande : un photon γ est plus énergique qu’un photon X, qui est lui-même plus énergique qu’un photon ultraviolet, etc. L’énergie s’exprime aussi en fonction de la fréquence ν de l’onde, qui est donnée en fonction de la longueur d’onde par ν = c/λ. L’énergie d’un photon s’écrit donc de façon équivalente sous la forme de Planck-Einstein E = hν = h¯ ω.
(11.2)
avec h¯ = h/2π et ω = 2πν est la pulsation ou fréquence angulaire (figure 11.2). 198
Chapitre 11. Annexes
11.3
L’énergie-impulsion relativiste
Dans cette annexe, nous nous proposons de déduire les lois générales de la conservation de l’énergie-impulsion. Pour ce faire, nous allons envisager la collision élastique de deux boules identiques de masse m, comme les boules de pétanque de la section 4.2, avec deux différences : les vitesses des deux boules ne sont pas supposées faibles par rapport à c, et nous allons prendre en compte deux dimensions d’espace, la collision se passe dans un plan. Notre hypothèse de base est que l’impulsion est conservée, mais nous ne connaissons pas encore la forme de l’impulsion des boules : notre objectif est de la déduire à partir de la loi de conservation. A priori, l’impulsion doit être de la forme p = m f (v)v : en effet, l’impulsion est une quantité vectorielle et comme la vitesse est le seul vecteur dont nous disposons, p est nécessairement parallèle à v. La fonction sans dimension f (v) ne peut dépendre que de la valeur absolue v de la vitesse, et elle doit également vérifier f (v) = 1 pour v c. C’est cette fonction que nous devons déterminer. Dans la figure 11.3, nous avons dessiné la collision dans le référentiel du centre de masse R : chacune des deux boules part d’un des deux murs et le rejoint après collision, et nous avons choisi une configuration aussi symétrique que possible. Avant la collision, les deux boules ont des impulsions p A = pi et p B = −pi , et après la collision, p A = p f et p B = −p f , l’impulsion totale est nulle avant la collision et elle le reste après la collision. Nous allons examiner la collision vue dans deux autres référentiels : dans le référentiel R A qui se déplace avec une vitesse horizontale v xA par rapport au centre de masse, cette vitesse est choisie de telle sorte que la vitesse v de la boule A soit dirigée suivant Oy, et dans le référentiel R B , qui se déplace avec une vitesse horizontale −v xA par rapport au centre de masse, et cette fois c’est la vitesse w de la boule B qui est
y x
boule B
Δy
boule A
Δy
Référentiel du centre de masse F IGURE 11.3. Collision des deux boules dans le référentiel du centre de masse R.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
199
B boule B O
υ
θ
boule A
Δy Δy
y
w
O x
boule B
boule A
Δy Δy
(b) Référentiel
(a) Référentiel
F IGURE 11.4. Collision des deux boules. (a) Vue dans le référentiel R A . (b) Vue dans le référentiel R B .
verticale1 (figure 11.4). On choisit aussi une configuration de la collision telle que les vitesses verticales v et w soient très faibles, (v, w) c, mais il n’y a aucune restriction sur les composantes horizontales des vitesses. Appelons Δt A le temps mis par la boule A pour aller dans R A du mur au point de collision. Comme on a supposé la vitesse v c, Δt A ΔτA , où ΔτA est l’intervalle de temps propre entre l’instant où la boule quitte le mur et celui où elle entre en collision. La variation de l’impulsion de la boule A dans le choc, c’est-à-dire la différence Δp A entre l’impulsion finale et l’impulsion initiale est −2mΔy/ΔτA , et elle est dirigée suivant l’axe Oy. Comme les distances perpendiculaires à la direction des changements de référentiel sont invariantes, on remarque que Δy A = Δy B = Δy. Par conservation de l’impulsion, il en est de même au signe près pour la composante verticale de l’impulsion de la boule B Δp B = 2m
Δy . ΔτA
Mais, par symétrie, le mouvement de la boule B dans le référentiel R B possède les mêmes caractéristiques que celui de A dans R A , ce qui implique
(ΔτA )RA = (ΔτB )RB = (ΔτB )RA . La dernière égalité s’obtient en remarquant que l’intervalle de temps propre ΔτB est un invariant, il est indépendant du référentiel. On peut alors construire les deux triangles rectangles de la figure 11.5 dans R A . Les deux triangles étant semblables, on en déduit l’impulsion de la boule B
p B = m
Δr B , ΔτB
où Δr B est la distance orientée parcourue par la boule B entre le point de collision et le mur, en allant du point O au point B. De façon générale, si une particule de 1 Toutefois,
même si les distances suivant Oy ne sont pas modifiées dans les changements de référentiel, la composante y de la vitesse des particules est modifiée, car, ainsi que nous l’expliquons dans la section 4.2, c’est la composante y de l’impulsion qui est invariante.
200
Chapitre 11. Annexes
Δ
O
B B
B
Δy
θ
m
θ
Δy Δτ B
F IGURE 11.5. Triangles semblables. Le second triangle se déduit du premier en multipliant les longeurs des côtés par m/ΔτB .
masse m parcourt une distance orientée Δr en un intervalle de temps propre Δτ, son impulsion est donnée par Δr p = m . Δτ
11.4
Invariance et covariance
N.B. Dans cette annexe et les suivantes, nous utilisons un sytème d’unités tel que c = 1. Nous désignons les coordonnées d’un point xˆ de l’espace-temps par x μ , μ = 0, 1, 2, 3, avec x0 = t et xi = coordonnée d’espace. Examinons d’abord le cas le plus simple, celui des transformations de Lorentz (2.7), que l’on peut écrire sous la forme μ
x =
3
μ
∑ Λ ν xν .
(11.3)
ν =0
En comparant avec (2.7) pour une transformation de Lorentz de vitesse v le long de l’axe Ox, ou axe 1, nous pouvons faire l’identification Λ00 = Λ11 = γ
Λ01 = Λ10 = −γv
Λ22 = Λ33 = 1.
tous les autres coefficients étant nuls. Les transformations de Lorentz laissent invariant le produit scalaire de Minkowski (2.11) 3
xˆ · yˆ = x0 y0 − x · y = x0 y0 − ∑ xi yi = i =1
∑ xμ ημν yν ,
(11.4)
μ,ν
où ημν définit la métrique de Minkowski (plus exactement ημν est le tenseur métrique de Minkowski) ημν = diagonal(1, −1, −1, −1). LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
(11.5)
201
Par la suite, étant donné qu’il n’y aura pas d’ambiguïté possible, nous allons ˆ L’invariance du produit scalaire noter les points d’espace-temps x au lieu de x. (11.4) dans une transformation de Lorentz implique que μ
∑ Λ ρ ημν Λνσ .
ηρσ =
(11.6)
μ,ν
Le fait que le tenseur de Minkowski soit le même dans les deux membres de l’équation (11.6) est la traduction mathématique de l’équivalence entre tous les référentiels d’inertie : la physique est la même dans tous ces référentiels. Passons maintenant à un changement de coordonnées général, en notant gμν ( x ) la métrique (le tenseur métrique) qui, contrairement au cas précédent, dépend explicitement du point d’espace-temps x. Un changement de coordonμ μ nées x μ → x relie dx μ et dx suivant dx μ =
∂x μ
∑ ∂x ν dx ν
μ
ν
μ
ν
= ∑ S ν ( x )dx .
(11.7)
ν
μ
Contrairement à Λ ν dans (11.3), S ν dépend du point x. Comme l’élément de longueur au carré ds2 doit être indépendant du choix de coordonnées, ds2 = et on en déduit
( x )dx ∑ gμν μ,ν
( x ) = gρσ
μ
ν
dx =
∑ gμν (x)dxμ dxν , μ,ν
μ
∑ gμν (x)S ρ (x)Sνσ (x).
(11.8)
μ,ν
Afin d’éviter toute ambiguïté, précisons que x et x désignent les coordonnées du même point d’espace-temps. La loi de transformation (11.8) est un exemple de loi de transformation d’un tenseur. On appelle covariance généralisée le fait que les équations de la relativité générale doivent être valables dans tout système de coordonnées. Écrire qu’un vecteur est nul est une équation admissible, mais écrire qu’une composante particulière d’un vecteur est nulle ne l’est pas, car cela ne pourrait pas être valable dans tout système de coordonnées. La physique de la relativité générale n’est pas contenue dans la covariance généralisée, mais dans le principe d’équivalence (section 5.1), par exemple sous la forme : les lois de la relativité restreinte sont valables dans tout référentiel localement inertiel. 11.5
Géodésiques et déviation géodésique
Nous avons écrit au chapitre 5, équation (5.9), la forme explicite dans le cadre newtonien de la déviation géodésique dans un réferentiel en chute libre, pour
202
Chapitre 11. Annexes
une particule tombant sur une masse M. Dans le cas de la relativité générale, nous partons de la ligne d’univers suivie par un observateur en chute libre le long d’une géodésique (figure 5.11). Cette ligne d’univers est paramétrée par le temps propre τ de l’observateur et elle est définie par quatre coordonnées x μ (τ ). On définit la quadrivitesse uμ comme la tangente à la ligne d’univers (encadré 2.4) uμ (τ ) =
dx μ (τ ) . dτ
(11.9)
Par définition du temps propre (voir l’équation (5.12) avec ds2 = dτ 2 > 0 car la ligne d’univers de l’observateur est de genre temps) dτ 2 =
∑ gμν dxμ dxν , μ,ν
cette quadrivitesse est de genre temps et de longueur unité
∑ gμν uμ uν = u · u = 1.
(11.10)
μ,ν
Nous choisissons un système de coordonnées dont l’origine est centrée sur l’observateur en chute libre, et dont la métrique soit aussi proche que possible de celle de Minkowski. L’axe des temps du système de coordonnées est orienté le long de la quadrivitesse en tout point de la géodésique, et nous prenons comme axes d’espace trois axes orthogonaux à la quadrivitesse et se déplaçant parallèlement à eux-mêmes. On peut donner un sens mathématique précis à cette définition intuitive, ce système de coordonnées étant souvent appelé coordonnées normales de Fermi, ou coordonnées dans un référentiel en chute libre. Un référentiel en chute libre est un référentiel localement inertiel dont l’origine suit une géodésique de genre temps et dont les axes se déplacent parallèlement à eux mêmes. Appelons δμ (τ ) le quadrivecteur donnant la position dans l’espace-temps d’une particule test voisine de l’observateur. Dans un référentiel en chute libre, la loi qui généralise (5.9) est d2 δ μ ( τ ) μ = ∑ R τντ δν (τ ), (11.11) dτ 2 ν μ
où R λνσ est le tenseur de Riemann : dans l’équation précédente, les indices λ et σ sont identiques et égaux à τ. On remarquera que τ intervient à deux titres dans l’équation précédente, d’abord comme temps propre, et ensuite comme indice. La formule (11.11) n’est valable que dans un référentiel en chute libre : dans un système de coordonnées général, la déviation géodésique s’écrit toujours en fonction du tenseur de Riemann, mais la formule est plus compliquée. Le calcul du tenseur de Riemann dans la géométrie de Schwarzschild-Droste permet de
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
203
montrer que, dans un référentiel en chute libre, les équations de la relativité générale sont identiques à celles de Newton (5.9), à condition de remplacer le temps universel newtonien par le temps propre. Venons-en maintenant aux lois de conservation le long d’une géodésique. Celles-ci permettent de déduire simplement les propriétés des orbites des particules massives décrites au chapitre 6, et en particulier le potentiel effectif (6.4). Supposons que la métrique soit indépendante de la coordonnée numéro i, et soit ζ le quadrivecteur ayant toutes ses composantes nulles, sauf la composante numéro i qui vaut 1. Par exemple, si i = 3, c’est-à-dire si la métrique est indépendante de la troisième coordonnée, le vecteur ζ = (0, 0, 1, 0). On montre alors que le produit scalaire ζ · u est constant le long d’une géodésique, u étant le quadrivecteur vitesse de la particule le long de la géodésique. L’application à la géométrie de Schwarzschild-Droste est immédiate : la métrique est indépendante du temps t et de l’angle azimuthal φ. Nous avons donc un premier vecteur ξ = (1, 0, 0, 0, ) associé à l’invariance par rapport aux translations de temps et un second vecteur η = (0, 0, 0, 1) associé à l’invariance par rapport aux rotations perpendiculaires à l’axe θ. Les produits scalaires ξ · u et η · u sont constants le long des géodésiques, et en particulier le long des orbites des planètes décrites au chapitre 6. Ces produits scalaires, notés respectivement ε et −, sont donnés par dt r dt r = 1− S = 1 − S ut (11.12) ε = ξ · u = gtt dτ r dτ r dφ dφ = −η · u = − gφφ = r2 sin2 θ = r2 sin2 θ uφ , (11.13) dτ dτ et ils sont constants le long d’une géodésique. En prenant la limite r → ∞, on observe que la quantité ε est l’énergie par unité de masse et le signe moins devant η · u assure que est bien le moment angulaire. Sans perte de généralité en raison de la symétrie sphérique, on peut choisir θ = π/2, sin2 θ = 1, le mouvement s’effectue dans le plan θ = π/2, et par conséquent uθ = 0. Une dernière équation est obtenue à partir de la normalisation (11.10) : u · u = 1 rS t 2 r −1 r 2 1− (u ) − 1 − S (u ) − r2 (uφ )2 = 1. r r En utilisant (11.12) pour éliminer dt/dτ et (11.13) pour dφ/dτ, cette condition de normalisation devient en rétablissant c 2 rS 2 2 r S dr + − + 2 − 3 = ε2 − 1. (11.14) dτ r r r On reconnaît dans le terme entre crochets le potentiel effectif (6.4) à un facteur 1/2 près : en effet, dans la section 6.1, nous sommes partis de l’énergie cinétique
204
Chapitre 11. Annexes
radiale v2r = (dr/dt)2 /2 pour une masse unité et à la limite r → ∞, dr/dτ → dr/dt. Dans le cas d’une orbite circulaire de rayon r+ , dr/dτ = 0 et ε2 − 1 = Veff (r+ ), soit ε = (1 + Veff (r+ ))1/2 . Pour l’orbite ISCO, on trouve Veff (r+ ) = −c2 /9, d’où l’énergie d’une particule de masse m sur cette orbite : mc2 (1 − 1/9)1/2 . Pour déterminer les orbites des photons, nous allons prendre la limite de masse nulle m → 0 sur les géodésiques de particules massives, en choisissant des équations où cette limite est bien définie. Partons du rapport suivant b=
r2 dφ/dτ r −1 2 dφ = = 1− S r . ε (1 − rS /r )dt/dτ r dt
(11.15)
Comme ε et sont conservés le long des géodésiques, leur rapport l’est également. Ce rapport n’est autre que le paramètre d’impact, ainsi que nous l’avons anticipé en choisissant la notation. En effet, la figure 6.6 donne le schéma d’une trajectoire possible pour une particule massive ultra-relativiste dans le champ de gravitation d’une masse M, le Soleil pour fixer les idées. La particule suit d’abord une asymptote horizontale et son moment angulaire par unité de masse est conservé. Lorsque la particule de vitesse v est très éloignée du Soleil2 , dφ r2 = bv. dt Mais si m → 0, alors v → c et par conséquent = b (c = 1). La limite m → 0 de l’équation (11.15) est bien définie et valable quel que soit t. Comme les photons se déplacent sur des géodésiques de longueur nulle, il en découle
soit
1−
rS r −1 (dt)2 − 1 − S (dr )2 − r2 (dφ)2 = 0, r r
1 1 rS −1 dr 2 1 rS 1 1 . = − + − b2 b r dt r2 r
(11.16) phot
On reconnaît dans le dernier terme de (11.16) le potentiel effectif Veff (r ) de (6.6). Cette dernière équation peut être utilisée directement pour l’étude des orbites. Pour retrouver l’ensemble de (6.6), il faut introduire la paramétrisation 2 On peut donner une autre démonstration de cette équation : pour r → ∞, φ b/r et dr/dt −1, d’où dφ dr b dφ = = 2. dt dr dt r
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
205
des géodésiques par ce que l’on appelle un paramètre affine λ. On montre alors que les quantités rS dt ε = ξ ·u = 1− r dλ 2 dφ = −η · u = r dλ sont conservées le long des géodésiques. On remarque que εb = r2 dφ/dλ = , et il suffit maintenant d’écrire rS −1 dr 1 dr 1 1 1− = = vr b r dt εb dλ pour retrouver l’intégralité de (6.6). Venons-en maintenant aux détails sur le processus de Penrose (section 7.3), en partant de la conservation de l’énergie-impulsion dans la désintégration de la particule incidente en une particule sortante et une particule absorbée par le trou noir (tn) pinc. = psort. + ptn . (11.17) En effet, cette loi est valable dans un référentiel localement inertiel où la relativité restreinte s’applique, et elle est donc valable en général. D’autre part, nous pouvons prendre le produit scalaire de cette équation avec le vecteur ξ = (1, 0, 0, 0). Les quantités ξ · pinc. et ξ · psort. sont conservées le long des géodésiques respectives des deux particules, et comme celles-ci peuvent partir à l’infini Einc. = ξ · pinc. > 0
Esort. = ξ · psort. > 0.
La particule tn, elle, ne sort jamais de l’ergorégion où gtt < 0, et ξ · ptn n’est pas une énergie, mais la composante d’une impulsion qui peut être positive ou négative. Dans ce dernier cas, on obtient Esort. > Einc. . Pour étudier le comportement du moment angulaire, considérons un observateur tournant dans le sens de rotation du trou noir avec une quadrivitesse t t (1, 0, 0, Ωobs. ) = uobs. (ξ + Ωobs. η ). uobs. = uobs.
La vitesse de rotation est limitée dans l’ergorégion par Ωmin ≤ Ωobs. ≤ Ωmax , mais l’observateur ne suit pas nécessairement une géodésique, il peut être équipé de propulseurs. L’énergie de la particule qui tombe dans le trou noir mesurée par l’observateur doit être positive, car dans un référentiel localement inertiel un observateur mesure nécessairement une énergie positive pour une particule (ξ + Ωobs. η ) · ptn ≥ 0, 206
Chapitre 11. Annexes
et par conséquent Etn ≥ Ωobs. Ltn . où Ltn = −η · ptn = mtn tn est le moment angulaire de la particule qui tombe dans le trou noir. Pour extraire de l’énergie du trou noir, il faut que Etn < 0, ce qui implique que Ltn < 0. Le moment angulaire du trou noir doit donc diminuer. 11.6
Espaces courbes en cosmologie
Dans cette annexe, nous nous proposons d’obtenir la généralisation de la métrique de Friedmann-Lemaître (9.9) au cas d’un espace courbe homogène et isotrope. Nous utiliserons comme coordonnée comobile radiale une variable χ ; par définition, à (θ, φ) fixés, l’élément de distance est −(Δs)2 = a2 (t)(Δχ)2 . Dans cette annexe, nous avons choisi un facteur d’échelle ayant les dimensions d’une longueur. Pour revenir à un facteur d’échelle sans dimension, il suffit de redéfinir a(t) → Ra(t), où R est une longueur fixée. Imaginons que nous observions depuis l’origine un petit cube (figure 11.6). Comme l’espace est supposé isotrope, ce petit cube n’est pas déformé, car il n’existe pas de direction le long de laquelle il pourrait être contracté ou étiré. Dans la direction radiale, l’arête de ce cube est aΔχ, et dans les directions perpendiculaires, ar (χ)Δθ suivant la direction θ et ar (χ) sin θ Δφ suivant la direction φ : r (χ) est une coordonnée z aΔχ (χ, θ ,φ)
ar(χ)Δ θ ar(χ) sin θ Δ φ
aχ
χ=0
θ φ
x
y F IGURE 11.6. Définition des coordonnées (χ, r (χ), θ, φ) de la métrique (11.18).
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
207
angulaire sans dimension qui vaut simplement χ pour un espace plat. En résumé, χ est une distance radiale, et r (χ) une mesure des distances dans les directions perpendiculaires. La forme générale de la métrique spatiale est, compte tenu des hypothèses d’isotropie et d’homogénéité
− (Δs)2 = a2 (t) (Δχ)2 + r2 (χ) (Δθ )2 + sin2 θ (Δφ)2 .
(11.18)
Dans cette équation, a(t) a les dimensions d’une longueur, χ et r (χ) sont sans dimensions. Il reste à déterminer la fonction r (χ). Dans le cas de l’espace plat, r (χ) = χ = r permet de retrouver immédiatement la métrique euclidienne usuelle. Les deux autres possibilités correspondent à une forme spécifique de r (χ), et on peut établir la forme explicite de r (χ) dans les deux autres cas : 1. espace à courbure positive, qui n’est autre que la sphère S3 à 3 dimensions dans un espace euclidien à 4 dimensions : r (χ) = sin χ ; 2. espace à courbure négative, qui n’est autre que l’hyperboloïde H 3 à 3 dimensions dans un espace euclidien à 4 dimensions : r (χ) = sinh χ. Pour regrouper les trois cas de figure possibles, on écrit souvent
− (Δs)2 = a2 (t) (Δχ)2 + rk2 (χ) (Δθ )2 + sin2 θ (Δφ)2 ,
(11.19)
avec : 1. courbure positive (sphère) : k = +1 : r1 (χ) = sin χ ; 2. espace plat : k = 0 : r0 (χ) = χ ; 3. courbure négative (hyperboloïde) : k = −1 : r−1 (χ) = sinh χ. La séparation angulaire Δθ entre deux galaxies lointaines de même coordonnée comobile radiale χ et distantes de ΔL est Δθ =
ΔL . a ( t )r ( χ )
(11.20)
Compte tenu de la forme de r (χ), on vérifie que Δθ > ΔL/d(t) pour la courbure positive, et Δθ < ΔL/d(t) pour une courbure négative, car par définition d(t) = a(t)χ et sin χ < χ tandis que sinh χ > χ. La fonction r (χ) donne aussi 208
Chapitre 11. Annexes
l’aire A(t, χ) de la sphère de rayon a(t)χ : en effet, compte tenu de la métrique (11.19) A(t, χ) = 4πa2 (t)r2 (χ).
(11.21)
Si un photon reçu au temps t0 a été émis par une galaxie dont la coordonnée comobile radiale est χcom , le temps d’émission te est donné par χcom =
t0 dt te
a(t)
,
et on en déduit que (9.11) reste valable pour un espace courbe. Revenons sur la distance de luminosité lorsque la courbure spatiale est non nulle, en écrivant l’équation de Friedmann sous la forme 2 a20 a˙ 2 ρ = H0 + (1 − Ω0 ) 2 , a ρc a
(11.22)
où nous avons utilisé l’expression (9.25) de la densité critique ρc et défini Ω0 = ρ0 /ρc . On décompose ρ en une partie matière (non relativiste) ρm , une partie rayonnement ρr et une partie vide ρv suivant (9.23). Dans le cas de la matière par exemple, on écrit ρ0 a3 ρm = m 30 = Ωm0 (1 + z )3 , ρc ρc a et en procédant de la même manière avec ρr et ρv , on aboutit à 1/2 a˙ = H0 Ωm0 (1 + z )3 + Ωr0 (1 + z )4 + Ωv0 + (1 − Ω0 )(1 + z )2 . a
(11.23)
On en déduit χcom χcom
1 = a0 H0
z
dz
. 1/2 [Ωm0 (1 + z )3 + Ωr0 (1 + z )4 + Ωv0 + (1 − Ω0 )(1 + z )2 ] (11.24) La distance effective est deff = a0 rk (χcom ). Ceci donne le rapport f /L 1
f 1 1 1 = = = . 2 2 2 2 2 L 4πa0 rk (χcom )(1 + z) 4πdeff (1 + z) 4πd2L
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
(11.25)
209
Cette expression permet d’identifier la distance de luminosité d L = deff (1 + z) = a0 rk (χcom )(1 + z). Passons à la distance angulaire d A : considérons un objet que nous voyons sous un angle Δθ. Les photons se sont propagés depuis cet objet jusqu’à nous à θ et φ constants. La taille de l’objet au moment de l’émission était ΔL = a(t)rk (χcom )Δθ, et comme l’angle n’a pas varié, on a aujourd’hui Δθ =
ΔL ΔL(1 + z) ΔL = = , a(t)rk (χcom ) a0 rk (χcom ) dA
par définition de la distance angulaire d A . On a donc la relation suivante entre d A et d L d A = a0 rk (χ)(1 + z)−1 = d L (1 + z)−2 .
210
Chapitre 11. Annexes
Références 1. Bailey et al. [1977] : J. Bailey et al., Measurements of relativistic time dilation for positive and negative muons in circular orbits, Nature, 268, 301. 2. Bernardeau [2007] : F. Bernardeau, Cosmologie : des fondements théoriques aux applications, EDP Sciences/CNRS-Éditions, Paris. 3. Bouchet [2005] : F. Bouchet, Cosmologie, dans Einstein aujourd’hui, p. 321, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS-Éditions, Paris. 4. Brillet et Hall [1979] : A. Brillet and J. Hall, Improved laser test of the isotropy of space, Phys. Rev. Lett., 42, 549. 5. Broderick et Loeb [2012] : A. Broderick et A. Loeb, L’ombre d’un trou noir, Dossier Pour La Science avril–juin 2012, Belin, Paris. 6. Cavalier et al. [2010] : F. Cavalier, P. Hello et N. Leroy, Virgo et la quête des ondes gravitationnelles, Images de la Physique, CNRS, Paris. 7. Chou et al. [2010] : C. Chou, D. Hume, T. Rosenband and D. Wineland, Optical clocks and relativity, Science, 329, 1630. 8. Collin-Zahn [2009] : S. Collin-Zahn, Des quasars aux trous noirs, EDP Sciences, Paris. 9. Damour [2005a] : T. Damour, Si Einstein m’était conté, le cherche midi, Paris. 10. Damour [2005b] : T. Damour, Relativité générale, dans Einstein aujourd’hui, p. 267, M. Le Bellac et M. Leduc eds., EDP Sciences/CNRS-Éditions, Paris. 11. Damour [2013] : T. Damour, Experimental tests of gravitational theory, http ://pdg.lbl.gov/2013/reviews/rpp2013-rev-gravity-tests.pdf. 12. Defayet [2014] : C. Defayet, Énergie sombre ou nouvelle gravitation ?, Pour La Science, septembre 2014, p. 38, Belin, Paris. 13. Denegri et al. [2014] : D. Denegri, C. Guyot, A. Hoecker et L. Roos, L’aventure du grand collisionneur de hadrons : du big bang au boson de Higgs, EDP Sciences, Paris.
14. Deruelle et Uzan [2014] : N. Deruelle et J.-P. Uzan, Théories de la relativité, Belin, Paris. 15. Eisenstaedt [2002] : J. Eisenstaedt, Einstein et la relativité générale : les chemins de l’espace-temps, CNRS-Éditions, Paris. 16. Eisenstein et Bennett [2008] : D. Eisenstein and C. Bennett, Cosmic sound rule, Physics Today, 44, April 2008. 17. Genzel et al. [2010] : R. Genzel, F. Eisenhauer and S. Gillessen, The galactic center massive black hole and nuclear star cluster, Rev. Mod. Phys., 82, 3121. 18. Geroch [1978] : R. Geroch, General relativity from A to B, University of Chicago Press, Chicago. 19. Giddings [2013] : S. Giddings, Black holes, quantum information and the foundations of physics, Physics Today, April 2013. 20. Gisin [2013] : N. Gisin, L’Impensable hasard, Odile Jacob, Paris. 21. Giulini [2014] : D. Giulini, Le principe d’équivalence à l’épreuve quantique, Pour La Science, juillet 2014, p. 56, Belin, Paris. 22. Gourgoulhon [2009] : É. Gourgoulhon, Relativité générale, Master Astronomie et Astrophysique Paris, http://luth.obspm.fr/luthier/ gourgoulhon/fr/master/relat.htlm. 23. Gourgoulhon [2010] : É. Gourgoulhon, Relativité restreinte : des particules à l’astrophysique, EDP Sciences, Paris. 24. Grandou et Rubin [2009] : T. Grandou and J. Rubin, On the ingredients of the twin paradox, Int. J. Th. Phys., 48, 101. 25. Hafele et Keating [1972] : J. Hafele and R. Keating, Around-the-clock atomic clocks : observed relativistic time gains, Science, 178, 168. 26. Hartle [2003] : J. Hartle, Gravity : an introduction to Einstein’s general relativity, Addison-Wesley, New York. 27. Hobson et al. [2009] : M. Hobson, G. Efstathiou et A. Lasenby, Relativité générale, de boeck. 28. Iliopoulos [2015] : J. Iliopoulos, Aux origines de la masse : symétries fondamentales et particules élémentaires, EDP Sciences, Paris. 29. Lasota [2010] : J.-P. Lasota La science des trous noirs, Odile Jacob, Paris. 30. Lasota [2012] : J.-P. Lasota, (1) La chasse aux trous noirs, (2) Les trous noirs dévoilés, (3) La vrille des trous noirs, Dossier Pour La Science avril–juin 2012, Belin, Paris 31. Le Bellac [2013] : M. Le Bellac, Physique quantique, 3e édition, EDP Sciences/CNRS-Éditions, Paris.
212
Références
32. Lévy-Leblond [1976] : J.-M. Lévy-Leblond, One more derivation of the Lorentz group, Am. J. Phys., 44, 1976. 33. Lévy-Leblond et Provost [1979] : J.-M. Lévy-Leblond et J-P Provost, Additivity, rapidity, relativity, Am. J. Phys., 47, 1979. 34. Luminet [2006] : J.-P. Luminet, Le destin de l’Univers, folio essais, Paris. 35. Luminet [2014a] : J-P Luminet, La topologie cosmique, Dossier Pour La Science avril–juin 2014, Belin, Paris. 36. Luminet [2014b] : J-P Luminet, L’invention du Big Bang, Points Sciences, Le Seuil, Paris. 37. Marolf [2003] : D. Marolf, Notes on relativity and cosmology, http ://web. physics.ucsb.edu/marolf/MasterNotes.pdf. 38. Mermin [2005] : N. Mermin, It’s about time, Princeton University Press, Princeton. 39. Moore [2014] : T. Moore, Relativité générale, de boeck. 40. Novak [2012] : J. Novak, Les étoiles à neutrons, Dossier Pour La Science, avril–juin 2012, Belin, Paris. 41. Nussbaumer [2014] : H. Nussbaumer, Einstein’s conversion from his static to an expanding universe, Eur. J. Phys. History, 39, 37. 42. Parentani [2012] : R. Parentani, Les prédictions de Stephen Hawking, Dossier Pour La Science avril–juin 2012, Belin, Paris. 43. Peter et Uzan [2012] : P. Peter et J.-P. Uzan, Cosmologie primordiale, Belin, Paris. 44. Poisson et Will [2014] : E. Poisson and C. Will, Gravity : Newtonian, Post-Newtonian, Relativistic, Cambridge University Press, Cambridge. 45. Riazuelo [2014] : A. Riazuelo, (1) La trace de l’invisible, (2) Planck, géomètre de l’Univers primordial, (3) L’écho du Big Bang, (4) À l’horizon des trous noirs, Dossier Pour La Science, avril–juin 2014, Belin, Paris. 46. Rich [2002] : J. Rich, Principes de la cosmologie, Éditions de l’École Polytechnique, Palaiseau. 47. Schwarzschild [2011] : B. Schwarzschild, The largest neutron-star mass yet recorded has broad implications, Physics Today, 64, January 2011. 48. Spagnou [2012] : P. Spagnou, De la relativité au GPS : quand Einstein s’invite dans votre voiture, Ellipses, Paris. 49. Springel [2014] : V. Springel, Sur les traces de l’Univers invisible, Pour la Science, septembre 2014, p. 22, Belin, Paris.
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
213
50. Steinhardt [2014] : P. Steinhardt, L’inflation cosmique en débat, Dossier Pour La Science, avril–juin 2014, Belin, Paris. 51. Susskind [2010] : L. Susskind, Trous noirs : la guerre des savants, Robert Laffont, Paris. 52. Taillet [2014] : R. Taillet, Les chasseurs souterrains de matière noire, Pour La Science, septembre 2014, p. 30, Belin, Paris. 53. Taylor et Wheeler [1963] : E. Taylor and J. Wheeler, Space-time physics, W.H. Freeman, New York. 54. Tegmark [2014] : M. Tegmark, Notre univers mathématique, Dunod, Paris. 55. Thorne [2009] : K. Thorne, Trous noirs et distorsions du temps, Flammarion (Collection Champs), Paris. 56. Vessot et Levine [1979] : R. Vessot and M. Levine, Test of the equivalence principle using a space-born clock, Gen. Rel. and Grav., 10, 181. 57. Vincent et al. [2011] : F. Vincent, T. Paumard, E. Gourgoulhon and G. Perrin, GYOTO : a new general relativistic ray-tracing code, Class. Quantum Grav. 28, 225011. 58. Weaver [2012] : K. Weaver, Les trous noirs supermassifs, Dossiers Pour La Science, avril–juin 2012, Belin, Paris. 59. Will [1989] : C. Will, Les enfants d’Einstein, EDP Sciences, Paris. 60. Will [2014] : C. Will, The confrontation between general relativity and experiment, http ://www.livingreviews.org/lrr-2014-4. 61. Zee [2013] : A. Zee, Einstein gravity in a nutshell, Princeton University Press, Princeton.
214
Références
Index A
barrière centrifuge 101 baryon 184 Big Bang 159, 181
constante de Boltzmann 133, 181 constante de gravitation 75 constante de Hubble 158 constante de Planck 131, 198 coordonnées comobiles 163 d’Eddington-Finkelstein 115 de Schwarzschild-Droste 93, 112 de temps 4 normales de Fermi 41, 85, 203 corps noir 134, 158 courbure 80
C
D
causalité 19, 21 centre de masse 27 chronogéométrie 20 collision élastique 56 composante 20 cône de lumière 13 futur 13 passé 13 conjecture de censure cosmique 126 conservation de l’énergie 57, 59 conservation de l’impulsion 54, 199 constante cosmologique 178
date 4 décalage vers le rouge cosmologique 167 décalage vers le rouge gravitationnel 70, 95 découplage 172, 185 densité critique 179 déviation géodésique 82, 203 diagramme d’espace-temps 7 dipôle électrique 140 disque d’accrétion 129 distance angulaire 175, 210 comobile 163 euclidienne 4
accélération 24 accélération de la pesanteur âge de l’Univers 159 année lumière (a.l.) 196 antiproton 64, 184
26
B
de luminosité 174, 210 de Minkowski 35
138, 198
E
G
effet de marée 27, 82 effet Doppler 48, 70 effet Shapiro 107 effondrement gravitationnel 118 énergie cinétique 56, 99 énergie de liaison 62 énergie-impulsion 60 énergie sombre 177 énergie thermonucléaire 63 entropie d’un trou noir 134 équation d’Einstein 91 équation de Friedmann 178 ergorégion 123 ergosphère 123 espace affine 2 espace euclidien 2 espace-temps 4 de Minkowski 19 plat 71, 83, 163 étoile à neutrons 128 étoile compacte 111 événement 4 expansion de l’Univers 158
géodésique 79, 204 GPS (Global Positioning System) 72 gravité faible 95, 104
F facteur de Lorentz 34 facteur de dilatation (ou d’échelle) 163 flèche du temps 14 fond diffus cosmologique 157, 185 force de marée 27, 84, 118
216
force d’inertie 24 fréquence angulaire
H hertz 5, 198 horizon des événements 116, 122 horizon des particules 170 horloge atomique 5 hypersurface de simultanéité 17, 36
I impulsion 54, 199 inflation 190 instabilité de Jeans 186 intervalle de temps propre 34 invariant de Lorentz 22, 35 ion 5, 25, 48
L lentille gravitationnelle 107 ligne d’univers 5 loi de Boltzmann 182 loi de conservation 53, 204 longueur d’onde 138, 198 luminosité 64, 159
M masse gravitationnelle 25, 68 masse inertielle 25, 68
Index
matière sombre 156 métrique 20, 88, 202 asymptotiquement plate 93 de Friedmann-Lemaître 163, 167, 207 de Kerr 121 de Minkowski 20, 83, 144, 201 de Schwarzschild 93 sur la sphère 79 sur l’espace-temps 88 modèle de concordance (ou ΛCDM) 191 moment angulaire 100, 120 moment dipolaire 142 moment monopolaire 142 moment quadrupolaire 142 mouvement rectiligne uniforme 24 mouvement circulaire uniforme 24, 141
N naine blanche 128 nanoseconde 9, 196 neutrino 10, 44, 54, 63, 183 non-relativiste 61 norme d’un vecteur 4 nucléosynthèse primordiale 184
O observateur 14 ondes électromagnétiques 138, 197 gravitationnelles 144 sonores primordiales 187 orbite ISCO 105, 205 orbites planétaires 100
LES RELATIVITÉS : ESPACE, TEMPS, GRAVITATION
P paradoxe des jumeaux 16, 46 paradoxe d’Olbers 155 paramètre de compacité 111 paramètre de Hubble 169 paramètre de Kerr 120 paramètre d’impact 106, 205 parsec 196 particule test 27 pic acoustique 188 photon 8, 198 plan tangent 78 point de l’espace-temps 4 polarisation 138 positron 9, 62 potentiel effectif 100 potentiel gravitationnel 75 précession du périhélie 104 précession géodésique 109 principe cosmologique 157 principe d’équivalence 69, 86 principe de relativité 30 processus de Penrose 123, 206 processus virtuel 132 produit scalaire 39, 88, 201 pulsar 149
Q quadri-impulsion 123 quadrivecteur 20, 58 quadrivitesse 40, 203 quantité de mouvement quark 183 quasar 107, 131
54
R radian 97 rayon de Hubble
158
217
rayon de Schwarzschild 93 rayonnement cosmologique fossile 157 rayonnement de Hawking 131 rayonnement dipolaire 142 rayonnement quadrupolaire 142 redshift cosmologique 168 redshift gravitationnel 70 référentiel dans l’espace-temps 37, 39 du centre de masse 55, 64, 199 en chute libre 85, 203 inertiel (ou d’inertie) 24 local 42 localement inertiel 84, 88 relativité générale 77 relativité restreinte 9
S scalaire 22, 35, 58 scalaire de courbure 90 seconde d’arc 97 source du rayonnement 140 surface de décalage vers le rouge infini 95, 117 surface de dernière diffusion 173, 185 surface de redshift infini 117 surface de simultanéité 17, 36 surface limite stationnaire 123 supraluminique 11 système de coordonnées 3, 86
T température absolue 133 température de Hawking 133
218
temps comobile 162 temps-coordonnée 16, 36, 70 temps de Hubble 158 temps propre 15 temps retardé 141, 147 tenseur 83 de Riemann 85 de Ricci 90 théorème de Birkhoff 95, 145 de Pythagore 4, 162 transformation de Galilée 35 de Lorentz 35, 201 trou noir de Kerr (ou en rotation) 121 de Schwarzschild (ou sphérique) 112 stellaire 128 supermassif 131
U ultra-relativiste 61
V variété 5 vecteur 2 de base 3 de genre espace 21 de genre lumière 20 de genre temps 20 vie moyenne 44 vitesse 24 vitesse de la lumière 8 vitesse de libération 111 vitesse du son 48
Index