175 100 5MB
French Pages 300 [298] Year 2018
Il était temps
Il était temps Comprendre enfin la relativité
N. DAVID MERMIN Traduction de Victor Policarpo Préface de Richard Taillet
17, avenue du Hoggar – P.A. de Courtabœuf BP 112, 91944 Les Ulis Cedex A
Translation from the English language edition of: "It's about time, Understanding Einstein's Relativity", N. David Mermin, © 2005, Princeton University Press. Licensed by Princeton University Press, Princeton New Jersey, U.S.A. in conjunction with their duly appointed agent, L’Autre agence. All rights reserved. No part of this book may be reproduced or transmitted in any form or by any means, electronic or mechanical, including photocopying, recording or by any information storage and retrieval system, without permission in writing from the Publishers.
Composition et mise en pages : Patrick Leleux PAO Couverture : conception graphique de B. Defretin, Lisieux Illustration de couverture : peb & fox Imprimé en France ISBN (papier) : 978-2-7598-2161-7 ISBN (ebook) : 978-2-7598-2206-5
Tous droits de traduction, d’adaptation et de reproduction par tous procédés, réservés pour tous pays. La loi du 11 mars 1957 n’autorisant, aux termes des alinéas 2 et 3 de l’article 41, d’une part, que les « copies ou reproductions strictement réservées à l’usage privé du copiste et non destinés à une utilisation collective », et d’autre part, que les analyses et les courtes citations dans un but d’exemple et d’illustration, « toute repré sentation intégrale, ou partielle, faite sans le consentement de l’auteur ou de ses ayants droit ou ayants cause est illicite » (alinéa 1er de l’article 40). Cette représentation ou reproduction, par quelque procédé que ce soit, constituerait donc une contrefaçon sanctionnée par les articles 425 et suivants du code pénal. © EDP Sciences, 2018
NOTE DU TRADUCTEUR
Merci à Stéphane Puech pour sa précieuse aide. Merci à toi de m’avoir plongé dans la relativité restreinte exactement au moment où il le fallait !
Le titre original « It’s about time » est basé sur un double sens. En anglais, il peut se lire de deux façons différentes : « Il était temps » ou « C’est une question de temps ».
PRÉFACE
Si l’importance d’une discipline scientifique peut se mesurer par les références dans la culture populaire, les théories de la relativité (la relativité restreinte et la relativité générale) occupent une place très privilégiée dans l’imaginaire collectif. Voyages dans le temps, trous noirs, espace-temps, antimatière, « E égale m c deux », toutes ces expressions résonnent aujourd’hui de façon familière, même aux oreilles de publics peu sensibilisés à la physique, au moins autant grâce aux films, séries et livres de science-fiction ou de vulgarisation que par l’enseignement scolaire. Une des raisons en est probablement que ces théories révolutionnent notre façon de concevoir le temps, notion – préoccupation – universelle par excellence. La relativité restreinte est aujourd’hui enseignée au lycée, dans le but de ne pas laisser des bacheliers scientifiques n’avoir jamais entendu parler de cette théorie pendant leur scolarité. Si l’on tente de formuler cet objectif de façon positive, la question se pose de savoir ce qu’on veut que ces bacheliers aient compris exactement. David Mermin se la posait déjà lorsqu’il tentait d’intégrer la relativité dans les programmes de « High School » aux États-Unis à la fin des années 1960 mais rien ne laisse penser que les leçons qu’il en avait tirées aient été vraiment entendues ni comprises depuis. 7
Préface
En effet, les programmes actuels laissent très peu de place à la présentation de notions fondamentales qui permettraient aux lycéens de comprendre comment la relativité nous demande de revoir notre façon de concevoir l’espace et le temps, au-delà d’un « le temps s’écoule moins vite pour un observateur en mouvement » qui au mieux n’a aucun sens, au pire est un contresens total. Pourtant, l’idée d’introduire la relativité restreinte dès le lycée semble excellente : le formalisme mathématique est remarquablement simple et les raisonnements obligent à une grande rigueur dans la logique et le langage, dans le vocabulaire et l’articulation des phrases, autant de compétences précieuses pour les jeunes étudiants. La plupart des paradoxes relativistes — car ceux-ci font très rapidement leur apparition lorsqu’on se penche sur les principes de la relativité restreinte – perdent leur substance lorsqu’on les énonce de façon claire et précise, sans tenter de prendre des raccourcis de vocabulaire. L’acquisition de ces compétences demande de la patience, de la part de l’élève, de la part des enseignants, et de la part des institutions qui veillent à l’équilibre et à la profondeur des programmes scolaires. L’immense mérite de « It’s About Time » de David Mermin, c’est de prendre le temps d’aborder les difficultés une par une en dévoilant le caractère profond de certaines d’entre elles. On réalise rapidement que nombre de ces difficultés étaient déjà présentes en physique classique, mais que des raccourcis de langage ou le recours à l’intuition nous les avaient masquées. Le premier chapitre sur le principe de relativité galiléenne et ses conséquences sur les propriétés des chocs est à ce titre absolument remarquable. Enfin, et c’est un point qui peine à imprégner la culture scientifique populaire, rappelons que la relativité restreinte n’est pas un simple jeu de l’esprit, réservé aux physiciens et à quelques geeks en mal d’intellectuelles sensations fortes. Elle décrit le monde dans lequel nous vivons. Lorsque nos conceptions intuitives sont en conflit avec certaines de ses prédictions, il faut questionner notre 8
Préface
intuition autant que la théorie. Il se trouve que les tests expérimentaux valident toujours la théorie d’Einstein et non notre intuition, lorsqu’elles sont en conflit. L’ouvrage, au-delà de la belle leçon de physique, alimentera chez le lecteur de tout âge de riches réflexions sur la nature du savoir scientifique. Il était temps, pour reprendre le jeu de mots de son titre original, qu’il soit mis à la disposition des lecteurs francophones ! Richard Taillet
9
SOMMAIRE
Préface.........................................................................................
7
Avant-propos.................................................................................
13
Avis aux lecteurs............................................................................
21
1. Le principe de relativité...........................................................
25
2. Combiner des (petites) vitesses............................................... 45 3. La vitesse de la lumière........................................................... 53 4. Combiner (toutes) les vitesses................................................. 69 5. Des événements simultanés et des horloges synchronisées......... 93 6. Une horloge en mouvement ralentit et une règle en mouvement raccourcit................................................................................ 111 Règle des horloges synchronisées................................................ 126 Règle de contraction des règles ou de ralentissement des horloges en mouvement.......................................................................... 126 7. Regarder une horloge en mouvement........................................ 135 8. L’intervalle entre deux événements........................................... 145 9. Des trains de fusées................................................................ 159 10. La géométrie de l’espace-temps.............................................. 176 11. E = Mc2................................................................................. 233 12. Un peu de relativité générale................................................. 263 13. Quel est le « mécanisme » à l’œuvre ?.................................... 285 11
AVANT-PROPOS
« Le temps absolu, vrai et mathématique, sans relation à rien d’extérieur, coule uniformément. » Isaac Newton « Mon temps est ton temps. » Rudy Vallée « Il me vint à l’esprit que le temps était suspect ! » Albert Einstein L’année 2005 est le centenaire de la publication de la théorie de la relativité restreinte par Einstein. Quarante années plus tôt, pendant l’année du 60e anniversaire, je décidai, en tant que jeune professeur assistant de physique à l’université de Cornell (Ithaca, État de New York), que le moment était venu d’introduire la relativité restreinte dans les programmes du lycée. Il est possible de le faire à partir de notions simples d’algèbre et de géométrie plane élémentaire qui, aussi étonnant que cela puisse paraître, sont les seuls outils mathématiques requis pour arriver à une compréhension totale du sujet. C’est ainsi que j’ai commencé à donner des cours de relativité 13
Avant-Propos
restreinte à un groupe de professeurs de lycée qui ont eu l’air de bien les apprécier. La relativité est un sujet d’étude idéal pour le lycée, non seulement parce qu’elle offre une application surprenante des concepts de base des mathématiques faites au lycée, mais aussi parce que tout le monde connaît intimement le sujet. La relativité est une question de temps. Que pourrait-il y avoir de plus familier que le temps ? Ce qui rend le sujet si fascinant, c’est que la relativité est une remise en question radicale de notre conception de la nature du temps, elle a balayé en 1905 tout ce que les gens considéraient comme allant de soi à propos du temps. Par exemple, nous savons maintenant que la première des deux citations qui ouvre la préface est fausse. Comprendre pourquoi Newton et Vallée ont tous deux tort sur la question du temps doit faire partie du bagage intellectuel de tout un chacun. La troisième citation, qui est un admirable résumé de la clé du mystère qui a défié les physiciens du début du xxe siècle, provient du récit d’une conversation privée1 avec Einstein vers la fin de sa vie. Malgré toutes ces bonnes raisons, au cours des quatre dernières décennies, la relativité restreinte n’a jamais été introduite au lycée dans les programmes scolaires2. La seule chose qui reste de mon combat chimérique est un livre écrit en 1968, Space and Time in Special Relativity, qui est encore publié actuellement. Mon idée était d’écrire ce livre pour des lycéens, cependant, au cours des trois décennies et demie qui ont suivi sa publication, il n’a quasiment jamais fait d’apparition dans les lycées. Pour ma part, je l’ai utilisé dans les cours de relativité restreinte que j’ai donnés épisodiquement à des étudiants de premier cycle de l’université de Cornell durant les trente dernières années. 1. R. S. Shankland, “Conversations with Albert Einstein”, American Journal of Physics 31 (1963) : 47-57. 2. NDT : En France, la relativité restreinte a fait son entrée dans le programme de sciences physiques de terminale S en 2012 (seule la dilatation du temps est abordée). 14
Avant-Propos
Au fil des ans, en intervenant sur le sujet devant les étudiants, je suis devenu de plus en plus insatisfait de mon propre livre. Tout en continuant à le préférer aux autres présentations de niveau mathématique comparable, j’ai fini par le considérer comme le meilleur choix parmi un étalage de choses imparfaites. Pendant les années 1990, j’ai même cessé de le recommander en tant que lecture pour m’appuyer davantage sur des notes de cours que j’étais spécialement en train d’écrire à l’intention de mes étudiants non scientifiques de Cornell. Tout au long de cette décennie, ces notes furent un véritable chantier permanent, continuellement réorganisées et révisées en fonction des nouvelles difficultés rencontrées et en réaction aux incompréhensions émergeant des innombrables conversations que j’ai pu avoir avec des étudiants brillants mais souvent perplexes. Quarante années se sont écoulées et le professeur assistant visionnaire d’alors est aujourd’hui sur le point de prendre sa retraite et ce nouveau livre sur la relativité s’est construit autour de l’état présent de mes notes de cours. Il ne fait aucun doute que ces notes auraient pu être encore améliorées si j’avais continué à bénéficier de la stimulation des étudiants de Cornell, prodigieusement brillants, spontanés et sceptiques, sans qui elles n’auraient pas évolué jusqu’à leur forme actuelle. Sans l’aiguillon que constitue cette source d’inspiration et de surprises, tout bricolage ultérieur sur ces notes a autant de chances de les améliorer que de les détériorer. Il est donc temps de les transformer en un nouveau livre. Entre 1968 et 2005, j’ai beaucoup appris sur la manière d’aborder l’enseignement de la relativité restreinte. Une découverte pédagogique m’a particulièrement été utile. Toute personne qui souhaite comprendre le sujet doit être capable de visualiser comment certains événements qui se produisent, par exemple sur le quai d’une gare, seront décrits par le passager d’un train qui traverse cette gare à vitesse constante, et réciproquement comment des événements qui se produisent dans le train seraient décrits par une personne située sur 15
Avant-Propos
le quai de la gare. Sans cette faculté de pouvoir passer d’une description à l’autre, on ne peut pas envisager de comprendre la relativité. Alors que dans toutes les introductions à la relativité que je connaisse, c’est valable aussi pour mon livre de 1968, on fait comme si tout le monde possédait cette faculté. On exige immédiatement du lecteur qu’il applique à des phénomènes hautement contre-intuitifs cette capacité peu développée, inhabituelle et souvent inexistante. Lorsqu’on enseigne la relativité, ces changements de point de vue mènent souvent à deux descriptions qui semblent, au premier abord, se contredire. Face à ces paradoxes apparents, les gens qui ne se sont jamais entraînés à passer d’une description depuis la gare à une description depuis le train – et réciproquement – se disent tout naturellement qu’ils ont fait une erreur de transcription. Et au lieu de chercher à comprendre pourquoi cette contradiction n’est qu’apparente, ils perdent confiance dans la méthode d’analyse qui a abouti à ce résultat. À ce propos, l’approche pédagogique habituelle de la relativité est épouvantable. On introduit un concept technique essentiel et non familier (passer de la description d’un « référentiel » à un autre), en l’appliquant immédiatement à des cas inhabituels et hautement contre-intuitifs. La chose la plus importante que j’ai apprise en enseignant la relativité à de nombreuses générations d’étudiants de premier cycle à Cornell, dont aucun ne suivait d’études purement scientifiques, c’est qu’il faut commencer par inculquer cette technique de changement de référentiel en l’appliquant à des cas tout à fait familiers et très intuitifs. Les méthodes pour développer ces capacités ne manquent pas et elles permettent de s’entraîner sur des situations qui peuvent être complexes, mais dont les résultats ne semblent jamais paradoxaux. C’est l’objet du chapitre 1 de ce livre où nous examinerons quelques situations simples de collisions entre objets. Bien que ces phénomènes non relativistes ne fassent jamais partie des préliminaires des présentations conventionnelles de la relativité, je suis maintenant convaincu qu’il est essentiel de les 16
Avant-Propos
aborder lorsqu’on présente le sujet à des personnes n’ayant aucune formation scientifique, si nous voulons qu’ils comprennent ce qui va suivre. Commencer une introduction à la relativité par une étude de quelques collisions simples présente un deuxième avantage, car on peut ensuite mettre à profit ces situations pour expliquer la formule E = mc2. Ce que j’ai également appris depuis 1968, c’est qu’il est primordial d’insister le plus tôt possible sur le fait que, bien que les objets allant à la vitesse de la lumière aient la réputation de se comporter de manière très étrange, le comportement d’objets allant à des vitesses comparables à celle de la lumière est tout aussi bizarre. La spécificité du mouvement à la vitesse de la lumière n’est qu’un cas particulier d’une propriété plus générale, valable pour tout mouvement, mais dont l’importance ne se manifeste qu’à des vitesses extrêmes. Cette propriété plus générale peut s’exprimer sous la forme d’une règle simple mais quantitative, qu’il est possible et même utile de formuler assez rapidement. C’est ce que je fais dans le chapitre 4 en utilisant une expérience de pensée étonnamment simple qui apparaît comme un devoir à la maison dans mon livre de 1968. Quand j’ai réalisé que personne n’avait jamais vraiment remarqué cette démonstration, j’ai publié ce devoir à la maison et sa solution dans l’American Journal of Physics (1983). Dès lors, il m’est apparu clairement que le sujet de ce devoir à la maison pouvait jouer un rôle pédagogique important dans le développement de la relativité. Chacun peut prendre conscience que le rôle primordial que semble jouer la lumière dans les nombreuses expériences de pensée utilisées dans l’investigation de la nature du temps n’est pas indispensable. À la place, il est tout à fait possible d’utiliser le déplacement rectiligne uniforme de n’importe quel autre objet pour transmettre des signaux d’un endroit à l’autre de l’espace. Un aspect plus conventionnel de la présentation qui va suivre est la place qui est réservée à une question dont l’importance a été comprise dès le départ par Einstein, mais qui a eu tendance à être 17
Avant-Propos
minimisée dans les exposés ultérieurs de la relativité restreinte, y compris dans mon livre de 1968. Il s’agit du caractère totalement conventionnel de l’affirmation que deux événements qui se produisent en deux lieux différents sont simultanés. Le fait qu’on ne puisse attribuer aucune signification absolue à la simultanéité de deux événements éloignés est la plus importante leçon que nous enseigne la relativité et cette notion doit inévitablement apparaître dans n’importe quelle introduction sur le sujet. Mais en 1968, je l’ai introduite comme une conséquence secondaire d’autres propriétés au lieu d’insister sur le rôle fondamental qu’elle joue pour expliquer presque tous les autres aspects de la théorie. Dans le livre présent, la question du caractère conventionnel de la simultanéité est introduite dès les premiers chapitres avec une formulation quantitative, concise et facile à retenir qui lui permet de jouer un rôle central dans la clarification de tout ce qui suit. Une autre innovation dans le livre est mon traitement des diagrammes d’espace-temps inventés par Minkowski dans la foulée de la publication de la théorie. Ils jouent un rôle important en reliant ensemble tous les aspects de façon visuelle et intuitive sans faire appel à des équations compliquées. Dans mon livre de 1968, ces diagrammes apparaissent dans un cadre plutôt conventionnel dans lequel les axes des coordonnées d’espace-temps jouent un rôle fondamental dans la description des événements, et (ce qui est moins conventionnel) j’utilise des relations trigonométriques pour en extraire des informations importantes. Une vingtaine d’années après cela, j’ai réalisé que ces axes ne sont qu’une distraction inutile et potentiellement déroutante et que toute cette trigonométrie qui alourdit parfois ma présentation passée peut être remplacée avantageusement par de la géométrie plane très simple où il suffit généralement de comparer différents assemblages de triangles analogues. À ma connaissance, cette approche des diagrammes d’espace-temps qui permet très facilement de les établir directement à partir des deux principes d’Einstein n’était 18
Avant-Propos
jamais apparue auparavant dans aucun livre ni même dans la littérature scientifique avant que je n’en fasse état il y a quelques années dans l’American Journal of Physics (1997 et 1998). Les diagrammes d’espace-temps, comme je les présente ici, sont à la présentation conventionnelle des diagrammes d’espace-temps ce que la géométrie plane d’Euclide est à la géométrie analytique de Descartes. La géométrie analytique est l’outil le plus puissant pour les calculs professionnels, mais l’approche d’Euclide est essentielle à une compréhension profonde. Un aspect inhabituel de mon livre de 1968 consistait en une approche alternative, moins puissante mais aussi moins abstraite que les diagrammes d’espace-temps, basée sur quelques images de deux trains en mouvement relatif montrant comment les deux trains se présenteraient aux passagers de l’un d’entre eux. Une dizaine d’années plus tard, il m’est apparu que cette présentation pouvait être faite de façon beaucoup plus simple et beaucoup plus puissante en montrant chaque train non pas du point de vue de l’autre, mais du point de vue d’une plate-forme par rapport à laquelle ils se déplaceraient en sens inverse à la même vitesse. La présentation selon cette approche optimale constitue l’objet du chapitre 9. Et pour clore l’inventaire des avancées pédagogiques proposées dans ce présent travail, il me reste à mentionner Alice et Bob. Ces personnages sont devenus, depuis quelques décennies, les protagonistes traditionnels des histoires qu’on se raconte en cryptologie. J’ai fait leur connaissance dans les années 1990 quand je me suis intéressé au développement des nouvelles applications de la physique quantique au traitement de l’information, j’ai alors réalisé qu’ils avaient un rôle nouveau et important à jouer dans la présentation de la relativité restreinte. Ce n’est pas juste parce qu’il est beaucoup plus agréable de parler d’Alice et de Bob que du « référentiel A » ou du « référentiel B ». C’est surtout parce que chacun d’eux est associé à un jeu complet de pronoms de genre différent (au moins dans les langues européennes), ce qui permet au récit d’être familier et informel sans 19
Avant-Propos
que l’exigence de précision ne vienne alourdir les phrases. Ils jouent un rôle central dans ce livre (et de manière occasionnelle, leurs amis Charles, Carol, Dick et Ève) et si ce livre n’atteint pas son objectif de vulgarisation de la relativité restreinte, j’espère au moins qu’il ouvrira la voie à des apparitions plus nombreuses des personnages d’Alice et de Bob dans l’arène relativiste.
20
AVIS AUX LECTEURS
Même si ce livre demande peu de connaissances mathématiques – géométrie plane élémentaire et algèbre de base du lycée –, il ne peut pas être lu comme un roman. J’ai essayé de suivre scrupuleusement la règle communément attribuée à Einstein qui veut que la présentation soit aussi simple que possible, mais pas plus simple que cela. Il vous sera par conséquent souvent nécessaire de faire une pause pour comprendre un point délicat, examiner une figure, analyser la relation avec le texte qui l’accompagne et, plus généralement, de vérifier activement par des allers-retours si vous avez saisi chaque avancée du raisonnement plutôt que de faire une lecture passive et linéaire. J’ai écrit ce livre à l’intention de lecteurs pouvant avoir différents types de formations. Je l’ai écrit en premier lieu pour des gens qui n’avaient aucune formation particulière en physique ni en mathématiques au-delà de notions élémentaires de géométrie et d’algèbre. La démarche que je propose contient des éléments novateurs, elle est plus terre-à-terre et plus intuitive que les méthodes traditionnelles de niveau comparable qui servent habituellement à former les physiciens. C’est pourquoi j’espère que les étudiants en physique (de premier cycle et au-delà) et même des utilisateurs professionnels de 21
Avis aux lecteurs
la relativité pourront trouver ici ou là des choses intéressantes malgré le niveau élémentaire scrupuleusement respecté. Spécialement pour ce deuxième groupe de lecteurs potentiels, par endroits, vers la fin de certains chapitres, je vais plus loin dans le sujet que ce qui serait strictement nécessaire pour mon premier groupe de lecteurs. Ces prolongements sont conçus de façon à ne pas dépasser le niveau mathématique général de ce livre. Au fur et à mesure que vous avancez dans un chapitre, si à un moment donné vous trouvez que cela devient trop difficile, je vous conseille de passer au chapitre suivant. Il y a de grandes chances que tout ce que vous avez sauté, même si en soi cela avait un intérêt, ne jouera pas un grand rôle dans le développement qui suit. Si jamais ce n’est pas le cas – si vous tombez sur des références récurrentes aux sections que vous avez sautées – alors et seulement dans ce cas, il vous faudra revenir en arrière et batailler pour passer à travers la difficulté qui vous sera utile pour comprendre la suite. Je ne recommande pas une lecture en picorant le contenu de manière aléatoire, comme on pourrait le faire avec un mode d’emploi, cependant il n’est pas nécessaire de le lire en respectant forcément l’ordre des chapitres. En guise d’exemples de sujets « facultatifs » qui pourraient décourager certains lecteurs, je mentionnerais les applications de la loi relativiste de composition des vitesses aux collisions à la fin du chapitre 4, la démonstration de la loi des événements simultanés en utilisant des signaux moins rapides que la lumière à la fin du chapitre 5, la méthode de synchronisation des horloges par transport direct des horloges à la fin du chapitre 6, la discussion à la fin du chapitre 10 sur les relations entre les coefficients d’échelle des différents référentiels, les conséquences de tout cela sur l’intervalle invariant et les diverses applications des lois de conservation relativistes à la fin du chapitre 11. J’ai séparé ces sections du reste de leur chapitre par un paragraphe écrit en petits caractères qui résume leur contenu. Même si elles peuvent être sautées sans perdre le fil de la progression du livre, je ne vous encourage pas à les ignorer parce qu’elles contiennent des 22
Avis aux lecteurs
aspects de la relativité très intéressants et traités de la manière la plus simple que je connaisse. Mais ces sections peuvent parfaitement être sautées sans que cela nuise à la compréhension de la nature du temps révélée par la théorie.
23
1 Le principe de relativité
La théorie de la relativité restreinte a été publiée par Einstein en 1905 dans son article « Sur l’électrodynamique des corps en mouvement1 ». L’adjectif « restreinte » permet de la distinguer de la relativité générale, théorie achevée dix ans plus tard par Einstein, qui englobe la gravitation. Dans ce livre, mis à part le chapitre 12 où il est question de relativité générale, nous nous préoccuperons uniquement de relativité restreinte. Dans la suite, je n’utiliserai pas le mot « restreinte » puisque c’est d’elle dont il sera forcément question. Einstein a basé sa théorie de la relativité sur deux postulats. Le premier est aujourd’hui appelé le principe de relativité. Le second sera traité plus en détail dans le chapitre 3. Einstein a formulé son principe de relativité de la façon suivante : « Dans le domaine de la mécanique comme dans celui de l’électromagnétisme, il n’existe aucun phénomène dont les propriétés accréditent le concept de repos 1. A. Einstein, “Zur Elektrodynamik bewegter Körper”, Annalen der Physik 17 (1905) : 891-921. 25
IL ÉTAIT TEMPS
absolu. » Il aurait tout aussi bien pu le formuler d’une manière plus brève et plus générale : « Il n’existe aucun phénomène dont les propriétés accréditent le concept de repos absolu. » Einstein prend la peine de préciser électromagnétisme et mécanique, car le principe de relativité était communément admis, depuis longtemps déjà, dans le domaine de la mécanique. Il a d’abord été énoncé par Galilée trois siècles plus tôt et il constitue un des fondements de la mécanique classique de Newton. Mais en 1905, il régnait une grande confusion sur la question de la validité de ce principe dans le domaine de l’électromagnétisme. Le titre un peu particulier de l’article d’Einstein s’explique par sa volonté d’insister sur la validité générale de ce principe à la fois dans le domaine de la mécanique et dans celui de l’électromagnétisme. Einstein n’a pas explicitement indiqué que le principe de relativité s’applique à tous les phénomènes, car en 1905 on croyait encore que la mécanique (avec la gravité, souvent considérée à l’époque comme une partie de la mécanique) et l’électromagnétisme englobaient à eux seuls tous les phénomènes de la nature. Aujourd’hui, nous savons qu’il y a d’autres types de phénomènes (précisés au chapitre 13) et nous sommes convaincus que le principe de relativité s’applique à tous les phénomènes sans exception. Dans ce chapitre, nous expliquerons le principe de relativité avec plus de détails que dans la formulation très concise d’Einstein et ensuite nous verrons comment ce principe peut être utilisé pour prévoir l’issue de quelques situations simples, mais pas forcément évidentes. La recherche d’une formulation très rigoureuse de ce principe soulève des problèmes conceptuels très subtils. Nous les mentionnerons au passage, mais nous éviterons à tout prix de perdre du temps à les décortiquer. Ce serait sans doute très divertissant de mener une telle étude philosophique, mais cette distraction serait superflue et parfaitement inutile à la réussite de notre objectif, qui est de bâtir un système de pensée capable de nous aider à comprendre la relativité. 26
Le principe de relativité
Ce qui importe avant tout, c’est d’apprendre à manier ce principe pour se doter d’un outil pratique destiné à élargir notre compréhension du comportement des objets en mouvement. Au début, l’utilisation du principe de relativité pourra nous sembler un peu étrange, mais il faudra apprendre à l’appliquer sans se noyer dans des difficultés métaphysiques qui peuvent se présenter lorsqu’on cherche à comprendre les choses en profondeur. Pour bien comprendre les conséquences prodigieuses et contre-intuitives des applications directes du principe de relativité dans la théorie d’Einstein, il est essentiel de commencer par apprendre à l’appliquer dans des cas plus simples, moins déroutants. Le principe de relativité est un exemple de principe d’invariance. Il y a plusieurs autres principes de ce type. Ils commencent tous par la phrase « Toutes choses égales par ailleurs », puis ils se poursuivent par : 1°) Quel que soit l’endroit où vous êtes (principe d’invariance par translation dans l’espace) ; 2°) Quel que soit l’instant que vous considérez (principe d’invariance par translation dans le temps) ; 3°) Quelle que soit l’orientation que vous choisissez dans l’espace (principe d’invariance vis-à-vis de la rotation). Le principe de relativité obéit également à ce modèle : Toutes choses égales par ailleurs, 4°) Quelle que soit la vitesse à laquelle vous vous déplacez à condition qu’elle reste constante et que votre chemin suive une ligne droite (principe de relativité). « Quel(le) que soit » signifie « les lois qui décrivent les phénomènes naturels sont les mêmes ». Par exemple, la loi qui décrit la force de gravité de Newton entre deux corps matériels est la même s’ils se trouvent dans une certaine galaxie ou dans une autre (invariance par translation dans l’espace). Cette force est la même aujourd’hui que des millions d’années auparavant (invariance par translation dans le temps). La loi n’est pas modifiée si un des corps est à l’est au lieu d’être 27
IL ÉTAIT TEMPS
au nord de l’autre (invariance vis-à-vis de la rotation dans l’espace). La loi ne doit pas non plus être modifiée si on mesure la force entre deux corps placés dans une gare au lieu d’être placés dans un train en mouvement rectiligne uniforme (principe de relativité). L’expression « toutes choses égales par ailleurs » soulève de profondes questions. Dans le cas de l’invariance par translation, cela signifie que quand vous déplacez votre expérience vers un nouvel endroit ou vers un nouvel instant, vous devez reproduire tous les autres facteurs qui semblent avoir une influence et, dans le cas de l’invariance vis-à-vis de la rotation, vous devez tourner tout ce qui peut avoir une influence. Dans le cas du principe de relativité, vous devez mettre en mouvement tout ce qui peut avoir une influence. Si jamais tout ce qui a une influence correspond, finalement, à l’univers tout entier, vous pouvez vous demander, à raison, quelle peut bien être l’utilité de ce principe. Si nous faisons un pas de plus, nous risquons de sombrer rapidement dans des abysses métaphysiques d’où beaucoup ne ressortiront pas. Ne suivons donc pas ce chemin. Intéressons-nous à la manipulation concrète d’un tel principe dans des situations qui, d’habitude, ne posent aucun problème. Dans ces cas-là, il est assez facile d’identifier le petit nombre de facteurs qui doivent rester les mêmes et il n’en faut pas davantage pour que cela fonctionne. Si jamais le principe ne fonctionne pas, alors un facteur qu’on a oublié de considérer et qui a de l’importance finira forcément par apparaître. Cette démarche permet non seulement de régler au coup par coup les problèmes rencontrés, mais aussi d’apprendre des choses nouvelles sur la nature puisqu’elle permet de transposer des conclusions dans des contextes différents. Si, par exemple, l’immobilité de l’air était un facteur important dans une expérience que vous avez menée dans une gare, il faudra alors absolument vous assurer que le wagon roulant sur des rails rectilignes à vitesse constante dans lequel vous reproduisez cette expérience ne soit pas être ouvert aux quatre vents : tous les autres facteurs doivent agir de manière identique. 28
Le principe de relativité
Les principes d’invariance sont très utiles parce qu’ils nous permettent d’étendre le champ de la connaissance à des situations nouvelles. C’est dans cet esprit que nous nous saisirons du principe de relativité, en restant dans le domaine du concret. Ce principe soutient qu’il n’existe aucune expérience qui nous permette de distinguer l’état de repos de l’état de mouvement rectiligne uniforme. Toute série d’expériences effectuées dans un laboratoire que l’on considère au repos doit donner exactement les mêmes résultats que la série correspondante d’expériences menées dans un laboratoire qui se déplace en mouvement rectiligne uniforme par rapport au premier. Les résultats que nous obtenons dans la nouvelle situation en faisant des expériences dans un laboratoire en mouvement rectiligne uniforme peuvent donc être déduits des résultats que nous avons trouvés dans l’ancienne situation où les expériences étaient menées dans un laboratoire au repos. Il est important de bien comprendre la signification de ce principe et, en même temps, de se familiariser à son utilisation pratique qui consiste à transposer des connaissances d’une situation à l’autre. Mais en évitant de s’embourber à nouveau dans des questions trop pointues. Qu’entend-on réellement par « au repos » ou par « mouvement rectiligne uniforme » ? Restons dans le concret : un mouvement rectiligne uniforme signifie se déplacer avec une vitesse constante le long d’une direction fixe. On peut le formuler de façon plus concise en disant qu’on se déplace avec un vecteur vitesse constant. Le « vecteur vitesse » englobe à la fois la vitesse et la direction du mouvement. Deux bateaux se déplaçant à 15 pieds/seconde (pi/s), l’un allant vers le nord et l’autre vers l’est, ont la même vitesse, mais un vecteur vitesse différent. Permettez-moi une rapide digression pour faire remarquer que le pied est une unité de distance utilisée dans certains pays anglophones et qui vaut 30,48 cm. Pour le propos de ce livre, il sera très utile de redéfinir le pied et de le raccourcir légèrement par rapport au foot anglais pour que sa taille soit un peu plus petite que 30 cm (ou plus précisément 29,9792458 cm – 98,36 % du foot anglais). Nous verrons dans le chapitre 3 en quoi cette redéfinition nous sera utile. 29
IL ÉTAIT TEMPS
Quand on considère des objets en mouvement le long d’une droite, il peut être utile d’orienter cette droite en fixant un sens positif et un sens négatif : ainsi, en fonction de la convention choisie, un même mouvement peut correspondre soit à une vitesse de − 10 pi/s vers l’est soit à une vitesse de + 10 pi/s vers l’ouest. Il faut noter également que dans la définition du mouvement rectiligne uniforme, le maintien d’une direction fixe est aussi important que le maintien d’une vitesse constante : le principe de relativité ne s’applique pas à un objet qui se déplace à vitesse constante sur une trajectoire circulaire. Il est impossible de confondre les mouvements rectilignes uniformes ou l’état de repos avec les autres mouvements. Pour les passagers, les sensations à bord d’un avion qui vole paisiblement en ligne droite et à vitesse constante ne sont pas du tout les mêmes que lorsque l’avion traverse soudainement une zone de turbulences. Il en va de même si on compare les sensations dans une voiture en mouvement rectiligne uniforme avec celles ressenties dans une voiture en phase d’accélération ou dans un virage très serré ou sur une route avec des nids de poule ou pendant un freinage brutal. Par contre, le ressenti est exactement le même (si on ne regarde pas par la fenêtre) dans un avion qui vole paisiblement dans l’air à 900 km/h et dans un avion à l’arrêt devant l’aérogare. Quand on applique le principe de relativité, on utilise le terme référentiel. Un référentiel est le système sur lequel vous choisissez de vous placer pour décrire les événements. Imaginons qu’une hôtesse de l’air marche vers l’avant de l’avion à 4 km/h dans le référentiel de l’avion. Vous partez de l’arrière de l’avion dans l’intention de la rattraper et pour cela, vous imprimez à votre marche une allure de 6 km/h dans le référentiel de l’avion. Si l’avion vole à 900 km/h alors, dans le référentiel lié au sol, cette situation serait décrite de la manière suivante : l’hôtesse de l’air se déplace vers l’avant à 904 km/h et vous la rattrapez, car votre vitesse est de 906 km/h. Un des aspects remarquables à propos du principe de relativité, c’est la possibilité qu’il nous donne de changer de point de vue et d’apprendre des choses même dans des situations relativement banales. 30
Le principe de relativité
Un autre concept important est celui de référentiel inertiel. « Inertiel » signifiant au repos ou en mouvement rectiligne uniforme. Un référentiel en rotation n’est pas inertiel, il en va de même pour un référentiel qui oscille en effectuant des allers-retours entre deux positions. Nous utiliserons presque uniquement des référentiels inertiels, c’est pourquoi, la plupart du temps, nous omettrons le terme inertiel sauf lorsqu’il sera important de bien faire la distinction entre les référentiels qui se déplacent en ligne droite et à vitesse constante et les autres. Comment sait-on qu’un référentiel est inertiel ? Cette question cruciale n’est qu’une variante de celle qui consiste à se demander comment il est possible de reconnaître un mouvement rectiligne uniforme. Pour répondre à cette question, il semble nécessaire d’avoir sous la main un premier référentiel inertiel pour spécifier par rapport à quoi le mouvement est rectiligne uniforme. Par conséquent, si nous savons que le référentiel dans lequel la gare est immobile est un référentiel inertiel, alors le référentiel lié à n’importe quel train se déplaçant en ligne droite à vitesse constante par rapport à la gare est aussi un référentiel inertiel. Oui, mais comment savoir que le référentiel de la gare est effectivement inertiel ? Heureusement, il y a un test physique simple qui permet de reconnaître très facilement un référentiel inertiel. Dans un référentiel inertiel, les objets au repos qui ne subissent aucune force (ou qui subissent des forces qui se compensent) restent au repos. Par exemple, si vous êtes dans un train et que vous posez délicatement une bille sur une table parfaitement horizontale : si la bille ne roule pas, vous êtes dans un référentiel inertiel. De la même manière, un corps (vous) placé dans un avion qui traverse des turbulences n’est plus au repos – vous êtes secoué(e) dans votre siège – et cela vous permet de savoir que l’avion dans lequel vous vous êtes assis(e) – et le référentiel qui lui est associé – n’est plus en mouvement rectiligne uniforme. Pour ne pas nous freiner dans notre élan, nous n’expliquerons pas comment on peut savoir si les 31
IL ÉTAIT TEMPS
forces qui s’exercent sur un objet se compensent. Laissons faire notre intuition, ce n’est pas difficile de s’imaginer dans un avion (un train ou une voiture) et de deviner quels mouvements seraient susceptibles de nous indisposer. En désignant un référentiel, il est possible de tomber dans le piège suivant : supposons que, dans le référentiel que vous utilisez, une voiture soit immobile jusqu’à midi puis elle se déplace vers l’est à 60 km/h entre midi et 13 heures et enfin elle revient vers l’ouest à 40 km/h après 13 heures. Le « référentiel de X » (aussi appelé le référentiel propre de X) constitue le référentiel dans lequel X est au repos. Nous voyons bien qu’il n’y a aucun référentiel inertiel dans lequel la voiture est au repos tout le long de son histoire. Si on veut parler du « référentiel inertiel lié à la voiture », on doit préciser s’il s’agit du référentiel dans lequel la voiture est au repos avant midi ou entre midi et 13 heures ou après 13 heures. Selon le moment considéré, le référentiel propre de la voiture peut désigner trois référentiels inertiels différents. Il en va de même pour le Cannonball Express qui admet un référentiel inertiel lorsqu’il passe en trombe sur des rails rectilignes à 160 km/h de New York à Chicago et un autre lorsqu’il passe dans l’autre sens à la même vitesse. Le référentiel d’un avion fouetté par des vents violents n’est à priori pas inertiel. Exactement comme celui du Cannonball qui n’est pas inertiel lorsqu’il file à vitesse constante le long d’une portion de rails curvilignes. Voici un autre piège un peu plus subtil dans lequel tombent de nombreuses personnes (y compris, je le crains, certains physiciens) : on entend parfois dire que le principe de relativité signifie que le comportement d’un objet en mouvement rectiligne uniforme ne dépend pas de sa vitesse ou autrement dit que le mouvement rectiligne uniforme n’affecte aucune des propriétés d’un objet. Cette interprétation est tout simplement fausse. Le principe de relativité affirme seulement qu’un objet ayant certaines propriétés dans un référentiel dans lequel il est au repos aura les mêmes propriétés lorsqu’il est en mouvement rectiligne uniforme, mais seulement par rapport à un référentiel qui 32
Le principe de relativité
l’accompagne le long de son mouvement. Les propriétés d’un objet en mouvement rectiligne uniforme dans un référentiel donné dépendent bien entendu de sa vitesse. Commençons par un exemple un peu trivial : un objet au repos possède une vitesse nulle tandis que sa vitesse n’est pas nulle dans un référentiel où il est en mouvement rectiligne uniforme. Vous pouvez bien sûr objecter que la vitesse n’est pas une propriété intrinsèque, mais dépend de la relation entre l’objet et le référentiel dans lequel cette vitesse est mesurée. Je vous l’accorde. Mais le piège se situe alors dans le fait que beaucoup de propriétés qui peuvent, au premier abord, apparaître comme intrinsèques à un objet sont dues, en y regardant de plus près, à la relation entre l’objet et son environnement. Nous en verrons de nombreux exemples. L’effet Doppler constitue un exemple un peu plus élaboré. Si une source de lumière jaune s’éloigne de vous à grande vitesse, la couleur perçue se décale du jaune vers le rouge alors que si la source s’approche de vous à grande vitesse, la couleur perçue vire du jaune au bleu. Ainsi, la couleur d’un objet dans un référentiel donné peut dépendre de sa vitesse ou de la direction dans laquelle il se déplace. Le principe de relativité nous garantit seulement qu’une source lumineuse perçue jaune dans un référentiel où elle est au repos sera perçue de la même couleur lorsqu’elle est en mouvement rectiligne uniforme uniquement par un observateur qui l’accompagne avec la même vitesse et selon la même direction (un observateur qui aura donc le même vecteur vitesse que la source). Nous nous intéresserons presque exclusivement aux applications pratiques du principe de relativité. Pour appliquer ce principe, il faut être capable de décrire des événements du point de vue de référentiels inertiels différents. Un bon exercice pour se familiariser avec ces changements de référentiels consiste à décrire une même série d’événements du point de vue de différents observateurs se déplaçant à des vitesses différentes dans des trains en mouvement rectiligne uniforme. Nous verrons que le principe de relativité nous livrera des résultats extraordinaires lorsqu’il sera appliqué à une même série d’événements 33
IL ÉTAIT TEMPS
décrits selon le point de vue de référentiels différents. Ce que nous allons apprendre vous semblera si surprenant et si difficile à croire que vous penserez certainement avoir fait une erreur dans l’application du principe. C’est pour cela qu’il est très important de faire ses débuts avec le principe de relativité sur des situations qui vous apprendront des choses nouvelles, mais sans vous déboussoler. Le protocole général à suivre est toujours le même : Prenez une situation qui vous pose un problème de compréhension. Trouvez un nouveau référentiel dans lequel elle est beaucoup plus facile à comprendre. Analysez-la dans ce nouveau référentiel. Transposez ensuite tout ce que vous avez compris dans le langage de l’ancien référentiel. En voici un exemple très simple. La première loi de Newton du mouvement stipule qu’un corps persévère dans son état de mouvement rectiligne uniforme tant qu’aucune force extérieure ne s’exerce sur lui. Cette loi peut être déduite du principe de relativité et d’une loi beaucoup plus simple qui stipule qu’en l’absence de toute force extérieure un corps au repos reste immobile. Pour comprendre comment une loi générale peut se déduire d’une loi plus simple, nous allons jouer le jeu et supposer que nous ne connaissons que la loi simple. Le principe de relativité nous dit qu’elle doit être vraie dans tous les référentiels inertiels. Si nous voulons savoir quel sera, en l’absence de toute force extérieure, le mouvement d’une balle lancée initialement à 15 m/s, nous devons chercher un référentiel inertiel dans lequel on peut appliquer la loi simple que nous connaissons. Ce référentiel est tout simplement celui qui se déplace à 15 m/s dans la même direction que la balle, étant donné qu’il s’agit du référentiel dans lequel la balle est au repos. Pour dire les choses concrètement, imaginez-vous dans un train qui suivrait la balle à 15 m/s le long de la direction de son mouvement, comment la balle vous apparaîtrait-elle ? Dans le référentiel du train, la balle serait au repos et nous pouvons appliquer la loi qui dit qu’en l’absence de force extérieure, un corps au repos reste immobile. Mais tout ce qui est au repos dans le référentiel du train se déplace à 15 m/s pour 34
Le principe de relativité
le référentiel dans lequel nous avons initialement posé le problème. Comme en l’absence de toute force extérieure la balle reste au repos dans le référentiel du train, alors, dans le référentiel initial, nous en déduisons qu’elle doit continuer son mouvement à 15 m/s en l’absence de force extérieure. C’est ainsi qu’en commençant avec le fait qu’un objet au repos qu’on ne perturbe pas reste au repos, nous avons exploité le principe de relativité pour établir une nouvelle loi beaucoup plus générale qui dit que si on ne perturbe pas un objet en mouvement rectiligne il persévère dans cet état (au risque de compliquer quelque chose de simple, il me semble nécessaire de signaler que dans le raisonnement précédent nous avons implicitement admis que si un objet n’est pas perturbé dans un référentiel inertiel, alors il ne l’est pas non plus dans un autre – nous avons donc admis le fait que l’absence de forces extérieures sur un objet est un invariant qui ne dépend pas du référentiel choisi. Étant donné que les forces sont associées à la présence ou non de réacteurs, de roues, de ressorts, de cordes, etc., notre hypothèse paraît raisonnable). Si vous connaissiez déjà la première loi de Newton du mouvement, il est possible que vous ne soyez pas trop impressionné par la puissance du raisonnement précédent, je vous propose d’examiner un cas qui nous apprendra des choses peut-être un peu moins familières. Supposons que nous ayons à disposition deux balles identiques parfaitement élastiques. Deux balles identiques élastiques, projetées l’une vers l’autre avec la même vitesse, ont la propriété de rebondir l’une sur l’autre en repartant chacune dans la direction initiale avec la vitesse qu’elles avaient avant la collision. Question : Qu’arrive-t-il si maintenant vous lancez une des balles vers l’autre qui est au repos ? Il existe une longue tradition en physique qui veut qu’on réponde à de telles questions en invoquant la conservation de l’énergie et de la quantité de mouvement. Si vous savez comment utiliser de telles lois de conservation, alors il vaudrait mieux les oublier pour l’instant (nous reviendrons à l’utilisation de ces lois de conservation dans le 35
IL ÉTAIT TEMPS
cadre des collisions au chapitre 11). Laissez-vous porter et vous allez voir qu’il peut être instructif et amusant de comprendre comment cette situation et beaucoup d’autres questions similaires peuvent être résolues grâce au seul principe de relativité. Répondre à de telles questions par le principe de relativité plutôt que par une application machinale des lois de conservation nous apporte une vision bien plus profonde des phénomènes. En apprenant à manier ce principe, vous allez approfondir vos représentations, ce qui sera essentiel pour comprendre tout ce qui va suivre. Pour prévoir ce qui va se passer après la collision à partir du seul principe de relativité, on représente d’abord la situation connue par un schéma : quand les deux balles sont lancées avec des vitesses identiques, elles rebondissent en repartant avec la même vitesse (voir la partie supérieure de la figure 1.1). Ensuite, on représente le schéma de la nouvelle situation (voir la partie inférieure de la figure 1.1). Pour être plus concret, j’ai fixé les vitesses initiales des balles à 10 m/s. Nous cherchons à compléter la case de la figure 1.1 dans laquelle il y a un point d’interrogation. Pour cela, nous allons imaginer que cette collision a lieu sur le quai d’une gare. La balle blanche est lancée vers la droite le long des rails avec une vitesse de 10 m/s en direction de la balle noire qui est au repos (voir aussi la partie supérieure de la figure 1.2). Pensez maintenant à la façon dont tout cela serait décrit par un observateur qui serait situé dans un train traversant la gare vers la droite à la vitesse de 5 m/s,
Avant le choc
Après le choc
Situation connue Situation inconnue Figure 1.1
36
10 m/s
?
Le principe de relativité
comme cela est illustré par la partie centrale de la figure 1.2. Étant donné qu’à chaque seconde la balle blanche parcourt 10 m de rails pendant que le train n’en parcourt que 5 m, alors à chaque seconde la balle blanche prend 5 m d’avance sur le train. On peut donc dire que dans le référentiel d’un train se déplaçant vers la droite à 5 m/s, la balle blanche se déplace vers la droite à 5 m/s. Comme la balle noire est au repos par rapport aux rails dans le référentiel du train, elle se déplace donc vers la gauche à 5 m/s, exactement comme les rails. Ainsi, la situation inconnue avant la collision (représentée sur la figure 1.2 juste au-dessus du schéma du train) est vue depuis le référentiel de ce train comme la situation parfaitement connue (représentée juste audessous du schéma du train) dans laquelle les balles sont lancées l’une vers l’autre avec la même vitesse. Le principe de relativité nous assure que toute expérience faite avec deux balles élastiques identiques nous donnera le même résultat dans tous les référentiels inertiels. Comme dans le référentiel du train les deux balles sont lancées l’une vers l’autre avec une vitesse de 5 m/s alors, dans ce même référentiel, chacune repart après le rebond à la vitesse de 5 m/s. Cette situation est représentée juste sous le schéma du train dans la figure 1.2. Avant le choc
Situation inconnue
Après le choc
10 m/s
?
5 m/s
Train
Gare
5 m/s 5 m/s
10 m/s
5 m/s
5 m/s
10 m/s
Figure 1.2
37
IL ÉTAIT TEMPS
Maintenant, il ne nous reste plus qu’à transposer dans le référentiel de départ (celui de la gare) la réponse obtenue dans le référentiel du train. Après la collision, la balle blanche se déplace vers la gauche à 5 m/s dans le référentiel du train, ainsi elle doit être au repos dans le référentiel de la gare. Après la collision, la balle noire se déplace vers la droite à 5 m/s dans le référentiel du train, elle doit donc se déplacer vers la droite à la vitesse de 10 m/s dans le référentiel de la gare. Cette situation est représentée dans la partie inférieure de la figure 1.2. Nous avons donc utilisé le principe de relativité pour apprendre des choses nouvelles sur le comportement des balles élastiques identiques : si l’une est au repos et que l’autre vient la percuter de plein fouet, alors la balle incidente s’arrête net et celle qui était au repos est éjectée avec un vecteur vitesse égal à celui de la balle incidente. Ce phénomène est connu par tous les joueurs de billard2, mais peu d’entre eux l’interprètent comme la conséquence d’un phénomène beaucoup plus évident (moins fréquemment rencontré au billard) qui veut que, lorsque deux boules entrent en collision à la même vitesse, elles repartent en sens opposés avec la même vitesse. C’est une illustration impressionnante de la puissance du principe de relativité. Il n’y a rien d’étonnant à ce que les deux balles s’approchent l’une de l’autre à la même vitesse et repartent chacune avec la même vitesse. Avec des balles identiques et suffisamment élastiques, que pouvons-nous espérer d’autre ? Par contre, l’effet est beaucoup plus spectaculaire lorsque la balle incidente s’arrête net après avoir frappé la balle au repos qui, de son côté, est soudainement projetée à la même vitesse que la balle incidente. On peut se demander comment la balle incidente s’arrange pour s’arrêter net et comment la balle au repos s’arrange pour acquérir exactement la même vitesse que celle qui est venue la frapper. Ce mystère est résolu quand vous réalisez que cette collision spectaculaire n’est en réalité
2. NDT : Et, en France, surtout par les joueurs de pétanque ! 38
Le principe de relativité
qu’une variante d’une autre collision plus banale observée depuis un référentiel en mouvement bien choisi. La figure 1.3 nous fournit un autre exemple. Prenons deux balles et fixons sur chacune une bande de velcro pour qu’elles puissent s’accrocher l’une à l’autre de telle manière que lorsqu’elles sont lancées l’une vers l’autre à la même vitesse, elles s’accrochent l’une à l’autre et l’ensemble s’immobilise juste après la collision.
Avant le choc
Après le choc
Situation connue Situation inconnue
10 m/s
?
Figure 1.3
Supposons maintenant qu’une des balles est au repos lorsqu’on lance la deuxième vers elle à 10 m/s. Avec quelle vitesse et dans quelle direction se déplacera l’ensemble des deux balles après la collision si elles restent accrochées ? Il est possible de répondre à cette question à l’aide du seul principe de relativité, en observant la balle blanche incidente et la balle noire au repos depuis le référentiel d’un train dans lequel les deux balles se déplacent avec la même vitesse, mais en sens opposés, comme le montre la figure 1.4. Comme dans l’exemple précédent, un tel train se déplace vers la droite le long de la direction de la balle blanche à 5 m/s. Dans le référentiel du train, la situation avant la collision est celle dont nous connaissons l’issue : les balles s’approchent l’une de l’autre avec la même vitesse. Par conséquent, dans le référentiel du train, nous savons qu’après la collision, l’assemblage des deux balles se retrouvera au repos. Mais comme le train se déplace le long des rails à la vitesse de 5 m/s et que l’ensemble des balles est au repos dans le 39
IL ÉTAIT TEMPS
référentiel du train, dans le référentiel des rails il va se déplacer le long des rails à 5 m/s (la même vitesse que celle du train le long des rails). Avant le choc
Gare
10 m/s
Après le choc ?
5 m/s
Train
Gare
5 m/s 5 m/s
10 m/s
5 m/s
Figure 1.4
Ce qui résout notre problème : quand la balle incidente frappe celle qui est au repos, l’assemblage qui résulte de la collision se déplace avec une vitesse égale à la moitié de celle de la balle incidente. Un troisième exemple est donné sur la figure 1.5. Cet exemple est particulièrement intéressant, car il n’est pas évident à résoudre en appliquant la loi de conservation de la quantité de mouvement, mais par contre il peut être facilement résolu en utilisant le principe de relativité. Imaginez que vous possédez deux balles élastiques, l’une des deux est très grosse et l’autre est au contraire très petite. Si la grosse balle est initialement au repos et que la petite est lancée vers elle, la petite balle rebondit simplement contre la grosse et repart dans la direction opposée avec la même vitesse tandis que la grosse balle reste au repos (pensez à ce qui peut se passer si une balle de ping-pong entre en collision avec une balle de bowling). Quel sera le mouvement de chaque balle après la collision si la petite balle est initialement au repos et si la grosse balle est lancée vers elle avec une vitesse de 10 m/s ? 40
Le principe de relativité
Avant le choc
Après le choc
Situation connue 10 m/s
Situation inconnue
?
Figure 1.5
Pour appliquer le principe de relativité, il faut se placer dans un référentiel où la grosse balle est au repos, il faut donc observer la collision dans le référentiel d’un train qui suivrait la grosse balle dans son mouvement à 10 m/s vers la gauche, comme le montre la figure 1.6. Dans ce référentiel, la petite balle se déplace initialement à 10 m/s vers la droite, nous savons donc ce qui va se passer après la collision : dans le référentiel du train, nous savons qu’après la collision, la grosse balle reste au repos et que la petite balle se déplace à la vitesse de 10 m/s vers la gauche. Pour revenir à la description des événements dans le référentiel de la gare, il faut noter qu’après la collision, la Avant le choc
Après le choc
10 m/s
Gare
?
10 m/s
Train
Gare
10 m/s
10 m/s
10 m/s
10 m/s
Figure 1.6
41
IL ÉTAIT TEMPS
grosse balle se déplace avec le train à 10 m/s vers la gauche. La petite balle se déplace à la vitesse de 20 m/s vers la gauche, car chaque seconde elle gagne 10 m par rapport au train qui se déplace lui-même de 10 m vers la gauche. Donc si la petite balle est initialement au repos, alors, après la collision avec la grosse balle, elle se déplacera à une vitesse double de la grosse. Il y a un autre cas intéressant à analyser, il est présenté sur la figure 1.7. Que va-t-il arriver si la grosse et la petite balle s’approchent l’une de l’autre avec la même vitesse, disons 5 m/s ? Dans ce cas, le référentiel dans lequel nous connaissons la réponse est associé à un train qui se déplacerait avec la grosse balle vers la gauche à 5 m/s, ainsi la petite balle se déplace vers la droite à 10 m/s dans le référentiel du train. Après la collision, la grosse balle reste au repos dans le référentiel du train tandis que la petite balle se déplace vers la gauche à 10 m/s. Il est facile de transposer ce résultat dans le référentiel de la gare : après la collision, la petite balle se déplacera vers la gauche à 15 m/s avec une vitesse qui est le triple de sa vitesse initiale tandis que la grosse balle poursuivra sa route en conservant sa vitesse de 5 m/s. Notons en passant qu’on peut observer une démonstration spectaculaire de ce qui vient d’être dit en plaçant une petite balle, par exemple une balle de tennis, au sommet d’un gros ballon, par exemple un ballon de basket, en lâchant le tout sur une surface dure, tout en faisant bien attention à ce que la petite balle ne roule pas sur le sommet de la grosse. Quand la grosse balle rebondit sur le sol, son mouvement change de direction sans changer de vitesse et ainsi, pendant un très court instant, le ballon se déplace vers le haut et la balle vers le bas tous deux à la même vitesse. Immédiatement après cela, la petite balle se retrouve projetée vers le haut à une vitesse triple de sa vitesse initiale. La hauteur maximale atteinte par une balle se déplaçant vers le haut est proportionnelle au carré de sa vitesse initiale, ainsi si les pertes énergétiques dues aux divers frottements sont négligeables, la petite balle peut remonter à une hauteur égale à environ neuf fois la hauteur depuis laquelle elle a initialement été lâchée ! 42
Le principe de relativité
Avant le choc
Gare
Après le choc
5 m/s 5 m/s
?
5 m/s
Train
Gare
10 m/s
10 m/s
5 m/s 5 m/s
15 m/s
5 m/s
Figure 1.7
Cette expérience peut nous procurer l’agréable sensation d’assister à un bon tour de magie. Et le plaisir de deviner l’astuce sur laquelle repose le tour de magie (la figure 1.7 en donne l’explication) en est décuplé lorsqu’on prend conscience de sa simplicité. J’espère que ces exemples vous donneront une idée de comment le principe de relativité est réellement utilisé et de son pouvoir de prédiction sur le comportement d’objets placés dans des situations inconnues. Avant de commencer à l’appliquer dans des situations vraiment étranges, nous devons d’abord analyser en détail le raisonnement que nous venons d’utiliser dans ces exemples simples.
43
2 Combiner des (petites) vitesses
Dans le chapitre 1, nous avons découvert toute la puissance du principe de relativité. Il nous a permis de prévoir l’issue de certaines collisions problématiques en nous appuyant sur le déroulement d’autres collisions dont l’issue est évidente. En plus du principe de relativité, nous avons aussi fait appel à une règle implicite qui relie la vitesse d’une balle dans le référentiel du train à sa vitesse dans le référentiel de la gare. Ce court chapitre sera l’occasion de formuler cette loi de manière explicite. Ne m’en voulez pas si je m’attarde sur une loi qui, comme je l’espère, vous paraît évidente et sans aucun intérêt. Si je consacre un chapitre entier à une loi qui peut être considérée comme une fastidieuse et plate évidence, c’est, qu’en réalité, elle n’est pas tout à fait exacte. Le niveau de précision de cette loi est extrêmement élevé quand toutes les vitesses mises en jeu ne dépassent pas quelques milliers de mètres par seconde, mais lorsqu’elles s’élèvent à quelques millions de mètres par seconde, nous devrons, à notre grande surprise, nous résigner à la modifier. 45
IL ÉTAIT TEMPS
La règle que nous avons utilisée sans la nommer dans le premier chapitre est communément appelée loi de composition non relativiste des vitesses. Le terme « non relativiste » est très mal choisi, mais comme tout le monde l’utilise, nous sommes condamnés à le faire aussi. Il ne signifie pas, comme on pourrait malheureusement le penser, « en contradiction avec le principe de relativité ». Il provient du fait que la théorie construite pour appliquer le principe de relativité à certains phénomènes exotiques impliquant des mouvements à très grande vitesse a fini par porter le nom de théorie de la relativité. Par conséquent, le terme « non relativiste » se réfère à une vision du monde qui précède la découverte de la théorie de la relativité. Vu que pour des vitesses faibles les choses se comportent presque exactement comme nous pensions qu’elles le faisaient avant la découverte de la théorie de la relativité, « non relativiste » signifie « valable avec une grande précision lorsque toutes les vitesses sont suffisamment petites ». Qu’entend-on par suffisamment petites ? Cette question sera traitée dans les prochains chapitres, mais on peut d’ores et déjà préciser que même la vitesse d’une balle de revolver (environ 1 000 m/s) peut être considérée comme très petite. Avant d’énoncer la loi de composition non relativiste des vitesses, nous devons décider d’une convention de signe (positif ou négatif) pour les vitesses. Dans presque toutes les situations que nous envisagerons, les objets ne pourront se déplacer que le long d’une seule direction (et ce sera très souvent le long de rails rectilignes). Le mouvement sur des rails peut se faire dans deux sens différents, nous avons donc besoin d’un moyen simple pour les distinguer. Prenons des rails de direction est-ouest et attribuons arbitrairement un signe positif à la vitesse de tout mouvement vers l’est et un signe négatif à la vitesse de tout mouvement vers l’ouest. Par conséquent, le mouvement d’une balle vers l’ouest à 5 m/s correspond selon notre convention à une vitesse de − 5 m/s (on dit aussi que la coordonnée de la vitesse est − 5 m/s). Ces manipulations de signes présentent certaines subtilités qu’il est préférable de signaler dès le départ. Une vitesse est toujours 46
Combiner des (petites) vitesses
définie par rapport à un référentiel. Imaginons qu’un train se déplace vers l’est à 10 m/s et qu’une balle soit lancée vers l’arrière du train à 3 m/s alors, dans le référentiel des rails (qui est aussi celui de la gare), la balle se déplace vers l’est à seulement 7 m/s. Dans le référentiel des rails, la vitesse de la balle est + 7 m/s vu qu’elle se déplace vers l’est. Mais dans le référentiel du train, la balle se déplace vers l’arrière de celui-ci, c’est-à-dire vers l’ouest. Donc sa vitesse dans le référentiel du train est égale à − 3 m/s. Il ne faut pas perdre de vue que dans le train « vers l’ouest » signifie « vers l’extrémité du train tournée vers l’ouest ». Vers l’ouest représente un sens et non pas un lieu. Si le train se déplace de la Californie vers New York, la balle s’éloigne à chaque instant de la Californie même si elle a été lancée vers l’extrémité ouest du train. Tout cela, bien sûr, parce que le train s’éloigne de la Californie avec une vitesse plus grande que celle avec laquelle la balle a été lancée vers l’ouest (dans le référentiel du train). Dans les schémas qui illustreront les événements ayant lieu le long des rails, nous supposerons que les rails sont plus ou moins horizontaux et nous placerons, comme les géographes le font sur les cartes, l’ouest à gauche et l’est à droite. Nous sommes sur le point d’énoncer la règle « évidente » qui permet de transformer une vitesse du référentiel du train en une vitesse du référentiel de la gare (et réciproquement), mais avant cela, sans vouloir pinailler, il me semble nécessaire d’ajouter une dernière précision. Supposons que X soit un objet (une balle par exemple) en mouvement rectiligne uniforme le long des rails. Il existe un référentiel dans lequel la vitesse de X est nulle (dans lequel X est au repos). Ce référentiel est, évidemment, celui qui est lié à un train qui se déplace sur les rails à la même vitesse que X. Comme nous l’avons remarqué au chapitre précédent, ce référentiel est le référentiel propre de X. L’appellation « propre » ne doit pas faire penser que ce référentiel particulier possède quelque chose de vertueux. C’est juste que chaque objet en mouvement rectiligne uniforme peut être associé 47
IL ÉTAIT TEMPS
naturellement à un unique référentiel inertiel – celui dans lequel il est immobile (l’immobilité doit être vue comme étant un cas particulier de mouvement, mais avec une vitesse nulle). Le plus souvent, le caractère « propre » reste implicite : on se contente, par exemple, de dire « le référentiel de la balle ». Si un objet a un mouvement autre que rectiligne uniforme dans un référentiel inertiel, alors il n’existe aucun référentiel inertiel dans lequel l’objet est au repos à chaque instant ; si un objet a un mouvement autre que rectiligne uniforme dans un référentiel inertiel, alors le référentiel dans lequel cet objet est au repos est forcément non inertiel. Si Y est un second objet en mouvement rectiligne uniforme le long des rails à une vitesse différente de X, alors nous pouvons, si nous le souhaitons, décrire le mouvement de Y dans le référentiel propre de X, en notant vY/X la vitesse de Y dans le référentiel de X. La notation vY/X signifie « la vitesse de Y par rapport à X ». X et Y peuvent être soit un objet, soit un référentiel – le référentiel propre de l’objet –, étant donné que l’objet et le référentiel associé se déplacentà la même vitesse. Nous pouvons maintenant énoncer la loi de composition non relativiste des vitesses dans toute son abstraite splendeur. Si X, Y et Z se déplacenttous en mouvement rectiligne uniforme le long de la même ligne droite alors :
vX/Z = vX/Y + vY/Z (2.1)
Autrement dit, pour obtenir la vitesse de X par rapport à Z, il faut ajouter la vitesse de X par rapport à Y à la vitesse de Y par rapport à Z. Ou, si vous préférez, la vitesse de X dans le référentiel de Z s’obtient en ajoutant la vitesse de X dans le référentiel Y à la vitesse du référentiel Y par rapport à celui de Z. Supposons par exemple que X soit une balle, Y un train et Z la gare (ou les rails). Alors (2.1) nous dit que la vitesse de la balle dans le référentiel de la gare est égale à la vitesse de la balle dans le référentiel du train à laquelle il faut ajouter la vitesse du train dans le référentiel de la gare. Ceci est évident quand toutes les 48
Combiner des (petites) vitesses
vitesses sont positives. Si la balle est lancée à 5 m/s vers l’est dans le référentiel du train et que le train roule à 10 m/s vers l’est dans le référentiel de la gare, alors la balle se déplace à 15 m/s (5 m/s + 10 m/s) vers l’est pour un observateur assis sur le quai de gare. Cette relation fonctionne également pour des vitesses négatives. Imaginons que la balle soit lancée vers l’arrière du train à la vitesse de 3 m/s, ainsi sa vitesse vX/Y dans le référentiel du train est égale à − 3 m/s et par conséquent, sa vitesse dans le référentiel de la gare est égale à + 7 m/s (− 3 m/s + 10 m/s) : elle se déplace vers l’est à 7 m/s. Si maintenant la balle est lancée vers l’arrière du train à la vitesse de 16 m/s, alors sa vitesse par rapport à la gare est égale à − 6 m/s (− 16 m/s + 10 m/s) ce qui fait que dans le référentiel de la gare, la balle se déplace vers l’ouest (donc dans le sens opposé à celui du train) à la vitesse de 6 m/s. Habituellement, on arrive à traiter facilement ces questions sans s’appuyer sur la forme abstraite (2.1) de la loi de composition. On dirait une de ces formules qu’on écrit juste pour le plaisir d’avoir une formule, comme un inutile étalage d’érudition. Cependant, nous allons bientôt montrer que la loi de composition (2.1) n’est pas tout à fait exacte, elle donne des résultats extrêmement précis seulement lorsque les vitesses mises en jeu ne sont pas trop grandes. Si les objets étudiés possèdent des vitesses trop élevées ou si, tout simplement, on cherche à obtenir un résultat d’une précision extraordinaire, alors il faut modifier la relation (2.1). Et là, nous n’aurons pas d’autre choix que celui de se laisser guider par une formule (la loi de composition (2.1) modifiée), vu que notre bon sens ne pourra plus nous fournir la bonne réponse. C’est pourquoi il est important de bien savoir utiliser la loi de composition non relativiste (2.1), même si le résultat qu’elle fournit est « évident ». Une conséquence importante de (2.1) – valable quelles que soient les valeurs des vitesses – est que :
vX/Y = – vY/X (2.2)
49
IL ÉTAIT TEMPS
Si X se déplace avec une certaine vitesse par rapport à Y, alors Y se déplace avec la même vitesse par rapport à X, mais en sens opposé. Cette relation (parfaitement évidente) peut être déduite directement de la loi générale (2.1). Si on considère le cas particulier où Z est immobile par rapport à X (par exemple si Z est la gare et X les rails), dans ce cas vX/Z = 0 et vY/Z = vY/X et (2.1) prend alors la forme suivante :
0 = vX/Y + vY/X (2.3)
Ce qui démontre immédiatement (2.2). Comment pourrait-on faire comprendre la relation (2.1) à une personne têtue qui ne la trouverait pas évidente ? Considérons cet exemple : soit un train se déplaçant vers l’est dans le référentiel des rails. Si une balle est lancée vers l’est dans le référentiel du train à 5 m/s, alors en 1 seconde la balle avance de 5 m vers l’avant du train. Et si le train se déplace à 10 m/s dans le référentiel des rails, alors en 1 seconde le train avance de 10 m vers l’est le long des rails. C’est ainsi que chaque seconde la balle avance de 15 m vers l’est le long des rails (les 5 qu’elle gagne par rapport au train additionnés aux 10 supplémentaires que le train gagne lui-même par rapport aux rails). Dire qu’une balle avance chaque seconde de 15 m vers l’est le long des rails revient à dire qu’elle se déplace à la vitesse de 15 m/s dans le référentiel des rails. Qui pourrait en douter ? À ce stade, je vous encourage à croire au bien-fondé de cette loi. Il faut, avant d’envisager ce qui suit, que les questions traitées dans ce chapitre et dans le précédent vous apparaissent comme des banalités affligeantes. Mais j’attire votre attention sur l’innocence apparente de l’expression « en 1 seconde » qui s’avère être, de façon étonnante, un vrai champ de mines. Nous avons fait l’hypothèse implicite que l’expression « en 1 seconde » signifie la même chose dans le référentiel du train et dans celui des rails. « Bien sûr que c’est la même chose », me direz-vous, « Une seconde est une seconde. Mon temps est le même que le tien. » Mais supposez un seul instant que cela 50
Combiner des (petites) vitesses
ne soit pas vrai. Supposez qu’« en 1 seconde » dans le référentiel du train signifie quelque chose de différent de « en 1 seconde » dans le référentiel des rails. Qu’advient-il du raisonnement que nous venons de faire ? Il va falloir que nous remplacions « en 1 seconde » par quelque chose du genre « en 1 seconde selon le temps du train » ou « en 1 seconde selon le temps des rails ». Le raisonnement précédent sera presque identique, juste un peu plus alambiqué : Si la balle se déplace vers l’est dans le référentiel du train à 5 m/s, alors en 1 seconde selon le temps du train elle avance de 5 m vers l’avant du train. Et si le train se déplace à 10 m/s dans le référentiel des rails, alors en 1 seconde selon le temps des rails il avance de 10 m vers l’est le long des rails. Mais lorsqu’on en arrive à : C’est ainsi qu’en 1 seconde la balle avance de 15 m vers l’est le long des rails, les 5 qu’elle gagne par rapport au train additionnés aux 10 supplémentaires que le train gagne par rapport aux rails. Que signifie l’expression « en 1 seconde » précédemment en italique ? Les 5 premiers mètres sont gagnés en 1 seconde selon le temps du train et les 10 mètres suivants sont gagnés en 1 seconde selon le temps des rails. Réunir ces deux distances parcourues « en 1 seconde » n’a de sens que si le temps des rails est le même que le temps du train. Nous laisserons là ce raisonnement – en tout cas pour le moment. Mais prenez bien conscience que la règle simple (2.1), qui nous dit comment les vitesses se combinent, s’appuie sur l’hypothèse implicite de l’existence d’un temps absolu valable pour tous et transposable d’un référentiel à l’autre. Einstein a fait preuve en 1905 d’une immense perspicacité en comprenant que cette hypothèse apparemment évidente est en fait fausse. « Il me vint à l’esprit que le temps était suspect », confia-t-il à un collègue plusieurs années plus tard. Et quand l’hypothèse d’un temps unique, indépendant du référentiel, s’écroule, les autres hypothèses « évidentes » les suivent dans la débâcle. 51
IL ÉTAIT TEMPS
Cette imperfection est si minime que son effet est quasiment imperceptible quand les vitesses mises en jeu sont petites comparées à celle de la lumière (comme dans les exemples du chapitre 1). Il est temps maintenant de voir comment la vitesse de la lumière est mêlée à cette histoire.
52
3 La vitesse de la lumière
Quand on allume une lampe, combien de temps met la lumière pour aller de la lampe aux objets qu’elle éclaire ? Galilée a apparemment essayé de répondre à cette question en plaçant deux personnes avec des lanternes sur le sommet de deux montagnes éloignées d’une grande distance D. Alice allume sa lanterne, Bob allume la sienne à l’instant même où il voit celle d’Alice s’allumer et Alice note le temps T qui s’est écoulé entre le moment où elle a allumé la sienne et le moment où la lumière de la lanterne de Bob lui parvient. Pour obtenir la vitesse c avec laquelle la lumière fait l’aller-retour entre les deux sommets, il suffira à Alice de diviser le double de la distance entre les deux sommets par la durée T du trajet :
c=
2D (3.1) T
Je ne sais pas si Galilée s’en est rendu compte, mais il y a un problème dans ce protocole : seule une part de la durée mesurée correspond réellement au temps mis par la lumière pour effectuer 53
IL ÉTAIT TEMPS
l’aller-retour entre Alice et Bob. L’autre part est due au temps de réaction de Bob, la lumière provenant de la lanterne d’Alice doit se transformer en influx nerveux et atteindre le cerveau de Bob, cette information doit être traitée et convertie en un ordre envoyé vers les muscles du bras et de la main pour finalement provoquer l’ouverture du rideau qui cachait la lanterne de Bob. Il y a une façon simple et astucieuse de résoudre ce problème. Il faut faire l’expérience une deuxième fois en plaçant Bob au sommet d’une troisième montagne alignée avec les deux autres et encore plus éloignée d’Alice. Si la lumière provenant de la lanterne d’Alice n’est pas trop affaiblie par l’éloignement, le temps de réponse de Bob reste le même et ainsi Alice peut attribuer l’accroissement de la durée mesurée au temps supplémentaire nécessaire pour que la lumière effectue l’aller-retour entre les deux sommets occupés par Bob. Comme ce temps supplémentaire n’est que le double de la distance supplémentaire divisée par la vitesse de la lumière, Alice est donc en mesure de déterminer la vitesse de la lumière sans avoir à faire la moindre hypothèse sur le temps de réponse de Bob. Il lui suffit d’utiliser la relation (3.1) où D sera la distance entre les deux positions de Bob et T l’accroissement de la durée d’une expérience à l’autre. Mais malheureusement, ce procédé ne permettra pas à Alice de constater le moindre accroissement de durée entre les deux expériences. Soit parce que la lumière parcourt la distance entre les deux sommets de Bob de façon instantanée – ce qui voudrait donc dire que la vitesse de la lumière est infinie –, soit parce que le temps de réponse de Bob est beaucoup plus grand que la durée réelle du parcours de la lumière, ce qui fait qu’Alice ne peut pas percevoir de différence entre les deux expériences. Et effectivement, comme la lumière se propage très rapidement et les temps de réponse humains sont comparativement très lents, il est impossible de trouver deux montagnes terrestres suffisamment éloignées pour que cette méthode donne un résultat correct. Trois siècles plus tard, la tentative infructueuse de Galilée a été menée à bien en remplaçant deux montagnes par la Terre et la Lune. 54
La vitesse de la lumière
La Lune est si éloignée qu’une onde radar met plus de 2 secondes à revenir sur Terre après s’être réfléchie sur sa surface. Mais entretemps, la vitesse de la lumière a été déterminée avec une grande précision par d’autres méthodes. Notons, au passage, que la vitesse de l’onde radar est la même que celle de la lumière, car toutes les deux appartiennent à la famille des ondes électromagnétiques (lumière, ondes radar, ondes radio, rayons X, rayons gamma, signaux hertziens, etc.) qui ont toutes la même vitesse dans le vide. La lumière se propage si rapidement que pour mesurer sa vitesse vous devez soit la laisser se propager sur une très grande distance, soit mesurer avec une précision extrême de très petits intervalles de temps. La toute première estimation réussie de la vitesse de la lumière a utilisé des distances astronomiques. Galilée, qui a joué un grand rôle dans l’histoire de la relativité, a découvert les quatre principales lunes de Jupiter au début du xviie siècle. En 1676, les relevés scrupuleux effectués par Ole Rømer des moments où chaque lune disparaît dans le cône d’ombre de Jupiter, révèlent que parfois les éclipses des lunes joviennes retardent d’environ 10 minutes sur leur horaire habituel et que d’autres fois elles ont lieu environ 10 minutes en avance. On remarqua que les éclipses avaient lieu en avance quand la Terre était plus proche de Jupiter et en retard quand la Terre était au contraire plus éloignée. On en conclut que la lumière met une vingtaine de minutes pour traverser le diamètre de l’orbite de la Terre. Ce qui donna une estimation de la vitesse de la lumière de quelques centaines de milliers de kilomètres par seconde. En 1849, Hippolyte Louis Fizeau réussit à faire une mesure sur Terre en mettant au point un procédé lui permettant de mesurer de très petits intervalles de temps. Imaginez deux roues crantées parfaitement identiques placées symétriquement à chaque extrémité d’un axe de façon à ce qu’un fin pinceau de lumière puisse traverser l’espace entre les deux crans d’une roue pour se propager le long de l’axe et enfin ressortir à travers l’espace correspondant de l’autre roue. Si, à présent, on imagine que tout ce système tourne très rapidement 55
IL ÉTAIT TEMPS
autour de son axe, on peut espérer que, pendant le temps de propagation (très court) de la lumière entre les deux roues, la deuxième roue aura suffisamment tourné pour que l’espace et le cran suivant se soient décalés de façon à bloquer au moins un peu de la lumière ayant traversé l’espace correspondant de la première roue. Vu que les roues tournent extrêmement rapidement, il se peut que les crans de la deuxième roue aient le temps de se décaler d’un angle très petit, mais suffisant pour bloquer un peu de lumière incidente. Il se trouve que pour un axe suffisamment court pour éviter qu’il ne se déforme sous les contraintes mécaniques et que la coïncidence entre les crans ne soit perturbée, la lumière se déplace encore beaucoup trop vite pour que ce système fonctionne avec une fréquence de rotation réalisable. Pour contrecarrer ce problème, il est possible, avec l’aide de quatre miroirs, d’obliger la lumière à suivre un long détour avant de ressortir par la deuxième roue. Une fois ce détour imposé – quelques kilomètres dans l’expérience de Fizeau –, on a pu enfin observer le phénomène attendu et le résultat était en adéquation avec l’estimation obtenue presque deux siècles plus tôt grâce aux mesures astronomiques de Rømer. Aujourd’hui, nous disposons de nombreuses méthodes très sophistiquées pour mesurer la vitesse de la lumière et nous savons maintenant qu’elle vaut précisément 299 792 458 mètres/seconde (m/s). Ajoutons qu’il ne sera pas possible d’obtenir plus de précision que cela, car depuis 1983 le mètre n’est plus défini comme la distance entre deux traits sur une barre de platinium-iridium conservée à Paris avec amour, mais comme la distance que la lumière parcourt en une durée de 1/299 792 458 seconde. Notre unité de longueur (le mètre) est maintenant liée à notre unité de temps (la seconde). Vous pensez peut-être que, vu que la vitesse de la lumière est maintenant fixée pour toujours par la définition du mètre, cela signifie qu’il n’y a plus aucune raison d’essayer de la mesurer de plus en plus précisément. Mais il ne faut pas oublier que de telles expériences nous procurent à présent des mesures de la longueur du mètre de plus en plus précises 56
La vitesse de la lumière
(ce qui permet d’affiner les normes de longueur). Ces expériences restent donc aussi utiles que par le passé. Ce qui a changé, c’est notre façon d’interpréter leurs résultats. Une vitesse de la lumière égale à 299 792 458 m/s entraîne deux coïncidences numériques plutôt utiles : Premièrement, ce nombre est extrêmement proche de 300 millions de mètres/seconde ou 300 000 kilomètres/seconde (km/s). Les physiciens ont pris l’habitude d’utiliser la valeur de 3.108 m/s. Il existe une légende qui dit que quelqu’un est allé jusqu’à falsifier le rapport d’une expérience de très haute précision en remplaçant 2,998 par 3 pour que le résultat soit plus pratique. Deuxièmement, en unité anglaise, la vitesse de la lumière est environ égale à 186 000 miles/seconde. Comme il y a 5 280 pieds dans 1 mile, c’est une bonne nouvelle pour tous ceux qui, à Washington et dans d’autres avant-postes ailleurs dans le monde, résistent encore au système métrique, puisqu’on obtient pour la vitesse de la lumière une valeur environ égale à 982 millions de pieds/seconde. Donc, à 2 % près, la vitesse de la lumière vaut 1 milliard de pieds par seconde ou sous une forme plus pratique, 1 pied par nanoseconde (1 nanoseconde est égale 1 milliardième de seconde). Le pied par nanoseconde (pi/ns) s’avère être une unité parfaitement adaptée lorsqu’on travaille sur la question de la taille optimale qu’un ordinateur doit avoir pour fonctionner à très grande vitesse. Les opérations de calcul se font maintenant en moins de 1 microseconde (1 millionième de seconde), et la limite de la nanoseconde est déjà en ligne de mire et par conséquent, si on veut échanger des informations avec une autre partie de l’ordinateur avant d’effectuer la prochaine opération, il vaut mieux qu’elle ne soit pas distante de plus de la moitié de 1 pied, étant donné que – comme nous le verrons – aucune information ne peut être transmise plus vite que la vitesse de la lumière. Les nanosecondes et les pieds sont également adaptés lorsqu’on s’intéresse à la précision du système GPS (Global Positioning System) qui utilise des signaux émis par les satellites toutes les nanosecondes, ces signaux sont par 57
IL ÉTAIT TEMPS
conséquent espacés de 1 pied quand ils arrivent à la surface de la Terre, ce qui fait du pied une parfaite mesure de la précision de ce système. Quand il faut résoudre des problèmes en relativité, il est très commode d’utiliser un système d’unités qui attribue des valeurs simples à la vitesse de la lumière. En 1959, le pied a officiellement été défini comme mesurant exactement 0,304 8 m. Étant donné que la vitesse de la lumière est exactement 299 792 458 m/s, si seulement les gens en 1959 avaient décidé que le pied était égal à 0,299 792 458 m, juste 1,64 % plus court, alors la vitesse de la lumière aurait été exactement égale à 1 pi/ns. Cette unité de longueur nous aurait été si précieuse que je prends l’initiative de redéfinir le pied : Désormais, nous appellerons pied la distance parcourue par la lumière en 1 nanoseconde. Un pied correspond, si vous préférez, à 1 nanoseconde de lumière (et encore mieux, 1 nanoseconde peut être vue comme 1 pied de lumière). Nous pourrons toujours revenir à l’appellation plus encombrante de « nanosecondes de lumière » chaque fois qu’il sera nécessaire de distinguer notre pied du pied usuel, très légèrement plus long. Si vous vous offusquez à l’idée que l’on puisse redéfinir le pied (comme l’a été un expert de l’American Journal of Physics à qui j’avais proposé un article en ce sens), il vous suffira de convenir que 1 pié a pour longueur 0,299 792 458 m et de penser « pié » chaque fois que vous lisez « pied ». Pour comparer la vitesse de la lumière avec des vitesses plus petites, il peut être plus pratique de convertir 1 pied par nanoseconde en 1 000 pieds par microseconde. Comme la vitesse du son dans l’air est environ égale à 1 000 pieds par seconde et que 1 microseconde correspond à 1 millionième de seconde, cela montre que la lumière se propage environ 1 million de fois plus vite que le son. Il y a quelque chose de singulier et même, quand on y réfléchit bien, de presque extraordinaire dans l’affirmation que la vitesse de la lumière dans le vide est égale à 299 792 458 m/s. En général, quand on annonce une vitesse, et a fortiori avec une aussi grande précision, 58
La vitesse de la lumière
la question « par rapport à quoi » se pose obligatoirement. Nous savons bien que la vitesse d’un objet dépend du référentiel dans lequel elle est mesurée. Comme nous l’avons fait remarquer à plusieurs reprises, une balle lancée par Alice dans un train en mouvement à vitesse constante possède une vitesse par rapport au train, mais aussi une vitesse par rapport aux rails. Dans le cas de la lumière, on pourrait avancer deux réponses évidentes à la question « par rapport à quoi ? » : Première réponse évidente La vitesse de la lumière est égale à 299 792 458 m/s par rapport à la source qui produit cette lumière. Quand on allume une lampe de poche, la lumière est produite à une vitesse de 299 792 458 m/s par rapport à la lampe. Comment pourrait-il en être autrement ? De façon similaire, quand on précise la vitesse d’une balle de revolver, on suppose qu’il s’agit de la vitesse par rapport au canon de l’arme qui l’a tirée. Cette réponse qui semble pleine de bon sens est contredite par les conceptions actuelles concernant la nature électromagnétique de la lumière. Au xixe siècle, il y eut une grande unification des lois de l’électricité et du magnétisme accomplie par le physicien écossais James Clerk Maxwell. Les équations de Maxwell prédisent que l’oscillation d’une particule chargée électriquement (par exemple un électron dans un fil métallique chauffé) s’accompagne d’une émission d’énergie radiative qui se propage dans le vide à une vitesse d’environ 300 000 000 m/s. Cette valeur n’a évidemment pas été considérée comme une coïncidence, la lumière a été vue comme un cas particulier des radiations émises par la vibration de particules chargées (à des fréquences allant jusqu’à des millions de milliards de fois par seconde). Les équations de Maxwell affirment sans ambiguïté que la vitesse de propagation de l’énergie radiative ne dépend pas de la vitesse de la source émettrice. Selon cette théorie, la vitesse de la lumière ne dépend pas du mouvement de l’échantillon de matière à l’intérieur duquel les particules oscillent : sa vitesse reste la même, 59
IL ÉTAIT TEMPS
que l’échantillon soit immobile, qu’il avance dans la direction de la lumière émise ou qu’il se déplace dans le sens opposé. Des mesures ont également démontré que la régularité de certains mouvements astronomiques observés depuis la Terre n’est pas du tout affectée par l’éloignement ou le rapprochement de la source de lumière qui nous permet de les observer en les éclairant. Si la lumière se propageait jusqu’à nous plus doucement lorsque la source éclairante s’éloigne de nous, et plus vite lorsqu’elle s’approche de nous, alors nous pourrions détecter ces irrégularités, or ce n’est pas le cas. Il y a donc à la fois des preuves théoriques et astronomiques pour dire que la vitesse de la lumière ne dépend pas de la vitesse de la source émettrice. Deuxième réponse évidente Par rapport à un milieu luminifère, historiquement appelé l’éther, j’insiste sur le fait que 299 792 458 m/s est la vitesse de la lumière dans le vide. La lumière se déplace bien plus lentement dans les milieux transparents comme l’eau ou le verre, mais à peine plus doucement dans l’air. Cet éther serait alors une espèce de résidu irréductible de ce qui resterait une fois qu’on a retiré tout ce qu’il est possible d’enlever dans un espace donné. Dans ce cas, on ne fait pas l’analogie avec une balle émise par le canon d’un fusil, mais avec le son, qui est une onde se propageant dans l’air. Comme la vitesse de la lumière, la vitesse du son ne dépend pas de la vitesse de la source qui émet ce son. Le son se propage à une vitesse bien définie par rapport à l’air dont les vibrations constituent et transmettent ce son. Si la lumière est issue de la vibration d’un milieu qu’on appelle « éther », alors la vitesse de la lumière doit rester fixe par rapport à cet éther. Comme la course de la Terre autour du Soleil s’effectue à 30 km/s dans différentes directions en fonction de l’époque de l’année et que le Soleil se déplace très rapidement autour du centre de notre galaxie, ce serait une coïncidence extraordinaire si la Terre était au repos dans le référentiel de l’éther. On peut alors s’attendre à ce qu’il existe une 60
La vitesse de la lumière
sorte de vent d’éther soufflant autour de la Terre, ce qui conduirait à une influence de la direction de ce vent sur la vitesse de la lumière mesurée sur Terre. La vitesse de la lumière se propageant contre le vent d’éther devrait donc être plus petite que celle de la lumière qui se propage dans le sens du vent d’éther. Tous les efforts pour détecter une telle différence sont restés vains, le plus célèbre étant l’expérience menée par Michelson et Morley en 1887, dont il a fallu accepter le résultat sans équivoque. Les mesures démontrèrent que si la vitesse de la lumière était définie par rapport à l’éther, alors la Terre, malgré son mouvement complexe par rapport à la galaxie, était, contre toute attente, au repos dans le référentiel lié à l’éther au moment de l’expérience. Certaines personnes se sont même entêtées à considérer la possibilité que la Terre puisse entraîner l’éther avec elle dans son sillage. Si c’était le cas, alors les positions apparentes des étoiles dans le ciel apparaîtraient décalées suivant les époques de l’année en fonction de la manière avec laquelle la Terre entraîne l’éther. Un tel décalage ne fut jamais observé. L’importance de l’expérience de Michelson et Morley dans le développement historique de la relativité a été très débattue. Einstein en parle dans son fameux article de 1905 qui expose la théorie de la relativité, mais sous la forme d’une simple allusion et seulement en passant : « Des exemples du même genre, ainsi que les expériences entreprises pour démontrer le mouvement de la Terre par rapport à l’éther luminifère et dont les résultats furent négatifs, font naître la conjecture que... » (c’est moi qui ai mis certains mots en italique). Mais la référence est claire et ces tentatives ne pouvaient pas être passées sous silence parce que si elles avaient réussi à démontrer sans ambiguïté des changements de la vitesse de la lumière sur Terre, alors la théorie de la relativité aurait été tuée dans l’œuf. Les « exemples du même genre » qu’Einstein avance pour justifier son réexamen de la nature du temps sont des exemples où le comportement électrique et magnétique de la matière est parfaitement compatible avec le principe de relativité malgré l’idée largement répandue 61
IL ÉTAIT TEMPS
à l’époque qu’il y avait un référentiel privilégié pour les phénomènes électromagnétiques, celui dans lequel l’éther est au repos. Les équations de la théorie électromagnétique étaient considérées par beaucoup comme n’étant valables que dans ce référentiel et dans aucun autre. Mais Einstein fit remarquer que, par ailleurs, une large gamme de phénomènes électromagnétiques semble se dérouler exactement de la même façon dans des référentiels où l’éther n’est pas au repos. Ceci le poussa à postuler que les lois de l’électromagnétisme sont rigoureusement valables dans n’importe quel référentiel inertiel choisi arbitrairement. Einstein fait remarquer que si ce postulat est valable, alors « l’introduction d’un “éther luminifère” se révèle superflue » parce qu’aucune expérience basée sur des phénomènes électromagnétiques ne pourra jamais mettre en évidence un quelconque référentiel dans lequel l’éther serait au repos. C’est ce postulat spécifique – que nous appelons maintenant le principe de relativité, qui s’applique aussi bien à l’électromagnétisme qu’à la mécanique de Newton (sa validité en mécanique était admise par tous) – qu’Einstein appelle le « principe de relativité » (Prinzip der Relativität). Si les équations de Maxwell sont valables dans n’importe quel référentiel inertiel et si elles prédisent que les radiations électromagnétiques et la lumière en particulier se propagent à une vitesse fixe qui est indépendante de la vitesse de la source produisant cette lumière, alors la lumière doit se propager à la même vitesse dans n’importe quel référentiel inertiel. La réponse à la question « par rapport à quoi ? » est, comme nous le savons maintenant, « par rapport à n’importe quel référentiel inertiel choisi ». La vitesse de la lumière dans le vide est simplement 299 792 458 m/s quel que soit le référentiel inertiel choisi et quelle que soit la vitesse de la source qui produit la lumière et quel que soit le référentiel que vous utilisez pour mesurer la vitesse de cette lumière. Si, par exemple, vous poursuivez la lumière dans une fusée à 10 km/s, vous ne diminuerez pas pour autant la vitesse de la lumière à la valeur de 299 782 km/s. Gardons bien à l’esprit que c’est seulement la vitesse de la lumière dans le vide qui a cette propriété 62
La vitesse de la lumière
particulière. La vitesse de la lumière dans l’eau dépend de la vitesse à laquelle vous vous déplacez par rapport à l’eau (mais pas d’une façon évidente, comme nous le verrons). Ce n’est donc pas la lumière qui est spéciale, mais la vitesse c = 299 792 458 m/s. Quand on parle de « vitesse de la lumière » sans aucune autre précision, on se réfère toujours à la vitesse de la lumière dans le vide, 299 792 458 m/s. Comment est-ce possible ? Comment peut-il exister une vitesse c telle que tout corps qui se déplacerait à cette vitesse aurait la même vitesse c quel que soit le référentiel inertiel choisi pour la mesurer ? Ce phénomène, appelé invariance de la vitesse de la lumière est fortement contre-intuitif. En fait, « contre-intuitif » est un mot beaucoup trop faible, car cette éventualité apparaît d’emblée comme étant carrément impossible. L’un des objectifs principaux de ce livre est d’effacer ce sentiment d’impossibilité et de montrer, qu’au contraire, tout ceci est parfaitement logique et cohérent. Permettez-moi une digression concernant la notation de la vitesse de la lumière dans le vide : aujourd’hui, tout le monde utilise la lettre c, comme dans la très fameuse équation « E = mc2 » sur laquelle nous reviendrons plus en détail dans le chapitre 11. Il fut un temps où je pensais qu’on avait choisi c pour « constante », pour illustrer le fait qu’elle ne varie pas d’un référentiel à l’autre. Mais cela viendrait plutôt de celeritas – la vitesse en latin – à l’origine des mots « célérité » ou « accélérer ». Pour comprendre l’invariance de la vitesse de la lumière, nous devons d’abord examiner scrupuleusement ce que veut réellement dire « avoir une vitesse » dans un référentiel donné. Quand on dit qu’un objet se déplace uniformément avec une certaine vitesse v, cela signifie qu’il parcourt une certaine distance D pendant un certain temps T et que la distance et le temps sont reliés par la relation v = D/T. Il faut donc que nous examinions en profondeur comment ces distances et ces temps sont mesurés. Soit P un protocole valide, capable de nous fournir la vitesse d’un objet dans un référentiel donné grâce à des mesures de temps et de 63
IL ÉTAIT TEMPS
distance. Supposons que Bob utilise le protocole P dans le référentiel d’une station spatiale pour mesurer la vitesse d’une impulsion lumineuse qui se propage dans l’espace. Il va trouver que la lumière se déplace à environ 299 792 km/s. Supposons qu’Alice poursuive cette lumière à grande vitesse dans un vaisseau spatial volant à une vitesse égale à 792 km/s (déterminée par Bob). Bob observe donc – tout à fait justement – que, chaque seconde, la lumière parcourt 299 792 km supplémentaires par rapport à lui, mais, en même temps, comme Alice s’éloigne de 792 km de lui, la distance entre Alice et la lumière augmentera selon un taux de 299 000 km/s. Mais si Alice, dans le référentiel de son vaisseau, mesure avec le même protocole P la vitesse de la lumière, alors elle trouvera bien 299 792 km/s de façon à ce que, dans son propre référentiel, la distance entre elle et la lumière augmente toujours avec un taux égal à 299 792 km/s. Comment pouvons-nous interpréter ce désaccord ? Évidemment, les méthodes utilisées par Alice pour mesurer les distances et les temps doivent comporter des différences par rapport à celles de Bob. Ils utilisent pourtant exactement le même protocole P. Oui, mais il faut absolument clarifier ce qu’on entend par « exactement le même ». Si, par exemple, Bob utilise des horloges qui sont au repos dans le référentiel de sa station spatiale pour mesurer le temps et si elle utilise exactement le même protocole dans son référentiel, elle doit utiliser des horloges qui sont au repos dans le référentiel de son vaisseau spatial. Par conséquent, dans le référentiel de Bob, les horloges d’Alice sont en mouvement alors que les siennes ne le sont pas et, bien sûr, réciproquement : dans le référentiel d’Alice, les horloges de Bob sont en mouvement alors que les siennes ne le sont pas. La même remarque s’applique également aux règles graduées que chacun utilise pour mesurer des distances. Le protocole utilisé par Bob décrit dans le référentiel de Bob doit être exactement le même que celui d’Alice décrit dans le référentiel d’Alice. Mais on saisit facilement la nuance existante : le protocole de Bob décrit dans le référentiel de Bob est exactement le même que 64
La vitesse de la lumière
le protocole d’Alice décrit dans le référentiel d’Alice, mais le protocole d’Alice décrit dans le référentiel de Bob n’est pas exactement le même que le protocole de Bob décrit dans le référentiel de Bob. C’est cette nuance qui permet à Bob et Alice d’interpréter de façon parfaitement rationnelle le désaccord entre leurs deux points de vue. Le fait qu’Alice et Bob, dans leurs différents référentiels, trouvent tous deux exactement la même vitesse pour une même impulsion de lumière ne semble paradoxal que si on approuve un certain nombre d’hypothèses sur la relation entre les horloges et les règles graduées utilisées par Alice et Bob. Avant 1905, tout le monde approuvait sans aucune restriction les trois affirmations suivantes : 1°) Le procédé utilisé par Alice pour synchroniser toutes ses horloges dans son référentiel lui fournit un jeu d’horloges qui apparaissent également synchronisées entre elles lorsque Bob les compare avec un autre jeu d’horloges qu’il a lui-même synchronisé dans son propre référentiel avec le même procédé. (Ici, le mot « même » signifie que les étapes du protocole suivi par Bob sont décrites de la même manière par Alice dans son référentiel). 2°) Le rythme d’une horloge déterminé dans le référentiel de Bob ne dépend pas de la vitesse de déplacement de l’horloge par rapport à Bob. 3°) La longueur d’une règle graduée déterminée dans le référentiel de Bob est indépendante de la vitesse à laquelle cette règle se déplace par rapport à Bob. Si au moins une de ces affirmations est fausse, alors il faudra remettre en question la loi d’addition des vitesses non relativiste qui précise ce qu’il advient de la vitesse d’un objet lorsqu’on passe d’un référentiel à un autre. Aujourd’hui, nous savons que ces trois affirmations sont toutes fausses. La théorie de la relativité restreinte apporte des arguments quantitatifs montrant l’inexactitude de ces affirmations et elle fournit, grâce à de nouvelles hypothèses corrigées, une représentation simple et cohérente du temps et de l’espace qui s’accorde parfaitement avec l’existence d’une vitesse invariable 65
IL ÉTAIT TEMPS
identique dans tous les référentiels inertiels. La méthode traditionnelle (et la plus simple) pour arriver à cette représentation – c’est celle que nous suivrons et celle qu’a suivie Einstein – consiste à se laisser porter par une hypothèse de travail qui stipulerait que, quel que soit le référentiel dans lequel on se place, tout protocole correct de mesure de la vitesse de la lumière dans le vide doit fournir un résultat égal à 299 792 458 m/s. Il nous faudra accepter l’étrange fait que, si Alice et Bob mesurent tous deux la vitesse d’une même impulsion lumineuse, ils trouveront exactement le même résultat (299 792 458 m/s), même si Alice et ses instruments de mesure se déplacent dans la même direction que la lumière par rapport à Bob. En essayant d’accepter ce phénomène étrange et sans jamais déroger au principe de relativité, nous serons en mesure de déduire précisément quelles modifications il est nécessaire d’apporter à chacune des trois affirmations sur le comportement des horloges et des règles graduées. Une fois ce travail réalisé, les versions correctes de ces trois affirmations identifiées et comprises, l’étrange phénomène cessera d’apparaître comme tel. Mais surtout, nous aurons compris en profondeur les nouvelles et merveilleuses subtilités de la nature du temps qu’Einstein a été le premier à pressentir. Cette extraordinaire propriété de la lumière – sa vitesse qui ne dépend pas du référentiel dans lequel elle est mesurée – est appelée le principe d’invariance de la vitesse de la lumière. De nos jours, on considère que la théorie de la relativité restreinte repose sur les deux principes suivants : le principe de relativité et le principe de l’invariance de la vitesse de la lumière. Ces principes de relativité et d’invariance sont équivalents à ceux formulés en 1905 par Einstein dans son prodigieux article. Einstein n’utilise pas le mot Prinzip pour son principe de relativité (il l’utilise pour son principe d’invariance). Il qualifie ses deux principes de « postulats » (Voraussetzungen) : son premier postulat (relativité) affirme que le concept de repos absolu n’a pas plus de sens pour les phénomènes électromagnétiques qu’il en a pour les phénomènes de la mécanique newtonienne, alors que son 66
La vitesse de la lumière
second (invariance) pose que la lumière se propage dans le vide à une vitesse indépendante de la vitesse du corps ayant émis cette lumière. Si vous avez des notions d’allemand et si cela vous intéresse de voir comment Einstein pose le problème, je vous invite à télécharger le texte original du célèbre article cité au début du chapitre 1 « Zur Elektrodynamik bewegter Körper », d’où surgit pour la première fois la relativité. Le lien de téléchargement se trouve sur la page http:// press.princeton.edu/titles/8112.html ou plus directement en allant sur http://einsteinpapers.press.princeton.edu/vol2-doc/312
67
4 Combiner (toutes) les vitesses
Dans le chapitre 2, nous avons imaginé une situation où Alice, passagère d’un train roulant à une vitesse v, lance une balle vers l’avant à la vitesse u. La vitesse w de la balle dans le référentiel des rails sera orientée dans le même sens que le mouvement du train et on aura :
w = u + v (4.1)
La relation (4.1) est appelée loi de composition non relativiste des vitesses. On la qualifie de « non relativiste » parce que les vitesses u et v doivent toutes deux être faibles par rapport à la vitesse de la lumière pour que cette loi fournisse un résultat conforme à l’expérience. Et évidemment, elle ne fonctionne pas quand u = c (c’est-à-dire si Alice allume une lampe de poche au lieu de lancer une balle), parce que nous savons que la vitesse w de la lumière par rapport au référentiel des rails ne sera pas c + v, mais simplement c, la même valeur qu’elle avait dans le référentiel du train ! Supposons qu’Alice possède un fusil capable d’expulser de son canon des balles à une vitesse u égale à 90 % de la vitesse de la lumière. 69
IL ÉTAIT TEMPS
Si vous préférez imaginer une situation concrète, considérez alors que les « balles » tirées par Alice sont des impulsions de lumière, qui se propagent dans le train à l’intérieur d’un tuyau contenant un fluide dans lequel la lumière se propage à une vitesse de 0,9 pied par nanoseconde (c’est seulement lorsqu’elle est mesurée dans le vide que la vitesse de la lumière reste la même dans tous les référentiels). Comme la composition des vitesses (4.1) ne fonctionne pas quand u = c, il serait tout à fait surprenant qu’elle fonctionne lorsque u est égal à 0,9c – et en effet elle ne fonctionne pas. La relation (4.1) et l’invariance de cette vitesse c si singulière constituent en fait deux cas particuliers d’une loi beaucoup plus générale de composition des vitesses qui fonctionne pour toutes les vitesses, qu’elles soient petites ou grandes vis-à-vis de celle de la lumière. La loi relativiste de composition des vitesses est la suivante :
w=
u+v u 1+ c
v c
(4.2)
Si u et v sont tous deux petits par rapport à la vitesse de la lumière, u v u v alors et sont des nombres proches de zéro. Le produit c c c c est donc un nombre encore plus proche de zéro, c’est pourquoi la loi de composition relativiste (4.2) diffère de la composition plus familière et non relativiste (4.1) uniquement par le dénominateur qui est un nombre très proche de 1. Si, par ailleurs, u = c, alors (4.2) implique que w soit égale à c, quelle que soit la valeur de v. (N’hésitez pas à le tester par vous-même ! C’est un exercice d’algèbre facile.) Ainsi, (4.2) est cohérente aussi bien avec notre expérience non relativiste du monde – où les vitesses habituelles sont petites comparées à celle de la lumière – qu’avec le comportement plus étrange d’une impulsion lumineuse dans le vide, pour laquelle la vitesse est la même dans tous les référentiels inertiels. Nous allons maintenant démontrer que la loi générale de composition relativiste des vitesses (4.2) est une conséquence directe et 70
Combiner (toutes) les vitesses
immédiate de l’invariance de la vitesse de la lumière et du principe de relativité. Nous allons montrer que si la vitesse de la lumière est la même dans tous les référentiels inertiels, alors la loi de composition (4.1) doit obligatoirement être remplacée par (4.2), quel que soit l’objet que nous décrivons et quelle que soit la vitesse à laquelle il se déplace. Le fait qu’une loi aussi générale puisse être déduite du cas particulier de l’invariance de la vitesse de la lumière et à partir du principe de relativité est une preuve remarquable de la puissance de ce principe. La démarche qui va nous amener à (4.2) est analogue à notre démonstration de la première loi de Newton du mouvement dans le chapitre 1 où nous avons appliqué le principe de relativité à un corps au repos qui reste au repos si aucune force ne lui est appliquée. Une fois que vous avez bien compris le principe de relativité, il est évident de voir comment le cas particulier des objets au repos restant au repos nous amène au cas plus général où les objets en mouvement rectiligne uniforme doivent conserver leur mouvement rectiligne uniforme. Par contre, le cheminement qui nous conduit à la règle générale (4.2) à partir du cas particulier de l’invariance de la vitesse de la lumière est beaucoup moins évident. Avant que nous embarquer dans cette importante application du principe de relativité, il est important de noter que la présence de la vitesse c dans la loi (4.2) (alors qu’aucun des objets et aucun des référentiels utilisés n’a de rapport avec la lumière) doit nous faire pressentir à quel point cette vitesse est fondamentale, elle est intégrée dans l’architecture de l’espace et du temps. Tout ce qui se déplace à cette vitesse particulière se déplace à cette même vitesse dans tout autre référentiel : c’est une conséquence directe de (4.2). L’importance de la constante c dépasse très largement le fait que la lumière, de par sa nature, se déplace à cette vitesse dans le vide. Pour mettre au point une stratégie de déduction de la loi de composition relativiste des vitesses (4.2), nous devons d’abord repérer les hypothèses fausses qui nous aiguillent vers la loi (4.1) inexacte. La façon la plus évidente de déterminer la vitesse d’un objet est de mesurer le 71
IL ÉTAIT TEMPS
temps qu’il met pour parcourir une portion de sa trajectoire de longueur connue. Cette opération nécessite deux horloges, chacune placée à une extrémité de la portion choisie, l’une mesurant l’instant où l’objet commence et l’autre celui où il finit sa course. Pour obtenir la composition non relativiste des vitesses (4.1), nous considérons implicitement que les gens qui utilisent le référentiel du train et les gens qui utilisent le référentiel des rails sont d’accord sur le fait que les deux horloges sont synchronisées. Avant Einstein, personne n’a jamais fait explicitement ressortir la nécessité de cette hypothèse essentielle. Même si les gens étaient conscients des difficultés pratiques à surmonter pour synchroniser deux horloges éloignées, la validité de cette hypothèse était admise par tous et personne ne trouvait qu’elle allait à l’encontre d’un quelconque principe3. On considérait également de manière implicite que les gens utilisant des référentiels différents seraient d’accord sur la longueur de la portion de trajectoire comprise entre les deux horloges et sur le rythme des oscillations des deux horloges. L’invariance de la vitesse de la lumière signifie que la composition non relativiste des vitesses (4.1) ne peut pas être correcte pour un objet qui se déplace à la vitesse de la lumière et par conséquent cela signifie que les hypothèses sur lesquelles repose (4.1) doivent être fausses. Le doute est donc jeté sur la validité de la composition non relativiste pour toutes les vitesses. Mais si nous ne sommes plus autorisés à faire certaines hypothèses sur les instruments basiques avec lesquels nous mesurons les vitesses, comment pourrons-nous déduire la loi correcte de composition des vitesses ? Une façon d’y parvenir serait de trouver et de prendre en compte toute une série de nouvelles lois relativistes englobant les désaccords sur la synchronisation des horloges, le rythme des horloges en mouvement et la longueur des règles en mouvement, mais malheureusement cette démarche est loin 3. Pour une vue d’ensemble sur l’importance du problème de la synchronisation des horloges distantes et ses difficultés pratiques à l’époque où Einstein a publié la théorie de la relativité, voir Peter Galison, Einstein’s Clocks, Poincare’s Maps: Empires of Time (New York : W. W. Norton), 2003. 72
Combiner (toutes) les vitesses
d’être une mince affaire. C’est en fait la façon habituelle de démontrer la loi de composition relativiste des vitesses (4.2) dans la plupart des présentations sur le sujet. À un moment donné, nous établirons effectivement cette série de nouvelles lois concernant les horloges et les règles en mouvement, mais à ce stade nous n’en connaissons encore aucune. Il est néanmoins tout à fait possible (et même préférable) d’établir la bonne loi de composition avant de nous pencher sur le problème des horloges et des règles en mouvement : c’est donc la démarche que nous suivrons. Une manière directe d’obtenir (4.2) consiste à tirer profit du fait que nous connaissons au moins la vitesse d’une chose : celle de la lumière. Avec de l’imagination, nous pouvons utiliser la lumière pour mesurer la vitesse de n’importe quel objet sans utiliser ni horloges, ni règles. Nous n’aurons donc pas besoin de faire des hypothèses sur leur comportement pour savoir comment les vitesses sont modifiées lorsque le référentiel est modifié. L’idée est d’organiser une course entre un objet – par exemple, une balle – et une impulsion de lumière – appelons-la un photon. En comparant la distance parcourue par la balle et celle parcourue par le photon, il est possible de déterminer la vitesse de la balle. Si jamais le photon, en se déplaçant à la vitesse c, couvre deux fois plus de chemin que la balle, cela voudra dire que c la balle s’est déplacée à une vitesse (nous ne considérerons que le 2 cas où la balle se déplace moins vite que le photon, car nous verrons plus loin qu’il est très problématique d’envisager des balles qui vont plus vite que la lumière). Cette bonne idée nous place d’emblée face à un obstacle. Au départ de la course, le photon et la balle passent tous deux au même endroit, mais, en fin de course, ils vont se trouver à deux endroits différents, éloignés dans l’espace. Or, pour comparer les différentes longueurs parcourues durant la course, nous devons être capables de déterminer exactement où se trouve la balle au moment précis où le photon passe la ligne d’arrivée. Et pour ce faire, nous avons besoin de deux horloges 73
IL ÉTAIT TEMPS
synchronisées, une qui se trouve au niveau de la ligne d’arrivée et l’autre avec la balle. Déterminer l’endroit où se trouve la balle lorsque le photon passe la ligne d’arrivée revient à repérer l’emplacement de la balle quand son horloge affiche le même temps qu’une autre horloge située sur la ligne d’arrivée au moment du passage du photon. Hélas, pour faire cela, il faut savoir si deux horloges éloignées sont synchronisées, et c’est précisément le problème que nous essayons d’éviter. Mais heureusement, cet obstacle est facile à contourner. Au lieu d’arrêter la course lorsque le photon passe la ligne d’arrivée, arrangeons-nous pour que celui-ci soit réfléchi par un miroir et que son mouvement change de sens. Décidons que la course s’arrête au moment où le photon retrouve la balle qui, de son côté, a continué son mouvement dans le même sens. En arrêtant la course à ce moment-là, il n’est plus nécessaire d’utiliser des horloges pour déterminer où était la balle quand le photon a passé la ligne : à la fin de la course, la balle est précisément au même endroit que le photon. Supposons que cette course ait lieu dans un train. Nous allons, tout d’abord, décrire la course en utilisant le référentiel du train. Imaginons que la ligne de départ soit installée à l’arrière du train et qu’un dispositif provoque la réflexion du photon sur l’avant du train de façon à ce qu’il parte de nouveau vers l’arrière. Supposons que le photon rejoigne la balle après avoir parcouru une fraction f de la longueur du train après avoir rebroussé chemin (si par exemple le train est constitué de 100 wagons identiques numérotés 1, 2, 3… à partir de l’avant et que le photon rencontre la balle entre deux wagons numérotés 34 et 35 alors f = 0,34). Entre le départ et la fin de cette course, le photon a parcouru toute la longueur du train, à laquelle il faut ajouter une fraction f de cette longueur, alors que la balle, elle, a parcouru depuis le début de cette course une longueur de train à laquelle il faut soustraire une fraction f de cette longueur. Le rapport de la distance parcourue par la balle sur la distance parcourue par le 1− f photon est donc . Tout ceci est illustré par la figure 4.1. 1+ f 74
Combiner (toutes) les vitesses
c u (1) c
u
c
(2)
1–f
f c u
(3) Figure 4.1 | Un photon (cercle blanc, vitesse c) fait la course avec une balle (cercle noir, vitesse u) dans un train au repos (long rectangle). Trois moments de la course sont illustrés sur cette figure. (1) Le photon et la balle passent la ligne de départ côte à côte à l’arrière du train, chacun avec sa vitesse respective : c pour l’un et u pour l’autre. (2) Le photon atteint l’arrière du train où il est réfléchi à nouveau vers l’arrière (d’où la double flèche). (3) À la fin de la course, le photon rejoint la balle après avoir parcouru une fraction f de la longueur du train après sa réflexion.
Vu que la durée de la course a été la même pour la balle et le photon, ce rapport est aussi celui de leurs vitesses. Insistons encore sur le fait que nous n’avons plus besoin d’horloges pour savoir quand la course s’arrête puisque nous avons fixé les modalités de cette course pour que le photon et la balle soient au même endroit au début et à la fin. On note u la vitesse de la balle et la vitesse du photon est c quel que soit son sens de déplacement, nous avons alors :
u 1− f = (4.3) c 1+ f
Les gens dans le référentiel du train peuvent donc mesurer la vitesse de la balle sans utiliser d’horloge et sans même connaître la 75
IL ÉTAIT TEMPS
longueur des wagons du train. Ils ont juste besoin de savoir compter des wagons. Si la balle rencontre le photon quelque part entre les deux extrémités d’un wagon, alors ils devront être capables de comparer la longueur des deux parties du wagon, mais sans toutefois avoir à connaître la longueur réelle de chacune des parties, ils n’auront qu’à compter le nombre de fois qu’il faut translater un bâton de sa longueur (inconnue) pour parcourir chaque partie. Ainsi (4.3) constitue une manière simple de comparer les vitesses de deux objets sans utiliser d’horloge et sans avoir à déterminer des distances absolues. Reformulons la relation (4.3) pour en tirer l’expression de la fraction f en fonction de la vitesse u de la balle et de la vitesse de la lumière c :
f =
c −u (4.4) c +u
[Une courte digression pédagogique : lorsque j’affirme que deux expressions sont équivalentes – par exemple les relations (4.3) et (4.4) –, prenez bien le temps de le vérifier par vous-même. Si les manipulations algébriques nécessaires pour passer de (4.3) à (4.4) s’avèrent fastidieuses, n’hésitez pas à tester l’équivalence des deux relations en considérant au moins quelques cas particuliers. Si par 1 u 1 exemple f = alors (4.3) nous dit que = . Et à l’inverse, quand 2 c 3 1 1 u = c, (4.4) nous donne effectivement f = .] 3 2 Reprenons tout à zéro et analysons cette course qui se déroule dans le train, mais, cette fois-ci, en utilisant le référentiel des rails dans lequel le train a une vitesse v (que nous prendrons plus petite que la vitesse de la lumière) et la balle une vitesse w. Nous choisirons u, v et w pour qu’elles soient toutes positives – c’est-à-dire que dans le référentiel du train la balle se déplace vers la droite et, dans le référentiel des rails, le train et la balle se déplacent tous deux également vers la droite –, mais le résultat que nous obtiendrons sera aussi valable dans le cas général où on combine des vitesses positives ou négatives 76
Combiner (toutes) les vitesses
(on entend par vitesse négative un mouvement vers la gauche). La course se déroule donc suivant les mêmes modalités, le photon et la balle commencent tous deux leur course à l’arrière du train, le photon atteint d’abord l’avant du train, où il est réfléchi à nouveau vers l’arrière, et ensuite la course se termine lorsque le photon rejoint la balle. Comme tout à l’heure, nous voulons savoir quelle fraction de longueur de train le photon a parcourue vers la gauche avant de rencontrer la balle. Nous voulons exprimer cette fraction en fonction des différentes vitesses. Cette fois-ci, l’analyse est un peu plus compliquée étant donné que le train se déplace pendant la course. Nous continuons à prendre comme hypothèse que le photon a une vitesse c quel que soit le sens de son mouvement dans le référentiel des rails. Un peu plus loin, nous allons faire appel à l’invariance de la vitesse de la lumière pour interpréter ceci comme étant exactement la même course que celle que nous avons suivie depuis le référentiel du train. Mais en attendant, il vaut mieux oublier momentanément la première course pendant que nous analyserons celle-ci. Vous pouvez considérer, si vous préférez, que le photon de la deuxième course est un nouveau photon qui a une vitesse c dans le référentiel des rails alors que le vieux photon du train avait la même vitesse c, mais dans le référentiel du train. Si pour l’instant vous voyez les choses de cette façon (ce que je vous conseille), alors l’analyse qui va suivre dans le référentiel des rails n’aura rien d’étrange. Elle est un peu plus compliquée que l’analyse dans le référentiel du train, mais c’est juste parce que le train est en mouvement. Pour analyser ce qui se passe dans le référentiel des rails, nous allons devoir utiliser certaines distances et certains temps de ce référentiel. Par contre, nous ne ferons aucune hypothèse sur le comportement des horloges et des règles dans le référentiel des rails, on suppose seulement que les gens du référentiel des rails sont capables de déterminer la vitesse d’un objet en mesurant, dans leur référentiel, le temps et la longueur d’un parcours. Notre objectif est d’obtenir une relation comme (4.3) ou (4.4) dans laquelle il n’intervient aucune longueur ni aucun temps. La relation cherchée ne devra comporter que des vitesses et des fractions f 77
IL ÉTAIT TEMPS
de train que le photon doit parcourir sur son chemin de retour avant de retrouver la balle. Toutes les distances et les temps inconnus pourront apparaître transitoirement, mais devront disparaître à la fin. Supposons (voir figure 4.2) qu’un temps T0 soit nécessaire pour que le photon aille de l’arrière du train jusqu’au miroir placé à l’avant du train et un temps T1 pour, qu’après sa réflexion, le photon parcoure une fraction f de longueur de train pour retrouver la balle. Notons L la longueur du train et D la distance entre l’avant du train et la balle au moment où le photon atteint l’avant du train. Ces temps et ces distances sont relatifs au référentiel des rails, leurs valeurs ne sont pas connues, mais comme le raisonnement qui va suivre sera entièrement fait dans le référentiel des rails et vu que les quantités problématiques D, L, T0 et T1 ne figureront pas dans le résultat final, ce ne sera pas un problème. Ces temps et ces distances sont illustrés dans la figure 4.2 que je vous conseille de consulter, chaque fois que nécessaire, au cours de la discussion qui va suivre. Pendant le temps T0, le photon a distancé la balle d’une longueur D : le photon a parcouru une distance cT0 tandis que la balle a parcouru une distance wT0. Vu qu’ils démarrent leur course au même endroit et au même moment, nous avons :
D = cT0 − wT0 (4.5)
D’autre part, T1 est le temps nécessaire au photon et à la balle initialement séparés par une distance D pour se rejoindre. Comme, pendant ce temps, le photon parcourt une distance cT1 et la balle une distance wT1, nous pouvons écrire que :
D = cT1 + wT1 (4.6)
Comme nous ne connaissons pas la valeur de D, nous allons l’éliminer à partir des deux relations précédentes. Cela nous donne l’égalité suivante, qu’il est pratique d’écrire sous la forme : T1 (c − w ) (4.7) = T0 (c + w ) 78
Combiner (toutes) les vitesses
c w v
L (1)
T0 c
w
c v
D (2)
T1 c w fL
v
(3) Figure 4.2 | Le photon fait de nouveau la course avec une balle, mais dans un train qui se déplace à une vitesse v par rapport aux rails. Les trois situations présentées illustrent chacune un moment de la course vue depuis le référentiel des rails. (1) Au moment du départ de la course, le photon et la balle passent au niveau de l’arrière du train avec des vitesses respectives c et w. La longueur du train est L. (2) Un temps T0 après la situation illustrée en (1), le photon est réfléchi sur l’avant du train puis rebrousse chemin vers l’arrière. À ce moment-là, le photon se trouve à une distance D devant la balle. (3) À la fin de la course, le photon rejoint la balle un temps T1 après les événements illustrés en (2) et il a parcouru une fraction f de la longueur du train – c’est-à-dire une distance f L – depuis son demi-tour.
Mais malheureusement, nous ne connaissons pas les temps T1 et T0. Il y a toutefois une deuxième manière d’obtenir le même rapport T1/T0, en comparant la progression du photon non plus avec celle de la balle, comme nous l’avons fait, mais avec celle du train. Remarquons d’abord que T0 est le temps nécessaire au photon pour distancer l’arrière du train d’une longueur L. Comme le photon a une vitesse c et le train une vitesse v :
L = cT0 − vT0 (4.8)
79
IL ÉTAIT TEMPS
Remarquons ensuite que T1 est le temps nécessaire pour que le photon, qui se déplace vers l’arrière du train avec une vitesse c, atteigne un point du train initialement à la distance fL et qui vient vers lui à la vitesse v. Nous avons donc : f L = cT1 + vT1 (4.9)
Comme pour D, nous ne connaissons pas la valeur de L, mais comme précédemment, nous pouvons éliminer L des deux dernières équations. On obtient cT1 + vT1 = f ⋅ (cT0 − vT0 ) , ce qui nous donne une deuxième expression du rapport T1/T0 : (c − v ) T1 (4.10) = f⋅ (c + v ) T0
Même si on ne connaît pas T1 ou T0, cette dernière expression du rapport T1/T0 doit être la même que l’expression (4.7). Nous concluons donc que
f⋅
c−v c −w = c+v c+w
(4.11)
Il s’agit de la relation que nous attendions. Les distances et les temps inconnus ont tous disparu et nous avons une relation qui ne comporte que des vitesses et la fraction f. La relation (4.11) nous permet immédiatement d’exprimer la fraction f en fonction des vitesses v et w : c+v c −w (4.12) ⋅ c−v c+w Il est important de souligner que, dans le référentiel des rails, l’analyse de la course entre la balle et le photon à l’intérieur du train (qui se déplace à la vitesse v par rapport aux rails alors que la balle a une vitesse w et le photon une vitesse c) aboutit à la relation (4.12) sans faire appel au moindre raisonnement contre-intuitif. Il faut maintenant mettre la relation (4.12) au banc d’essais pour s’assurer que nous n’avons pas fait d’erreur. Si la vitesse v du train par rapport aux rails
80
f =
Combiner (toutes) les vitesses
était nulle, alors le référentiel des rails aurait été le même que celui du train. Par conséquent, w, la vitesse de la balle dans le référentiel des rails, aurait été la même que u, la vitesse de la balle dans le référentiel du train. Effectivement, si dans (4.12) on remplace la vitesse v par zéro et w par u, on obtient bien la relation (4.4) valable dans le référentiel du train. Galilée aurait été très satisfait du raisonnement qui nous a conduits à (4.12) (à part qu’il aurait fallu transformer le train en bateau). En effet, le résultat (4.12) reste tout à fait valable même si on remplace le photon par n’importe quoi d’autre qui se déplace dans les deux sens avec une même vitesse, ce qui reviendrait à remplacer c par toute autre vitesse supérieure à w et v. Par contre, Galilée s’opposerait radicalement à l’idée d’affirmer que comme le photon est vraiment un photon et que c représente vraiment la vitesse de la lumière dans le vide, alors les deux volets de l’analyse que nous venons de faire (d’abord dans le référentiel du train puis dans celui des rails) peuvent être considérés comme deux manières différentes d’interpréter une seule et même course. Dans cette course, u est la vitesse de la balle dans le référentiel du train, w est la vitesse de la balle dans le référentiel des rails et v est la vitesse du train dans le référentiel des rails. Insistons bien sur le fait que le seul point contre-intuitif est celui qui relie les deux volets de notre analyse : il s’agit d’un seul et unique photon et sa vitesse est exactement la même dans le référentiel des rails et dans le référentiel du train. Quel que soit le référentiel et quel que soit son sens de déplacement, sa vitesse est c. C’est le seul moment de tout le raisonnement où nous invoquons le principe contre-intuitif de l’invariance de la vitesse de la lumière. Si nous avons alors décrit une seule et unique course vue depuis deux référentiels différents, alors f, la fraction de train parcourue par le photon quand il recroise la balle après avoir fait demi-tour, doit avoir la même valeur dans les deux référentiels. Même s’il peut y avoir un désaccord (et en effet, nous verrons qu’il y en a un) entre les deux référentiels sur la longueur des wagons du train, aucun désaccord 81
IL ÉTAIT TEMPS
n’est possible à propos de l’endroit du train où le photon recroise la balle. La rencontre pourrait par exemple déclencher une explosion qui ferait des dégâts sur le sol que tous les observateurs dans tous les référentiels pourraient inspecter plus tard, selon leur envie, pour confirmer à quel endroit du wagon la rencontre a eu lieu. Ainsi l’expression (4.12) de la fraction f dans le référentiel des rails peut être identifiée avec l’expression (4.4) dans le référentiel du train. Ceci étant fait, nous obtenons une relation entre les trois vitesses w, u et v :
c+v c−v
c −w c −u = c+w c +u
(4.13)
Il est utile de réécrire cette loi de composition relativiste des vitesses de façon à ce que w apparaisse dans le terme de gauche et u et v dans le terme de droite, comme dans la relation non relativiste (4.1) :
c −w c −u = c+w c +u
c−v c+v
(4.14)
Il s’agit donc de la loi relativiste qui remplace la loi non relativiste (4.1). Au lieu d’ajouter simplement u et v pour obtenir w, nous devons multiplier une expression qui comporte u par une expression de même forme avec v pour obtenir une troisième expression de même forme qui comporte w. Le lien entre la relation non relativiste (4.1) et la relation relativiste (4.14) ne saute pas aux yeux. Pour faire apparaître ce lien, il faut passer par un exercice d’algèbre consistant à isoler la vitesse w de la balle dans l’expression (4.14) en fonction de u et v. Le résultat est la loi de composition relativiste des vitesses énoncée en (4.2) :
w=
u+v u 1+ c
v c
(4.15)
Pour ceux qui sont fâchés avec l’algèbre, la transformation de (4.14) en (4.15) est présentée en fin de chapitre. 82
Combiner (toutes) les vitesses
Même si les deux formes (4.14) et (4.15) de la composition des vitesses sont deux manières parfaitement équivalentes d’exprimer la relation entre les trois vitesses w, u et v, il sera très utile de les garder toutes deux à l’esprit, car une forme peut s’avérer plus utile que l’autre en fonction de la question qui se pose. D’un côté, la forme (4.15) met immédiatement en évidence (comme nous l’avons mentionné en début de chapitre) la raison pour laquelle la relation non relativiste w = u + v devient valable quand u et v sont petits par rapport à la vitesse de la lumière. De l’autre, une analyse qualitative de la forme (4.14) nous révèle directement le point suivant : Si la vitesse u de la balle dans le référentiel du train et la vitesse v du train dans le référentiel des rails sont toutes deux plus petites que c−v c −u la vitesse de la lumière alors et seront tous deux des c+v c +u nombres compris entre 0 et 1. Et comme le produit de deux nombres compris entre 0 et 1 est aussi compris entre 0 et 1 cela signifie que c −w est aussi compris entre 0 et 1, ce qui implique en retour que c+w la vitesse w de la balle dans le référentiel des rails est aussi plus petite que la vitesse de la lumière. Ce résultat est aussi prédit par (4.15), mais il est beaucoup plus évident à obtenir à partir de (4.14). Imaginons que vous possédiez un fusil capable de tirer des balles à la vitesse de 0,9c (90 % de la vitesse de la lumière), si vous embarquez ce fusil dans un train qui se déplace lui-même à 0,9c et si vous tirez une balle vers l’avant du train, alors la vitesse de la balle dans le référentiel des rails ne sera pas égale à 1,8c, la vitesse de la balle restera inférieure à celle de la lumière : ce stratagème qui aurait pour but de lancer un objet plus vite que la lumière peut paraître parfaitement sensé, mais il ne fonctionne pas. La relation (4.15) nous dit que la vitesse w de la balle dans le référentiel des rails sera égale à une 0,9 + 0,9 1,8 = fraction de la vitesse de la lumière (environ 99,45 %). 2 1 + (0,9) 1,81 83
IL ÉTAIT TEMPS
C’est le premier indice rencontré – il y en aura d’autres – renforçant l’idée qu’aucun objet matériel ne peut se déplacer plus vite que la lumière. Pour la rendre plus générale, il est nécessaire d’énoncer la loi de composition relativiste des vitesses hors du contexte du lancer d’une balle dans un train sur des rails. Pour cela, il faut introduire des vitesses relatives d’objets par rapport à d’autres. Disons que les rails soient un objet A, le train un objet B et la balle un objet C. La vitesse v du train par rapport aux rails se noterait alors vB/A, la vitesse de B par rapport à A. De la même manière, la vitesse u de la balle dans le référentiel du train serait notée vC/B, la vitesse de C par rapport à B. Et enfin la vitesse w de la balle dans le référentiel des rails serait quant à elle notée vC/A. Avec ces notations, les deux formes de la loi de composition relative des vitesses deviennent : c − vC / A c − vC / B = c + vC / A c + vC / B
et
vC / A =
c − vB / A (4.16) c + vB / A
vC / B + v B / A v v B / A (4.17) 1 + C /B c c
( )( )
L’autre avantage de (4.16) sur (4.17) apparaît lorsqu’on considère le cas où un objet C, par exemple une fusée, éjecte lui-même un quatrième objet D. Si D a une vitesse vD/C par rapport à C, quelle sera la vitesse de D par rapport à A ? En d’autres termes, quelle forme prend la loi de composition des vitesses quand on compose trois vitesses au lieu de deux ? Utiliser la forme (4.17) pour essayer de répondre à la question nous conduit directement à une grosse pagaille, mais en utilisant la forme (4.16), on remarque simplement la chose suivante : La vitesse de D par rapport à A peut être obtenue par composition de la vitesse de D par rapport à C avec la vitesse de C par rapport à A. La règle générale (4.14) nous dit que : 84
c − vD / A c − v D /C = c + vD / A c + v D /C
c − vC / A (4.18) c + vC / A
Combiner (toutes) les vitesses
Et maintenant, si nous appliquons (4.16) pour exprimer la vitesse vC/A en fonction de vC/B et vB/A, on obtient :
c − vD / A c − v D /C = c + vD / A c + v D /C
c − vC / B c + vC / B
c − vB / A (4.19) c + vB / A
Nous voyons ainsi que pour composer trois vitesses au lieu de deux, il suffit de rajouter un troisième terme dans le produit (4.16) et on obtient (4.19). Et évidemment si D était aussi une fusée qui émettait un cinquième objet E, nous pourrions continuer comme cela indéfiniment. Alors que sous sa forme (4.17) la loi deviendrait de plus en plus compliquée, sous la forme (4.16) elle garde une forme simple. Sous ces deux formes, aussi bien (4.16) que (4.17), la loi de composition reste valable quand les vitesses mises en jeu ne sont pas de même signe – ce qui serait le cas pour une balle lancée vers l’arrière du train au lieu d’être lancée vers l’avant. Dans le cas où Alice lance une balle avec une vitesse u vers l’arrière du train qui, lui, se déplace avec une vitesse v positive le long des rails alors la vitesse w de la balle par rapport aux rails est donnée par :
w=
−u + v (4.20) u v 1− c c
( )( )
C’est bien la forme que prendrait (4.2) si on remplace u par – u (voilà un bon exercice d’application : refaire toute la démarche précédente afin de retrouver la forme (4.20) dans le cas où la course commence à l’avant du train plutôt qu’à l’arrière). Considérons une autre méthode, plus simple, mais plus abstraite, pour voir que (4.16) et (4.17) restent valables même lorsque certaines vitesses sont négatives. En effet, il est possible d’introduire des vitesses négatives dans l’expression (4.16) où toutes les vitesses vC/A, vC/B et vB/A étaient positives en exploitant l’égalité suivante :
vY/X = – vX/Y (4.21)
85
IL ÉTAIT TEMPS
Nous pouvons par exemple remplacer la vitesse positive vB/A dans (4.16) par – vA/B. Après avoir fait cela, nous pouvons facilement écrire (4.16) sous la forme suivante :
c − vC / B c − vC / A = c + vC / B c + vC / A
c − vA/B (4.22) c + vA/B
Nous remarquons que c’est exactement la même forme que la relation (4.16) sauf que les indices A et B ont été permutés. Mais maintenant, une des trois vitesses vA/B est négative. Des astuces similaires utilisant (4.21) nous permettent de réécrire (4.16) sous des formes équivalentes où une, voire toutes les vitesses de droite peuvent être négatives. Cela peut paraître incroyable, mais une expérience confirmant la validité de la loi de composition relativiste (4.2) a été réalisée par Fizeau en 1851, quelques années après qu’il ait mesuré la vitesse de la lumière et plus d’un demi-siècle avant qu’Einstein n’écrive l’article de 1905 où cette loi apparaît pour la première fois. Fizeau mesura la vitesse de la lumière dans un courant d’eau en mouvement. Comme nous l’avons déjà précisé, la vitesse de la lumière dans l’eau au repos est plus faible que sa vitesse c dans le vide. Traditionnellement, c on écrit la vitesse de la lumière dans l’eau sous la forme où n est n « l’indice de réfraction » de l’eau – qui vaut environ 1,33. Par conséquent, c 3 = c. D’après 1,33 4 la seule loi de composition connue à l’époque (donc non relativiste), le résultat attendu pour la vitesse w de la lumière dans un courant c d’eau était la somme de , la vitesse de la lumière dans l’eau au repos n c et de v, la vitesse avec laquelle l’eau s’écoule dans le tuyau : w = + v. n Et pourtant Fizeau trouva en 1851 le résultat suivant : la vitesse de la lumière dans l’eau est environ égale à
86
w=
c 1 + v 1 − 2 (4.23) n n
Combiner (toutes) les vitesses
Le résultat de Fizeau (4.23) a été interprété à l’époque comme la confirmation d’une théorie très sophistiquée basée sur l’idée que l’eau était susceptible d’entraîner en partie l’éther avec elle. Mais aujourd’hui, elle est expliquée de manière beaucoup plus simple en tant que conséquence élémentaire de la composition relativiste des vitesses : c Si w est la vitesse de la lumière dans le référentiel du tuyau, est la n vitesse de la lumière dans le référentiel de l’eau et v la vitesse de l’eau dans le référentiel du tuyau, alors (4.17) nous dit que : c +v (4.24) w= n v 1+ nc Cette façon d’exprimer w ne ressemble pas vraiment à (4.23), pour mieux voir la ressemblance, ne considérons pas w, mais la quantité avec laquelle w diffère de la vitesse de la lumière dans l’eau au repos : c w − . Il découle directement de (4.24) que : n 1 c c v + v − 1+ v 1− 2 n n nc c n (4.25) w− = = v v n 1+ 1+ nc nc C’est précisément le résultat que Fizeau obtient en (4.23), sauf que v 1 l’expression v 1 − est divisée par 1 + à cause du mouvement 2 nc n de l’eau, mais comme la vitesse v de l’eau dans le tuyau est très petite devant c, le dénominateur vaut quasiment 1. Pour déceler la différence entre (4.23) et (4.25), il aurait fallu que la précision des résultats donnés par l’expérience soit d’un niveau impossible à atteindre. Bien qu’Einstein n’ait pas mentionné l’expérience 87
IL ÉTAIT TEMPS
de Fizeau dans son article de 1905, il déclara plus tard que cette expérience a eu une importance fondamentale dans sa réflexion4. Il nous reste à démontrer que la forme (4.15) de la composition relativiste des vitesses peut être effectivement déduite de sa forme alternative (4.14) : Il faut écrire (4.14) sous la forme c −w a = (4.26) c+w b
où
a = (c − u)(c − v ) (4.27)
et
b = (c + u)(c + v ) (4.28)
De (4.26), il découle que :
(c − w )b = (c + w )a (4.29)
ou et ainsi
c(b − a) = w(b + a) (4.30) w b−a = (4.31) c b+a
et maintenant, selon (4.28) et (4.27)
b = c 2 + c(u + v ) + uv (4.32)
a = c 2 − c(u + v ) + uv
4. Voir R. S. Shankland, “Conversations with Albert Einstein,” American Journal of Physics 31 (1963) : 47-57. C’est tout à fait réjouissant de voir émerger le résultat de Fizeau comme une conséquence immédiate des deux postulats d’Einstein. 88
Combiner (toutes) les vitesses
et par conséquent,
b + a = 2(c 2 + uv ) = 2c 2 1 +
u c
v c
(4.33)
b − a = 2c(u + v ) Les relations écrites en (4.33) transforment (4.31) en (4.15). Dans ce qui reste de ce chapitre nous allons revenir sur certaines des collisions étudiées au chapitre 1 en considérant le cas où les vitesses ne sont plus négligeables vis-à-vis de celle de la lumière : nous devrons donc appliquer la loi de composition relativiste des vitesses (4.2) au lieu de la loi non relativiste (4.1). Je vous encourage à jeter au moins un coup d’œil à ces exemples même s’ils ne sont pas essentiels pour comprendre la suite.
Comme nous l’avons déjà indiqué dans le chapitre 2, nous avons utilisé le principe de relativité dans le chapitre 1 pour prévoir l’issue de certaines collisions en nous appuyant sur la loi de composition non relativiste. Les conclusions que nous avons tirées à ce moment-là ne sont valables que pour des vitesses faibles par rapport à celle de la lumière. Pour prévoir l’issue de ces collisions quand les vitesses sont élevées, il faut suivre la même démarche, mais en faisant attention, chaque fois, à bien utiliser la loi relativiste à la place de la composition non relativiste. Considérons par exemple la collision entre la grosse et la petite balle élastique illustrée par les figures 1.5 et 1.6. Considérons par exemple la collision élastique de la petite balle lancée contre la grosse au repos : la petite balle rebondit en repartant avec la même vitesse en sens opposé alors que la grosse balle reste au repos. Supposons que la succession de ces événements reste valable même quand la vitesse de la petite balle est comparable à la vitesse de la lumière c. Revenons à ce qui arrive à la petite balle initialement au repos lorsqu’elle est heurtée par la grosse balle lancée avec une vitesse u. L’analyse non relativiste prévoit qu’après la collision, la petite balle se déplace avec 89
IL ÉTAIT TEMPS
une vitesse 2u. Si cela était vrai, on serait alors en mesure de projeter la petite balle avec une vitesse supérieure à celle de la lumière : il suffirait de lancer la grosse balle avec une vitesse u supérieure à la moitié de la vitesse de la lumière. Mais maintenant, nous savons qu’il faut réexaminer la situation en utilisant la loi de composition relativiste. Supposons que, dans le référentiel où la petite balle est initialement au repos, la grosse balle se déplace vers la droite avec une vitesse u. Dans le référentiel lié à la grosse balle, la petite se déplace vers la gauche avec la même vitesse u et, après la collision, la petite balle va donc rebondir et repartir vers la droite en gardant la même vitesse u. Pour déterminer la vitesse prise par la petite balle après sa collision dans le référentiel où elle est initialement au repos, nous allons appliquer la loi de composition relativiste (4.15) en notant u la vitesse de la petite balle dans le référentiel de la grosse balle après la collision et v la vitesse de la grosse balle dans le référentiel où la petite balle est initialement au repos (comme nous l’avons précisé, la vitesse v est égale à u). La relation (4.15) nous dit que w, la vitesse après la collision de la petite balle dans le référentiel où elle est initialement au repos est donnée par :
w=
u+u u 1+ c
u c
=
2u u 1+ c
2
(4.34)
Quand u est très faible par rapport à c, nous retrouvons le résultat non relativiste : la petite balle se déplace avec deux fois sa vitesse de 1 départ. Mais si u = c, (4.34) nous indique qu’après la collision la 2 4 petite balle est projetée, non pas à la vitesse de la lumière, mais à c. 5 3 Si u = c, après la collision, la petite balle est projetée, non pas à 4 3 c 24 2 = c. une fois et demie la vitesse de la lumière, mais à 2 25 3 1+ 4 90
Combiner (toutes) les vitesses
2
u 2u est forcément inférieur à 1 + c c 2 u [en partant du fait que si u < c, 1 − est forcément supérieur c Il est facile de démontrer que
à 0 : 1 −
u c
2
>0
u u 1− 2 + c c
2
>0
1+
u c
2
u > 2 ]. Par conséc
quent, quelle que soit la vitesse avec laquelle on lance la grosse balle, la petite balle est toujours projetée à une vitesse plus petite que celle de la lumière. En suivant la même démarche, nous pouvons réexaminer la situation dans laquelle une grosse balle et une petite balle sont lancées l’une contre l’autre avec la même vitesse u. L’étude non relativiste nous a montré que la petite balle rebondit sur la grosse avec une vitesse égale à trois fois sa vitesse initiale, comme cela est illustré sur la figure 1.7. Maintenant, quand on se place dans le référentiel de la grosse balle, la vitesse w de la petite balle avant la collision est donnée par (4.34). Dans le référentiel associé à la grosse balle, la petite balle rebondit et repart en sens inverse avec la même vitesse w. Quand on utilise la loi de composition relativiste des vitesses pour se placer dans le référentiel où la grosse balle est au repos, nous trouvons que la vitesse de la petite balle après la collision est :
w +u (4.35) w u 1+ c c Avec l’expression de w donnée par (4.34), on obtient : 3+
u c
u 1+ 3 c
2
2
u (4.36)
91
IL ÉTAIT TEMPS
u est très petit, on obtient effectivement un résultat très c proche du résultat non relativiste qui dit que la petite balle rebondit 1 7 avec une vitesse 3u, mais quand u = c, w vaut c, et même en pre3 9 2 62 c. nant u = c , w ne vaut que 3 63 Quand
92
5 Des événements simultanés et des horloges synchronisées
Entravés par une fausse représentation de la nature fondamentale du temps, profondément ancrée en nous, nous éprouvons les pires difficultés à concevoir qu’une impulsion de lumière puisse avoir la même vitesse dans le référentiel des rails et dans le référentiel du train. Avant qu’Einstein nous dise le contraire en 1905 – avant lui personne n’avait eu cette audace –, nous croyions implicitement que la simultanéité de deux événements éloignés dans l’espace avait un caractère absolu, qu’elle ne dépendait pas du référentiel dans lequel les événements étaient décrits. Cette idée s’est insinuée dans notre vision du monde, elle a infiltré notre langage jusqu’à enrayer toute tentative de questionnement sur ce qu’il y a réellement derrière l’affirmation que deux événements éloignés dans l’espace sont simultanés. Avant de s’embarquer dans un tel questionnement, il est nécessaire de s’attarder sur le terme événement, qui joue un rôle fondamental dans la description relativiste du monde. Un événement est une chose 93
IL ÉTAIT TEMPS
qui arrive à un instant précis et en un point donné de l’espace. Il s’agit, si vous préférez, de la généralisation à l’espace-temps de la notion purement géométrique d’un point de l’espace. En regardant de plus près, on réalise que le concept d’événement est aussi idéalisé que celui du point. Vous ne pouvez pas saisir et manipuler un objet si, comme un point géométrique, il a une extension spatiale nulle et, de même, vous ne pouvez pas raconter une histoire si elle a une extension nulle à la fois dans l’espace et dans le temps (une extension temporelle nulle est dite « instantanée » et une extension spatiale nulle est dite « ponctuelle »). Notre enclin à attribuer le statut d’événement à quelque chose dépendra de l’échelle avec laquelle nous souhaitons discerner les séparations spatiales et temporelles. Si, par exemple, l’unité temporelle sur laquelle on travaille est l’année et l’unité spatiale est la centaine de kilomètres, alors il paraît tout à fait judicieux de considérer qu’une réunion entre 13 heures 25 et 14 heures 40 dans la salle 115 du Rockefeller Hall sur le campus d’Ithaca de l’université de Cornell à New York est un événement (au moins pour des référentiels qui ne se déplacent pas trop vite par rapport à la Terre). Mais évidemment, ce n’est plus du tout adapté si on cherche à obtenir des données en minutes et en mètres. Un phénomène peut donc être considéré comme un seul et unique événement dans un référentiel donné si ses extensions spatiale et temporelle sont toutes deux petites devant l’échelle choisie pour les distances et les durées. Tous les événements que nous étudierons par la suite auront le statut d’événement dans tous les référentiels qui nous seront utiles, ils pourront être considérés comme des points de l’espace-temps. Comment pouvons-nous savoir si deux événements différents éloignés dans l’espace et simultanés dans le référentiel du train sont aussi simultanés dans le référentiel des rails ? Pour être concret, supposons qu’un des événements consiste à faire très rapidement une petite marque sur les rails (pendant qu’ils passent très vite sous le train) depuis l’arrière du train, et l’autre consiste à faire la même chose depuis l’avant. Vous pouvez modifier à votre guise la nature des deux 94
Des événements simultanés et des horloges synchronisées
événements : des cloches qui sonnent à l’avant et à l’arrière du train, des flashs lumineux produits à chaque extrémité, etc. Mais vu qu’il nous sera très utile de garder une trace de l’endroit sur les rails où chaque événement a eu lieu, le plus simple sera de choisir de marquer les rails. Comment Alice, placée dans le référentiel du train, peut-elle être convaincue que les deux marques sur les rails ont bien été faites en même temps ? Eh bien, elle peut fixer à chaque extrémité du train une horloge très précise et confirmer que chaque marque a bien été faite quand les horloges placées à chaque bout du train marquaient midi. Mais comment peut-elle être sûre que les deux horloges sont correctement synchronisées ? Comment peut-elle savoir vraiment qu’elles affichent toutes les deux midi exactement au même moment ? Prouver la simultanéité de deux événements avec des horloges conduit Alice directement dans une impasse puisque, pour confirmer que ses horloges sont correctement synchronisées, elle a besoin de mettre en œuvre un procédé que nous essayons justement de mettre au point : elle a besoin d’une méthode qui lui permette d’être sûre que deux événements ayant lieu à deux endroits différents – dans ce cas chaque horloge affichant midi – ont bien lieu au même moment. Nous voilà au centre d’une question cruciale. Certes, il est très utile d’avoir deux horloges à deux endroits différents, mais il faut qu’elles soient correctement synchronisées ! « Synchronisées » signifiant que les deux horloges présentent le même affichage au même moment. Par conséquent, vous avez besoin d’une méthode pour vérifier que deux événements éloignés dans l’espace sont simultanés si vous voulez vérifier que vos deux horloges éloignées dans l’espace sont synchronisées. La question de savoir si deux horloges éloignées dans l’espace sont synchronisées et la question de savoir si deux événements éloignés dans l’espace sont simultanés, sont juste deux facettes différentes d’une même énigme : vous pouvez répondre à une question si et seulement si vous pouvez répondre à l’autre. Ne nous décourageons pas et cherchons de nouvelles pistes. Alice pourrait réunir les deux horloges en un même lieu et vérifier par 95
IL ÉTAIT TEMPS
comparaison directe qu’elles affichent bien la même chose quand elles sont toutes les deux au même endroit, puis elle pourrait les faire transporter jusqu’aux deux extrémités du train. Mais comment vat-elle pouvoir s’assurer que le rythme de chaque horloge n’est pas perturbé par leur transport jusqu’aux extrémités du train ? Face à un phénomène aussi déroutant que l’invariance de la vitesse de la lumière, il serait plus prudent de supposer qu’elle ne sait rien sur le rythme des pulsations d’une horloge en mouvement (nous traiterons ce sujet en détail dans le chapitre 6). La méthode la plus simple pour vérifier si le transport des horloges n’a pas un effet étrange sur le rythme de leurs oscillations serait de comparer ce qu’elles affichent en arrivant au bout du train avec une autre horloge au repos préalablement installée. Mais nous ne pouvons faire cela que si nous sommes sûrs que les horloges préalablement installées à chaque bout du train sont correctement synchronisées, ce qui nous ramène au point de départ… Mais comment contourner le fait que nous ne savons pas quel impact peut avoir le mouvement d’une horloge sur le rythme de son fonctionnement ? Et si nous supposions que le déplacement des deux horloges démarre exactement depuis le milieu du train et que leur transport vers les deux extrémités est exécuté exactement de la même façon (à l’exception évidemment du fait qu’elles se déplacent dans deux directions opposées). Dans ce cas, même si le transport d’une des horloges modifie de façon étrange son fonctionnement, vu que l’autre subit exactement le même sort, le transport aura sur elle les mêmes conséquences. Ainsi, même si les deux horloges ont toutes deux perdu ou toutes deux gagné du temps à cause de leur mouvement, elles arriveront au bout du train avec le même affichage. Grâce à ce procédé, nous devrions pouvoir placer à chaque extrémité du train une horloge synchronisée avec celle de l’autre extrémité. C’est une méthode qui marche, oui, mais dans le référentiel du train ! Maintenant, nous sommes face à un nouveau problème. Même si Alice a imaginé un astucieux stratagème consistant à transporter de façon symétrique deux horloges synchronisées pour s’assurer de la 96
Des événements simultanés et des horloges synchronisées
simultanéité de deux événements dans le référentiel du train, Bob, qui utilise le référentiel des rails, ne sera pas d’accord pour dire que la procédure de transport des horloges est identique, parce que, pour lui, dans le référentiel des rails, le mouvement vers l’avant du train n’est pas assimilable au mouvement vers l’arrière. Bob sera d’accord avec Alice pour dire que ses horloges présentent bien les mêmes affichages aux instants où elles atteignent les extrémités du train vu qu’ils ne peuvent pas être en désaccord à propos des événements qui se produisent à la fois en un même lieu et au même moment. De fait, pour Bob, les deux horloges présentent bien le même affichage à leur arrivée, mais cela ne l’oblige pas pour autant à considérer qu’elles arrivent en même temps puisque, dans le référentiel des rails, les horloges n’ont pas été soumises à deux mouvements symétriques, par conséquent elles sont susceptibles d’avoir fonctionné à des rythmes différents pendant leur transport du centre du train vers les extrémités. Pour savoir, si du point de vue de Bob, les deux horloges atteignent ou non leurs destinations au même moment, il faudrait se lancer dans des calculs très élaborés. Il faudrait déterminer à quelle vitesse chaque horloge s’est déplacée dans le référentiel des rails et quelle distance chacune a parcourue. Ce calcul est, certes, compliqué, mais tout à fait faisable et il mène à une conclusion particulièrement remarquable que nous allons, heureusement, parvenir à extraire d’une façon beaucoup plus simple. Utilisons un procédé bien plus commode, comme celui qui nous a permis de trouver la composition relativiste des vitesses, et qui nous a évité tous les soucis inhérents au comportement fantasque des horloges. La méthode que nous utiliserons pour tester, dans le référentiel du train, le caractère simultané de deux événements éloignés dans l’espace ne mettra aucune horloge en jeu. De plus, on pourra très facilement voir les choses depuis le référentiel des rails. En effet, le changement de référentiel sera grandement facilité par le fait que la vitesse de la lumière est c = 1 pied/nanoseconde quel que soit son sens de propagation et quel que soit le référentiel dans lequel on se place. 97
IL ÉTAIT TEMPS
Mais pourquoi fait-on appel à un phénomène aussi étrange que l’invariance de la vitesse de la lumière dans un procédé destiné à déclencher de façon simultanée deux événements éloignés dans l’espace ? Si cette question vous traverse l’esprit, c’est que vous avez oublié pourquoi nous avons commencé à mettre en doute le caractère absolu de la simultanéité. En cherchant à mieux comprendre l’invariance de la vitesse de la lumière, nous nous sommes inquiétés de l’impact que pourrait avoir un changement de référentiel sur le caractère simultané de deux événements. La démarche que nous suivons est tout à fait logique : commencer par admettre cet étrange phénomène d’invariance et voir ensuite ce qu’il nous force à conclure sur le concept de simultanéité. Finalement, nous trouverons qu’il nous force à conclure que la simultanéité de deux événements éloignés dans l’espace dépend du référentiel (d’une façon qui peut être formulée de manière simple et quantitative). Remarquons pour commencer que, dans le référentiel du train, Alice peut s’assurer que les marques effectuées depuis les extrémités de son train sont bien simultanées en exploitant le fait que la lumière se propage à une vitesse c constante. Elle place une lampe exactement au milieu du train puis elle l’allume. La lumière de la lampe se propage à la même vitesse c vers les deux extrémités du train. Puisque la lumière doit parcourir la même distance (la moitié de la longueur du train) dans les deux directions et qu’elle se déplace à la même vitesse dans les deux directions, elle arrive aux deux extrémités du train forcément au même moment. Donc, si le marquage des rails est déclenché par l’arrivée de la lumière, les marques seront nécessairement effectuées au même moment. Alice a ainsi trouvé le moyen de produire deux événements simultanés à deux endroits différents dans le référentiel du train sans avoir à utiliser d’horloge. Bien sûr, cette procédure fonctionne, quelle que soit la nature du signal, à condition que le signal utilisé se propage du centre du train vers les deux extrémités à la même vitesse. Par contre, si la vitesse commune de ces signaux n’est pas celle de la lumière, alors 98
Des événements simultanés et des horloges synchronisées
l’analyse depuis le référentiel des rails n’est pas aussi simple qu’elle le serait avec des signaux lumineux, car, dans le référentiel des rails, les signaux qui partent vers les deux extrémités ne se propagent plus à la même vitesse. Il faudra donc calculer les deux vitesses en appliquant la composition relativiste, ce qui complique forcément les choses, mais les résultats obtenus avec des signaux lumineux peuvent être généralisés dans le cas de signaux de nature quelconque. Nous démontrerons par la suite (pages 107 à 110) que cette façon plus générale de produire deux événements simultanés dans le référentiel du train nous conduit à une relation entre la durée séparant deux événements dans le référentiel des rails et la distance entre deux événements dans le référentiel des rails qui sera exactement la même que celle que nous allons trouver maintenant avec beaucoup moins d’effort en utilisant des signaux lumineux. La question qui nous préoccupe est de savoir comment cette procédure, qui garantit à Alice de déclencher deux événements simultanés dans le référentiel du train, sera interprétée par Bob, qui utilise le référentiel des rails. Bob sera certainement d’accord pour dire que la lampe est au centre du train parce que dans un train de 100 wagons, Alice placerait la lampe entre les wagons 50 et 51 et comme Bob peut aussi compter les wagons, il trouvera le même nombre de wagons de chaque côté de la lampe : il ne pourrait donc pas contredire Alice sur ce point. (Cela resterait vrai même si la longueur du train dans le référentiel des rails était modifiée par son mouvement – nous verrons dans le chapitre 6 que c’est effectivement le cas –, car quel que soit cet étrange phénomène, les effets qu’il produirait sur la moitié avant du train seraient les mêmes que sur la moitié arrière.) Dans le référentiel des rails, dès que la lampe s’allume, la lumière commence à se propager vers les deux extrémités, mais l’arrière du train avance vers le point de départ de la lumière, alors que l’avant du train s’en éloigne. Étant donné que, dans le référentiel des rails, la vitesse de la lumière est égale à c indépendamment de son sens de propagation (n’oublions pas que nous utilisons un signal lumineux pour tirer parti de l’invariance de sa vitesse), il est clair que la lumière atteint plus 99
IL ÉTAIT TEMPS
rapidement l’arrière du train que l’avant (car l’arrière vient à sa rencontre alors que l’avant s’éloigne à mesure que la lumière le poursuit). C’est ainsi que Bob conclut qu’à l’instant où la lumière atteint l’arrière du train, elle n’a pas encore atteint l’avant : par conséquent, pour lui, la marque de derrière est faite avant la marque de devant. Le procédé qui garantit à Alice que les marques soient faites de façon simultanée dans le référentiel du train permet à Bob, qui utilise le référentiel des rails, de certifier qu’au contraire, elles ne sont pas simultanées. Un observateur pour lequel deux événements se produisent au même instant à deux endroits différents ne doit pas considérer cela comme une vérité absolue, il peut être contredit en toute bonne foi par un observateur utilisant un autre référentiel pour décrire la chronologie de ces événements. (Notons en passant que si on permute le temps et l’espace dans la phrase précédente, ce qui paraissait choquant devient alors une simple banalité : « Un observateur pour lequel deux événements se produisent au même endroit à deux instants différents ne doit pas considérer cela comme une vérité absolue, il peut être contredit en toute bonne foi par un observateur utilisant un autre référentiel pour décrire les positions relatives de ces événements.) Les gens utilisant le référentiel du train, dans lequel les marques sur les rails sont faites de façon simultanée, peuvent utiliser l’arrivée des signaux lumineux pour synchroniser entre elles des horloges placées à l’arrière et à l’avant du train. Par contre, les gens du référentiel des rails certifient que la marque à l’arrière a été faite avant celle de l’avant, ces mêmes personnes soutiendront par conséquent que la procédure de synchronisation utilisée par les gens du train a eu pour effet de décaler les affichages des deux horloges : de leur point de vue, celle de l’avant se retrouve en retard par rapport à celle de l’arrière. Il est facile de mesurer de façon quantitative l’intensité de ces désaccords. Analysons la procédure utilisée par Alice pour faire ses marques de façon simultanée à chaque extrémité de son train du point de vue de Bob, placé dans le référentiel des rails, dans lequel le train se déplace avec une vitesse v. Par commodité, nous noterons la 100
Des événements simultanés et des horloges synchronisées
longueur du train L. J’insiste bien sur le fait que L désigne la longueur du train dans le référentiel des rails. Même si nous sommes habitués à l’idée que la longueur d’un objet soit indépendante du référentiel dans lequel il est mesuré, nous ne pouvons plus considérer cela comme une vérité absolue et, comme cela a déjà été mentionné, nous allons prouver que cette idée est effectivement fausse. Dans la partie (1) de la figure 5.1, la lampe est allumée au milieu du train et les deux impulsions de lumière – que nous appellerons des photons – commencent à se propager à partir du centre vers les deux extrémités. c
L
c
v (1)
c
Tg
E2
c
L
v Td
(2) E1 L D
T c v
(3)
Figure 5.1 | La figure montre une série d’événements à trois instants différents du temps des rails. Toutes les longueurs, les temps et les vitesses sont relatifs aux référentiels des rails. Le long rectangle horizontal est un train de longueur L se déplaçant vers la droite avec une vitesse v. Les cercles blancs sont des photons qui se déplacent avec la vitesse c. (1) Deux photons sont produits à cet instant au centre du train, l’un est émis vers l’avant, l’autre vers l’arrière. (2) Au bout d’un temps Tg, le photon de gauche atteint l’arrière du train et une marque noire (carré noir) est laissée sur les rails pour enregistrer le lieu de l’événement (Événement E2). (3) Au bout d’un temps Td, le photon de droite atteint l’avant du train et une nouvelle marque est laissée sur les rails pour enregistrer le lieu de l’événement (Événement E1). La marque faite en E1 se retrouve à une distance D de la marque faite en E2. La durée entre les deux événements E1 et E2 est T = Td – Tg. Par un raisonnement expliqué dans le texte, on démontre que la durée T et la distance D entre les événements E1 et E2 sont reliées par la formule T = Dv/c2. 101
IL ÉTAIT TEMPS
La partie (2) de la figure 5.1 illustre la situation lorsqu’une durée Tg s’est écoulée, juste au moment où le photon émis vers la gauche touche l’arrière du train venu à sa rencontre. Pile à ce moment-là, une marque est faite sur les rails à l’endroit où la rencontre a eu lieu. Pendant la durée Tg, le photon (qui se déplace avec la vitesse c) a parcouru la distance cTg. Cette distance correspond à la moitié de la longueur du train, à laquelle il faut retrancher la distance parcourue par l’arrière du train (en mouvement à la vitesse v) en direction du photon pendant la durée Tg. Il vient : L cTg = − vTg (5.1) 2 La partie (3) de la figure 5.1 illustre la situation un temps Td après la partie (1) où la lampe a été allumée. À cet instant, le photon parti vers la droite atteint l’avant du train qui n’a échappé que momentanément à la poursuite du photon. À l’instant de la rencontre, une marque est faite sur les rails exactement à l’endroit où le photon a touché l’avant du train. Pendant le temps Td, le photon a parcouru une distance cTd. Cette distance n’est que la moitié de la longueur du train, à laquelle il faut ajouter la distance parcourue par l’avant du train pendant le temps Td. Il en résulte que : L cTd = + vTd (5.2) 2 Nous voulons trouver la durée T = Td – Tg entre les deux marquages, il vient naturellement à l’idée de soustraire la relation (5.1) à la relation (5.2), vu que le terme de gauche devient c(Td – Tg), qui s’écrit plus simplement cT. Grâce à ce procédé, la longueur inconnue L disparaît du résultat et on obtient :
cT = v(Td + Tg ) (5.3)
Mais que représente (Td + Tg) ? Heureusement, le produit de cette quantité par c a une signification très simple : c(Td + Tg) est la somme de cTg, la distance parcourue par la lumière émise vers la gauche du 102
Des événements simultanés et des horloges synchronisées
point où la lampe a été allumée (représenté dans la partie (1) de la figure 5.1) jusqu’au point où elle atteint l’arrière du train (représenté dans la partie (2) de la figure 5.1) lorsqu’une marque est faite sur les rails. Et cTd est la distance que parcourt la lumière émise vers la droite du point où la lampe a été allumée jusqu’au point où elle atteint l’avant (représenté dans la partie (3) de la figure 5.1) lorsqu’une autre marque est faite sur les rails. Ce qui nous permet d’exprimer la distance totale D le long des rails entre les deux marques de la façon suivante :
D = c(Td + Tg ) (5.4)
En remplaçant (Td + Tg) dans (5.3) par D/c puis en divisant les deux côtés de (5.3) par c de manière à isoler T, nous obtenons la relation entre la durée T dans le référentiel des rails qui sépare la création des deux marques et leur distance D également dans le référentiel des rails : Dv T = 2 (5.5) c Il est possible de formaliser tout ceci par une règle générale où il ne sera plus question d’Alice, de Bob, du train, des rails et des marques : Si des événements E1 et E2 sont simultanés dans un référentiel, alors, dans un second référentiel qui se déplace en ligne droite de E1 vers E2 avec une vitesse v, l’événement E2 se produit avec un temps T = Dv/c2 d’avance sur l’événement E1, où D est la distance mesurée entre les événements dans le second référentiel. Quelle est donc l’intensité de cet effet ? Supposons que finalement les deux marques sur les rails soient séparées par une distance de 3 km et que la vitesse du train soit de 30 m/s (environ 110 km/h). Si on prend 300 000 km/s pour la vitesse de la lumière, on obtient une durée T = Dv/c2 égale à 1 picoseconde (10–12 s) : les deux événements simultanés dans le référentiel du train seraient alors séparés par 1 picoseconde dans le référentiel des rails. Ce n’est pas le genre de choses qu’on risque de remarquer au quotidien. En revanche, pour un physicien qui manipule des lasers, une mesure de temps avec une 103
IL ÉTAIT TEMPS
précision jusqu’à 1 000 fois plus petite que 1 picoseconde (1 femto seconde) n’a rien d’extraordinaire. Comme je l’ai déjà précisé, lorsqu’on permute le rôle du temps et de l’espace dans l’affirmation que deux référentiels peuvent ne pas être d’accord sur l’ordre chronologique de deux événements éloignés dans l’espace, elle se transforme en un véritable lieu commun : deux référentiels peuvent ne pas être d’accord sur les positions relatives de deux événements éloignés dans le temps. Si on exprime la vitesse de la lumière dans n’importe quel système d’unités où elle vaut 1, par exemple le pied/nanoseconde, alors cette curieuse symétrie vis-à-vis de la permutation du temps et de l’espace devient quantitative aussi bien que qualitative. La règle des événements simultanés stipule que : Si deux événements se produisent au même moment dans le référentiel du train, alors, dans le référentiel des rails, le temps qui les sépare en nanosecondes est égal à la distance qui les sépare en pieds multipliée par la vitesse v du train le long des rails (mesurée en pieds par nanoseconde). Prenez cette affirmation et permutez temps et espace dans chacun des mots en italique sans aucun autre changement. Ce que vous obtenez est une deuxième règle : Si deux événements se produisent au même endroit dans le référentiel du train, alors, dans le référentiel des rails, la distance qui les sépare en pieds est égale au temps qui les sépare en nanosecondes multiplié par la vitesse v du train le long des rails (mesurée en pieds par nanoseconde). Ce second énoncé nous est très familier, il s’agit tout simplement de la méthode de calcul de la distance parcourue par un point – par exemple, le fauteuil d’un wagon entre le moment où un passager s’assoit et celui où il se lève – se déplaçant à une vitesse donnée pendant un temps donné. Nous retrouverons plus loin d’autres exemples de la merveilleuse symétrie entre temps et espace. La règle quantitative que nous venons de découvrir pour les événements simultanés engendre une règle quantitative similaire pour 104
Des événements simultanés et des horloges synchronisées
les horloges synchronisées. Nous avons remarqué auparavant que le désaccord sur la simultanéité de deux événements est intimement lié au désaccord sur le caractère synchronisé de deux horloges. Pour formuler une règle quantitative concernant les désaccords sur la synchronisation des horloges, nous avons besoin de nous attarder sur ce qui suit : Supposons que les instants des deux marquages soient mesurés par deux horloges, correctement synchronisées dans le référentiel des rails et attachées aux endroits où les marques sont réalisées. Comment les gens utilisant le référentiel du train, pour qui les marquages sont simultanés, justifient-ils le fait que les horloges attachées aux rails affichent des temps qui différent d’une quantité Dv/c2 ? Très facilement ! De leur point de vue, l’horloge attachée à la marque arrière indique un temps antérieur à celui indiqué par l’horloge attachée à la marque avant : l’horloge attachée à la marque arrière est tout simplement en retard sur celle qui est attachée à la marque avant. Les deux horloges sont donc décalées exactement de Dv/c2 et l’horloge qui, de leur point de vue, est située à l’avant des rails en mouvement, est en retard sur celle de l’arrière. Ce qui nous permet d’écrire la règle suivante : Si deux horloges sont synchronisées et séparées par une distance D dans leur référentiel propre, alors dans le référentiel dans lequel les horloges se déplacent avec une vitesse v le long de la droite qui les relie, l’affichage de l’horloge de devant est en retard par rapport à l’affichage de l’horloge de derrière d’une quantité Dv/c2. En prenant c = 1 pied/nanoseconde, on peut exprimer cette règle en disant tout simplement que le retard (en nanosecondes = 10–9 s) de l’horloge de devant sur l’horloge de derrière est égal au produit de v (vitesse de déplacement des horloges en pieds/nanoseconde) par la distance séparant les deux horloges dans leur référentiel propre (en pieds). Même avec une vitesse v égale à la vitesse de la lumière, cet effet reste faible : le décalage présenté par deux horloges distantes de D = 300 m (environ 103 pieds) dans leur référentiel propre est à peine 105
IL ÉTAIT TEMPS
de 1 microseconde (1 × 103 pieds · 10–9 s = 10–6 s = 1 microseconde) pour un observateur placé dans un référentiel dans lequel les horloges se déplacent à la vitesse de la lumière. Et évidemment, si v est petit devant c, cet effet diminue en proportion. Toujours pour une distance D = 300 m dans le référentiel propre des horloges, si v = 340 m/s (la vitesse du son, égale à environ 10–6 pied/nanoseconde), le décalage n’est plus que de l’ordre de 1 picoseconde (10–6 × 103 pieds · 10–9 s = 10–12 s). Notez bien que la règle T = Dv/c2 des événements simultanés et la règle T = Dv/c2 des horloges synchronisées relient entre eux un temps T et une distance D relatifs à un seul et même référentiel. La règle des événements simultanés relie la distance D et le temps T séparant deux événements dans le référentiel dans lequel ils ne sont pas simultanés. Dans la règle des horloges synchronisées, D est la distance entre les horloges dans le référentiel dans lequel elles sont synchronisées, et T est le décalage entre leurs affichages lus dans le référentiel dans lequel elles ne sont pas synchronisées, mais leurs affichages correspondent au « temps » du référentiel dans lequel elles sont synchronisées. Dans le chapitre 4, nous avons constaté que nos diverses tentatives de propulser un objet à une vitesse plus grande que celle de la lumière – des fusées à plusieurs étages ou des collisions à très grande vitesse – ont toutes échouées. La règle T = Dv/c2 des événements simultanés nous apporte une preuve directe de l’aspect problématique d’un objet se déplaçant plus vite que la lumière. Imaginons un objet qui se déplace vers la droite le long des rails à une vitesse u plus grande que c. Cet objet parcourt une distance D dans le référentiel des rails à chaque fois qu’une durée T = D/u s’écoule dans ce même référentiel. Si nous attribuons au train une vitesse v de valeur c2/u (qui sera, elle, plus petite que la vitesse de la lumière, étant donné que c/u est plus petit que 1), alors nous avons T = Dv/c2. Utilisons maintenant la règle des événements simultanés sous sa forme réciproque : comme le temps T et la distance D entre deux positions de l’objet sont reliés par la relation T = Dv/c2 dans le référentiel des rails, alors dans le référentiel du train ces événements doivent être 106
Des événements simultanés et des horloges synchronisées
simultanés. C’est ainsi que dans le référentiel du train l’objet pourrait se trouver à deux endroits différents au même moment ! Cette situation est si bizarre qu’elle ne fait que confirmer nos soupçons : toutes les difficultés que nous rencontrons pour propulser des objets à une vitesse plus grande que celle de la lumière doivent provenir de l’impossibilité physique d’un tel mouvement. Cette conclusion ne fera que se renforcer au fur et mesure que nous avancerons dans les prochains chapitres et que nous examinerons d’autres situations problématiques engendrées par des vitesses supraluminiques. Le reste de ce chapitre sera consacré à démontrer que la règle T = Dv/c2 des événements simultanés reste valable (comme il se doit) même si Alice utilise des signaux qui ne se propagent pas à la vitesse de la lumière dans le référentiel du train. On utilise de préférence des signaux lumineux, car l’analyse est grandement simplifiée étant donné que les signaux lumineux (et seulement eux) ont la même vitesse dans le référentiel du train et dans celui des rails. Je vous encourage au moins à jeter un coup d’œil à cette discussion même si elle n’est pas essentielle pour les développements qui suivront.
La règle T = Dv/c2 des événements simultanés joue un rôle tellement central dans la théorie de la relativité qu’il est important de montrer qu’elle reste valable quels que soient les signaux utilisés par Alice pour produire des marques simultanées sur les rails. Elle peut utiliser n’importe quels types de signaux du moment qu’ils se propagent depuis le milieu de son train jusqu’aux extrémités avec la même vitesse u dans le référentiel du train. Pour examiner cela, nous allons supposer que la vitesse u des deux signaux d’Alice, même s’ils ne vont pas aussi vite que la lumière, se propagent plus vite que la vitesse v de son train dans le référentiel des rails, ainsi le signal qu’elle émettra vers l’arrière se déplacera dans le sens opposé au signal qu’elle émettra vers l’avant, même dans le référentiel des rails. Notons les vitesses des signaux envoyés par Alice wd vers la droite et wg vers la gauche. Plus tard, il nous faudra utiliser 107
IL ÉTAIT TEMPS
leurs expressions en fonction de u et v en utilisant la composition relativiste des vitesses du chapitre 4. La figure 5.2 illustre la situation. Remarquez qu’elle ne diffère de la figure 5.1 que par le fait que nous avons remplacé c par wd ou wg, en fonction du sens de propagation du signal. Pour réécrire (5.1) et (5.2), il faut juste remplacer c par le w adapté, ce qui nous donne L w g Tg = − vTg (5.6) 2 et L wdTd = + vTd (5.7) 2 Et la distance totale D entre les deux marques le long des rails et maintenant donnée par D = wdTd + w g Tg (5.8)
wg
wd L
v (1) Tg
wg
wd
L
v Td
(2) E1 L D
T wd v
(3)
Figure 5.2 | Si les signaux d’Alice se propagent vers les deux extrémités du train avec une vitesse différente de c, alors leurs vitesses dans le référentiel des rails seront aussi différentes de c. Par conséquent, la figure 5.1 doit être adaptée. Les cercles blancs représentent toujours les signaux d’Alice, mais ce ne sont plus des photons. L’un des signaux se propage vers l’avant du train avec une vitesse wd. L’autre se propage vers l’arrière avec une vitesse wg.
108
Des événements simultanés et des horloges synchronisées
Pour trouver la relation qui relie la durée T = Td – Tg entre les deux marquages dans le référentiel des rails et la distance D séparant les marques dans le référentiel des rails, nous devons maintenant faire un peu plus d’effort que précédemment, car wg et wd ne sont pas égaux à c. Commençons par isoler Tg et Td dans les relations (5.6) et (5.7) :
1 L Tg = 2 (5.9) wg + v
1 L Td = 2 (5.10) wd − v Nous obtenons alors l’expression de T en fonction de L :
T=
1 1 1 L⋅ − (5.11) wd − v w g + v 2
En remplaçant Tg et Td dans l’expression (5.8), nous obtenons également D en fonction de L :
D=
wg wd 1 (5.12) L⋅ + wd − v w g + v 2
En divisant (5.11) par (5.12) on obtient une expression un peu lourde pour le rapport de T sur D :
2v − (wd − w g ) T = (5.13) D 2wd w g + v ⋅ (wd − w g )
Quelques remarques à propos de (5.13) : Si les signaux d’Alice avaient été des signaux lumineux, alors les deux vitesses wd et wg dans le référentiel des rails auraient été égales à c. On peut facilement vérifier que lorsque wg = wd = c, la relation (5.13) se simplifie en T/D = v/c2, ce qui démontre la règle T = Dv/c2, mais d’une façon beaucoup moins élégante que précédemment. 109
IL ÉTAIT TEMPS
En supposant maintenant que la composition non relativiste des vitesses soit valable, nous aurions alors :
wd = u + v et wg = u – v (5.14)
On aurait wd – wg = 2v et la relation (5.13) deviendrait simplement T/D = 0 : la durée entre les marquages est nulle aussi bien dans le référentiel des rails que dans celui du train. On retrouve bien la règle non relativiste (fausse) des événements simultanés : deux événements qui sont simultanés dans le référentiel du train sont aussi simultanés dans le référentiel des rails. Finalement, pour obtenir le bon résultat, il faut remplacer wd et wg dans la relation (5.13) par leurs expressions relativistes correctes trouvées dans le chapitre 4 :
wd =
u+v u−v ; w g = (5.15) uv uv 1+ 1− c c c c
Et si on simplifie avec précaution la lourde expression qui en résulte, on est agréablement surpris de constater qu’elle se réduit simplement à v/c2 : v T = (5.16) D c2 Nous avons donc retrouvé la règle T = Dv/c2 sans faire aucune hypothèse sur la nature des signaux utilisés par Alice, il suffit que ces signaux se propagent dans les deux sens du référentiel du train avec la même vitesse u. L’invariance de la vitesse de la lumière ne joue donc pas un rôle clé dans la procédure de synchronisation des horloges, mis à part le fait que l’utilisation de signaux lumineux nous facilite grandement les calculs (elle a toutefois joué un rôle central dans la déduction de la composition relativiste des vitesses que nous avons utilisée pour trouver la vitesse des signaux d’Alice dans le référentiel des rails).
110
6 Une horloge en mouvement ralentit et une règle en mouvement raccourcit
Dans le chapitre 5, nous avons conclu que deux horloges synchronisées séparées par une distance D dans un référentiel où elles sont toutes deux au repos ne sont plus synchronisées lorsqu’on se place dans un autre référentiel dans lequel elles se déplacent avec une vitesse v le long de la droite qui les relie. L’horloge située à l’avant est en retard sur l’horloge située à l’arrière d’une quantité T donnée par la formule suivante : Dv T = 2 (6.1) c Nous avons trouvé cette règle lorsque nous nous sommes placés avec Alice dans le référentiel du train pour observer simultanément deux horloges utilisées par Bob dans le référentiel des rails. Alice est convaincue que les horloges de Bob sont désynchronisées puisqu’elles présentent deux affichages différents au moment exact où deux événements simultanés se produisent (les deux marques sur les rails). Quant à Bob, il soutient au contraire que ses deux horloges sont 111
IL ÉTAIT TEMPS
parfaitement synchronisées, mais que ce sont les deux marques sur les rails qui ont été faites à deux instants différents. Le principe de relativité exige que la règle (6.1) soit valable dans n’importe quel référentiel inertiel. Nous avons déduit (6.1) en découvrant avec Alice que les deux horloges de Bob étaient désynchronisées, le principe de relativité prévoit donc que, pour Bob, les horloges d’Alice sont aussi désynchronisées (bien qu’elle ait pris la peine de les synchroniser dans son référentiel). En explorant les conséquences de la relation (6.1) d’une part sur les horloges synchronisées par Alice dans le référentiel du train et d’autre part sur les horloges synchronisées par Bob dans le référentiel des rails, nous allons parvenir à des avancées intéressantes sur la question du rythme avec lequel Alice voit fonctionner les horloges de Bob (et vice versa) et sur la question de la longueur que Bob attribue au train d’Alice ou qu’Alice attribue à un certain tronçon des rails de Bob. Nous verrons que les horloges en mouvement tournent plus lentement et que les trains en mouvement (ou les rails en mouvement) raccourcissent le long de la direction de leur mouvement. Nous établirons enfin l’expression mathématique du facteur par lequel le rythme des horloges est ralenti ou par lequel la longueur des objets est raccourcie. Imaginons qu’Alice synchronise ses deux horloges puis en fixe une à chaque extrémité de son train. La partie droite de la figure 6.1 illustre cette situation dans le référentiel du train. Étant donné que les deux horloges du haut sont synchronisées dans le référentiel du train, elles affichent toutes les deux le même temps : 0. La longueur propre du train LA est indiquée sur le schéma, il s’agit de la longueur du train mesurée dans un référentiel où celui-ci est au repos. Le schéma fait également apparaître deux horloges en bas, fixées sur des rails qui, eux, se déplacent vers la gauche à la vitesse v. Les horloges des rails ont été préalablement synchronisées dans leur référentiel propre. Il s’ensuit que dans le référentiel du train, l’horloge des rails située à l’avant retarde par rapport à celle de l’arrière d’une quantité que nous noterons TB. 112
UNE HORLOGE EN MOUVEMENT RALENTIT…
Si on se place maintenant dans le référentiel des rails, on constate que les horloges d’Alice ne sont plus synchronisées, car elles ont été synchronisées dans le référentiel du train (ce point de vue est illustré dans la partie gauche de la figure 6.1). Du point de vue de Bob, placé dans le référentiel des rails, les deux horloges d’Alice n’afficheront donc pas 0 au même instant. Ainsi, il nous faudra deux schémas pris à deux instants différents du temps des rails pour visualiser les deux instants où Bob lit 0 sur une des horloges d’Alice. Le schéma en haut à gauche de la figure 6.1 représente la situation au moment où l’horloge fixée à l’arrière du train indique 0. Comme l’horloge située à l’avant retarde par rapport à celle de l’arrière, son affichage sera donc négatif, nous le noterons − TA. Entre les deux schémas de la partie gauche de la figure 6.1, l’horloge de l’avant du train a avancé de − TA à 0, pendant que l’horloge à l’arrière a avancé de la même durée de 0 à TA (elles avancent de la même durée, car ce sont deux horloges identiques se déplaçant à la même vitesse). Par contre, dans le référentiel des rails, la durée qui s’écoule entre les deux schémas de gauche est TB, les deux horloges des rails ont chacune avancé d’une même quantité TB. Au vu des deux schémas de gauche, il est évident que les horloges des rails sont synchronisées. La règle (6.1) nous dit que la différence TA entre les affichages des horloges du train lues depuis le référentiel des rails est reliée à la distance LA par la relation suivante : L ⋅v TA = A2 (6.2) c où v est la vitesse du train dans le référentiel des rails. De la même façon, la différence TB entre les affichages des horloges des rails lue depuis le référentiel du train est reliée à la distance DB par la relation suivante : D ⋅v TB = B2 (6.3) c où v représente cette fois-ci la vitesse des rails par rapport au train (mais elle est égale à celle du train par rapport aux rails). Les relations (6.2) et (6.3) et l’analyse de la figure 6.1 vont nous permettre de 113
IL ÉTAIT TEMPS
déduire tout ce qu’il faut savoir sur le rythme des horloges en mouvement et sur la longueur des trains (ou des rails) en mouvement. Le rapport TA/TB est le « facteur de ralentissement » des horloges. (Je l’appelle dès maintenant « facteur de ralentissement », car il sera effectivement plus petit que 1.) Entre les deux schémas de la partie gauche de la figure 6.1, les horloges des rails avancent d’une quantité TB pendant que les horloges du train avancent d’une quantité TA, ainsi le rapport TA/TB représente aussi le taux avec lequel les horloges du train avancent par rapport à celles des rails. Référentiel des rails (celui de Bob)
Référentiel du train(celui d’Alice)
–TA
0 LB
v
0
0
LA v
TA
TB
0 DA
0 LB
TB
0
0
DB
v TB
DB
Figure 6.1 | Sur chacun de ces trois schémas, il y a quatre horloges, un train et des rails. Le train est représenté par un long rectangle. Deux des horloges sont solidaires du train, une devant, l’autre derrière (ce sont les petits rectangles arrondis aux sommets, juste au-dessus de l’arrière et de l’avant du train). Les rails sont représentés par deux lignes parallèles sous le train. Les deux autres horloges sont solidaires des rails (ce sont les deux petits rectangles arrondis aux sommets placés sous les rails). Les deux horloges solidaires du train sont synchronisées dans le référentiel du train ; les deux autres horloges, solidaires des rails, sont synchronisées dans le référentiel des rails. Le temps affiché par les horloges est inscrit à l’intérieur des petits rectangles arrondis qui les symbolisent.
114
UNE HORLOGE EN MOUVEMENT RALENTIT…
Le schéma de droite représente un seul et unique instant du temps du train. Les deux horloges du train indiquent le même temps 0. Les rails et leurs horloges se déplacent vers la gauche à la vitesse v. Les horloges des rails ne sont pas synchronisées dans le référentiel du train : l’horloge de devant est en retard par rapport à l’horloge de derrière d’un temps TB. La longueur du train dans le référentiel du train constitue donc sa longueur propre LA. À cet instant du référentiel du train, les horloges des rails sont juste sous les horloges du train. Le schéma fait apparaître de manière évidente que LA est égale à DA, la longueur mesurée dans le référentiel du train du tronçon de rails (mobile) compris entre les deux horloges. Les deux schémas de gauche représentent deux instants différents du temps des rails. Le schéma du haut correspond à l’instant où les deux horloges affichent 0 ; le schéma du bas correspond à l’instant où les deux horloges affichent TB. Le train et ses horloges se déplacent vers la droite à la vitesse v. Remarquez que les horloges du train ne sont pas synchronisées dans le référentiel des rails : l’horloge de devant est en retard sur celle de derrière d’un temps TA. La longueur du tronçon de rails délimité par les deux horloges du référentiel des rails est notée DB, il s’agit de la longueur propre du tronçon. La longueur du train dans le référentiel des rails est LB. De la même manière, le calcul de LB/LA, le rapport de la longueur LB du train dans le référentiel des rails sur sa longueur propre LA mesurée dans un référentiel où le train est à l’arrêt, nous permet de comparer les longueurs du train dans les deux référentiels. J’anticipe à nouveau sur la suite : le rapport LB/LA joue le rôle d’un « facteur de contraction », on montrera plus loin que ce rapport est effectivement plus petit que 1. Par réciprocité, le facteur de contraction peut être obtenu en calculant le rapport DA/DB de la longueur DA, mesurée depuis le train, du tronçon de rails compris entre ses deux horloges sur la longueur DB du même tronçon dans le référentiel des rails. Nous avons donc : LB DA (6.4) = LA DB 115
IL ÉTAIT TEMPS
Pour exprimer le facteur de ralentissement et de contraction, nous avons besoin de deux relations supplémentaires : 1°) La partie droite de la figure 6.1 montre de façon évidente que la distance DA mesurée dans le référentiel du train entre les deux horloges fixées sur les rails est égale à la longueur LA du train dans son référentiel propre :
LA = DA (6.5)
Nous avons pu écrire l’égalité (6.5), car les horloges placées à chaque extrémité du train présentent le même affichage, il est important que le schéma de droite de la figure 6.1 représente bien un seul et unique instant du temps du train. Si, au contraire, la figure avait été une mosaïque réunissant différents moments du temps du train, alors le mouvement des rails sous le train aurait fait apparaître plusieurs images des rails à différents instants du train et il nous aurait été impossible de conclure quoi que ce soit sur la longueur du tronçon de rails compris entre ses deux horloges dans le référentiel du train. 2°) Le point de vue du référentiel des rails illustré par les deux schémas de la partie gauche de la figure 6.1 donne une relation un peu plus compliquée entre LB et DB. Selon ces deux schémas, DB est la distance mesurée dans le référentiel des rails entre la position de l’arrière du train à l’instant 0 et celle de l’avant du train à l’instant TB (0 et TB sont deux instants différents du temps des rails). La distance DB est égale à la longueur LB du train mesurée dans le référentiel des rails à laquelle il faut ajouter la distance parcourue par le train entre les deux schémas. Étant donné que la durée entre les deux schémas est TB (comme on peut le constater sur les deux horloges des rails) et que le train se déplace à une vitesse v, la distance parcourue par le train entre les deux schémas est vTB. Nous avons ainsi :
DB = LB + vTB (6.6)
Toute la démonstration qui va suivre s’appuie sur les relations (6.2) à (6.6). Pour commencer, nous pouvons immédiatement 116
UNE HORLOGE EN MOUVEMENT RALENTIT…
conclure à partir des relations (6.2), (6.3) et (6.5) que le facteur de ralentissement des horloges en mouvement est forcément le même que le facteur de contraction des objets en mouvement. Une division membre à membre de (6.2) par (6.3) nous dit que TA/TB = LA/DB, mais comme (6.5) nous dit que LA = DA, on obtient :
TA DA = (6.7) TB DB
Le membre de gauche de cette égalité est le facteur de ralentissement des horloges en mouvement alors que le membre de droite est le facteur de contraction des objets en mouvement. Si on note ce facteur s, nous pouvons écrire : TA = sTB ; DA = sDB et également LB = sLA (6.8) [La dernière égalité provient de (6.4)]. Les deux relations (6.3) et (6.6) vont nous aider à trouver l’expression de s, le facteur de contraction (ou de ralentissement) en fonction de v. Si on remplace TB dans (6.6) par son expression donnée dans (6.3), v2D nous trouvons que DB = LB + 2 B , ainsi : c
LB = DB ⋅ 1 −
v2 (6.9) c2
À partir de (6.5) et (6.8), on peut écrire que LA = DA = sDB. Or, toujours d’après (6.8), LB = sLA, ce qui nous donne LB = s2 · DB, en remplaçant LB dans (6.9) on obtient finalement
s2 ⋅ DB = DB ⋅ 1 −
v2 (6.10) c2
Nous voilà au bout de notre démonstration, le facteur de ralentissement (ou de contraction) est
s = 1−
v2 (6.11) c2 117
IL ÉTAIT TEMPS
(Habituellement, en relativité, on utilise plutôt 1/s, l’inverse de s qui est traditionnellement noté γ. Pour ce qui nous intéresse, il est préférable d’utiliser s = 1/γ, qui est plus intuitif et s’avèrera plus utile.) Remarquons que s est la racine carrée d’un nombre plus petit que 1, s est donc bien plus petit que 1 : c’est effectivement un facteur de contraction ou un facteur de ralentissement. Remarquons également que si v venait à dépasser la vitesse de la lumière c, alors (6.10) ferait de s2 un nombre négatif, ce qui n’aurait pas de sens. Rappelonsnous également que la situation étudiée dans le chapitre 5 n’a de sens que si la vitesse v du train le long des rails est inférieure à la vitesse de la lumière, car si le train se déplace plus vite que la lumière alors le photon qui part du milieu du train ne peut jamais atteindre l’avant du train dans le référentiel des rails. Voilà un autre indice qui nous suggère que c constitue la limite supérieure de la vitesse que peut prendre un objet dans n’importe quel référentiel inertiel. La contraction des objets le long de la direction de leur mouvement est souvent appelée la contraction de Fitzgerald en l’honneur du physicien irlandais peu connu qui l’a suggérée le premier. Ce phénomène est aussi appelé la contraction de Lorentz-Fitzgerald en l’honneur du grand physicien hollandais H.A. Lorentz qui a eu la même idée à peu près au même moment. Le plus souvent, on l’appelle juste la contraction de Lorentz, une manifestation de plus de l’effet Mathieu (« On donnera à celui qui a et il sera dans l’abondance, mais à celui qui n’a pas on ôtera même ce qu’il a. »). Lorentz et Fitzgerald suggérèrent que les objets devaient subir une contraction lorsqu’ils étaient en mouvement par rapport à « l’éther ». Mais ils n’ont pas eu la perspicacité nécessaire pour comprendre que cette contraction se produit dans n’importe quel référentiel inertiel pour lequel l’objet est en mouvement. Ils n’ont pas saisi le caractère relatif de la simultanéité et le rôle essentiel joué par cet aspect dans la cohérence globale de la théorie. En revanche, toutes ces idées n’ont pas échappé à la clairvoyance d’Einstein. On fait souvent référence au ralentissement des horloges en mouvement par l’expression « dilatation du temps », cette dénomination est 118
UNE HORLOGE EN MOUVEMENT RALENTIT…
malencontreuse, car elle suggère vaguement que le « temps lui-même » (quelle qu’en soit la substance) se dilate quand une horloge en mouvement se met à tourner plus doucement. Certes, l’idée que le temps s’étire pour une horloge en mouvement peut séduire, mais il ne faut pas perdre de vue que ce phénomène n’a absolument rien à voir avec le concept global de temps. C’est simplement la mise en relation de deux jeux d’horloges qui produit la mal nommée « dilatation du temps ». Alors que nous croyons communément qu’il existe quelque chose qui s’appelle le temps et qui est mesuré par une horloge, une des grandes leçons que nous donne la relativité est que le concept de temps n’est rien d’autre qu’un procédé commode (mais potentiellement trompeur) pour résumer toutes les relations qui existent entre différentes horloges. Supposons qu’un observateur soit placé dans un référentiel muni d’un jeu d’horloges au repos et synchronisées entre elles : si on considère maintenant un deuxième jeu d’horloges (synchronisées dans leur propre référentiel) en mouvement par rapport au premier, notre observateur trouvera que les horloges en mouvement sont désynchronisées et tournent au ralenti. Mais si notre observateur saute du premier référentiel au second (il est maintenant au repos par rapport au second jeu d’horloges qu’il considérait autrefois en mouvement), il s’étonnera de constater que le premier jeu d’horloges est maintenant désynchronisé et tourne au ralenti. Le chapitre 9 illustre en détail ce point. Il n’y a rien de surprenant à ce qu’on puisse être sceptique à propos de ce qui vient d’être dit sur la contraction des règles en mouvement et sur le ralentissement des horloges en mouvement. Alice affirme que les horloges de Bob tournent au ralenti alors que Bob affirme au contraire que ce sont les horloges d’Alice qui tournent au ralenti : comment peuvent-ils avoir tous les deux raison ? Si Alice affirme que les horloges de Bob tournent au ralenti, Bob ne devrait-il pas nécessairement confirmer que ce sont celles d’Alice qui tournent plus vite ? Supposons qu’Alice et Bob possèdent chacun un double-décimètre identique (imaginons qu’ils l’ont acheté ensemble avant qu’elle prenne son train) et qu’ils maintiennent les deux règles parallèlement 119
IL ÉTAIT TEMPS
à la direction de leur mouvement relatif. Si Alice affirme que la règle de Bob a rétréci par rapport à la sienne, alors Bob ne devrait-il pas lui confirmer en retour qu’il a constaté l’allongement de la règle d’Alice ? S’abandonner à ces doutes, c’est oublier qu’Alice et Bob n’ont pas le même jugement sur la simultanéité de deux événements éloignés dans l’espace ou, de façon équivalente, sur la synchronisation de deux horloges éloignées dans l’espace. À cause de ce désaccord de fond, chacun d’eux affirme que l’autre a déterminé de façon incorrecte le rythme des battements des horloges en mouvement ou la longueur de la règle en mouvement. Pour mesurer la longueur d’une règle en mouvement, il faut déterminer où se trouvent ses deux extrémités au même moment. Si vous ne localisez pas les deux extrémités d’une règle exactement au même moment, alors la règle se déplace entre vos deux tentatives de localisation et par conséquent votre mesure de longueur sera fausse. Pour faire cette mesure, il faut être sûr que deux événements éloignés dans l’espace (car ils se produisent à chaque extrémité de la règle) sont effectivement simultanés. De la même manière, pour comparer le rythme de fonctionnement d’une horloge en mouvement avec celui des horloges fixes, il est nécessaire de comparer au moins deux affichages de l’horloge en mouvement avec ceux des horloges fixes situées juste à côté d’elle aux moments où elle présente ces affichages. Puisque l’horloge en mouvement se déplace, cette opération nécessite l’utilisation de deux horloges au repos, synchronisées, mais situées à deux endroits différents. Il n’y a, par conséquent, rien d’incohérent à ce qu’Alice et Bob affirment chacun que l’horloge de l’autre fonctionne plus lentement et que la règle de l’autre a subi une contraction. Chacun peut pointer du doigt une erreur (l’utilisation d’horloges non synchronisées) dans la procédure que l’autre utilise pour faire ses mesures. Cela ne veut cependant pas dire que les phénomènes de « dilatation du temps » et de contraction des longueurs sont de simples conventions de langage pour décrire le comportement des horloges et des doubles décimètres. Comme nous le verrons, ces phénomènes peuvent avoir des conséquences vraiment frappantes. 120
UNE HORLOGE EN MOUVEMENT RALENTIT…
Une des plus simples manifestations de ces phénomènes, qui est connue et observée depuis un demi-siècle, nous est fournie par les particules subatomiques instables. Leur durée de vie caractéristique est τ. Si on observe un échantillon de ces particules, au repos ou en mouvement lent, environ la moitié se désintègre pendant une durée τ. Le comportement statistique de l’échantillon nous permet en quelque sorte de mesurer le temps, nous pouvons donc l’utiliser comme une horloge. Mais, contrairement aux montres et aux horloges, les particules subatomiques peuvent être accélérées à des vitesses u très proches de la vitesse de la lumière. Quand un échantillon de ces particules se déplace le long d’un rail à la vitesse u proche de la vitesse de la lumière c, la majorité des particules de l’échantillon arrivent à voyager sans se désintégrer sur des distances bien plus grandes que la distance uτ à laquelle on aurait pu s’attendre, cela montre bien que leur durée de vie est affectée par leur mouvement. Ces particules en mouvement parviennent à « rester en vie » bien plus longtemps qu’au repos, car les « horloges internes » qui gouvernent leurs désintégrations tournent au ralenti pour un observateur situé dans le référentiel où elles filent le long du rail à une vitesse proche de c. Voilà un exemple d’un effet bien réel qui joue un rôle essentiel dans les accélérateurs de particules. Mais comment ce comportement peut-il être cohérent avec le fait que dans le référentiel qui se déplace avec les particules, les horloges internes reprennent leur rythme normal et que seulement environ la moitié de l’échantillon survit pendant la durée τ ? La cohérence vient du fait que du point de vue des particules (dans le référentiel qui se déplace avec elles), le rail qui leur sert de guide est projeté à la vitesse u. Par conséquent, toutes les distances le long du rail sont raccourcies par le facteur de contraction, ce qui permet aux particules de voir passer pendant la durée τ un tronçon de rail bien plus étendu que celui qu’elles auraient vu défiler si le phénomène de contraction n’avait pas été à l’œuvre. Et voilà pourquoi les observateurs des deux référentiels sont d’accord pour dire que la moitié des particules sont capables de parcourir un plus grand tronçon de rail uτ/s où s, le facteur de ralentissement 121
IL ÉTAIT TEMPS
ou de contraction, vaut presque zéro pour des objets en mouvement, comme nos particules, à une vitesse v très proche de c. Dans le référentiel du rail, c’est parce qu’une particule peut espérer survivre pendant une durée τ/s bien plus longue que la durée de vie τ qu’elle aurait en moyenne au repos. Dans le référentiel des particules, c’est parce que le rail se contracte d’un facteur s, par conséquent le tronçon de rail qui défile devant les particules est multiplié par un facteur 1/s (1/s est beaucoup plus grand que 1, car s est très proche de zéro étant donné que u est très proche de c). On voit bien que les explications avancées diffèrent, mais que le comportement des particules reste bien le même. Cet effet a été précisément observé pour les particules appelées muons, avant même la construction des premiers accélérateurs de particules. Les muons sont produits dans la haute atmosphère par le rayonnement cosmique qu’elle reçoit de l’espace, ils ont une durée de vie au repos d’environ 2 microsecondes. Sans faire intervenir la « dilatation du temps » ou la contraction des longueurs, on prédit qu’en voyageant à la vitesse de la lumière, environ la moitié des muons devraient se désintégrer après seulement un parcours de 600 m. Et pourtant la moitié des muons produits dans la haute atmosphère parviennent à se frayer un chemin jusqu’au sol (à 30 km du lieu de leur production !). C’est seulement parce que les muons se déplacent à des vitesses si proches de la vitesse de la lumière que le facteur de contraction (ou de ralentissement) s est égal à 1/50, ils peuvent ainsi espérer durer 50 fois plus longtemps qu’au repos. Dans le référentiel des muons, leur durée de vie reste évidemment de 2 microsecondes, mais la moitié d’entre eux arrivent au sol parce que le sol se précipite vers les muons à une vitesse si importante que l’altitude de la haute atmosphère se contracte d’un facteur 1/s = 50, elle passe de 3 km à 600 m. Remarquons que, même s’il existe d’importants désaccords entre l’image des événements vécus par Alice dans le référentiel du train et les images des événements vécus par Bob dans le référentiel des rails, dès lors qu’on appose une loupe sur ces images pour ne garder que des événements qui arrivent à la fois en un même lieu et au même 122
UNE HORLOGE EN MOUVEMENT RALENTIT…
moment, on constate que les parties zoomées sont en parfait accord. Cette remarque est illustrée par la figure 6.2, qui n’est autre que la figure 6.1 redessinée pour mettre l’accent sur les événements de l’espace-temps sur lesquels Alice et Bob sont d’accord. Cette remarque peut être généralisée sous la forme d’une règle : tous les référentiels sont d’accord lorsqu’ils décrivent des événements qui se sont passés à la fois au même moment et en un même lieu. Référentiel des rails (celui de Bob)
Référentiel du train(celui d’Alice)
–TA
0 LB
v
0
0
LA v
TA LB
TB
0 DA
0
TB
0
0
DB
v TB
DB
Figure 6.2 | Il s’agit tout simplement de la figure 6.1 redessinée de façon à mettre l’accent sur le fait qu’il existe d’importants désaccords entre Alice et Bob, mais qu’il y a un accord total sur les événements qui se passent au même lieu et au même moment. Les événements entourés sur le schéma en haut à gauche dans le référentiel des rails (deux horloges au même niveau, à l’arrière du train, qui affichent 0) se retrouvent à l’identique dans la partie entourée à gauche sur le schéma dans le référentiel du train. Et les événements entourés sur le schéma en bas à droite dans le référentiel des rails (deux horloges au même niveau, à l’avant du train, l’horloge du train qui affiche 0 et l’horloge des rails qui affiche TB) se retrouvent également à l’identique dans la partie entourée à droite sur le schéma dans le référentiel du train. Il y a désaccord sur le caractère simultané (point de vue d’Alice) ou non simultané (point de vue de Bob) des deux événements. Mais il y a aussi de nombreux désaccords à propos de ce qui se passe ailleurs pendant que se produisent les événements entourés.
123
IL ÉTAIT TEMPS
Les différences de point de vue apparaîtront uniquement lorsqu’ils devront coller bout à bout des événements pour raconter ce qu’il se passait au même moment à des endroits différents. Des désaccords surgissent, car « au même moment » n’a pas la même signification dans deux référentiels différents. Quand on prend tout cela en compte, les désaccords ne sont plus considérés comme tels, ils sont vus comme des façons différentes, mais toutes rationnelles, de décrire un même phénomène. Il y a une raison très simple pour laquelle le facteur s de ralentissement des horloges en mouvement doit être égal au facteur de contraction d’une règle en mouvement. Si le facteur de ralentissement et le facteur de contraction avaient été différents, alors le calcul du lieu que peut potentiellement atteindre la moitié d’un échantillon de muons donnerait deux résultats différents en fonction du référentiel dans lequel on se place. Or les observateurs des deux référentiels doivent être d’accord sur le lieu où les muons naissent (la haute atmosphère) et sur le fait que la moitié de la population atteint le sol : les deux facteurs ont donc nécessairement la même valeur. Voici un raisonnement un peu plus abstrait qui mène à la même conclusion : Supposons (voir figure 6.3) que nous ayons une règle de longueur propre L et une horloge qui se déplace parallèlement à la règle vers la droite avec une vitesse v. L’horloge affiche 0 quand elle arrive à l’extrémité gauche de la règle et T quand elle passe au niveau de l’extrémité droite. Cette situation est décrite du point de vue du référentiel de la règle dans les deux schémas de gauche de la figure 6.3 et du point de vue du référentiel de l’horloge dans les deux schémas de droite. Dans le référentiel de l’horloge, la règle se déplace vers la gauche avec une vitesse v, elle a donc une longueur sL (s étant le facteur de contraction). La durée T du passage de la règle sous l’horloge est tout simplement la durée nécessaire à la règle pour parcourir une distance sL en se déplaçant à la vitesse v : T = sL/v. Comme l’horloge affiche 0 124
UNE HORLOGE EN MOUVEMENT RALENTIT…
Référentiel de la règle
0
Référentiel de l’horloge
v
0 v
L
T L
sL
v
T v
sL
Figure 6.3 | Une règle et une horloge en mouvement relatif. Sur la gauche, nous voyons les choses telles qu’elles sont vues dans le référentiel de la règle au repos. La longueur propre de la règle au repos est notée L. L’horloge se déplace avec une vitesse v vers la droite. Elle affiche 0 quand elle passe à côté de l’extrémité gauche de la règle et T quand elle passe à côté de l’extrémité droite. Sur la droite, nous voyons les choses telles qu’elles seraient décrites par un observateur situé dans le référentiel de l’horloge au repos. La règle se déplace vers la gauche avec une vitesse v et sa longueur est sL, où s est le facteur de contraction. L’horloge est au repos. Elle affiche 0 au moment du passage de l’extrémité gauche de la règle et T au moment du passage de l’extrémité droite.
quand l’extrémité gauche de la règle arrive à son niveau, elle devra afficher T quand l’extrémité droite la dépassera. Dans le référentiel de la règle, la durée nécessaire à l’horloge pour survoler la règle d’un bout à l’autre est L/v, la longueur propre L de la règle (qui, cette fois-ci, n’est pas raccourcie) divisée par la vitesse v de l’horloge. Comme les battements de l’horloge sont ralentis dans le référentiel de la règle, l’horloge avance seulement d’un temps T = s’L/v, où s’ est le facteur de ralentissement des horloges en mouvement. Et c’est bien ce qu’elle affiche lorsqu’elle passe au-dessus de l’extrémité droite de la règle. Et nous savons que les observateurs des deux référentiels doivent être d’accord sur le temps T affiché par l’horloge quand elle passe au-dessus de l’extrémité droite de la règle puisqu’il s’agit de deux événements ayant lieu au même endroit et au même moment. Nous venons donc de démontrer que s’, le facteur de ralentissement des 125
IL ÉTAIT TEMPS
horloges en mouvement, est le même que s, le facteur de contraction des règles en mouvement. Nous avons maintenant démontré tous les phénomènes relativistes de base qui peuvent affecter le rythme des horloges et la longueur des règles.
RÈGLE DES HORLOGES SYNCHRONISÉES Si deux horloges sont au repos, synchronisées et séparées par une distance D dans un référentiel, alors, dans un second référentiel dans lequel elles se déplacent avec une vitesse v le long de la droite qui les relie, l’horloge de devant retarde par rapport à l’horloge de derrière d’un temps Dv T = 2 (6.12) c RÈGLE DE CONTRACTION DES RÈGLES OU DE RALENTISSEMENT DES HORLOGES EN MOUVEMENT L’expression du facteur de contraction (ou de ralentissement) s associé à la vitesse v est la suivante :
s = 1−
v2 (6.13) c2
Signalons une source possible de confusion : le rythme d’une horloge qui se déplace avec une vitesse v ralentit d’un facteur s, mais doit-on multiplier ou diviser par le facteur de ralentissement ? Cela dépend de la question posée. Il faut garder ces deux repères en tête : (a) que les horloges en mouvement ralentissent et (b) que le facteur de ralentissement est plus petit que 1. Alors, si la question est « combien l’affichage d’une horloge en mouvement avance pendant un temps T ? », la réponse est : elle avance d’un temps sT puisqu’une horloge en mouvement ralentit et la multiplication de T par s nous donne un nombre plus petit que T. Mais, si la question est « combien 126
UNE HORLOGE EN MOUVEMENT RALENTIT…
de temps faut-il pour que la lecture d’une horloge en mouvement avance de T ? », la réponse est T/s, puisqu’il faut un temps plus long que T pour une horloge au repos (car elle fonctionne plus vite) et, diviser T par un nombre s plus petit que 1 donne effectivement un temps T/s plus grand. Un conseil pour ne pas s’embrouiller : il est préférable de bien réfléchir à la situation plutôt que d’appliquer des formules apprises par cœur. De la même manière, une règle se déplaçant parallèlement à elle-même avec une vitesse v est raccourcie d’un facteur s. Par conséquent, si sa longueur propre est L, alors un observateur qui la verra passer avec une vitesse v trouvera que sa longueur est sL. D’autre part, si un observateur voit passer une règle à la vitesse v et qu’il détermine qu’elle a une longueur L, alors sa longueur propre est L/s. Dans le reste de ce chapitre, je vais présenter une autre méthode pour synchroniser des horloges éloignées dans l’espace. Comme celles que nous avons déjà considérées au début du chapitre 5, mais que nous avons dû abandonner parce que nous ne savions pas encore calculer l’effet du mouvement sur le rythme d’une horloge. Finalement, de ces calculs ennuyeux et complexes n’émergera rien d’autre que la vieille règle T = Dv/c2 que nous avons déjà trouvée d’une façon beaucoup plus simple dans le chapitre 5. Je vous encourage quand même à jeter un coup d’œil sur cette discussion, qui illustre une nouvelle fois la cohérence globale de la théorie, même s’il n’est pas nécessaire de suivre tout le raisonnement en détail pour comprendre les prochains chapitres.
Supposons qu’Alice possède deux horloges identiques au repos au même endroit, elle peut donc les synchroniser sans aucun problème par comparaison directe. Une fois qu’elle a réglé les deux horloges à 0, elle reste au repos dans son référentiel auprès de la première horloge et fait transporter la deuxième à une vitesse u constante. (Il est possible de vérifier que sa vitesse est bien u sans l’utilisation 127
IL ÉTAIT TEMPS
complexe d’horloges supplémentaires nécessaires pour comparer sa vitesse avec celle d’un photon, comme cela a été décrit au chapitre 4.) La deuxième horloge est transportée loin de la première jusqu’à ce qu’elle affiche un temps t au moment où elle arrive à sa destination finale. Pendant son déplacement, la deuxième horloge a tourné au ralenti, la durée de son voyage mesurée par les horloges du référentiel d’Alice est donc supérieure à t et égale à t/su, où su est le facteur de ralentissement 1 −
u c
2
. La première horloge, restée sur place, a donc
continué à afficher le temps correct du référentiel d’Alice et a avancé d’une durée t/su pendant le transport de la deuxième horloge. Pour remettre la seconde horloge en synchronisation avec la première dans le référentiel d’Alice, il suffira de réinitialiser son affichage de t à t/su à la fin du transport. Ce procédé aboutit donc à l’obtention de deux horloges synchronisées dans le référentiel d’Alice. La distance D entre les deux horloges est égale au produit de la vitesse u à laquelle la deuxième horloge a été transportée par la durée t/su du transport : u⋅t D= (6.14) su Intéressons-nous maintenant au point de vue de Bob qui se déplace dans la direction opposée au mouvement de la seconde horloge avec la vitesse v, comment décrirait-il ce procédé ? (On peut parvenir exactement à la même conclusion générale si Bob se déplace dans le même sens que la deuxième horloge.) De son point de vue, la première horloge se déplace toujours à la vitesse v, mais la deuxième horloge, pendant son transport, se déplace par rapport à lui à une vitesse w (plus importante que v) dont l’expression s’obtient en appliquant la composition relativiste des vitesses : u+v w= (6.15) u v 1+ ⋅ c c 128
UNE HORLOGE EN MOUVEMENT RALENTIT…
Bob doit forcément être d’accord avec Alice sur le fait que le transport de la deuxième horloge a commencé au moment où les deux horloges marquaient 0 et qu’il s’est achevé au moment où l’horloge transportée affichait t, puisque les événements {début du transport + deux horloges affichant 0} d’une part et {arrêt du transport + deuxième horloge affichant t} d’autre part sont deux ensembles d’événements ayant eu lieu au même endroit et au même moment. Comme la deuxième horloge s’est déplacée pendant son transport à la vitesse w par rapport à Bob, il peut calculer la durée du transport en divisant t par le facteur de ralentissement sw. Ainsi selon Bob, la deuxième horloge a été transportée pendant une durée t/sw. Étant donné que la première horloge se déplace toujours à la vitesse v dans le référentiel de Bob, son rythme est ralenti d’un facteur sv. Par conséquent, pendant la durée t/sw que dure le transport de la deuxième horloge, l’affichage de la première horloge passe de 0 à sv(t/sw). C’est donc le temps indiqué par la première horloge au moment de l’immobilisation et de la réinitialisation de l’affichage de la deuxième horloge à t/su. Après la réinitialisation, les deux horloges se déplacent toutes deux à la vitesse v et tournent au même rythme, ainsi à partir de ce moment, l’affichage de la première horloge continuera à être décalé de la deuxième d’une quantité T =
sv 1 ⋅t − sw su
En remplaçant t par son expression en fonction de D extraite de (6.14), on obtient finalement :
T=
sv D ⋅ su s ⋅s D 1 (6.16) ⋅ = v u −1 ⋅ − sw su u sw u
Il va nous falloir procéder à quelques manipulations algébriques peu commodes pour retrouver la règle Dv/c2 à partir de (6.16). Par application de la loi de composition (6.15), le facteur de ralentissement sw devient : 129
IL ÉTAIT TEMPS
u v + c c sw = 1 − (w /c)2 = 1 − u v 1+ c c
=
u 1+ c
v c
1+ 1− =
u c 1+
2
–
u c
v c
2
1+ u c
u v + c c
v c
2
2
(6.17) 2
v c
su sv
= 1+
u c
v c
On obtient une relation qui récompense tous nos efforts :
su ⋅ sv u⋅v = 1 + 2 (6.18) c sw s ⋅s u⋅v Car en remplaçant u v par 1 + 2 dans (6.16), nous retrouvons sw c
effectivement que la lecture de la première horloge diffère de la deuxième horloge d’une quantité : Dv T = 2 (6.19) c Nous voyons là que, quelle que soit la vitesse à laquelle la deuxième horloge est transportée dans le référentiel d’Alice, Bob conclura que l’horloge de devant (la deuxième) est en retard sur celle de derrière (la première) d’une quantité Dv/c2, ce qui correspond bien à la règle T = Dv/c2. Nous venons donc de démontrer que cette règle est très 130
UNE HORLOGE EN MOUVEMENT RALENTIT…
générale, elle reste valable même si Alice parvient à synchroniser ses horloges sans utiliser un quelconque signal. Il est possible d’ajouter un petit raffinement à la procédure utilisée par Alice pour synchroniser ses deux horloges. Comme nous l’avons vu, la procédure passe par une réinitialisation de l’horloge transportée une fois qu’elle arrive à une distance D de la première horloge au repos, l’objectif étant de corriger le fait que, pendant le transport, son rythme s’est ralenti. Mais, puisque le facteur de ralentissement su = 1 −
u c
2
devient très proche de 1, si u devient très petit vis-à-vis
de la vitesse de la lumière, on peut penser qu’en transportant la deuxième horloge suffisamment doucement, Alice n’aura pas besoin de la réinitialiser pour la synchroniser à nouveau avec la première. Ce serait oublier que le transport de la deuxième horloge a pour but de l’amener à une certaine distance D fixe et que, par conséquent, la durée D/u du transport augmente lorsque la vitesse u diminue. Nous voyons apparaître une compétition entre deux effets : le ralentissement du rythme de l’horloge transportée devient de plus en plus faible lorsque u diminue, sauf que, parallèlement, la durée du transport D/u augmente et par conséquent, le ralentissement de l’horloge, bien que très faible, a plus de temps pour produire ses effets. Et, finalement, ce n’est pas évident de savoir lequel des deux va l’emporter. Une analyse plus approfondie montre que l’effet de la diminution de la vitesse u du transport l’emporte sur l’effet inverse lié à l’augmentation de la durée du transport : À la fin de son transport, l’affichage de la deuxième horloge d’Alice doit passer de t =
D D su à . L’écart entre ces deux valeurs est T0 : u u T0 = D
1 − 1 − u2 / c 2 (6.20) u
131
IL ÉTAIT TEMPS
Il est possible de mieux faire ressortir l’influence de u sur T0 (pour u très petit devant c) en multipliant le numérateur et le dénominateur de (6.20) par 1 + 1 −
u2 . En utilisant l’identité remarquable c2
(a − b) (a + b) = a2 − b2, nous obtenons alors
T0 = D
u / c2 1 + 1 − u2 / c 2
(6.21)
Si u est très petit par rapport à la vitesse de la lumière, le dénominateur de (6.21) est très proche de 1 + 1 = 2 et l’écart T0 entre l’affichage de la deuxième horloge à la fin de son transport et le temps qu’elle doit indiquer pour être à nouveau synchronisée est très proche de 1 T0 = Du / c 2 (6.22) 2 Ainsi, l’écart T0 est proportionnel à u, la vitesse de transport : plus Alice diminuera la vitesse de déplacement de sa deuxième horloge, plus l’écart T0 sera faible. En diminuant suffisamment la vitesse de transport, Alice peut faire décroître l’écart T0 autant qu’elle le désire. Si elle s’arrange pour que l’écart T0 devienne plus petit que la plus petite durée qu’elle peut lire sur ses horloges (autrement dit, leur résolution), alors elle n’a plus besoin de réinitialiser la seconde horloge après son transport. Cette procédure est appelée synchronisation des horloges par transport lent. Comme nous venons de le voir, elle fonctionne parfaitement bien dans le référentiel d’Alice, mais qu’en est-il du point de vue de Bob ? Pour voir les choses depuis son référentiel, il faut appliquer la règle T = Dv/c2 et nous avons vu que la vitesse de transport u de la deuxième horloge n’avait, pour lui, aucune influence sur l’écart qu’il lit sur les deux horloges après réinitialisation de la deuxième. L’écart lu par Bob sera donc presque égal à Dv/c2. Je dis « presque » parce que Bob aurait effectivement trouvé un écart exactement égal à Dv/c2 si Alice avait modifié l’affichage de sa seconde horloge de T0. 132
UNE HORLOGE EN MOUVEMENT RALENTIT…
Mais comme elle ne le fait plus, l’écart mesuré par Bob est presque égal à Dv/c2 à T0 près. Mais vu que la vitesse de transport u a été choisie par Alice pour que l’écart T0 soit plus petit que la résolution de ses horloges, Bob n’y verra que du feu, il ne se rendra même pas compte que l’horloge n’a pas été réinitialisée à la fin de son transport.
133
7 Regarder une horloge en mouvement
Nous avons démontré qu’une horloge qui se déplace à la vitesse v dans un référentiel inertiel donné fonctionne plus lentement que les autres horloges au repos dans ce même référentiel. L’expression du facteur de ralentissement est alors la suivante :
s = 1−
v2 (7.1) c2
On peut penser que tout ceci n’est qu’un artifice intellectuel, une conclusion abstraite sur laquelle on peut tomber en jouant avec le concept de simultanéité. Mais lorsqu’on regarde une horloge en mouvement, la voit-on réellement tourner au ralenti ? La réponse n’est pas la même si l’horloge s’éloigne ou s’approche de vous. Si elle s’éloigne de vous, vous la voyez effectivement fonctionner au ralenti, mais à un rythme encore plus lent que celui avec lequel elle fonctionne réellement. Par contre, si elle s’approche de vous, vous la voyez fonctionner plus rapidement !
135
IL ÉTAIT TEMPS
Le rythme réel d’une horloge est différent de celui avec lequel vous la voyez fonctionner. En effet, pour lire l’affichage d’une horloge, il faut attendre que la lumière qui est partie de l’horloge au moment où elle affichait cette heure ait parcouru le trajet entre l’horloge et vos yeux. Pour plus de commodité, nous allons imaginer qu’on regarde une horloge digitale conçue pour émettre un flash lumineux très court chaque fois que, sur son cadran, le nombre indiquant les secondes change. Même lorsqu’on regarde une horloge à aiguilles classique, il faut aussi attendre que la lumière voyage de l’horloge vers nos yeux à la vitesse de la lumière (sauf que la lumière provient à l’origine d’une lampe ou du Soleil). Si l’horloge est fixe dans votre référentiel, le retard entre le moment où l’horloge affiche une heure et le moment où vous lisez cette heure n’intervient pas, car le laps de temps entre l’affichage de l’heure et sa réception par vos yeux reste le même chaque fois que l’heure change (ou qu’un flash est émis). Ainsi, malgré l’existence d’un retard constant à la réception des flashs lumineux, le rythme de leur réception est le même que celui de leur émission. Vous voyez donc l’horloge fonctionner à son rythme réel, mais avec un temps de retard sur son affichage réel (celui que vous liriez si vous étiez placé juste à côté de l’horloge). Si l’horloge s’éloigne de vous, ses flashs successifs doivent parcourir une distance chaque fois plus grande avant de vous atteindre et ainsi vous voyez l’horloge fonctionner à un rythme plus lent que celui qu’elle a en réalité dans votre référentiel. À l’opposé, si l’horloge vient vers vous, les flashs ont chaque fois moins de distance à parcourir et ainsi, vous voyez l’horloge fonctionner plus rapidement que son rythme réel dans votre référentiel. Il s’avère que cet effet est plus important que son ralentissement, c’est ainsi que vous voyez fonctionner une horloge qui s’approche de vous à un rythme plus élevé que vos horloges fixes, alors qu’en fait, elle est ralentie. Il n’est pas difficile de quantifier cet effet qui est appelé l’effet Doppler relativiste. Il est même possible de le faire sans connaître 136
Regarder une horloge en mouvement
l’expression (7.1) du facteur de ralentissement s. En effet, la discussion qui va suivre va nous permettre de déduire que s = 1 − v 2 / c 2 par une démarche tout à fait différente de celle menée au chapitre 6. Accessoirement, nous obtiendrons également la loi relativiste de composition des vitesses par une méthode indépendante de la démarche suivie au chapitre 4. Tout cela sans jamais utiliser la règle T = Dv/c2 des événements simultanés (ou des horloges synchronisées) utilisée au chapitre 5. Placer la discussion qui va suivre juste après le chapitre 3 aurait été une option alternative pour présenter l’ensemble du livre. Mais alors à quoi sert ce chapitre si, au bout du compte, il va nous mener aux mêmes conclusions que celles que nous avons déjà tirées ? Dans le cas de la relativité, certaines conclusions sont si étranges qu’il peut être rassurant de constater qu’on peut les obtenir par des voies très différentes. Prenons une horloge qui émet un flash lumineux toutes les T secondes (chaque fois que son affichage numérique change) dans son référentiel propre. Soit fa · T et fe · T le nombre de secondes dans votre référentiel entre la réception de deux flashs respectivement quand l’horloge s’approche de vous (a) et quand elle s’éloigne de vous (e) à la vitesse v. Nous allons déterminer les expressions de fa et de fe, les facteurs d’accélération et de ralentissement de ce que vous voyez, ainsi que de l’expression de s, le facteur de ralentissement affectant le rythme réel de l’horloge dans votre référentiel. Je pars du principe que s est inférieur à 1 (nous savons déjà qu’une horloge en mouvement ralentit, mais nous voilà sur le point de le redémontrer), mais le raisonnement est identique en commençant sans la moindre hypothèse sur la valeur de s (à quelques ajustements de vocabulaire près). Comme l’horloge fonctionne au ralenti, elle émet un flash lumineux toutes les T/s secondes. Pendant ce temps, elle s’éloigne (ou se rapproche) de vous d’une distance v(T /s), par conséquent, il faudra à chaque flash successif un temps v(T /s)/c en plus (ou en moins) pour parvenir jusqu’à vous. C’est ainsi que le temps qui sépare la réception de deux flashs successifs (qui est donc la durée nécessaire pour 137
IL ÉTAIT TEMPS
que vous perceviez le changement du nombre affiché sur l’écran de l’horloge digitale) est
fe ⋅ T = T /s + v(T /s)/c = (T /s)(1 + v /c) (7.2) si l’horloge s’éloigne de vous. Et la durée est
fa ⋅ T = T /s − v(T /s)/c = (T /s)(1 − v /c) (7.3)
si l’horloge s’approche de vous. Par conséquent :
fe = (1/s)(1 + v /c) (7.4)
et
fa = (1/s)(1 − v /c) (7.5)
Vu que nous connaissons la valeur du facteur de ralentissement s depuis le chapitre 6, c’est terminé ! Nous avons les expressions de fe et de fa. Si nous n’avions pas l’expression de s, nous pourrions la déterminer par le raisonnement suivant : Supposons qu’Alice et Bob soient tous deux immobiles dans un même référentiel et postés en deux lieux différents. Bob tient une horloge et Alice la regarde. Supposons que l’horloge de Bob émette un flash toutes les t secondes dans son référentiel propre. Étant donné que l’horloge de Bob est immobile par rapport à Alice, tous les flashs émis vont mettre le même temps pour parvenir jusqu’à elle. Les horloges d’Alice lui indiqueront qu’elle reçoit un flash toutes les t secondes, car elles fonctionnent au même rythme que celles de Bob. Supposons maintenant que Carol se déplace de Bob vers Alice à la vitesse v. Chaque fois que Carol voit un nouveau nombre sur l’horloge de Bob, elle le signale en envoyant à son tour un flash. Elle peut le faire automatiquement en ajustant le rythme d’un stroboscope pour qu’il émette des flashs exactement au rythme avec lequel elle voit les nombres défiler sur l’horloge de Bob. Vu que Carol s’éloigne de Bob à la vitesse v, elle perçoit un flash venant de Bob toutes les fe ⋅ t secondes. Elle a donc ajusté son stroboscope pour qu’il émette 138
Regarder une horloge en mouvement
un flash toutes les T secondes, avec T = fe ⋅ t . Étant donné que Carol se déplace vers Alice à la vitesse v, Alice voit le stroboscope de Carol émettre un flash toutes les fa ⋅ T = fa ⋅ fe ⋅ t secondes. Mais comme les flashs de Carol parviennent à Alice conjointement avec ceux de Bob, Alice voit toutes les t secondes un flash émis par l’horloge de Bob en même temps qu’un flash émis par le stroboscope de Carol. Par conséquent, l’effet qui ralentit le rythme des flashs de Bob pour Carol est exactement compensé par l’effet qui accélère le rythme des flashs de Carol pour Alice et ainsi fa ⋅ fe ⋅ t = t , d’où :
fa fe = 1 (7.6)
En combinant (7.6) avec (7.4) et (7.5), nous allons obtenir tout ce qui nous intéresse. Combinons d’abord (7.4) et (7.5) :
fa fe = (1/s)2 (1 + v /c )(1 − v /c ) = (1/s)2 (1 − v 2 /c 2 ) (7.7)
En utilisant (7.6), on obtient immédiatement l’expression (7.1) du facteur de ralentissement par une démarche complètement indépendante. D’un autre côté, (7.4) et (7.5) nous permettent d’écrire également que : fa 1 − v /c = (7.8) fe 1 + v /c 1 = fa , ce qui nous permet d’éliminer À l’aide de (7.6), on sait que fe fa ou fe dans (7.8) pour obtenir les deux résultats suivants :
fa =
1 − v /c , (7.9) 1 + v /c
fe =
1 + v /c (7.10) 1 − v /c
Nous obtenons ainsi fa, fe et s sans utiliser aucun des résultats des chapitres 4, 5 et 6 ! 139
IL ÉTAIT TEMPS
3 Envisageons alors un exemple concret : en prenant v = c, le fac5 teur de ralentissement s vaut
1−
3 5
2
=
4 (7.11) 5
Ce résultat nous indique que le nombre de secondes affiché sur le cadran d’une horloge qui se déplace à 60 % de la vitesse de la lumière change toutes les 5/4 = 1,25 seconde – l’horloge fonctionne donc à 80 % de son rythme normal. Mais comme 3 5 = 1 , (7.12) 3 2 1+ 5
1−
lorsque l’horloge s’approche de vous, vous voyez le nombre qui indique les secondes changer toutes les 0,5 seconde sur son cadran – c’est-à-dire que vous la voyez fonctionner au double de son rythme normal. Si elle s’éloigne de vous, vous voyez son affichage changer toutes les 2 secondes – vous la voyez fonctionner seulement à la moitié de son rythme normal. Pour v =
4 c, la valeur du facteur de ralentissement 5
3 ne vaut plus que . Mais selon (7.9) et (7.10), le rythme avec lequel 5 on voit les secondes changer sur le cadran de l’horloge est multiplié ou divisé par 3 par rapport au rythme de fonctionnement qu’elle présente dans son référentiel propre. On peut facilement généraliser le raisonnement qui nous a conduits à (7.6) pour en tirer la loi de composition relativiste des vitesses d’une façon complètement différente de celle que nous avons suivie au chapitre 4. Supposons que, dans le référentiel d’Alice, Bob et Charles s’éloignent tous deux vers la droite avec les vitesses respectives v et w tandis que, dans le référentiel de Bob, Charles s’éloigne de Bob vers la droite avec une vitesse u. Si Alice possède une horloge qui émet un 140
Regarder une horloge en mouvement
flash toutes les secondes, alors Charles recevra un flash venant d’elle 1 + w /c secondes, pendant que Bob recevra un flash 1 − w /c 1 + v /c venant d’Alice toutes les secondes. Par conséquent, si Bob 1 − v /c signale les flashs qu’il reçoit d’Alice en émettant des flashs avec le même rythme que celui avec lequel il reçoit les flashs d’Alice, alors Charles toutes les
1 + u /c 1 + v /c ⋅ secondes. 1 − u /c 1 − v /c Étant donné que cette dernière expression représente aussi le rythme avec lequel Charles doit recevoir les flashs provenant directement d’Alice, nous devons avoir : recevra les flashs de Bob toutes les
1 + w /c 1 + u /c 1 + v /c = ⋅ (7.13) 1 − w /c 1 − u /c 1 − v /c
Mais (7.13) est une version parfaitement équivalente à la loi de composition des vitesses écrite sous forme d’un produit :
c −w c −u = c+w c +u
c−v c+v
(7.14)
Un effet similaire, moins connu (car moins utile) que l’effet Doppler, se produit lorsqu’on regarde un train en mouvement. Supposons que vous soyez juste à côté des rails et que vous regardiez un train de longueur L venant vers vous. Si le train se déplace avec une vitesse v, sa longueur dans le référentiel des rails deviendrait svL. En fait, il n’aurait pas l’air si petit. La lumière provenant de l’arrière du train (imaginons une lampe fixée à l’arrière du train qu’on pourrait voir depuis l’avant) doit parcourir une distance plus grande que la lumière provenant de l’avant et par conséquent l’image de l’arrière du train parvenant à vos yeux à un moment donné est plus ancienne que l’image de l’avant parvenant à vos yeux au même moment. Ainsi, l’arrière du train vous paraît plus éloigné qu’il ne l’est en réalité de l’avant et le train apparaît donc plus long. Si nous faisions une analyse 141
IL ÉTAIT TEMPS
similaire à celle que nous avons faite quand nous avons démontré l’effet Doppler relativiste, nous montrerions facilement que cet effet ferait plus que compenser le facteur de ralentissement et que le train serait en fait plus long que sa longueur propre d’un facteur
1 + v /c (7.15) 1 − v /c
D’un autre côté, si vous regardez partir un train, la lumière provenant de l’avant du train doit parcourir une plus grande distance pour arriver jusqu’à vous que la lumière provenant de l’arrière. Ainsi, l’image de l’avant du train qui atteint vos yeux à un moment donné est plus ancienne que l’image qui provient de l’arrière au même moment. Ainsi, l’avant du train vous paraît plus proche qu’il ne l’est en réalité de l’arrière et le train apparaît donc encore plus court que sa longueur contractée. Le même type d’analyse nous amènerait à conclure qu’un train qui s’éloigne apparaît plus court que sa longueur propre d’un facteur
1 − v /c (7.16) 1 + v /c
Nous conclurons ce chapitre par une énigme : la discussion précédente nous a conduits au facteur de ralentissement (7.1) en ne faisant appel qu’à de simples considérations sur le rythme avec lequel on voit fonctionner une horloge si elle s’approche ou si elle s’éloigne de nous. L’invariance de la vitesse de la lumière influe de façon décisive sur le phénomène relativiste de dilatation du temps et pourtant il n’est apparu à aucun moment dans la discussion. Comment est-ce possible ? La réponse à cette énigme est à chercher dans le fait que, même si le principe d’invariance n’est jamais explicitement invoqué, il s’est toutefois immiscé subtilement dans la démonstration. Nous avons établi les relations (7.4) et (7.5) dans un référentiel où la personne qui observe les horloges est immobile. Quand nous appliquons ces 142
Regarder une horloge en mouvement
relations pour obtenir (7.6), nous utilisons le facteur fe correspondant au référentiel de Carol et le facteur fa correspondant à celui d’Alice. La vitesse de la lumière n’a qu’une seule et même valeur c dans les expressions de fe pour Carol et de fa pour Alice, cela n’est évidemment possible que si les flashs de lumière se propagent à la même vitesse c dans les référentiels d’Alice et de Carol.
143
8 L’intervalle entre deux événements
Nous savons maintenant qu’il existe de nombreux sujets de discorde entre des personnes utilisant deux référentiels inertiels différents : le rythme d’une horloge, la longueur d’une règle, le caractère simultané de deux événements, la question de la synchronisation de deux horloges. Mais il ne faut pas oublier qu’il existe aussi quelques convergences de point de vue : les observateurs de tous les référentiels s’accordent sur les coïncidences spatio-temporelles (lorsque deux événements ont lieu à la fois au même moment et au même endroit). Et bien sûr, tous les observateurs, quel que soit leur référentiel, attribuent la même vitesse à toute chose se déplaçant à la vitesse de la lumière c. Il existe d’autres points sur lesquels des observateurs utilisant des référentiels différents peuvent tomber d’accord. L’invariance de la vitesse de la lumière n’est en fait qu’un cas particulier, elle fait partie d’un ensemble beaucoup plus large de grandeurs invariantes. Les invariants – les quantités sur lesquelles tout le monde tombe d’accord, quel que soit le référentiel utilisé – sont beaucoup plus utiles à 145
IL ÉTAIT TEMPS
la compréhension du monde que les quantités qui varient d’un référentiel à l’autre. La théorie de la relativité révèle toutes ces quantités invariantes et, à cet égard, l’appellation « théorie de la relativité » est regrettable. « Théorie des invariants » aurait été un nom bien plus approprié puisque la préoccupation principale de cette théorie est d’identifier les quantités qui ne varient pas d’un référentiel à l’autre. En guise de première approche de la nature de ces invariants, nous allons énoncer l’invariance de la vitesse de la lumière sous une forme un peu plus abstraite. Prenons deux événements distincts E1 et E2. Chaque événement se produit à une certaine date et en un endroit donné de l’espace, sauf que des référentiels différents peuvent être en désaccord sur ces lieux et ces dates. Soit D et T la distance et le temps écoulé entre ces deux événements dans un certain référentiel. Si les deux événements sont des événements de la vie d’un même photon se déplaçant à la vitesse c, alors D/T = c. Étant donné que la vitesse du photon est la même dans tous les référentiels, dans n’importe quel autre référentiel, la distance D’ et la durée T ’ entre E1 et E2 sont aussi liées par la relation D’/T ’ = c (le rapport reste le même, mais D’ n’est pas pour autant égal à D et T ’ égal à T). Il est possible de proposer une autre formulation de l’invariance de la vitesse de la lumière : Si la durée T et la distance D entre deux événements sont liées par la relation D = cT dans un référentiel, alors elles seront liées par une relation similaire dans n’importe quel autre référentiel. Il est possible de proposer une autre formulation de l’invariance de la vitesse de la lumière : « Si le temps qui s’écoule entre deux événements en nanosecondes est égal à la distance qui les sépare en pieds dans un certain référentiel, alors le temps qui s’écoule entre eux en nanosecondes dans n’importe quel autre référentiel sera aussi égal à la distance qui les sépare en pieds. » Il est, dans certains cas, utile d’attribuer à T ou à D un signe positif ou négatif pour tenir compte de l’ordre chronologique des deux événements ou de la position relative des lieux où les deux 146
L’intervalle entre deux événements
événements se sont produits. Afin de prendre en compte toutes les éventualités, il est commode de formuler l’invariance de la vitesse de la lumière en utilisant les carrés de la durée et de la distance entre les événements (on tire parti de l’égalité des carrés de deux nombres qui ne diffèrent que par leur signe). Si la durée et la distance dans un référentiel sont liées par la relation (cT)2 = D2, alors cette même relation sera valable dans tout autre référentiel. De façon équivalente, si la durée et la distance entre un couple d’événements sont liées par la relation
c 2T 2 − D2 = 0 (8.1)
dans un référentiel, alors elles vérifieront (8.1) dans n’importe quel autre référentiel. Pour deux événements séparés par une durée et une distance vérifiant (8.1), on dit que leur séparation est de genre lumière. Cette désignation exprime la possibilité pour un même photon d’être présent aux deux événements, c’est-à-dire qu’un photon peut être produit au cours d’un premier événement et arriver sur le lieu d’un deuxième événement juste au moment où celui-ci se produit, de tels événements peuvent être connectés par un signal lumineux. Ce nouveau vocabulaire nous permet de formuler l’invariance de la vitesse de la lumière d’une autre manière : si la séparation entre deux événements est de genre lumière dans un référentiel, elle sera de genre lumière dans tous les autres référentiels. Quand il est formulé de cette manière, le principe d’invariance de la vitesse de la lumière constitue un cas particulier d’une règle encore plus générale. Nous démontrerons plus loin que si T est la durée et D la distance séparant deux événements quelconques E1 et E2 dans un certain référentiel, alors la quantité c2T2 − D2 reste la même dans tous les référentiels même lorsque sa valeur est différente de zéro (T et D sont chacun modifiés lorsqu’on passe d’un référentiel à l’autre, mais la quantité c2T2 – D2 reste constante). Ce phénomène est appelé l’invariance de l’intervalle : 147
IL ÉTAIT TEMPS
Pour n’importe quel couple d’événements séparés par une distance D et une durée T, la valeur c2T2 – D2 ne dépend pas du référentiel dans lequel T et D ont été mesurés. Pour voir pourquoi ceci est vrai, nous considérerons que T et D représentent les valeurs (positives) de la durée et de la distance entre les événements. Puis nous envisagerons séparément les deux cas où la quantité c2T2 – D2 est différente de zéro : soit parce que cT est supérieur à D, soit parce que cT est inférieur à D. Envisageons d’abord le cas où cT est supérieur à D. Cela veut donc dire que D/T est inférieur à c, la vitesse de la lumière. Il existe donc un référentiel se déplaçant du premier événement vers le second à la vitesse v = D/T (8.2) dans lequel les deux événements se produisent au même endroit. Notons T0 la durée entre les deux événements dans ce référentiel particulier. Une horloge présente aux deux événements serait immobile dans ce référentiel particulier et elle mesurerait par conséquent une durée T0 entre les deux événements. Cette situation est illustrée dans la figure 8.1 du point de vue du référentiel initial dans lequel les événements sont séparés dans l’espace par D et dans le temps par T. Étant donné que l’horloge se déplace avec une vitesse v par rapport au référentiel initial, la durée T0 mesurée par l’horloge entre les deux événements est plus petite que la durée T :
T0 = sT = T 1 − v 2 /c 2 (8.3) Étant donné que v = D/T, de (8.3), il découle que
T02 = T 2 − D2 /c 2 (8.4)
Ainsi, quand la durée T et la distance D entre deux événements sont telles que T > D/c, alors la grandeur (T2 − D2/c2) est indépendante du référentiel dans lequel on mesure D et T, elle est égale au carré de la 148
L’intervalle entre deux événements
durée T0 entre les deux événements, mesurée dans le référentiel où les deux événements se produisent au même endroit. L’autre cas, quand cT < D, est un peu plus subtil. Dans ce cas, D/T est supérieur à c et aucun objet ne pourra être présent à la fois à l’événement E1 et à l’événement E2 (il faudrait qu’il se déplace plus vite que la lumière, ce qui est impossible). Par contre, cette fois-ci, il existe un référentiel se déplaçant à une vitesse inférieure à celle de la lumière dans lequel les deux événements se produisent au même moment. Pour comprendre pourquoi, nous allons supposer qu’une horloge se trouve au voisinage de chaque événement. Ces deux horloges sont immobiles et synchronisées entre elles dans le référentiel où les événements sont séparés de D dans l’espace et de T dans le temps. Cette situation est illustrée par la figure 8.2. Si l’horloge affiche 0 à l’instant du premier événement, alors l’autre horloge affiche T au moment du deuxième événement. Étant donné que la distance entre les deux horloges est D, on peut imaginer que les deux horloges sont reliées par une barre de longueur propre D. 0
v = D/T
E1 0
0
D
T0
v = D/T
E2 T
T D
Figure 8.1 | Les deux parties de la figure montrent le déroulement des événements E1 et E2 séparés dans le référentiel des rails par une distance D dans l’espace et par une durée T dans le temps. En haut de la figure, les deux horloges du référentiel des rails (boîtes carrées dessinées juste sous les rails) affichent 0. En bas, les deux horloges du référentiel des rails affichent T. Une troisième horloge (l’objet rond au-dessus des rails) se déplace à la vitesse v = D/T, elle est donc capable d’être présente d’abord à l’événement E1 en haut de la figure puis à l’événement E2 en bas de la figure. 149
IL ÉTAIT TEMPS
Dans un nouveau référentiel qui se déplace avec une vitesse v du premier événement vers le deuxième le long de la barre, l’horloge placée au niveau du premier événement est en retard sur l’autre horloge d’une quantité Dv/c2, il est alors possible de choisir v pour que Dv/ c2 soit égal à T, de sorte que les deux événements soient simultanés dans le nouveau référentiel. Cela implique que cT v = c 2T /D = c (8.5) D Référentiel de la barre
Référentiel de la fusée
E1 0
0
D v = Tc2/D v = Tc2/D
E1
E2
0
T D0 v=0
E2 T
T D
Figure 8.2 | La moitié gauche de la figure montre les événements E1 et E2 séparés par une durée T et par une distance D dans le référentiel d’une barre de longueur propre D, aux extrémités de laquelle les événements ont lieu. La figure en haut à gauche montre l’événement E1 se produisant à l’instant 0 et en bas à gauche on voit E2 se produire à l’instant T, ces temps sont donnés par des horloges fixées aux extrémités de la barre et synchronisées dans le référentiel de la barre (les boîtes carrées juste en dessous de la barre). Une fusée (l’objet allongé au milieu de la partie gauche de la figure) se déplace vers la droite avec la vitesse v = Tc2/D = c(cT/D), qui est forcément plus petite que c lorsque D > cT. Dans le référentiel de la fusée (sur la moitié droite de la figure), la barre et ses horloges attachées se déplacent vers la gauche avec la vitesse v. Dans le référentiel de la fusée, quand l’horloge de gauche affiche 0, l’horloge de droite affiche vD/c2 = T, les deux événements sont donc simultanés. Par conséquent, la distance D0 entre les événements dans le référentiel de la fusée est égale à la longueur contractée sD de la barre en mouvement.
150
L’intervalle entre deux événements
Vu que D est supérieur à cT, la vitesse nécessaire est plus petite que c, par conséquent il existe bien un référentiel dans lequel les deux événements sont simultanés : le référentiel de la fusée sur la figure 8.2. Dans le référentiel de la fusée, les événements se produisent aux extrémités d’une barre de longueur propre D qui se déplace avec une vitesse v = c2T/D. Comme les deux événements sont simultanés dans le référentiel de la fusée, la barre ne bouge pas entre les deux événements et la distance D0 entre les événements est tout simplement égale à la distance contractée de la barre en mouvement :
D0 = sD = D 1 − v 2 /c 2 (8.6)
Étant donné que la vitesse v de la fusée est donnée par (8.5), nous déduisons grâce à (8.6) que
D02 = D2 − c 2T 2 (8.7)
Ainsi, quand la durée T et la distance D entre deux événements sont telles que D/c > T, la grandeur (D2 − c2T2) est indépendante du référentiel dans lequel on mesure D et T, elle est égale au carré de la distance D0 entre les deux événements, mesurée dans le référentiel où les deux événements se produisent au même moment. Notons au passage l’harmonieuse ressemblance entre la conclusion en italique que nous venons d’écrire et la conclusion en italique qui suit immédiatement (8.4). Quand les distances et les durées sont mesurées en pieds et en nanosecondes (c = 1 pied par nanoseconde), on peut passer d’une conclusion à l’autre en permutant le temps et l’espace. Pour résumer, si D est la distance et T est la durée entre deux événements, alors la quantité c2T2 − D2 est indépendante du référentiel dans lequel elle est mesurée, et il est utile de distinguer trois cas : 1°) c2T2 − D2 > 0. Dans ce cas, on dit que la séparation entre les événements est de genre temps, car il y a un référentiel dans lequel ils se produisent au même endroit. Dans ce référentiel, ils sont séparés uniquement dans le temps et la durée T0 entre eux est donnée par c2T02 = c2T2 − D2. 151
IL ÉTAIT TEMPS
2°) c2T2 − D2 < 0. Dans ce cas, on dit que la séparation entre les événements est de genre espace, car il y a un référentiel dans lequel ils se produisent au même moment. Dans ce référentiel, ils sont séparés uniquement dans l’espace et la distance D0 entre eux est donnée par D02 = D2 − c2T2. 3°) c2T2 − D2 = 0. Dans ce cas, on dit que la séparation entre les événements est de genre lumière, car un même photon peut être présent aux deux événements. Pour le premier cas, si on sait par avance que c2T2 − D2 est indépendant du référentiel dans lequel D et T sont mesurés, on en déduit que c2T2 − D2 est forcément égal à c2T02 puisque T0 est la durée entre les événements dans le référentiel où la distance D0 entre eux est égale à 0. L’impossibilité de trouver un référentiel dans lequel les événements ont lieu en même temps apparaît aussi très clairement. En effet, dans un tel référentiel, la durée T aurait été nulle et dans ce cas c2T2 − D2 n’aurait pas pu être positif. De la même manière, dans le deuxième cas, sachant que c2T2 − D2 est un invariant, la valeur de c2T2 − D2 est évidemment D02 dans le référentiel où les deux événements ont lieu en même temps puisque la durée T0 qui les sépare est nulle. L’impossibilité de trouver un référentiel dans lequel les événements se produisent au même endroit apparaît clairement. En effet, dans un tel référentiel, la distance D aurait été nulle et dans ce cas c2T2 − D2 n’aurait pas pu être négatif. La quantité I = | c 2T 2 − D2 | est appelée l’intervalle entre deux événements. Ce terme a été soigneusement choisi pour n’évoquer ni une séparation dans l’espace, ni dans le temps. Quand c2T2 − D2 est positif, l’intervalle entre les deux événements (divisé par c) est simplement égal à la durée entre eux dans le référentiel où les événements ont lieu au même endroit. Quand c2T2 − D2 est négatif, l’intervalle entre les deux événements est simplement égal à la distance entre eux dans le référentiel où les événements ont lieu au même moment. 152
L’intervalle entre deux événements
Il est possible de faire une analogie entre cette vision des choses et la conception purement spatiale de points situés sur un même plan (illustrée à la figure 8.3). Soit deux points P1 et P2 et supposons que P1 soit à une distance x à l’est de P2 et à une distance y au nord. Alors, selon le théorème de Pythagore, la distance d la plus courte entre les deux points est donnée par d 2 = x 2 + y 2 (8.8)
D’autre part, si P1 se trouve à une distance a au nord-ouest de P2 et à une distance b au nord-est, alors, selon le théorème de Pythagore, la distance d la plus courte entre les deux points obéit à la relation d 2 = a2 + b2 (8.9)
Étant donné que la plus petite distance entre deux points ne dépend pas du système de coordonnées qu’on utilise, on en conclut que x2 + y2 = a2 + b2.
N x
y
O
P1
b
E d
a P2
S Figure 8.3 | La distance d entre deux points P1 et P2 est la longueur du segment en gras. Il s’agit de l’hypoténuse d’un triangle rectangle ayant pour côtés x et y et également l’hypoténuse d’un second triangle rectangle ayant pour côtés a et b. Les distances x et y sont les distances est-ouest (E-O) et nord-sud (N-S) entre P1 et P2, alors que les distances a et b sont les distances NO-SE et NE-SO entre ces mêmes points.
153
IL ÉTAIT TEMPS
La découverte remarquable de la relativité est qu’une relation similaire existe entre les séparations spatiales et temporelles. La seule différence réside dans le fait qu’on soustrait les carrés au lieu de les ajouter pour obtenir la quantité invariante. Le fait qu’un facteur supplémentaire c apparaisse dans l’expression de la quantité invariante c2T2 − D2 ne constitue pas une différence significative, car si nous choisissons de mesurer les distances x et a avec une certaine unité (par exemple le pied = 0,3048 m) et les distances y et b dans une autre unité (par exemple le mètre), il faudrait tout de même introduire un facteur de conversion similaire dans la relation (8.8), bien qu’elle soit purement géométrique. Si on souhaite exprimer d en mètres, comme 1 pied est égal à 0,3048 m, la relation (8.8) prendrait la forme suivante : d2 = (0,3048)2x2 + y2. Le facteur c, qui disparaît si on utilise des « unités naturelles » pour l’espace et le temps comme les nanosecondes et les pieds, n’est qu’un facteur de conversion qui devient nécessaire lorsqu’on utilise des unités inappropriées comme la seconde et le mètre (c = 299 792 458 mètres par seconde) au lieu de la nanoseconde et du pied (c = 1 pied par nanoseconde). L’invariance de l’intervalle n’a été découverte que très tardivement à cause de la valeur colossale de la vitesse de la lumière c par rapport aux vitesses usuelles. Les séparations spatiales et temporelles auxquelles nous sommes habitués dans notre vie de tous les jours sont telles que T n’est pas assez petit ou D pas assez grand pour empêcher cT d’être toujours très largement supérieur à D, ainsi nous ne pouvons jamais percevoir la différence existante entre la quantité I 2 = c 2T 2 − D2 et la quantité c 2T 2. Dans ces conditions, l’invariance de l’intervalle se réduit à l’affirmation que la durée entre deux événements est la même dans tous les référentiels, ce qui est exactement ce que les gens avaient l’habitude de croire. C’est seulement lorsque D devient très grand et/ou T très petit, lorsque D/T n’est plus négligeable par rapport à c, que l’invariance de l’intervalle a les implications profondes que nous connaissons à présent. 154
L’intervalle entre deux événements
Voici une conséquence amusante de l’invariance de l’intervalle. Considérons deux événements dans l’histoire d’une horloge se déplaçant en ligne droite et à vitesse constante. Ces deux événements sont séparés par une distance D et une durée T. Étant donné que la distance entre les deux événements est D0 = 0 dans le référentiel propre de l’horloge, la durée T0 mesurée par l’horloge entre les deux événements est donnée par T02 = T2 − D2/c2, comme nous l’avons déjà vu en (8.4). Nous pouvons réécrire cette relation sous la forme T02 + D2/c2 = T2 et finalement en divisant des deux côtés par T2, on obtient
T02 D2 + = 1 (8.10) T 2 c 2T 2
Comme l’horloge est présente aux deux événements, D/T est tout simplement la vitesse de l’horloge pour le référentiel dans lequel l’horloge est en mouvement, ce rapport nous indique de combien de mètres l’horloge se déplace à chaque seconde. D’un autre côté, T0/T nous indique de combien de secondes l’affichage de l’horloge avance à chaque seconde qui s’écoule dans le référentiel où elle est en mouvement. En utilisant un jeu d’unités pour lequel c = 1 (par exemple le pied et la nanoseconde), nous obtenons
T0 T
2
+ v 2 = 1 (8.11)
La relation (8.11) nous indique que lorsqu’on ajoute le carré de la vitesse de fonctionnement d’une horloge en mouvement rectiligne uniforme (en nanosecondes affichées par nanoseconde de temps écoulé) au carré de la vitesse avec laquelle l’horloge se déplace dans l’espace (en pieds par nanoseconde), on trouvera forcément 1. Ceci peut aussi se déduire directement de l’expression du facteur de ralentissement s = 1 − v 2 /c 2 pour les horloges en mouvement sans exploiter le concept d’intervalle. Une horloge immobile peut se déplacer dans le temps à 1 nanoseconde par nanoseconde, car elle ne se déplace pas du tout dans 155
IL ÉTAIT TEMPS
l’espace. Mais lorsque l’horloge est mise en mouvement, un échange se produit : plus elle se déplace rapidement dans l’espace (autrement dit, plus v est important), plus elle avance lentement dans le temps (autrement dit, plus T0/T est petit) de sorte que la somme des deux carrés reste toujours égale à 1. Tout se passe comme si l’horloge, quel que soit son état, était toujours en mouvement dans une combinaison d’espace et de temps – l’espace-temps – à la vitesse de la lumière. Pour pouvoir se déplacer dans l’espace, l’horloge doit sacrifier un peu de son mouvement à travers le temps pour maintenir une vitesse totale égale à 1 à travers l’espace-temps comme l’exige la relation (8.11). L’analogie avec la vitesse d’une voiture roulant sur l’autoroute est frappante : une voiture roulant vers l’est avec le régulateur de vitesse fixé à 130 km/h doit sacrifier une part de sa vitesse ve vers l’est pour acquérir une vitesse vn vers le nord. En effet, le régulateur maintient la vitesse totale de la voiture à 130 km/h alors que le théorème de Pythagore requiert que la vitesse ve vers l’est et la vitesse vn vers le nord soient reliées à chaque instant par la relation (130)2 = ve2 + vn2. Il est possible de mesurer l’intervalle entre deux événements quelconques en utilisant une seule et unique horloge présente seulement à un des deux événements. Supposons qu’Alice soit présente à l’événement E1 et Bob à l’événement E2. Supposons que chacun d’eux puisse voir (avec un télescope par exemple) ce qui se passe au voisinage de l’autre. Si Alice transporte une horloge dans son mouvement rectiligne uniforme, alors elle et Bob peuvent mesurer l’intervalle de la manière suivante : (1) Alice note l’indication t1 de son horloge quand l’événement E1 a lieu à côté d’elle. (2) Alice note l’indication t3 de son horloge quand elle voit (à travers son télescope) l’événement E2 se produire à côté de Bob. (3) Bob note l’indication t2 qu’il voit (à travers son télescope) sur l’horloge d’Alice au moment où l’événement E2 se produit à côté de lui. Le carré de l’intervalle entre E1 et E2 est donné par
156
I 2 = c 2 |(t3 − t1 )(t 2 − t1 )| (8.12)
L’intervalle entre deux événements
Il n’est pas compliqué de se convaincre que la relation (8.12) est exacte pour des événements dont la séparation est de genre lumière puisque dans ce cas un photon peut voyager d’un événement à l’autre, on a soit t2 = t1 soit t3 = t1, cela dépend si le photon part de E1 pour aller en E2 ou l’inverse. Dans les deux cas, (8.12) donne I = 0 . C’est également valable si l’horloge d’Alice est présente à la fois à l’événement E2 et à l’événement E1, ce qui est possible si la séparation entre les événements est de genre temps. Il est possible de confirmer la validité de (8.12) de façon plus générale en montrant que s’il existe un référentiel dans lequel les événements se produisent au même moment (donc pour des événements dont la séparation est de genre espace), alors le résultat de (8.12) est effectivement égal au carré de la distance qui les sépare dans ce référentiel. Et s’il y a un référentiel dans lequel les événements se produisent au même endroit (donc pour des événements dont la séparation est de genre temps), alors le résultat de (8.12) est égal au carré de la durée qui les sépare dans ce référentiel. Pour chacun de ces cas, il y a deux possibilités : pour des événements dont la séparation est de genre espace, Alice peut soit se déplacer vers E2, soit s’en éloigner ; pour des événements dont la séparation est de genre temps, E1 peut se produire soit avant, soit après E2. Dans tous ces cas, on profite du fait que les différences de temps peuvent être déduites en divisant les différences des indications de l’horloge d’Alice par le facteur de ralentissement sv associé à sa vitesse v. Je vous invite à examiner quelques-uns de ces cas. Je vous présenterai ma propre démonstration de la relation (8.12) au chapitre 10 (pages 226 à 228), qui utilisera un procédé beaucoup plus puissant et plus intuitif qu’une simple vérification sur quelques cas particuliers.
157
9 Des trains de fusées
Dans ce chapitre, nous allons montrer par une méthode simple comment un désaccord sur la synchronisation des horloges produit tous les effets relativistes que nous avons rencontrés : le facteur de ralentissement des horloges en mouvement, la contraction des règles en mouvement, la loi relativiste de composition des vitesses, l’existence d’une vitesse invariante, ainsi que l’invariance de l’intervalle. Nous allons examiner ce qui se passe dans deux référentiels en nous plaçant dans un troisième référentiel dans lequel les deux premiers se déplacent à la même vitesse, mais dans deux sens opposés. Le troisième référentiel sera le référentiel propre d’une station spatiale. Les deux premiers référentiels sont les référentiels propres de deux trains de fusées : un train gris qui se déplace vers la gauche à une certaine vitesse dans le référentiel de la station spatiale et un train blanc qui se déplace à la même vitesse, mais vers la droite (également dans le référentiel de la station). La figure 9.1 montre quatre instants successifs du référentiel de la station (représentée par un disque noir) avec les deux trains formés 159
IL ÉTAIT TEMPS
par un enchaînement de fusées numérotées. La station reste immobile pendant que les trains, eux, avancent de la longueur d’une fusée d’une partie à l’autre de la figure. Les trois chiffres qui suivent le deux-points (par exemple :006) à côté de chaque fusée représentent l’affichage d’une horloge à bord de cette fusée. L’horloge est placée au centre de la fusée, juste au niveau de son numéro. Quel que soit l’instant considéré, les deux séries d’horloges embarquées à bord de chaque train ne sont pas synchronisées : plus on va vers l’arrière du train, plus les horloges sont en avance et le décalage est exactement égal à deux unités de temps (que nous appellerons « tic-tac ») par longueur de fusée. Cette situation est conforme à la règle stipulant que des horloges synchronisées dans le référentiel du train sont alors désynchronisées pour un observateur de la station, l’horloge de devant étant en retard sur l’horloge arrière d’un temps T = Du/c2 (D étant la distance entre les horloges dans leur référentiel propre et u la vitesse du train dans le référentiel de la station). En prenant la longueur propre d’une fusée comme unité de longueur et en choisissant bien la valeur de u, on obtient un décalage sur la figure égal à :
u/c2 = 2 tic-tacs par fusée
(9.1)
Nous pouvons voir la figure 9.1 de deux manières. Nous pouvons imaginer que les deux trains se déplacent à une vitesse très élevée, que le tic-tac est une unité de temps très petite et que la précision des horloges est suffisamment importante pour que la désynchronisation décrite dans la figure corresponde à un véritable effet relativiste : u/c2 nanosecondes de désynchronisation pour chaque pied de séparation spatiale. Il y a une façon plus amusante de voir les choses : on peut tout à fait imaginer que les fusées se déplacent à une vitesse parfaitement réaliste – par exemple quelques kilomètres par seconde – et que les horloges, très ordinaires (battant la seconde avec une précision correcte, mais pas exceptionnelle), ont été délibérément désynchronisées 160
Des trains de fusées
:000 0
:002 1
:004 2
:006 3
:012 3
:014 4
:022 5
(1) 3 :006
2 :004
1 :002
0 :000
:006 0
:008 1
:010 2
3 :012
2 :010
1 :008
0 :006
:012 0
:014 1
:016 2
:018 3
:020 4
5 :022
4 :020
3 :018
2 :016
1 :014
0 :012
:018 0
:020 1
:022 2
:024 3
:026 4
:028 5
:030 6
6 :030
5 :028
4 :026
3 :024
2 :022
1 :020
0 :018
(2) 4 :014
(3)
(4)
Figure 9.1 | Deux trains de fusées, représentés à quatre instants différents du temps de la station spatiale, numérotés de (1) à (4). Les nombres (tels que :014) notés au-dessus ou au-dessous des fusées représentent l’affichage des horloges embarquées. D’une fusée à l’autre, les horloges sont décalées de :002. Entre deux instants représentés, l’affichage des horloges avance de :006 et chaque train avance de la longueur d’une fusée vers la gauche (train gris) ou vers la droite (train blanc).
161
IL ÉTAIT TEMPS
par les habitants de la station spatiale. On peut donc lire la figure en imaginant que les habitants de la station ont voulu mettre à l’épreuve les passagers de chaque train pour savoir à quelles conclusions ils parviendraient si on les persuadait que leurs horloges étaient synchronisées. Avant le départ des trains et après que les passagers soient enfermés dans leur fusée, les habitants de la station fournissent une horloge aux passagers de chaque fusée. Mais secrètement, ils avancent les horloges de 2 tic-tacs à chaque fois qu’ils progressent d’une fusée vers l’avant du train. Ils font également attention à ce que les passagers des différentes fusées ne puissent pas communiquer entre eux ni échanger des notes sur les indications de leurs horloges. Tout au long du processus, les passagers des trains sont si habilement manipulés qu’ils croient dur comme fer que leurs horloges sont synchronisées. Interprétons la figure 9.1 conformément à ce scénario complotiste. Après le départ des trains, les passagers ne peuvent avoir accès qu’à des informations relatives à leur voisinage immédiat. Par exemple, au moment où deux fusées se croisent (par exemple à l’instant (1) les deux fusées 0 se croisent, à l’instant (3) la fusée grise numéro 1 croise la fusée blanche numéro 3), les passagers de chaque fusée peuvent lire le numéro et l’affichage de l’horloge de la fusée d’en face ainsi que le numéro et l’affichage de leur propre horloge. Les informations que les passagers peuvent collecter sont toutes disponibles sur la figure 9.1. Par exemple, la figure 9.2 a été extraite de la partie (4) de la figure 9.1, elle résume les différentes informations que les passagers de la fusée grise 1 ou de la fusée blanche 5 peuvent collecter lors du croisement. En examinant la figure 9.2, les passagers du train blanc pourraient dire qu’au temps 28 tic-tacs du train blanc, la fusée grise 1 était juste en face de la fusée blanche 5 et son horloge affichait 20 tic-tacs. Les passagers du train gris, en examinant la même figure, pourraient dire (de façon similaire) qu’au temps 20 tic-tacs du train gris, la fusée blanche 5 était en face de la fusée grise 1 et son horloge affichait 28 tictacs. Remarquons que la seule différence d’interprétation de l’image réside dans le fait que les passagers de chaque train considèrent que 162
Des trains de fusées
seules leurs horloges donnent le temps correct et que les horloges de l’autre train ne sont pas réglées correctement, car elles n’indiquent pas le temps qui correspond au moment où l’image a été prise. Supposons que les deux trains se soient croisés et qu’une grande quantité d’informations ait pu être collectée par les passagers de chaque train qui sont maintenant de retour sur la station spatiale. Les passagers de chaque train sont à présent rassemblés chacun dans une salle de conférence – une pour le train blanc et l’autre pour le train gris – pour comparer et analyser les photos qu’ils ont prises. Si à aucun moment ils ne pensent à mettre en doute la synchronisation de leurs horloges, quelles déductions peuvent-ils faire ? D’emblée, ils pourraient commencer par examiner n’importe quelle paire d’images comportant la même fusée. La figure 9.3 montre par exemple deux images de la fusée grise 0, extraite des parties (2) et (3) de la figure 9.1. Voyons comment les passagers du train blanc peuvent interpréter ces images : Ils peuvent déterminer la vitesse de la fusée grise 0, car, dans la première image, elle est en face de la fusée blanche 2 et son horloge indique un temps de 10 tic-tacs, alors que dans la deuxième image elle est en face de la fusée blanche 4 et son horloge indique un temps de 20 tic-tacs. Ainsi, la fusée grise 0 a mis 10 tic-tacs pour avancer de 2 fusées, 1 par conséquent elle se déplace à une vitesse de de fusée par tic-tac. 5
:020
1
5 :028
Figure 9.2
163
IL ÉTAIT TEMPS
Une seconde déduction peut être faite par les passagers du train blanc s’ils remarquent qu’à l’instant 10 tic-tacs du temps blanc, l’horloge de la fusée grise 0 affiche 6 tic-tacs, alors qu’au temps blanc de 20 tic-tacs, l’horloge de la fusée grise 0 affiche 12 tic-tacs. Pendant la durée 10 tic-tacs écoulée entre les deux images (mesurée selon le temps blanc), l’horloge grise n’a avancé que de 6 tic-tacs, elle fonc3 tionne donc avec un facteur de ralentissement égal à . 5 Remarquons que ces conclusions sont entièrement basées sur l’hypothèse que les horloges blanches sont synchronisées vu que les passagers du train blanc utilisent l’affichage de deux horloges différentes (l’une dans la fusée blanche 2 et l’autre dans la fusée blanche 4) pour attribuer des temps aux événements. Je vous invite à vérifier par vous-même que les passagers du train blanc peuvent faire exactement les mêmes déductions à partir de n’importe quelle autre paire d’images où figure une 1 même fusée grise : la vitesse de la fusée grise sera égale à de fusée par 5 3 tic-tac et son horloge fonctionnera plus lentement d’un facteur égal à . 5 Au vu de la symétrie parfaite qui existe entre le train gris et le train blanc sur la figure 9.1, il est facile de se convaincre que les passagers du train gris vont arriver exactement aux mêmes conclusions à propos du train blanc et de ses horloges en étudiant une paire d’images quelconque comportant la même fusée blanche. Ils concluront que le 1 train blanc se déplace à la vitesse de de fusée par tic-tac et que ses 5 3 horloges sont ralenties d’un facteur . Cette situation nous montre 5 immédiatement qu’un désaccord sur la synchronisation des horloges conduit directement les passagers d’un train à conclure que les horloges de l’autre train tournent au ralenti. Quant à nous, en examinant la figure 9.1 du point de vue de la station, nous estimons que les deux jeux d’horloges tournent exactement au même rythme et que ni l’un ni l’autre ne sont correctement synchronisés. 164
Des trains de fusées
:006
:012
0
0
2
4
:010
:020
Figure 9.3
Chaque groupe de passagers a déterminé que l’autre train avait 1 une vitesse v = de fusée par tic-tac et que les horloges de l’autre 5 3 train sont ralenties d’un facteur s = . Pour voir s’il est possible 5 de retrouver tous les effets relativistes simplement en piochant des images dans la figure 9.1, il faudrait déterminer le rapport v/c : à partir 3 1 v 4 de s = = 1 − v 2 /c 2 , on en déduit que = . Comme v = de 5 c 5 5 v 4 1/5 fusée par tic-tac et que nous avons obtenu = = , on peut c 5 1/ 4 1 donc attribuer à la vitesse particulière de de fusée par tic-tac le 4 rôle de vitesse invariante – la vitesse de la lumière. L’analyse d’une paire d’images prises au même instant du temps d’un des deux trains permet également d’obtenir des résultats intéressants. Considérons par exemple les deux images de la figure 9.4, extraites des parties (3) et (4) de la figure 9.1, sur lesquelles les deux horloges grises affichent 20 tic-tacs. Comme, du point de vue des passagers du train gris, ces images ont été prises au même moment, ils en déduisent immédiatement que les horloges du train blanc ne sont pas synchronisées. 165
IL ÉTAIT TEMPS
:020
:020
4
1
0
5
:012
:028
Figure 9.4
Car au temps gris de 20 tic-tacs, l’horloge à bord de la fusée blanche 0 affiche 12 tic-tacs, alors que celle qui est dans la fusée blanche 5 affiche 28 tic-tacs. Les horloges blanches sont décalées de 16 tic-tacs et éloignées de 5 fusées blanches, elles sont donc désynchronisées de 3,2 tic-tacs par fusée. Il n’y a rien de surprenant à ce que cette valeur soit différente de 2 tic-tacs par fusée qui ressort de la figure 9.1. On s’attend forcément à une valeur différente, vu que la figure 9.1 représente ce qui se passe dans le référentiel de la station dans lequel les horloges grises sont aussi désynchronisées que les blanches et où, par conséquent, aucune des deux séries d’horloges n’est fiable. Les passagers du train gris peuvent aussi conclure à partir de la figure 9.4 qu’à un seul moment du temps gris – 20 tic-tacs – 5 fusées blanches (les fusées 4, 3, 2, 1 et la moitié des fusées 5 et 0) ont la même longueur que 3 fusées grises (les fusées 2, 3 et la moitié des fusées 4 et 1), on voit donc que les fusées blanches se sont contractées d’un 3 facteur identique à celui du ralentissement des horloges blanches. 5 On peut tirer les mêmes conclusions à partir de n’importe quelle autre paire d’images avec deux horloges grises affichant le même temps et on peut obtenir exactement les mêmes conclusions (en inversant gris et blanc) à partir de n’importe quelle paire d’images montrant deux horloges blanches affichant le même temps. 166
Des trains de fusées
Remarquons que le décalage de 3,2 tic-tacs par fusée est exactement ce qui est prévu par la règle T = Dv/c2 en remplaçant v et c par les valeurs que nous avons déterminées précédemment. En effet, 1 1 v = de fusée par tic-tac et c = de fusée par tic-tac, ainsi v/c2 vaut 5 4 1 5 = 16 = 3, 2 tic-tacs par fusée, (9.2) 2 5 1 4 c’est bien ce que nous avons déduit directement de la figure 9.4.
:000
:008
0
1
0
1
:000
:008
Figure 9.5
Nous pouvons également montrer que toutes les déductions que nous avons faites jusqu’à présent sont compatibles avec un décalage de 2 tic-tacs par fusée entre les horloges de chaque train pour les gens utilisant le référentiel de la station. Si nous notons u la vitesse de chaque train dans le référentiel de la station, la règle de désynchronisation des horloges nous dit que u/c2 doit être égal à 2 tic-tacs par 1 fusée. Si la vitesse invariante est c = de fusée par tic-tac alors u, la 4 vitesse de chaque train dans le référentiel de la station spatiale, doit 1 1 être égal à de fusée par tic-tac vu que 2 = 8 2 . Nous pouvons 8 1 4 167
IL ÉTAIT TEMPS
vérifier que c’est effectivement le cas en utilisant le fait que la vitesse d’un train dans le référentiel de la station est la même que celle de la station dans le référentiel d’un train. Il apparaît de façon évidente à partir des images extraites des parties (1) et (2) de la figure 9.1 (reproduite sur la figure 9.5) que, du point de vue d’un train comme de l’autre, la station met 8 tic-tacs pour aller de la fusée 0 à la fusée 1 1 : sa vitesse est donc bien égale à de fusée par tic-tac. 8 Nous pouvons aussi vérifier que ces différentes vitesses sont cohérentes avec la loi de composition relativiste des vitesses :
vbg =
vbs + vsg 1 + vbs vsg /c 2
(9.3)
où vbg est la vitesse du train blanc dans le référentiel du train gris, vbs est la vitesse du train blanc dans le référentiel de la station et vsg, la vitesse de la station dans le référentiel du train gris. Nous savons que 1 1 vbs = vsg = de fusée par tic-tac et c = de fusée par tic-tac. Quand 8 4 on calcule l’expression (9.3) avec ces valeurs, le résultat obtenu pour 1 vbg est effectivement égal à de fusée par tic-tac, notre analogie 5 continue donc à suivre les relations relativistes de manière précise. Il est important de souligner que la construction de la figure 9.1 repose sur un très petit nombre d’hypothèses. La structure de la partie (1) est extrêmement simple. La seule particularité de cette figure vient du décalage des horloges entre elles et de la manière simple avec laquelle ce décalage a été construit. À chaque fois qu’on passe d’une partie de la figure à la partie suivante du bas, il faut que chaque train avance de 1 fusée dans le sens de son mouvement et que chaque horloge avance de 6 tic-tacs. Il n’y a aucune manipulation complexe à faire pour obtenir la relativité à partir de ces figures. Une fois qu’on introduit les horloges désynchronisées dans les fusées, tous les autres effets relativistes se manifestent automatiquement. 168
Des trains de fusées
:006
:028
0
5
2
1
:010
:020
Figure 9.6
La loi de composition relativiste des vitesses est valable pour tout objet se déplaçant le long des deux trains – et pas seulement pour la station. Considérons l’exemple illustré par les deux images de la figure 9.6 sur lesquelles on voit un objet situé d’abord entre la fusée grise 0 et la fusée blanche 2 dans la partie (2) de la figure 9.1 puis entre la fusée grise 5 et la fusée blanche 1 dans la partie (4). Du point de vue du train gris, l’objet a parcouru 5 fusées vers la droite pendant un temps de 22 tic-tacs et, du point de vue du train blanc, l’objet s’est déplacé de 1 fusée vers la droite pendant un temps égal à 10 tic-tacs, 5 1 nous avons ainsi vog = de fusée par tic-tac et vob = de fusée 22 10 par tic-tac. Nous appliquons la relation vog =
vob + vbg 1 + vob vbg /c 2
(9.4)
ce qui se traduit par le calcul suivant
vog
1 1 + 10 5 = 1 1 1 1+ / 10 5 4
et le résultat est effectivement vog =
2
(9.5)
5 de fusée par tic-tac. 22 169
IL ÉTAIT TEMPS
Je vous invite à vérifier par vous-même que n’importe quelle paire d’images tirées de la figure 9.1 comportant deux moments de l’histoire d’un même objet donne par le même raisonnement des valeurs vob et vog cohérentes avec la loi de composition relativiste des vitesses 1 1 (9.4) et avec le fait que vbg = de fusée par tic-tac et c = de fusée 5 4 par tic-tac.
:014
:026
1
4
3
2
:018
:022
Figure 9.7
(Il faut bien faire attention à attribuer des signes corrects à vob et vog : positif si l’objet se déplace vers l’extrémité droite du train et négatif s’il se déplace vers l’extrémité gauche.) C’est particulièrement instructif de chercher deux photos de deux moments différents de l’histoire d’un même objet se déplaçant à la 1 vitesse particulière de de fusée par tic-tac. C’est le cas des deux 4 images de la figure 9.7 extraites des parties (3) et (4) de la figure 9.1 sur lesquelles on a ajouté un cercle blanc. Du point de vue du train gris, l’objet s’est déplacé de 3 fusées sur la droite pendant une durée 1 de 12 tic-tacs, sa vitesse est donc de de fusée par tic-tac. Du point 4 de vue du train blanc, le cercle s’est déplacé de 1 fusée sur la droite 1 en 4 tic-tacs, sa vitesse est donc aussi égale à de fusée par tic-tac. 4 170
Des trains de fusées
Un tel objet exploite de façon étonnante les décalages entre les horloges des deux trains, car il peut se déplacer le long des deux trains à la 1 fois dans le même sens et à la même vitesse ( de fusée par tic-tac). 4 Bien entendu, cela ne fonctionne que si on admet que le temps d’un train donné est indiqué par les horloges de ses fusées et également que toutes ses horloges sont parfaitement synchronisées entre elles. Sur la figure 9.8, j’ai repris les quatre parties de la figure 9.1 sur lesquelles j’ai ajouté un autre objet de ce type (qui se déplace cette fois-ci vers la gauche du point de vue de chaque train) pour que vous puissiez apprécier avec quelle élégance cet objet se déplace le long des deux trains pour que les passagers de chaque train lui attribuent la même 1 vitesse de de fusée par tic-tac. 4 La figure 9.1 nous fournit une justification supplémentaire du caractère problématique d’un mouvement qui se ferait à une vitesse plus élevée que celle de la lumière. La figure 9.9 comporte deux images (extraites des parties (3) et (4) de la figure 9.1) prises dans l’histoire d’un objet (l’ovale noir) qui, par hypothèse, se déplace plus vite que la lumière. Du point de vue du train gris, l’ovale noir s’est déplacé de 1 6 fusées en 18 tic-tacs, ce qui lui donne une vitesse de de fusée par 3 1 tic-tac, ce qui dépasse la vitesse invariante c = de fusée par tic-tac. 4 Les passagers du train blanc seraient également d’accord pour dire que l’objet va plus vite que la vitesse invariante, car il avance de 4 fusées en uniquement 2 tic-tacs, d’où une vitesse de 2 fusées par tictac. (Vous pouvez vérifier que la loi de composition relativiste des vitesses fonctionne même pour des vitesses supraluminiques, mais il faut être très prudent et ne pas oublier les signes qui indiquent le sens du mouvement dans le référentiel de chaque train.) Il y a cependant un aspect de la figure 9.9 qui dérange fortement. Du point de vue du train gris, l’image de gauche a été prise 18 tic-tacs (:030 – :012) avant celle de droite. Alors que, du point de vue du train 171
IL ÉTAIT TEMPS
:000 0
:002 1
:004 2
:006 3
:012 3
:014 4
:022 5
(1) 3 :006
2 :004
1 :002
0 :000
:006 0
:008 1
:010 2
3 :012
2 :010
1 :008
0 :006
:012 0
:014 1
:016 2
:018 3
:020 4
5 :022
4 :020
3 :018
2 :016
1 :014
0 :012
:018 0
:020 1
:022 2
:024 3
:026 4
:028 5
:030 6
6 :030
5 :028
4 :026
3 :024
2 :022
1 :020
0 :018
(2) 4 :014
(3)
(4)
Figure 9.8 | Il s’agit d’une version améliorée de la figure 9.1. Dans chaque partie, on a ajouté un objet (le petit cercle blanc) dont la vitesse, du point de vue de chaque train, 1 est égale à de fusée par tic-tac. 4
172
Des trains de fusées
:012
:030
0
6
4
0
:020
:018
Figure 9.9
blanc, l’image de gauche a été prise 2 tic-tacs (:020 – :018) après celle de droite. Les passagers des deux trains seraient donc en désaccord sur l’ordre avec lequel les deux photos ont été prises ! C’est le genre de désaccord que nous ne pouvons pas accepter. Supposons par exemple que l’objet soit une bougie qui brûle. Ces images nous permettraient d’en déduire la flèche du temps : plus la photo serait récente, plus la bougie serait courte et plus l’écoulement de cire fondue sous la bougie serait important. Une telle paire d’images aurait révélé à un des deux groupes de passagers que leurs horloges n’indiquent pas le temps de façon correcte. Il se trouve qu’il est possible de généraliser cet exemple. Si un objet pouvait se déplacer plus vite que la lumière, on pourrait toujours trouver deux référentiels pour qui l’ordre chronologique de deux événements de l’histoire de cet objet ne serait pas le même. Cet aspect est plus facile à démontrer en utilisant les diagrammes d’espace-temps que nous verrons au prochain chapitre (par exemple sur la figure 10.18). Pour qu’un quelconque objet puisse aller plus vite que la lumière, il faudrait que sa structure interne ne dévoile absolument aucun indice sur la flèche du temps. Les bougies qui brûlent, les glaçons qui fondent, les bananes qui pourrissent, les batteries qui se déchargent, les personnes qui vieillissent et tout ce qui est affecté par la flèche du temps se trouve dans l’impossibilité d’aller plus vite que la lumière. 173
IL ÉTAIT TEMPS
Une autre caractéristique bizarre des mouvements à vitesse supraluminique, que nous avons remarquée au chapitre 5, émerge également de la figure 9.1.
:006
:028
0
5
2
1
:010
:020
Figure 9.10
5 Tout objet qui se déplacerait à de fusées par tic-tac (ce qui est 16 1 supérieur à de fusée par tic-tac) du point de vue de l’un des trains 4 serait, pour les voyageurs de l’autre train, présent en face de toutes les fusées à un même et unique instant. Je vous invite à vous rendre compte par vous-même de cette bizarrerie en étudiant la figure. Remarquons finalement que la figure 9.1 peut être utilisée pour démontrer l’invariance de l’intervalle entre deux événements. Prenez n’importe quelle paire d’images et calculez 2
T 2 − D2 /c 2 = T 2 − ( 4 D ) (9.6) 1 (le 4 vient du fait que c = de fusée par tic-tac), T est le nombre 4 de tic-tacs entre les événements des deux images, et D le nombre de fusées séparant les événements. Les résultats ne dépendront pas du référentiel utilisé pour évaluer T et D. Considérons, par exemple, la figure 9.10 qui représente un événement pris dans la partie (2) et un autre pris dans la partie (4) de la figure 9.1. Du point de vue du référentiel gris, les deux événements sont séparés par 22 tic-tacs et 5 fusées
174
Des trains de fusées
et (22)2 – (4 × 5)2 = 222 – 202 = 84. Du point de vue du référentiel blanc, les deux événements sont séparés par 10 tic-tacs et une fusée et (10)2 – (4 × 1)2 = 102 – 42 = 84. La séparation entre les deux événements de la figure 9.10 est de genre temps étant donné que T2 – D2/c2 est positif et qu’un objet présent aux deux événements aurait effecti1 vement une vitesse inférieure à de fusée par tic-tac dans les deux 4 5 1 référentiels ( de fusée par tic-tac dans le référentiel gris et dans 22 10 le référentiel blanc). En choisissant au hasard d’autres paires d’événements dans la figure 9.1, vous pouvez vous persuader que le résultat de T2 – (4D)2 reste le même, que vous lisiez T (le temps séparant les deux images) et D (la distance séparant les deux images) du point de vue des fusées blanches ou du point de vue des fusées grises. J’ai décrit tout cela comme si les horloges des deux trains avaient été délibérément désynchronisées par les habitants de la station spatiale. Si les trains et les horloges avaient effectivement été réglés de cette manière et si les passagers de chaque train étaient fermement convaincus que les horloges fournies étaient effectivement synchronisées, alors ils auraient interprété leurs photos exactement comme nous l’avons fait. Et voilà ce que le monde dans lequel nous vivons a de si particulier : si les habitants de la station avaient choisi de faire leur expérience avec des trains se déplaçant avec une vitesse de u pied par nanoseconde et s’ils avaient décidé de fixer le décalage entre les horloges de chaque train à une valeur de u nanoseconde par pied de fusée alors, pour obtenir ce résultat, ils n’auraient eu qu’à placer une horloge extrêmement précise dans chaque fusée, faire partir les trains à la vitesse u et demander aux passagers de chaque train de s’arranger entre eux pour synchroniser leurs horloges. La nature aurait automatiquement produit le désaccord sur l’interprétation de l’affichage des horloges entre la station spatiale et chaque train.
175
10 La géométrie de l’espace-temps
Grâce aux différentes figures présentées dans ce livre nous avons pu étudier divers événements qui se sont produits le long de rails ou le long de trains de fusées. Un événement est un fait qui se produit à une date bien définie et en un lieu précis, le croisement de deux fusées et de leurs horloges ou un signal qui atteint l'extrémité d'un train et qui déclenche la production d'une marque sur les rails sont des exemples d'événements que nous avons examinés. La zone occupée par chacun de ces événements doit rester petite comparativement à la taille globale de la figure. Une séparation spatiale entre deux événements est représentée par un éloignement horizontal sur une même figure et une séparation temporelle entre deux événements est illustrée par deux figures décalées verticalement. Dans ce chapitre, nous allons nous inspirer des conventions précédentes pour développer une forme abstraite de représentation des événements qui va s’avérer extrêmement performante. Dans ces nouvelles figures, les zones représentant les événements vont carrément se réduire à des points géométriques. En utilisant de façon 177
IL ÉTAIT TEMPS
plus systématique et générale cette méthode graphique de représentation des phénomènes, il est possible d’arriver à une meilleure compréhension – en fait la meilleure qui soit – de ce que la relativité nous enseigne sur la nature de l’espace et du temps. Les figures que nous construirons sont appelées diagrammes d’espace-temps ou diagrammes de Minkowski, d’après le nom de Hermann Minkowski qui les a inventés en 1908, trois ans à peine après le premier article d’Einstein sur la relativité. Pour simplifier, nous continuerons à ne prendre en compte qu’une seule direction de l’espace – tous les événements que nous considérerons surviendront le long de rails rectilignes. La prise en compte des deux autres dimensions de l’espace – qui permettent de situer un événement dans le plan perpendiculaire aux rails – peut parfois nous aider à mieux comprendre une situation, mais il n’est pas possible de représenter tout cela sur une feuille. Beaucoup de phénomènes importants, y compris ceux que nous avons étudiés jusqu’à présent, n’impliquent qu’un mouvement relatif dans une seule dimension de l’espace. Nous commençons avec un référentiel particulier (celui d’Alice) et nous allons énoncer les quelques règles simples qu’Alice va utiliser pour représenter des événements par des points sur une feuille. Tant que Bob n’entre pas en scène, la discussion qui va suivre se rapporte uniquement au référentiel d’Alice : lorsqu’il sera question d’événements ayant lieu au même endroit ou en même temps, ce sera du point de vue d’Alice. Alice représente un événement par un seul et unique point dans son diagramme. Deux événements – voire plus – peuvent survenir au même moment et au même endroit (ce sont des coïncidences spatiotemporelles), ils ne seront représentés que par un seul et unique point. Ainsi, un même point peut représenter soit un événement unique, soit un certain nombre d’événements concomitants. Des points distincts sur le diagramme peuvent représenter des événements distincts qui se produisent soit à différents endroits, soit à différents moments, soit à la fois à différents moments et à différents endroits. 178
La géométrie de l’espace-temps
Alice représente des événements qui arrivent tous au même endroit, mais à différents moments par des points distincts situés sur une même ligne droite. Une telle droite, comme celles de la figure 10.1, est appelée droite de position constante ou, sous forme plus condensée, une équiloc (le terme équiloc ne fait pas partie du vocabulaire de la relativité). Alice est parfaitement libre de choisir la direction qu’elle veut pour tracer une équiloc, cela n’a aucune implication autre que celle d’orienter le diagramme selon une direction particulière de sa feuille.
Figure 10.1 | Deux équilocs dans le référentiel d’Alice. Les deux points noirs sur la ligne de gauche représentent deux événements qui se produisent au même endroit (mais à deux instants différents) du point de vue d’Alice ; les trois points noirs sur la ligne de droite représentent trois autres événements qui se produisent en un même lieu mais à un endroit différent du lieu où se produisent les deux événements de gauche. La distance indiquée par une double flèche sur le diagramme est proportionnelle à la distance réelle, mesurée dans le référentiel d’Alice, entre les deux endroits que les équilocs représentent. L’échelle du diagramme est caractérisée par un coefficient l qui traduit le nombre de centimètres entre les équilocs de la feuille en éloignement réel en mètres d’espace.
Remarquons que deux équilocs quelconques qui représentent une série d’événements se produisant en deux endroits différents sont forcément parallèles. Dans le cas contraire, ces droites se croiseraient forcément quelque part. Un seul point (le point d’intersection) représenterait alors deux événements s’étant produits à deux endroits différents. Comme ce n’est pas possible, deux équilocs distinctes sont forcément parallèles. En suivant les conventions usuelles des cartographes (en tout cas, ceux qui cartographient des régions très petites par rapport au rayon de la Terre), Alice fait en sorte que la distance entre deux équilocs sur 179
IL ÉTAIT TEMPS
sa feuille soit proportionnelle à la distance réelle entre les positions des événements qu’elles représentent : plus elles seront éloignées sur la feuille, plus les événements seront éloignés dans l’espace. Le coefficient l est la clé de passage entre les distances dans l’espace et les distances sur le diagramme. Pour obtenir la distance sur le diagramme entre les équilocs passant par deux événements, il faut multiplier la distance réelle entre les deux événements dans l’espace par l. Par exemple, si deux équilocs séparées de 1 cm sur la feuille correspondent à deux événements réellement éloignés de 1 km, alors l serait égal à 1/100 000. Pour distinguer le coefficient d’échelle adopté par Alice de celui des autres personnes (cette précaution s’avérera utile), nous pouvons lui assigner un indice en le notant l A. Comme je l’espère, ces règles vous semblent très simples et même ennuyeuses. Le propos qui va suivre ne sera guère plus excitant, car les règles que nous allons énoncer pour positionner les événements dans le temps seront exactement les mêmes que celles que nous avons utilisées pour les situer dans l’espace. Alice place les événements le long de ses équilocs de façon à ce que des événements se produisant en même temps (mais pas nécessairement au même endroit) soient représentés sur son diagramme par des points alignés, comme sur la figure 10.2. Une telle droite rassemble tous les événements simultanés dans le référentiel d’Alice, elle est appelée droite de temps égal ou équitemp (les termes « équitemp » et « équiloc » ne sont pas encore entrés dans le vocabulaire courant de la relativité). Alice est parfaitement libre de choisir une orientation quelconque pour ses équitemps, tout angle différent de zéro avec ses équilocs peut convenir, cela n’a aucune importance puisqu’elle peut changer l’angle en étirant d’un certain angle la feuille sur laquelle elle a dessiné son diagramme (pour cela, nous pouvons considérer que la feuille est en caoutchouc). En reprenant, sans trop réfléchir, les conventions utilisées pour représenter les figures des chapitres précédents nous pourrions être tentés de représenter les équitemps d’Alice suivant l’horizontale, mais il faut résister à cette tentation. Comme nous allons le montrer, ce choix est beaucoup trop restrictif. 180
La géométrie de l’espace-temps
Figure 10.2 | Deux équitemps dans le référentiel d’Alice. Les deux points noirs sur la droite du bas représentent deux événements qui se sont produits en même temps (mais à deux endroits différents) du point de vue d’Alice ; les trois points noirs sur la droite du haut représentent trois autres événements qui se sont produits également en même temps, mais à un instant différent de celui des événements du bas. La distance indiquée par la double flèche sur le diagramme est proportionnelle à la durée réelle écoulée dans le référentiel d’Alice entre les deux instants que les équitemps représentent. L’échelle du diagramme est caractérisée par un coefficient l qui indique, par exemple, le nombre de centimètres entre les équitemps sur la feuille pour une séparation réelle dans le temps de 1 nanoseconde entre les événements.
Tout comme les équilocs, deux équitemps différents doivent être parallèles. Si elles ne l’étaient pas, ces droites finiraient par se croiser quelque part et le point d’intersection ne pourrait plus, à lui seul, représenter deux événements séparés dans le temps. En suivant la même démarche qu’avec ses équilocs, Alice considère que la distance sur sa feuille entre deux équitemps est proportionnelle à la durée réelle qui sépare les deux instants auxquels elles sont associées. Nous avons donc des équilocs dont les points représentent des événements qui se produisent en un seul et même endroit et des équitemps dont les points représentent des événements qui se produisent à un seul et même moment. Remarquons qu’une équitemp quelconque peut couper n’importe quelle équiloc, mais elles n’auront en commun qu’un seul et unique point. Ce point représente les événements qui se produisent précisément à cet endroit et à cet instant. Pour le choix de la direction commune de toutes ses équitemps, Alice n’a qu’une seule contrainte : elle doit seulement être différente de la direction commune de toutes ses équilocs. Les équitemps et les équilocs doivent se croiser avec 181
IL ÉTAIT TEMPS
un angle q non nul. Si vous êtes tenté de choisir un angle q égal à 90°, résistez également à cette tentation. Ce choix est aussi beaucoup trop restrictif. La grandeur fondamentale que constitue la vitesse de la lumière va peser, pour la première fois, sur la structure des diagrammes d’Alice. La lecture du diagramme sera grandement facilitée si Alice choisit la distance qui sépare deux équitemps associées à des événements se produisant à 1 nanoseconde d’intervalle exactement égale à la distance qui sépare deux équilocs associées à des événements distants de 1 pied (n’oubliez pas que nous avons redéfini le pied comme étant la distance parcourue par la lumière dans le vide en 1 nanoseconde). Cela veut dire que le coefficient d’échelle l des équilocs (par exemple en centimètres sur le diagramme par pied dans l’espace) a la même valeur que le coefficient d’échelle l pour les équitemps (en centimètres sur le diagramme par nanoseconde). Grâce à ces conventions d’échelle, la distance µ séparant deux événements se produisant à 1 nanoseconde d’intervalle sur une équiloc est exactement la même que la distance séparant deux événements éloignés de 1 pied sur une équitemp. La figure 10.3 illustre cette situation. Tout ceci n’est que la conséquence d’une propriété géométrique élémentaire qui dit que si deux droites parallèles distantes d’une longueur l coupent deux autres droites parallèles distantes de la même longueur l, alors le parallélogramme défini par les quatre points d’intersection possède quatre côtés de même longueur (notée µ dans notre cas). Un parallélogramme qui possède quatre côtés de même longueur s’appelle un losange. Les diagonales – qui passent par deux sommets opposés – sont perpendiculaires entre elles et coupent les angles au sommet en deux parties égales. Ces propriétés élémentaires du losange vont jouer un rôle important dans la discussion qui va suivre. Notez bien que le coefficient d’échelle µ est supérieur au coefficient d’échelle l, à moins qu’Alice n’ait pas tenu compte de mes avertissements 182
La géométrie de l’espace-temps
λ 1 ns
µ
µ λ
0 ns 1 pi 0 pi
Figure 10.3 | Les coefficients d’échelle l et m. Les droites parallèles qui montent en pente douce vers la droite sont des équitemps ; les événements représentés par des points sur l’équitemp du haut se produisent 1 nanoseconde après les événements représentés sur l’équitemp du bas. Les droites parallèles qui montent en pente raide vers la droite sont des équilocs ; les événements représentés par les points d’une équiloc se produisent à une distance de 1 pied des événements représentés par les points de l’autre équiloc. Le coefficient d’échelle l représente la distance sur le diagramme entre les équilocs ou entre les équitemps. Le coefficient d’échelle m représente la longueur des segments (en gras sur le diagramme) reliant deux événements éloignés de 1 pied sur une équitemp ou deux événements se produisant à 1 nanoseconde d’intervalle sur une équiloc.
et qu’elle ait orienté ses équilocs perpendiculairement à ses équitemps et, seulement dans ce cas particulier, on a µ = l. Les deux coefficients d’échelle sont utiles. Parfois, il est plus facile de déduire le temps (ou la distance) entre deux événements en se basant sur la distance entre les équitemps (ou les équilocs) sur lesquelles ils se situent : dans ce cas, c’est l le coefficient adapté. Mais, le plus souvent, nous souhaitons déduire le temps (ou la distance) entre deux événements qui surviennent au même endroit (ou au même moment) en se basant sur la distance qui les sépare sur une même équiloc (ou une même équitemp) : dans ce cas, c’est µ le coefficient adapté. Un losange comme celui de la figure 10.3 sera appelé losange unité, car ses côtés sont des segments d’équiloc et d’équitemp reliant des événements éloignés de 1 pied et se produisant à 1 nanoseconde d’intervalle. 183
IL ÉTAIT TEMPS
Dans le cas d’un objet suffisamment petit par rapport à l’échelle qui nous intéresse pour qu’on puisse le considérer comme un point de l’espace à chaque instant, il existe une série d’événements particulièrement importante qui réunit l’ensemble de tous les événements où l’objet est présent. La succession de tous ces événements est représentée par une ligne en trait plein sur le diagramme. Cette ligne, qui représente l’histoire complète de l’objet, est appelée ligne d’univers ou trajectoire dans l’espace-temps de l’objet. Par exemple, l’histoire d’un objet immobile dans le référentiel d’Alice sera représentée par l’équiloc associée à la place qu’il occupe. Un objet ayant un mouvement rectiligne uniforme dans le référentiel d’Alice est représenté par une ligne droite qui ne peut pas être parallèle à une équiloc, étant donné que l’objet change de position à chaque instant. Si la vitesse de l’objet n’est pas constante, sa ligne d’univers est courbe (par exemple, un mouvement oscillant de va-et-vient est représenté par une courbe en zigzag). Les lignes d’univers représentant différents objets en mouvement rectiligne uniforme avec la même vitesse le long d’un même rail sont parallèles entre elles. Sinon elles finiraient par se rencontrer en un point qui représenterait un événement où les différents objets auraient été présents au même endroit et au même moment. Or c’est impossible, car, du point de vue d’Alice, les objets en question parcourent la même distance pendant le même intervalle de temps, aucun objet ne sera donc en mesure de rattraper les autres, ils ne pourront donc jamais être réunis en un même point de l’espace. Les trajectoires dans l’espace-temps d’objets se déplaçant le long d’un rail avec la même vitesse mais en sens inverse ne sont, bien sûr, pas parallèles. Dans ce cas, les deux objets peuvent très bien être au même endroit au même moment. La trajectoire dans l’espace-temps d’un photon ou de n’importe quel objet se déplaçant à la vitesse de 1 pied par nanoseconde est une ligne d’univers particulièrement intéressante. Grâce aux échelles adoptées, la trajectoire d’un photon possède des caractéristiques géométriques simples. N’importe quel couple d’événements sur la trajectoire d’un photon doit être séparé par autant de pieds dans l’espace que de nanosecondes 184
La géométrie de l’espace-temps
dans le temps. À cause des contraintes que nous avons imposées aux coefficients d’échelle spatiale et temporelle, la distance entre les deux équilocs passant par ces deux événements sur le diagramme doit être identique à celle qui sépare deux équitemps passant par ces événements. Par conséquent, la trajectoire du photon emprunte la diagonale du losange formé par une paire d’équitemps et une paire d’équilocs équidistantes, ainsi la trajectoire du photon coupe en deux parties égales les angles aux sommets du losange. Ceci est démontré dans la figure 10.4 qui révèle au passage une propriété extrêmement importante des diagrammes d’Alice :
α α
Figure 10.4 | La ligne en pointillé représente la trajectoire dans l’espace-temps d’un photon. Les points noirs représentent deux événements dans l’histoire de ce photon. Deux équilocs montent en pente raide vers la droite en passant chacune par un des deux événements ; deux équitemps montent en pente douce vers la droite en passant chacune par un des deux événements. Étant donné que le photon se déplace de 1 pied à chaque nanoseconde, la distance entre les équilocs est la même que la distance entre les équitemps. Le parallélogramme délimité par les 4 droites constitue donc un losange, la ligne d’univers du photon (en pointillé) est la diagonale de ce losange et la symétrie du losange implique que les angles notés a soient égaux.
185
IL ÉTAIT TEMPS
L’angle que les équilocs forment avec la trajectoire d’un photon doit être égal à celui que les équitemps forment avec cette trajectoire. Autrement dit, les deux trajectoires possibles pour un photon passant par le point d’intersection entre une équiloc et une équitemp coupent en deux parties égales les angles formés par ces deux droites. Étant donné que cette règle s’applique aux photons quel que soit le sens de leur mouvement, nous pouvons mettre en évidence une deuxième propriété importante démontrée dans la figure 10.5 : sur le diagramme, les trajectoires de deux photons se déplaçant en sens inverse sont perpendiculaires entre elles. Ceci se déduit directement de la figure 10.4, car les diagonales d’un losange sont nécessairement perpendiculaires et on remarque que la diagonale non dessinée du losange constitue potentiellement la trajectoire d’un photon qui se déplacerait dans le sens inverse du photon représenté par la ligne en pointillé.
β β
α
α
Figure 10.5 | La figure 10.4 est redessinée (sans les points noirs) et étendue pour qu’on puisse visualiser la trajectoire dans l’espace-temps d’un second photon voyageant en sens inverse. Étant donné que la nouvelle ligne en pointillé correspond également à la trajectoire d’un photon, elle coupe en deux parties égales l’angle entre les équitemps et les équilocs. Étant donné que 2a + 2b = 180°, l’angle a + b entre les lignes d’univers des deux photons est égal à 90°.
186
La géométrie de l’espace-temps
Ainsi, même si Alice peut choisir librement l’angle q entre ses équitemps et ses équilocs, nos conventions d’échelle impliquent que certains angles restent fixes : les lignes d’univers associées à des photons se déplaçant en sens inverse sont nécessairement perpendiculaires. L’angle droit qui en découle est une conséquence directe de la relation que nous avons choisi d’imposer entre nos deux coefficients d’échelle l. Alice peut choisir de tourner sa feuille de façon à ce que les trajectoires associées à deux photons se déplaçant en sens inverse soient disposées de part et d’autre de la verticale, l’une inclinée à 45° vers la droite et l’autre du même angle vers la gauche. Ainsi, quand on se déplace vers le haut de la feuille, le temps associé aux événements situés sur la trajectoire de chaque photon augmente. Comme les équitemps d’Alice forment le même angle avec les trajectoires des photons que ses équilocs, l’angle formé par ses équilocs avec la verticale est le même que celui que ses équitemps forment avec l’horizontale. La convention veut que l’on oriente toujours un diagramme d’espace-temps de cette façon, de manière à ce que les directions verticale et horizontale constituent les bissectrices des angles droits formés par les deux familles de trajectoires de photons. Dans ce cas, plus une équitemp est située en hauteur sur le diagramme, plus elle représente des événements qui se sont produits tard dans le temps. Avec cette convention d’orientation du diagramme, les équilocs sont toujours plus proches de la verticale que de l’horizontale (c’est-à-dire que l’angle qu’elles forment avec la verticale est inférieur à 45°) tandis que les équitemps sont toujours plus proches de l’horizontale que de la verticale (c’est-à-dire que l’angle qu’elles forment avec l’horizontale est inférieur à 45°). Nous avons maintenant complètement fixé la structure et l’orientation du système d’équilocs et d’équitemps utilisé par Alice pour positionner les événements dans l’espace et dans le temps, il lui reste deux libertés de choix : 1°) Elle est libre de choisir le coefficient d’échelle l – c’est-à-dire la distance sur la feuille entre les équilocs associées à deux positions 187
IL ÉTAIT TEMPS
éloignées de 1 pied (ce qui correspond également à la distance sur la feuille entre les équitemps associées à deux événements séparés de 1 nanoseconde dans le temps). 2°) Elle est libre de choisir l’angle q que ses équilocs forment avec ses équitemps, ou autrement dit, l’angle a = q/2 que ses équilocs et ses équitemps forment avec les lignes d’univers des photons (une fois le coefficient l et l’angle q fixés, l’autre coefficient d’échelle µ est automatiquement fixé à son tour). L’échelle qu’Alice va choisir sera fonction de la taille de la feuille qu’elle possède et de l’étendue spatio-temporelle de la série d’événements qu’elle veut représenter sur son diagramme. Son choix d’angle dépend de ce qu’elle veut (ou nous voulons) faire avec son diagramme. Si elle l’utilise uniquement à des fins personnelles, le choix le plus adapté serait alors de prendre l’angle q égal à 90° de manière à ce que ses équilocs soient verticales, ses équitemps horizontales et ses deux coefficients d’échelle l et µ égaux. Si, par contre, elle souhaite (ou nous souhaitons) comparer la description spatio-temporelle des événements qu’elle déduit de son diagramme avec la description spatio-temporelle de ces mêmes événements du point de vue d’autres observateurs utilisant des référentiels différents, alors prendre l’angle q égal à 90° n’est pas la meilleure option pour obtenir une image claire de la situation. Pour bien comprendre pourquoi, nous devons envisager les usages qui pourraient être faits du diagramme d’Alice par des personnes qui préfèreraient décrire les événements en utilisant d’autres référentiels que le sien. Pour la discussion qui va suivre, Alice est sur le quai et Bob a pris place dans un train qui se déplace par rapport à Alice avec une vitesse v constante le long des rails. Bob souhaite décrire dans son référentiel propre (dans lequel le train est immobile) les mêmes événements que ceux qu’Alice a placés sur son diagramme réalisé dans le référentiel des rails. Supposons que l’on montre à Bob le diagramme d’Alice rempli de points représentant des événements isolés et de lignes représentant des trajectoires spatio-temporelles, 188
La géométrie de l’espace-temps
mais sans les équitemps et les équilocs qu’elle a dessinées pour l’aider à localiser les événements dans l’espace et le temps. Plutôt que de faire son propre diagramme indépendant pour décrire tous ces événements, Bob peut parfaitement utiliser la même série de points et de trajectoires tracée par Alice. Mais il les transcrira dans un langage spatio-temporel différent étant donné qu’il sera en désaccord avec Alice sur les notions fondamentales de « au même endroit » et « en même temps ». Par conséquent, il n’utilisera pas les équilocs et les équitemps d’Alice. Il est facile de concevoir ce qu’il doit faire pour placer ses propres équilocs et équitemps sur le diagramme d’Alice. Si le référentiel de Bob se déplace à une vitesse v par rapport à celui d’Alice, alors les équilocs de Bob doivent être parallèles à la trajectoire spatio-temporelle d’un objet qui aurait une vitesse v du point de vue d’Alice. Donc les équilocs de Bob sont des lignes droites parallèles entre elles, mais qui ne sont pas parallèles à celles d’Alice. Plus Bob se déplace rapidement par rapport à Alice, plus ses équilocs sont inclinées par rapport à celles d’Alice. Les équilocs et les équitemps d’Alice passant par n’importe quel couple de points appartenant à une même équiloc de Bob définissent un parallélogramme dont le rapport des longueurs de ses deux côtés (ou le rapport des distances entre ses deux côtés) est tout simplement égal à la vitesse v de son référentiel par rapport à celui d’Alice en pieds par nanoseconde. Ceci est illustré par la figure 10.6. Nous devons déterminer également l’orientation des équitemps de Bob. Et c’est là que, pour la première fois, la relativité fait son entrée dans cette histoire. Jusqu’à présent, nous n’avons fait aucune utilisation ni du principe de relativité ni de l’invariance de la vitesse de la lumière (nous avons seulement anticipé le rôle important joué par la vitesse de la lumière c en choisissant la relation entre les coefficients d’échelle spatiale et temporelle d’Alice). 189
IL ÉTAIT TEMPS
a
b
Figure 10.6 | La droite très épaisse constitue la trajectoire dans l’espace-temps d’un objet immobile dans le référentiel de Bob – c’est donc une équiloc du point de vue de Bob. Les droites fines sont des équitemps et des équilocs d’Alice passant par deux événements situés sur la trajectoire épaisse. Sur ces droites, deux segments sont dessinés avec un trait plus épais, leurs longueurs sur le diagramme sont a et b. La vitesse de Bob par rapport à Alice est v = a/b étant donné que dans le référentiel d’Alice la position de l’objet change d’une distance a/µA pendant une durée b/µA.
Pour pouvoir orienter les équitemps de Bob, il faut placer sur le diagramme une série d’événements associés à la procédure discutée dans le chapitre 5 qui provoque deux événements simultanés aux deux extrémités du train immobile dans le référentiel de Bob. Pour cela, nous ne ferons pas appel à l’analyse que nous avons faite au chapitre 5, mais nous parviendrons aux mêmes conclusions quantitatives, et cela, uniquement à partir du diagramme. Ce qui démontrera, au passage, l’extrême puissance de cette approche géométrique. Sur le diagramme d’Alice, les lignes d’univers de l’extrémité gauche, de l’extrémité droite et du milieu du train constituent trois équilocs parallèles de Bob (car le train est immobile dans le référentiel de Bob). Comme Alice et Bob sont d’accord sur le point qui constitue le milieu du train, ces trois parallèles sont régulièrement espacées sur 190
La géométrie de l’espace-temps
le diagramme d’Alice. Les deux photons, créés ensemble au milieu du train, se déplacent en sens inverse à la même vitesse. Comme le train est au repos dans le référentiel de Bob et les deux photons ont la même vitesse dans son référentiel (1 pied par nanoseconde – c’est ici que l’invariance de la vitesse de la lumière apparaît dans notre histoire), du point de vue de Bob, les deux photons atteignent les deux extrémités du train au même moment. Si nous dessinons deux lignes de photons qui partent à 45° d’un point de la trajectoire du milieu du train, chacune va représenter la trajectoire d’un photon en mouvement vers une des deux extrémités du train. Les points d’intersection des deux photons avec les deux extrémités du train représentent des événements simultanés dans le référentiel de Bob, par conséquent ils se situeront tous deux sur l’un de ses équitemps. Tout ceci est illustré dans la partie (1) de la figure 10.7. La figure permet de démontrer facilement que, dans le diagramme d’Alice, les équitemps et les équilocs de Bob forment le même angle avec les trajectoires des photons, exactement comme les équitemps et les équilocs d’Alice. La façon la plus simple de le voir est de faire en sorte que chaque extrémité renvoie son photon par réflexion vers le milieu du train. Finalement, les trajectoires des photons (dessinées dans la partie (2) de la figure 10.7) constituent les 4 côtés d’un rectangle. Il est évident que les trois angles notés a sont égaux (idem pour les trois angles notés b). Par conséquent, les deux trajectoires de photons passant par le point noir sur la gauche coupent effectivement en deux angles égaux les angles formés par les équilocs et les équitemps de Bob passant également par ce point. Nous constatons donc que les équitemps et les équilocs de Bob obéissent exactement à la même règle que celle qu’a suivie Alice pour orienter ses équilocs et ses équitemps par rapport aux trajectoires des photons. De plus, comme la vitesse commune des deux photons dans le référentiel de Bob doit toujours être égale à 1 pied par nanoseconde, deux équilocs de Bob associées à des positions distantes de 1 pied dans son référentiel doivent être aussi espacées sur le diagramme que deux 191
IL ÉTAIT TEMPS
β α
β
(1)
α
β
α
(2)
Figure 10.7 | Le diagramme est dessiné par Alice. (1) Les trois droites parallèles régulièrement espacées représentent les deux extrémités et le milieu d’un train qui est immobile dans le référentiel de Bob. Elles permettent d’établir la direction que doivent prendre les équilocs de Bob dans le diagramme d’Alice. Le point noir le plus bas représente l’émission par le milieu du train de deux photons en sens inverse. Les lignes en pointillé représentent les trajectoires dans l’espace-temps de ces photons. Les deux autres points noirs représentent l’arrivée de chaque photon à chaque extrémité du train. Comme du point de vue de Bob les deux photons se déplacent à la même vitesse dans un train immobile, ils arrivent donc à l’extrémité du train au même moment. C’est pourquoi la ligne droite joignant les deux points du haut est une équitemp pour Bob. (2) Imaginons que les photons soient réfléchis par les extrémités du train, leur retour au milieu du train constitue deux événements simultanés représentés par le point noir en haut de la figure, les lignes associées aux deux photons forment alors un rectangle. Il est évident que la symétrie du rectangle implique que les deux angles notés a à l’intérieur du rectangle soient égaux, tout comme le sont les deux angles notés b à l’intérieur du rectangle. Comme les deux angles notés a et b à l’extérieur du rectangle ne sont en fait que des translations spatiales d’un angle analogue intérieur au rectangle, il en découle que les deux lignes en pointillé associées au photon parti vers la gauche coupent en deux parties égales chacun des angles compris entre l’équitemp et l’équiloc de Bob passant par le point le plus à gauche.
de ses équitemps associées à des instants séparés dans le temps de 1 nanoseconde. Les règles que nous avons mises en place pour l’orientation des équitemps et des équilocs d’Alice ainsi que la relation entre leurs échelles ont imposé des règles sur les équilocs et les équitemps que Bob doit utiliser s’il souhaite représenter les événements en utilisant les mêmes points que ceux du diagramme d’Alice. Il est important de constater que Bob doit utiliser exactement les mêmes règles que celles d’Alice. Et par conséquent, il est impossible pour une tierce 192
La géométrie de l’espace-temps
personne de dire lequel des deux a dessiné son diagramme le premier et lequel des deux a imposé ses propres équitemps et équilocs sur le diagramme de l’autre. Cette formidable symétrie est exigée par le principe de relativité. La voir émerger de cette manière constitue une preuve éclatante de la cohérence du principe de relativité avec l’invariance de la vitesse de la lumière vis-à-vis du référentiel. Le fait que les équitemps et les équilocs de Bob et d’Alice soient toutes deux situées symétriquement de part et d’autre des lignes à 45° des photons a pour conséquence immédiate la règle T = Dv/c2 pour les événements simultanés, sous la forme T = Dv prise par cette règle lorsqu’on mesure le temps en nanosecondes et les distances en pieds. Ceci est explicité dans la figure 10.8 et sa légende. C’est ainsi qu’Alice et Bob (tout comme Carol, Dick et Ève…) peuvent représenter les événements qui surviennent dans l’espace et dans le temps en utilisant le même ensemble de points dans un seul et même diagramme sur lequel ils vont chacun superposer des familles d’équilocs et d’équitemps. Quel que soit le référentiel adopté, les équilocs et les équitemps doivent être disposées symétriquement de part et d’autre des deux directions perpendiculaires formées par les directions des trajectoires de photons. Il nous reste à savoir comment des gens qui utilisent différents référentiels mettent en relation leurs coefficients d’échelle l qui donnent la distance sur la feuille entre les équilocs associées à des événements distants de 1 pied et entre les équitemps associées à des événements séparés par des durées de 1 nanoseconde. Il est possible de bien comprendre les situations à partir de diagrammes d’espace-temps appropriés sans jamais avoir besoin d’utiliser de relation quantitative entre les coefficients d’échelle, c’est pourquoi, pour le moment, nous nous contenterons de la règle suivante : Les coefficients d’échelle utilisés par différents référentiels sont reliés par une règle qui stipule que les losanges-unités utilisés par les différents observateurs doivent tous avoir la même aire. L’aire d’un losange est égale au produit de sa base par sa hauteur, la figure 10.9 193
IL ÉTAIT TEMPS
E2
d
t
E1 T
D E0 Figure 10.8 | La ligne épaisse qui joint les événements E1 et E0 est une équitemp pour Bob et la ligne épaisse qui joint les événements E2 et E0 est, pour lui, une équiloc. Les deux parallélogrammes longs et étroits qui se recouvrent en bas à gauche sont délimités par des segments d’équitemps et d’équilocs d’Alice. La figure entière est symétrique par rapport à la ligne de photons représentée en pointillé. Comme Bob se déplace avec une vitesse v dans le référentiel d’Alice et que, pour lui, E2 et E0 se produisent au même endroit, alors, du point de vue d’Alice, la distance d entre les deux événements (exprimée en pieds) est égale à la vitesse v multipliée par la durée t qui les sépare dans le temps (exprimée en nanosecondes) : d = vt. Le rapport d/t est égal au rapport de la longueur du petit côté sur celle du grand côté du parallélogramme ayant pour sommets opposés E2 et E0. La figure est symétrique par rapport à la ligne en pointillé, ce qui implique que v doit aussi être le rapport de la longueur du côté court sur celle du côté long du parallélogramme dont E1 et E0 sont les sommets opposés. Mais le rapport des côtés de ce parallélogramme est égal au rapport entre la durée T (exprimée en nanosecondes) qui sépare les événements E1 et E0 dans le temps d’Alice (qui, par contre, sont simultanés du point de vue de Bob) et la distance D (exprimée en pieds) séparant E1 et E0 mesurée par Alice. Comme v = T/D, on obtient T = Dv (le système d’unités utilisé fait que c2 = 1).
montre que la longueur de la hauteur d’un losange-unité correspond au coefficient d’échelle λ et que la longueur de sa base correspond au coefficient d’échelle µ. L’expression analytique de la règle géométrique énoncée précédemment impose donc que les coefficients d’échelle d’Alice et de Bob soient reliés par
194
λA µA = λB µB (10.1)
La géométrie de l’espace-temps
1 ns
λ
0 ns µ
1 pi 0 pi Figure 10.9 | Le losange-unité dans un référentiel quelconque. Les lignes notées 0 ns et 1 ns représentent des événements séparés de 1 nanoseconde dans le temps et les lignes notées 0 pi et 1 pi représentent des événements distants de 1 pied dans l’espace. La distance sur le diagramme entre deux équitemps est égale au coefficient d’échelle l, mais elle correspond aussi à la hauteur du losange. La longueur du segment épais sur l’équiloc du bas est égale au coefficient d’échelle µ, mais elle correspond aussi à la base du losange. L’aire du losange-unité qui se calcule en multipliant sa base par sa hauteur est donc égale au produit lm.
Cette règle se déduit simplement et directement du principe de relativité qui exige que quand Alice et Bob se déplacent l’un par rapport à l’autre à une vitesse constante, par réciprocité, ils doivent chacun voir l’horloge de l’autre fonctionner au même rythme lorsqu’ils la comparent à leur propre horloge. Nous n’avons pas un besoin urgent de cette règle, c’est pourquoi je préfère différer sa démonstration aux pages 218 à 221, une fois que nous aurons examiné quelques exemples d’utilisation de diagrammes d’espace-temps qui ne nécessitent pas l’utilisation de la relation (10.1). La figure 10.10 montre graphiquement comment il est possible, par réciprocité, que chacune des deux règles en mouvement relatif soit plus longue dans son référentiel propre que l’autre. Les deux lignes verticales représentent les trajectoires dans l’espace-temps des extrémités gauche et droite d’une règle, les équilocs dans le référentiel propre de cette règle sont verticales (vu que chaque extrémité de la règle ne 195
IL ÉTAIT TEMPS
Figure 10.10 | Les deux droites parallèles verticales sont associées aux extrémités gauche et droite d’une règle. Les deux droites parallèles inclinées vers la droite représentent les extrémités gauche et droite d’une seconde règle qui passe devant la première règle parallèlement à celle-ci. La ligne horizontale est une équitemp du référentiel dans lequel la première règle est immobile. La droite fine inclinée vers la droite est une équitemp du référentiel dans lequel la seconde règle est immobile, elle forme exactement le même angle avec l’horizontale que celui que les lignes épaisses inclinées (les équilocs représentant les extrémités de la seconde règle) forment avec la verticale.
change pas de position dans ce référentiel) et, par conséquent, les équitemps dans le référentiel propre de la règle doivent être horizontales. N’importe quelle tranche horizontale de la figure montre la réalité de la situation à un moment donné du temps du référentiel de la règle. Les deux droites parallèles qui montent vers la droite en pente raide représentent les trajectoires d’espace-temps des extrémités gauche et droite d’une deuxième règle. Ce sont des équilocs dans le référentiel propre de la seconde règle. Les équitemps du référentiel de la seconde règle forment avec l’horizontale le même angle que les équilocs forment avec la verticale. N’importe quelle tranche de la figure le long d’un de ces équitemps inclinées montre la réalité de la situation à un moment donné du temps du référentiel de la seconde règle. 196
La géométrie de l’espace-temps
La droite horizontale sur la figure 10.10 est une équitemp particulière du référentiel de la première règle. Lorsqu’on suit cette ligne de gauche à droite, on rencontre d’abord l’extrémité gauche de la première règle, ensuite l’extrémité gauche de la deuxième règle, après l’extrémité droite de la seconde règle et finalement l’extrémité droite de la première règle. Par conséquent, dans le référentiel propre de la première règle, la première règle se prolonge au-delà des deux extrémités de la deuxième : la deuxième règle est donc plus courte que la première. D’un autre côté, la ligne inclinée fine correspond à une équitemp particulière du référentiel de la deuxième règle. Lorsqu’on suit cette ligne inclinée, en partant du bas à gauche en allant vers le haut à droite, on rencontre d’abord l’extrémité gauche de la seconde règle, ensuite l’extrémité gauche de la première règle, après l’extrémité droite de la première règle et finalement l’extrémité droite de la deuxième. Par conséquent, dans le référentiel propre de la seconde règle, la seconde règle se prolonge au-delà des deux extrémités de la première règle : la première règle est donc plus courte. La figure fait ressortir le fait que la comparaison des longueurs de deux règles en mouvement l’une par rapport à l’autre dépend de la convention utilisée pour déterminer si des événements éloignés dans l’espace sont simultanés. Les différentes parties d’une règle (ces deux extrémités, son milieu, le point situé aux deux tiers de la longueur de la règle, etc.) sont situées à différents endroits. Chacun se fabrique une réalité de la règle à un moment donné en fonction des fragments de trajectoires d’espace-temps que chacun assemble pour recomposer la règle, tout dépend quels événements dans l’histoire des différentes parties spatialement séparées de la règle on choisit de considérer comme étant simultanés. Ce qui ne dépend d’aucune convention est la totalité de toutes les trajectoires d’espace-temps de toutes les parties de chaque règle. Ce qui dépend d’une convention, et donc du référentiel choisi, c’est comment chacun choisit de découper en tranches toutes ces 197
IL ÉTAIT TEMPS
trajectoires avec des équitemps pour former ce que chacun appellera la-règle-à-un-instant-donné. Notons pour finir qu’il est possible de se placer dans un troisième référentiel (en mouvement vers la droite par rapport à la première règle à une vitesse plus faible que celle de la seconde) dans lequel les deux règles ont la même longueur. Les équitemps de ce référentiel sont parallèles à la droite qui joint le point d’intersection des trajectoires des extrémités gauches des règles au point d’intersection des trajectoires des extrémités droites. De façon analogue, dans une situation où deux horloges sont en mouvement relatif, la figure 10.11 montre graphiquement comment il est possible que chaque horloge fonctionne à un rythme plus rapide que l’autre lorsqu’on se place dans son référentiel propre. La rangée verticale de cercles numérotés représente sept moments dans l’histoire d’une horloge avec l’heure qu’elle affiche à chaque moment. La rangée inclinée représente six moments dans l’histoire d’une deuxième horloge qui se déplace vers la droite par rapport à la première et son affichage à chaque moment. Les deux horloges se trouvent au même endroit quand elles affichent 0, elles sont par conséquent représentées à ce moment-là de leur histoire par un seul et même cercle. Tout observateur, quel que soit le référentiel qu’il utilise, est forcément d’accord pour dire que chaque horloge affiche 0 au même moment parce que les horloges affichent 0 au même moment et au même endroit. Les équilocs du référentiel propre de la première horloge sont verticales (vu que la droite sur laquelle se situent les sept moments de l’histoire de cette première horloge est verticale), les équitemps du référentiel propre de cette première horloge sont donc horizontales. Comme les événements {la seconde horloge affiche 4} et {la première horloge affiche 5} se situent tous deux sur une même horizontale, ces deux événements se produisent donc en même temps dans le référentiel propre de la première horloge. Étant donné que chaque horloge affiche 0 au même moment, la seconde horloge fonctionne 198
La géométrie de l’espace-temps
5 6
4
5
4
3
3 2 2 1 1
0
Figure 10.11 | Quelques moments dans l’histoire de deux horloges en mouvement rectiligne uniforme l’une par rapport à l’autre. Chaque point qui représente l’horloge a été agrandi à la taille d’un cercle pour pouvoir indiquer l’affichage de l’horloge à l’intérieur. Chaque horloge affiche 0 au même endroit et au même moment. Cet événement est représenté par un seul cercle. Les affichages suivants de la première horloge (de 1 à 6) sont indiqués dans les cercles régulièrement espacés sur une rangée verticale ; les affichages de la seconde horloge (de 1 à 5) sont indiqués dans les cercles formant une rangée inclinée vers la droite. La ligne épaisse horizontale est une équitemp du référentiel de la première horloge. La ligne épaisse inclinée est une équitemp du référentiel de la seconde horloge, l’angle qu’elle forme avec l’horizontale est le même que l’angle que forme la rangée d’images de la seconde horloge avec la verticale.
donc à un rythme égal à une fraction 4/5 du rythme de la première quand on se place dans le référentiel propre de la première horloge. Les équilocs du référentiel propre de la seconde horloge sont parallèles à la droite reliant les six moments de son histoire, par 199
IL ÉTAIT TEMPS
conséquent les équitemps de son référentiel propre vont former le même angle avec l’horizontale que celui que forme la droite reliant les six moments de son histoire avec la verticale. Une équitemp est dessinée sur la figure 10.11 joignant les événements {la première horloge affiche 4} et {la seconde horloge affiche 5}. Vu que chaque horloge affiche 0 au même moment, la première horloge fonctionne à un rythme égal à une fraction 4/5 du rythme de la seconde quand on se place dans le référentiel propre de la seconde horloge. La figure traduit bien le fait que la comparaison des rythmes de deux horloges en mouvement rectiligne uniforme l’une par rapport à l’autre dépend avant tout de la convention adoptée sur la simultanéité des événements se produisant en différents endroits. Comme chaque référentiel adopte une convention différente pour assembler des tranches d’espace-temps sur une équitemp, il n’y a aucune contradiction dans le fait que chaque référentiel affirme que ce sont les horloges de l’autre référentiel qui fonctionnent plus lentement. Si nous avions stoppé l’expérience à la figure 10.11, la question de savoir quelle est l’horloge qui fonctionne réellement plus lentement aurait été une question de convention, vide de tout sens, dépendant uniquement de la notion de simultanéité que l’on choisit d’adopter. Supposons maintenant que la seconde horloge effectue brusquement un demi-tour pour revenir vers la première. Quand elles seront de nouveau réunies au même endroit et au même moment, il sera alors possible de comparer directement leurs affichages, on pourra ainsi voir laquelle aura avancé d’une plus grande quantité. Il est essentiel de reconnaître dans ce processus que le demi-tour casse la symétrie entre les deux horloges. La première horloge est immobile dans un seul et unique référentiel inertiel tout au long de son histoire, alors que la seconde horloge, au moment où elle fait demi-tour, passe subitement d’un référentiel inertiel en mouvement rectiligne uniforme vers la droite à un autre référentiel inertiel en mouvement rectiligne uniforme vers la gauche. Il n’y a donc pas un référentiel inertiel unique dans lequel la deuxième horloge est 200
La géométrie de l’espace-temps
immobile tout au long de son histoire. Le terrible freinage et l’énorme accélération accompagnant le demi-tour constituent des preuves évidentes que n’importe quel observateur se déplaçant avec la deuxième horloge pourrait ressentir. Dans le référentiel de la première horloge (qui utilise des équitemps horizontales), il est clair, à partir de la figure 10.12, que quand le voyage est terminé, la deuxième horloge, comme elle a fonctionné lentement pendant tout son voyage, n’aura avancé que de 8 (4 à l’aller et 4 au retour) pendant que la première horloge aura, elle, avancé de 10. Ce qui fait que lorsque les deux horloges seront à nouveau réunies, la première affichera 10 et la seconde 8 comme cela est indiqué sur la figure 10.12. Les choses sont un peu plus délicates du point de vue de la seconde horloge vu que, dans ce cas, deux référentiels inertiels sont impliqués (le référentiel qui s’éloigne et celui qui se rapproche). Dans le référentiel qui s’éloigne avec la seconde horloge, la première horloge fonctionne plus lentement, car elle n’avance que de 3,2 (son affichage passe de 0 à 3,2) pendant que la seconde horloge avance de 4 (son affichage passe de 0 à 4). Cette situation est illustrée sur la figure 10.12 par l’équitemp inclinée du bas. De la même manière, dans le référentiel qui se rapproche avec la seconde horloge, la première horloge fonctionne également au ralenti, elle avance encore de 3,2 (son affichage passe de 6,8 à 10) pendant que la seconde horloge avance de 4 (son affichage passe de 4 à 8). Ceci est illustré sur la figure 10.12 par l’équitemp inclinée du haut. Le fait indiscutable que la première horloge affiche 10 et la seconde seulement 8 lorsqu’elles sont à nouveau réunies est tout à fait cohérent du point de vue de la seconde horloge, même si, du point de vue de la seconde horloge, la première a fonctionné au ralenti pendant la phase d’éloignement et pendant la phase de rapprochement. Les 3,6 unités manquantes à l’affichage de la première horloge (2 × 3,2 + 3,6 = 10) s’expliquent par un changement brutal de conception sur « l’affichage-que-présente-la-première-horloge-maintenant » au moment où 201
IL ÉTAIT TEMPS
10 8
9 7 8 6 7 5 6
4
5
4
3
3 2 2 1 1
0
Figure 10.12 | Deux horloges identiques. La première est représentée à onze moments différents le long d’une ligne verticale pendant que son affichage passe de 0 à 10. La seconde s’éloigne de la première avec un mouvement rectiligne uniforme pendant que son affichage passe de 0 à 4 ; à ce moment-là, l’horloge revient vers la première avec un mouvement rectiligne uniforme pendant que s o n a f f ic h a ge p a s s e de 4 à 8. En bas et en haut de l a f ig u re, l e s de u x horloges se retrouvent au même moment au même endroit, elles sont donc représentées par un seul et même cercle. La première horloge est immobile dans un seul et même référentiel inertiel. Vu que les équilocs s o nt v e r t ic a l e s da ns c e référentiel, les équitemps sont horizontales. La ligne horizontale au milieu est une équitemp du référentiel de la première horloge. La ligne du bas qui monte vers la droite est une équitemp du référentiel de la seconde horloge quand elle s’éloigne de la première. La ligne du haut qui descend vers la droite est une équitemp du référentiel de la seconde horloge quand elle revient vers la première.
la seconde horloge change de référentiel. Comme le montre la figure 10.12, juste avant le demi-tour, la seconde horloge placée dans le référentiel qui s’éloigne affiche 4 et la (très lointaine) première horloge affiche maintenant 3,2. Mais juste après le demi-tour, la seconde 202
La géométrie de l’espace-temps
horloge, placée dans le référentiel qui se rapproche, doit brutalement adopter une toute nouvelle conception de la simultanéité : elle affiche encore 4, mais, dans ce nouveau référentiel, la première horloge affiche maintenant 6,8. C’est cet ajustement sur la conception de l’état actuel de l’horloge, rendu nécessaire par le changement de référentiel, qui explique qu’au retour de la seconde horloge la première n’affiche pas 6,4, mais 10. Cette correction rappelle un peu (mais d’une manière bien plus subtile) la nécessité d’adapter sa montre à un nouveau fuseau horaire lorsqu’on sort d’un avion qui a traversé l’Atlantique. Le rôle essentiel (mais désagréablement artificiel) joué dans la figure 10.12 par les différences de conventions sur la simultanéité dans différents référentiels est éjecté de l’histoire si nous ne demandons pas aux observateurs qui accompagnent les horloges dans leur mouvement de dire ce qui se passe maintenant sur l’autre horloge, mais de dire comment ils voient l’autre horloge maintenant. La figure 10.13 reproduit les horloges de la figure 10.12, sans les équitemps associées aux trois référentiels, mais avec les trajectoires (en pointillé) des photons émis par chaque horloge quand son affichage change. Comme le fac4 3 teur de ralentissement est , la vitesse relative des horloges est v = c, 5 5 et par conséquent le coefficient Doppler discuté au chapitre 7, 1 + v /c est égal à 2. Des observateurs regardant une horloge 1 − v /c s’éloigner d’eux (le même effet est obtenu si on considère que ce sont 3 eux qui s’éloignent de l’horloge) à une vitesse égale à de celle de 5 la lumière la voient fonctionner à la moitié de son rythme réel ; des observateurs regardant une horloge s’approcher (le même effet est obtenu si on considère que ce sont eux qui s’approchent de l’horloge) 3 à une vitesse égale à de la vitesse de la lumière la voient fonctionner 5 à un rythme double de son rythme réel. Notons au passage que les fe =
203
IL ÉTAIT TEMPS
1 obtenus par la formule de l’effet Doppler peuvent 2 être directement déduits de la géométrie de la figure 10.13. coefficients 2 et
10 8
9 7 8 6 7 5 6
4
5
4
3
3 2 2 1 1
0
204
Figure 10.13 | Nous retrouvons les deux horloges de la figure 10.12, sans les équitemps, mais avec les trajectoires des photons pour nous permettre de savoir comment est vue chaque horloge par les observateurs accompagnant l’autre horloge. Les horloges émettent un flash de lumière chaque fois qu’elles affichent un nouveau nombre entier et, longtemps après, ces flashs sont reçus par les observateurs qui accompagnent l’autre horloge.
La géométrie de l’espace-temps
Quand elle reçoit la lumière que la seconde horloge a émise (lorsque son affichage devient 1, 2, 3 puis 4), la première horloge affiche successivement 2, 4, 6 puis 8. Chaque fois qu’elle reçoit les flashs de lumière que la seconde horloge a émis (lorsque son affichage devient 5, 6, 7 puis 8), la première horloge affiche successivement 8,5, 9, 9,5 puis 10. Les observateurs accompagnant la première horloge voient la seconde horloge fonctionner à la moitié de son rythme propre pendant 80 % de leur temps et au double de son rythme propre pendant 20 % de leur temps. La durée pendant laquelle ils voient l’horloge fonctionner au ralenti est bien plus importante que la courte durée pendant laquelle ils la voient fonctionner rapidement et, finalement, la seconde horloge a moins avancé que la première au bout de son voyage. D’autre part, quand elle reçoit la lumière que la première horloge a émise (lorsque son affichage devient 1 puis 2), la seconde horloge affiche successivement 2 puis 4. Quand elle reçoit la lumière que la première horloge a émise (lorsque son affichage devient 3, 4, 5, 6, 7, 8, 9 puis 10), la seconde horloge affiche successivement 4,5, 5, 5,5, 6, 6,5, 7, 7,5 puis 8. Ainsi, les observateurs accompagnant la seconde horloge voient la première fonctionner à la moitié de son rythme propre pendant la moitié du temps et au double de son rythme propre pendant l’autre moitié du temps. Comme les observateurs qui accompagnent la deuxième horloge voient fonctionner la première deux fois plus vite que son rythme propre pendant la moitié du temps, cela assure à la première horloge d’avancer au moins autant que la seconde quand elles seront à nouveau réunies. Et comme ils voient la première horloge fonctionner à la moitié de son rythme propre pendant la moitié du temps restant, ils constatent qu’elle a effectivement avancé d’une quantité 25 % supplémentaire lorsqu’ils comparent l’affichage des deux horloges à la fin de l’expérience. Le fait que deux horloges identiques placées initialement au même endroit avec le même affichage peuvent arriver, au terme de leur voyage, avec un affichage différent si elles se déplacent l’une par rapport à l’autre est souvent appelé le paradoxe des jumeaux. Si les 205
IL ÉTAIT TEMPS
mouvements des deux horloges avaient été images l’un de l’autre dans un miroir, cela aurait effectivement été un paradoxe, car il n’y aurait eu aucune façon de déterminer quelle horloge avance le plus pendant le voyage. Mais il n’y a absolument pas de paradoxe si les deux horloges se déplacent de façon asymétrique pendant leur séparation comme elles le font dans l’exemple que nous venons d’étudier dans lequel une horloge est en mouvement rectiligne uniforme pendant tout le temps, alors que l’autre subit un brutal changement quand son référentiel propre passe soudainement d’un référentiel inertiel à un autre qui se déplace en sens inverse. Le « paradoxe des jumeaux » fait référence à une version plus spectaculaire du phénomène où les horloges sont remplacées par deux jumeaux identiques. Si un des deux jumeaux voyage vers une étoile située à 3 années-lumière dans une super-fusée qui voyage à 3 une vitesse égale à de la vitesse de la lumière, les voyages aller et 5 retour prendraient chacun 5 ans dans le référentiel de la Terre. Mais vu que le facteur de ralentissement est 1 −
3 5
2
=
4 , le jumeau dans 5
la fusée aura vécu 4 ans pendant le voyage aller puis encore 4 ans pendant le voyage retour. Quand il rentre à la maison, il sera donc plus jeune que son frère qui aura, de son côté, vieilli de 10 ans. Comme personne n’est jamais allé aussi loin avec une aussi grande vitesse, il est tout à fait naturel que ce phénomène nous paraisse très étrange, mais il n’a rien de paradoxal. L’aperçu de la relativité générale du chapitre 12 me donnera l’occasion de présenter un prolongement intéressant du paradoxe des jumeaux. Il existe une variante amusante au paradoxe apparent de la contraction réciproque de deux règles. Considérons une situation où Alice court vers la porte d’entrée d’une grange beaucoup plus longue que large (la porte est découpée dans la largeur). Elle tient entre ses mains une longue perche qu’elle garde horizontale et parallèle à la longueur 206
La géométrie de l’espace-temps
de la grange. Si elle choisit une perche dont la longueur propre est plus grande que la longueur propre de la grange, il lui sera alors impossible de faire rentrer entièrement sa perche immobile dans la grange. Mais Alice court tellement vite que, dans le référentiel de la grange, sa perche se contracte pour devenir plus courte que la grange et elle peut rentrer ainsi sans problème à l’intérieur. Par contre, dans le référentiel d’Alice, la perche garde sa longueur propre, mais, cette fois-ci, la grange en mouvement vers Alice subit une contraction de sa longueur. Dans ce cas, il apparaît encore plus impossible (si quelque chose d’impossible peut devenir encore plus impossible) que la perche puisse rentrer à l’intérieur de la grange. Mais que se passe-t-il ici ? Pour éviter d’avoir à nous préoccuper d’une éventuelle collision de la perche contre le mur de la grange ou des énormes complications liées au terrible freinage nécessaire pour immobiliser une perche allant presque aussi vite que la lumière, nous supposerons, qu’en plus de la porte d’entrée, la grange possède une porte à l’arrière qui permette à la perche de continuer son mouvement rectiligne uniforme à la même vitesse après avoir traversé la grange. Y a-t-il un moment où la perche se trouve à l’intérieur de la grange ? La résolution de cet apparent paradoxe tient au fait que l’aptitude de la perche à rentrer dans la grange dépend du référentiel choisi. Car « la perche est dans la grange » signifie en réalité « toutes les parties de la perche sont comprises entre la porte d’entrée et la porte arrière de la grange au même moment ». Étant donné que les différentes parties le long de la perche sont situées à différents endroits et, comme des référentiels différents utilisent des conventions différentes pour déterminer si des événements éloignés dans l’espace sont simultanés, il peut effectivement exister un désaccord légitime sur la question de savoir s’il y a des moments où les différentes parties de la perche sont toutes comprises entre les deux portes de la grange. Supposons que chaque porte soit réglée pour rester ouverte quand la perche est en train de passer et pour se fermer instantanément 207
IL ÉTAIT TEMPS
dans le cas contraire. Le diagramme d’espace-temps présenté dans la figure 10.14 illustre clairement la situation. Les lignes verticales épaisses sont les lignes d’univers des portes (en pointillé lorsque les portes sont ouvertes).
Figure 10.14 | Le paradoxe de la perche dans la grange. Les lignes verticales épaisses sont les trajectoires dans l’espace-temps des portes d’entrée et de sortie de la grange qui sont fermées quand les lignes sont en trait plein et ouvertes quand les lignes sont en pointillé. Les lignes limitant les régions grisées sont les trajectoires d’espace-temps des extrémités gauche et droite de la perche. Les points situés à l’intérieur de la région grisée représentent les points intérieurs à la perche. Les deux lignes horizontales sont des équitemps du référentiel de la grange. Elles démontrent qu’il y a un intervalle de temps du référentiel de la grange pendant lequel la perche est entièrement contenue à l’intérieur des limites de la grange dont les deux portes sont toutes deux fermées. Les deux lignes inclinées vers le haut en allant vers la droite (mais moins inclinées que les lignes représentant les extrémités de la perche) sont des équitemps du référentiel de la perche. Elles démontrent qu’il y a un intervalle de temps du référentiel de la perche pendant lequel la perche s’étend au-delà des limites de la grange dont les deux portes sont toutes deux ouvertes.
208
La géométrie de l’espace-temps
Les points associés à la perche en mouvement sont situés dans les régions grisées limitées sur la gauche par les trajectoires d’espacetemps de l’extrémité gauche de la perche et sur la droite par les trajectoires d’espace-temps de son extrémité droite. Les équitemps dans le référentiel de la grange sont horizontales. Deux d’entre elles sont représentées sur la figure. L’équitemp horizontale la plus basse qui passe par l’événement {l’extrémité arrière de la perche est au niveau de la porte d’entrée} nous montre qu’au même moment du référentiel de la grange, l’extrémité avant de la perche n’a pas encore quitté la grange. L’équitemp du haut qui passe par l’événement {l’extrémité avant de la perche est au niveau de la porte de sortie} nous montre qu’au même moment du référentiel de la grange, l’extrémité arrière de la perche est effectivement à l’intérieur de la grange. Pour tous les temps du référentiel de la grange compris entre les deux équitemps horizontales, la perche est entièrement dans la grange et les deux portes de la grange sont toutes deux fermées. Mais les équitemps du référentiel de la perche sont inclinées vers le haut en allant vers la droite. Deux de ces droites sont présentées sur la figure 10.14. L’équitemp inclinée la plus basse qui contient l’événement {l’extrémité avant de la perche est au niveau de la porte de sortie} nous montre qu’à ce moment du référentiel de la perche, l’extrémité arrière de la perche n’est pas encore entrée dans la grange. L’équitemp inclinée du haut qui passe par l’événement {l’extrémité arrière de la perche est au niveau de la porte d’entrée} démontre qu’à ce moment du référentiel de la perche, l’extrémité avant de la perche a déjà quitté la grange. Il n’existe aucun moment du référentiel de la perche pendant lequel les deux portes sont toutes deux fermées. Dans le référentiel de la perche, la perche n’est jamais entièrement contenue dans la grange. La leçon qu’il faut tirer du paradoxe de la perche dans la grange est qu’une phrase aussi innocente que « la perche est enfermée dans la grange » implique, lorsque la perche est en mouvement, un jugement implicite sur le caractère simultané d’événements éloignés dans l’espace. 209
IL ÉTAIT TEMPS
Les diagrammes d’espace-temps facilitent également l’étude des particularités du mouvement à des vitesses supraluminiques. La ligne brisée épaisse sur la figure 10.15 représente la trajectoire dans l’espacetemps d’un objet qui se déplace d’abord moins vite que la lumière puis plus vite que la lumière pendant un certain temps et enfin qui reprend sa vitesse de départ plus petite que celle de la lumière. Le segment du milieu forme avec la verticale un angle supérieur à 45°, il est donc plus écarté de la verticale que les lignes des photons. L’angle que forment les deux autres segments avec la verticale est inférieur à 45°.
9 8 7 6 5 4 3 2 1
9 8 7 6 5 4 3 2 1
(1)
(2)
Figure 10.15 | La trajectoire d’un objet dans l’espace-temps est une ligne brisée composée de trois segments. Le segment central forme un angle inférieur à 45° avec l’horizontale, cela indique que sur ce segment, l’objet s’est déplacé plus vite que la lumière. La partie (1) montre un certain nombre d’équitemps dessinées sur le diagramme par Alice. La partie (2) montre un certain nombre d’équitemps dessinées sur le même diagramme par Bob.
Sur la partie (1), on a représenté la trajectoire avec les équitemps d’Alice, ce qui confirme la description précédente. Les lignes sont numérotées dans l’ordre chronologique. Entre les instants 1 et 4, l’objet se déplace moins vite que la lumière ; entre les instants 4 et 7, il se déplace plus vite que la lumière ; entre les instants 7 et 9, il reprend une vitesse inférieure à celle de la lumière. 210
La géométrie de l’espace-temps
Sur la partie (2), on a représenté la même trajectoire, mais avec les équitemps de Bob, qui se déplace vers la droite plus vite qu’Alice, mais pas plus vite que la lumière (comme il est possible de le confirmer en notant que ses équitemps sont inclinées d’un angle inférieur à 45° par rapport à l’horizontale). Bob a une histoire bien plus intéressante à raconter qu’Alice. Entre les instants 1 et 4, un objet sur la gauche de la figure se déplace à une vitesse plus petite que celle de la lumière. À l’instant 4, deux objets apparaissent soudainement sur la droite de la figure ! L’un d’entre eux file vers la gauche de la figure à une vitesse supérieure à celle de la lumière alors que l’autre se précipite sur la droite à une vitesse inférieure à celle de la lumière. Entre les instants 4 et 6, les trois objets sont présents, mais à l’instant 6, l’objet qui filait plus vite que la lumière rencontre l’objet de gauche qui allait moins vite que la lumière et tous deux disparaissent en laissant l’objet qui va moins vite que la lumière continuer tranquillement son chemin sur la droite entre les instants 6 et 9. Aussi étrange que cela puisse paraître, il est en principe tout à fait possible de tomber sur un désaccord à propos du nombre d’objets présents à un moment donné vu « qu’à un moment donné » signifie des choses différentes dans des référentiels différents comme le montre clairement l’étude de ces diagrammes. Par contre, le désaccord entre Alice et Bob sur la chronologie des événements de l’histoire de l’objet plus rapide que la lumière est, quant à lui, beaucoup plus gênant. Alice affirme qu’il surgit à gauche au moment où l’objet plus lent que la lumière prend soudainement une vitesse énorme et qu’il termine sa course sur la droite lorsque sa vitesse prend brutalement une valeur inférieure à celle de la lumière. Bob n’est pas d’accord, il affirme que l’objet plus rapide que la lumière est produit sur la droite en même temps qu’un deuxième objet plus lent que la lumière, puis il disparaît sur la gauche avec un objet moins rapide que la lumière qui était présent dès le départ. Nous avons déjà rencontré ce problème dans un cas particulier au chapitre 9 (figure 9.9). L’analyse graphique montre que ce problème est général : si un objet se déplace plus vite que la lumière, il 211
IL ÉTAIT TEMPS
existe forcément des référentiels en désaccord sur la chronologie des événements qui forment l’histoire de l’objet. L’ordre d’apparition des événements n’est pas le même si la pente des équitemps d’un référentiel est supérieure ou inférieure à la pente de la trajectoire de l’objet dans l’espace-temps. Ce n’est que lorsque l’objet va plus vite que la lumière qu’il est possible de trouver des référentiels dont les équitemps sont plus pentues que la trajectoire de l’objet dans l’espace-temps. Comme nous l’avons noté dans le chapitre 9, les difficultés liées à ces désaccords sont insurmontables si l’observation de l’objet permet d’en déduire la flèche du temps comme pour un être qui vieillit, une pomme qui pourrit ou une bougie qui brûle… La figure 10.16 révèle un autre problème concernant les objets allant plus vite que la lumière. La ligne fine sur la gauche de la figure est la trajectoire dans l’espace-temps d’Alice, elle contient deux gros points noirs notés 1 et 2 qui sont deux événements dans son histoire. L’événement 1 survient avant l’événement 2. Quand l’événement 2 se produit, Alice envoie à Bob un signal plus rapide que la lumière. Bob s’éloigne d’Alice à une vitesse prodigieuse, presque égale à celle de la lumière, mais comme le signal d’Alice (la ligne épaisse du haut) est plus rapide que la lumière, il rattrape Bob. L’événement {réception du signal par Bob} est représenté par le cercle blanc sur la droite. La ligne fine inclinée en trait plein qui passe par le cercle blanc est une équitemp pour Bob. Remarquons que cette ligne est plus proche de l’horizontale que la ligne en pointillé d’un photon passant par le cercle blanc, c’est donc une équitemp tout à fait plausible. La figure démontre que quand Bob reçoit le signal d’Alice venant de l’événement 2, l’événement 1 n’a pas encore eu lieu dans son référentiel, car il se situe au-dessus de son équitemp (notons bien que Bob est d’accord avec Alice pour dire que l’événement 1 a eu lieu avant le 2 ; il ne peut y avoir désaccord sur la chronologie des événements que si leur séparation est de genre espace). Comme Bob peut aussi envoyer des signaux plus rapides que la lumière, il peut donc envoyer un signal (la ligne épaisse du bas) à Alice pour qu’il arrive au moment où l’événement 1 se produit. 212
La géométrie de l’espace-temps
Alice
Bob
2
1
Figure 10.16 | La ligne fine qui passe par les deux gros points noirs 1 et 2 est la trajectoire d’espace-temps d’Alice. Les deux gros points noirs représentent deux événements où elle est présente. Quand l’événement 2 se produit, Alice envoie un signal plus rapide que la lumière à Bob (la ligne épaisse du haut). Le cercle blanc représente la réception du signal par Bob. Lorsque Bob reçoit le message d’Alice, il lui renvoie l’information en utilisant également des signaux plus rapides que la lumière (la ligne épaisse du bas). Le signal atteint Alice au moment où l’événement 1 se produit, même si l’événement 1 a lieu avant le 2 dans les deux référentiels. La ligne en pointillé passant par le cercle blanc est une ligne de photon, ce qui démontre que la ligne fine passant aussi par le cercle blanc est une équitemp du référentiel de Bob parfaitement envisageable si celui-ci se déplace à une vitesse suffisamment élevée vers la droite.
En procédant ainsi, Alice peut s’envoyer à elle-même des messages dans le passé. Supposons que l’événement 2 soit la fin d’une course de chevaux et l’événement 1 soit la dernière possibilité de parier sur la course. Quand la course est terminée, Alice envoie à Bob le nom du cheval gagnant grâce à un signal plus rapide que la lumière. Lorsque Bob reçoit ce nom, il le renvoie à Alice avec des signaux plus rapides que la lumière. Alice reçoit le message de Bob avant le début de la course, elle peut ainsi parier sur le gagnant. Bien sûr, dans le référentiel d’Alice, le nom du gagnant surgit un peu de nulle part, comme par magie, puis s’en va vers Bob à une vitesse supérieure à celle de la lumière, mais Alice sait que tout cela arrive parce qu’après la fin de la course elle ira transmettre le nom du gagnant à Bob avec sa machine à fabriquer des signaux se propageant plus vite que la lumière. Oui, mais 213
IL ÉTAIT TEMPS
quel sens donner à cette histoire si pour une raison ou pour une autre (le vol de sa machine ou une simple panne de courant), Alice se trouve dans l’incapacité d’envoyer le nom du gagnant à Bob après la course ? Tout ceci est évidemment très étrange… Envoyer des messages dans le passé pour modifier le cours des événements qui se sont déjà produits est monnaie courante dans les histoires de science-fiction, mais il est difficile de penser que cela soit compatible avec la réalité du monde dans lequel nous vivons. L’existence de signaux se déplaçant plus vite que la lumière rendrait possible la communication avec le passé, c’est un des arguments le plus fort contre l’existence de ce type de signaux. On peut tout à fait envisager l’existence de tels mouvements, mais ils ne doivent offrir aucune possibilité de communication avec le passé. Pour cela, il faut leur imposer une condition : tout ce qui peut se déplacer plus vite que la lumière ne doit pas pouvoir être déclenché de façon volontaire. Les choses doivent juste arriver jusqu’à nous ou défiler devant nous d’une manière aléatoire et incontrôlable afin qu’on ne puisse pas les utiliser pour communiquer. Les relations de séparation de genre espace, temps ou lumière entre deux événements évoquées au chapitre 8 sont des caractéristiques élémentaires de la représentation des événements sur un diagramme. La figure 10.17 représente un événement E qui coïncide avec le passage de deux photons se déplaçant en sens inverse. Les zones légendées « genre espace » rassemblent tous les événements dont la séparation avec E est de genre espace. Comme le segment joignant chacun de ces points à E est plus proche de l’horizontale que de la verticale, il existe un référentiel pour lequel cette ligne joue le rôle d’une équitemp. Dans ce référentiel, l’événement se produit au même moment que E. Les zones légendées « genre temps » rassemblent tous les événements dont la séparation avec E est de genre temps. Comme le segment joignant chacun de ces points à E est plus proche de la verticale que de l’horizontale, il existe un référentiel pour lequel cette ligne joue le rôle d’une équiloc. Dans ce référentiel, l’événement se produit au même endroit que E. Les trajectoires des photons formant les limites de ces régions contiennent tous les événements séparés de genre lumière avec E. 214
La géométrie de l’espace-temps
Genre temps (futur)
Genre espace
E
Genre espace
Genre temps (passé)
Figure 10.17 | Le gros point noir est un événement noté E. Les deux lignes pointillées sont les trajectoires de photons se déplaçant en sens inverse et présents à l’événement E. Les trajectoires des photons divisent le diagramme en quatre régions. Deux régions contiennent les événements dont la séparation avec E est de genre espace et les deux autres contiennent les événements dont la séparation avec E est de genre temps.
Une des deux régions contenant les événements dont la séparation avec E est de genre temps peut être appelée « futur » et l’autre « passé », étant donné que l’ordre chronologique de deux événements séparés de genre temps ne dépend pas du référentiel. En revanche, un événement qui a une séparation de genre espace avec E ne peut pas être placé de façon certaine dans le passé ou dans le futur de E, vu que les référentiels peuvent être en désaccord sur l’ordre chronologique de deux événements séparés de genre espace. Tout ceci est illustré sur la figure 10.18. La figure 10.19 montre – sûrement de la manière la plus simple qui soit – pourquoi l’intervalle entre deux événements ne dépend pas du référentiel dans lequel on mesure le temps T et la distance D. La figure est dessinée par Carol, qui utilise un référentiel dans lequel Bob et Alice se déplacent avec la même vitesse, mais en sens inverse (Bob se déplace vers la gauche et Alice vers la droite. Les équilocs verticales de Carol et ses équitemps horizontales n’ont pas été représentées). Le fait que les vitesses d’Alice et de Bob soient les mêmes dans le référentiel de Carol a trois conséquences importantes. 215
IL ÉTAIT TEMPS
E1 E
Figure 10.18 | L’événement E de la figure 10.17 et un second événement E1 dont la séparation avec E est de genre espace. Les deux droites parallèles représentées en trait épais et plein sont des équitemps d’un référentiel dans lequel E1 se produit avant E car l’équitemp contenant E1 est située plus bas dans le diagramme que celle qui contient E. Mais les deux autres droites parallèles représentées en trait fin et plein sont des équitemps d’un référentiel dans lequel E1 se produit après E, car l’équitemp contenant E1 est située plus haut dans le diagramme que celle qui contient E.
E1
da
ta tb
E2 db Figure 10.19 | Les deux cercles blancs sont les événements E 1 et E 2 . Le grand parallélogramme dont les deux cercles blancs forment deux sommets opposés est composé de segments d’équilocs et d’équitemps de Bob dont les longueurs sont tb et db. Le plus petit parallélogramme avec les mêmes sommets opposés est composé de segments d’équilocs et d’équitemps d’Alice de longueurs ta et da. Le diagramme a été représenté par Carol pour laquelle Bob et Alice se déplacent avec la même vitesse, mais en sens inverse. Remarquez qu’il y a deux triangles rectangles qui partagent la même hypoténuse (en pointillé), ce qui démontre bien que ta2 + db2 = tb2 + da2.
216
La géométrie de l’espace-temps
(a) Leurs coefficients d’échelle l (et leurs coefficients d’échelle m) doivent être les mêmes (par symétrie) dans le diagramme de Carol. (b) Les équilocs de Bob forment avec la verticale un angle vers la gauche égal à celui que les équitemps d’Alice forment vers le haut avec l’horizontale, ce qui montre qu’elles sont perpendiculaires. (c) Pour la même raison, les équitemps de Bob sont perpendiculaires aux équilocs d’Alice. Gardons bien à l’esprit ces trois conséquences et considérons les cercles blancs dans la figure 10.19 qui représentent les événements E1 et E2. Le grand parallélogramme dont les sommets opposés sont E1 et E2 est composé d’équilocs et d’équitemps de Bob ayant pour longueur tb et db ; le petit parallélogramme est composé d’équilocs et d’équitemps d’Alice de longueur ta et da. À cause de la conséquence (b), il y a, sur la figure, deux triangles rectangles qui partagent la même hypoténuse (en pointillé). Le triangle rectangle du dessous a un côté de longueur ta et un autre de longueur db, tandis que celui du dessus a un côté de longueur tb et un autre de longueur da. Étant donné qu’ils ont la même hypoténuse, Pythagore nous dit que ta2 + db2 = tb2 + da2, ou
ta2 − da2 = tb2 − db2 (10.2)
Les distances sur le diagramme sont reliées aux distances et aux temps réels séparant les événements par ta = µaTa , da = µa Da , tb = µ bTb et db = µb Db . Mais comme µa = µ b , on déduit de (10.2) que
Ta2 − Da2 = Tb2 − Db2 , (10.3)
ce qui revient à affirmer que la valeur de l’intervalle entre deux événements est indépendante du choix du référentiel de Bob ou d’Alice pour mesurer les temps et les distances. Nous conclurons ce chapitre par une expérience qui démontre comment les coefficients d’échelle l A ou µA utilisés par Alice sont reliés aux 217
IL ÉTAIT TEMPS
coefficients l B ou µB utilisés par Bob. Avec les conventions liées aux diagrammes d’espace-temps, cette relation possède une expression géométrique simple. Dans ce contexte, il est également possible de proposer une interprétation géométrique simple de l’invariance de l’intervalle et de l’utiliser pour montrer géométriquement comment mesurer l’intervalle entre deux événements avec une seule et même horloge, comme nous l’avons mentionné à la fin du chapitre 8 (sans toutefois l’avoir démontré).
La relation entre les échelles qu’Alice et Bob utilisent sur leurs équilocs (ou équitemps) se déduit directement de la représentation sur un diagramme d’espace-temps de ce que chacun d’eux voit quand il regarde l’horloge de l’autre. Nous allons maintenant démontrer que la relation qui existe entre la longueur d’un segment d’équiloc joignant deux événements séparés par un temps T dans le référentiel de Bob et la longueur d’un segment d’équiloc joignant deux événements séparés par un temps T dans le référentiel d’Alice est la suivante : les deux rectangles constitués par des trajectoires de photons ayant les deux segments d’équilocs pour diagonales ont la même aire. La règle est illustrée sur la figure 10.20. La partie (1) montre deux moments pour lesquels une horloge, immobile dans le référentiel d’Alice, affiche 0 et T. Les deux moments de l’histoire de l’horloge sont situés sur une équiloc d’Alice et séparés par une distance µAT . Les deux trajectoires de photons qui sont émis en sens inverse par l’horloge à l’instant 0 et les deux photons reçus par l’horloge à l’instant T forment un rectangle – un rectangle de lumière – qui a pour diagonale le segment d’équiloc d’Alice qui relie les deux horloges. La partie (2) de la figure 10.20 montre la même construction pour une horloge immobile dans le référentiel de Bob. La longueur µBT du segment d’équiloc de Bob qui relie les deux moments dans l’histoire de son horloge est supérieure à la longueur µAT du segment correspondant de l’équiloc d’Alice. Mais les deux rectangles de lumière représentés côte à côte ont exactement la même surface. 218
La géométrie de l’espace-temps
T T µAT µBT
0
(1)
0
(2)
Figure 10.20 | (1) Une équiloc d’Alice dans le référentiel d’Alice, joignant deux événements séparés par un temps T dans le référentiel d’Alice. La ligne peut être vue comme la trajectoire d’espace-temps d’une horloge, immobile dans le référentiel d’Alice, qui affiche 0 au premier événement et T au second. (2) La situation est la même que dans la partie (1), mais avec un couple différent d’événements et une horloge différente qui est, cette fois-ci, immobile dans le référentiel de Bob. Remarquons que le segment de longueur mBT joignant l’événement au cours duquel l’horloge immobile dans le référentiel de Bob affiche 0 et celui au cours duquel elle affiche T est plus long que le segment correspondant dans le référentiel d’Alice qui, lui, a pour longueur mAT. Cela revient à dire qu’Alice et Bob utilisent des coefficients d’échelle m différents pour transformer en distance la séparation dans le temps le long de leurs équilocs. Le rapport entre leurs coefficients d’échelle est tout simplement le rapport entre ces deux longueurs. Même si les coefficients d’échelle sont différents, les surfaces des deux rectangles de lumière formés par les trajectoires des photons émis à l’instant 0 et reçus à l’instant T sont les mêmes. Ceci est établi dans la figure 10.21.
Pour comprendre pourquoi, prenons le cas dans lequel les deux horloges se trouvent au même endroit lorsqu’elles affichent 0. Ceci est illustré dans la figure 10.21 qui résulte du glissement (sans rotation) de la partie (2) de la figure 10.20 sur la partie (1) pour faire coïncider en un même point les événements où les deux horloges affichent 0. Nous avons également ajouté d’autres événements et des notations. Supposons qu’Alice qui se déplace avec son horloge regarde l’horloge de Bob au moment où la sienne affiche T et supposons que Bob qui se déplace avec son horloge regarde celle d’Alice 219
IL ÉTAIT TEMPS
au moment où la sienne affiche aussi T. Chacun d’entre eux verra l’horloge de l’autre affichant le même temps t plus petit que T parce que les relations entre les horloges d’Alice et de Bob sont parfaitement symétriques : chacun regarde celle de l’autre après que le temps T s’est écoulé sur leur propre horloge ; chacun regarde l’horloge de l’autre comme si elle s’éloignait d’eux à la même vitesse et pour chacun la vitesse de la lumière provenant de l’autre horloge est de 1 pied par nanoseconde. Il suffit de regarder la figure 10.21 pour se rendre compte immédiatement que le rapport b/a d’un côté court du rectangle de lumière de Bob sur un côté court du rectangle de lumière d’Alice est le même que le rapport µAt / µAT = t / T . Et le rapport A/B du côté long du rectangle de lumière sur le côté long de celui de Bob est le même que le rapport µB t / µBT = t / T . Ainsi, A t b = = , (10.4) B T a
L’horloge T de Bob
L’horloge d’Alice T
t
t
A a
b
B
0
Figure 10.21 | Les deux parties de la figure 10.20 ont été superposées (sans aucune rotation) pour représenter une situation dans laquelle les deux horloges affichent 0 au même endroit et au même moment. Au moment où chaque horloge affiche T, l’observateur attaché à une des horloges regarde l’autre horloge et voit qu’elle affiche t (les deux segments épais en pointillé représentent les lignes des photons émis par chaque horloge lorsqu’elle affiche t vers l’autre horloge qui affichera T à la réception).
220
La géométrie de l’espace-temps
et par conséquent, Bb = Aa (10.5)
La partie gauche de (10.5) est l’aire du rectangle de lumière de Bob et la partie droite est l’aire de celui d’Alice. C’est bien ce que nous souhaitions démontrer. L’égalité des surfaces des rectangles de lumière implique l’égalité (10.1) du produit λµ des coefficients d’échelle. Car l’assemblage de quatre copies d’un des deux triangles analogues qui constituent chaque rectangle de la partie (1) de la figure 10.22 peuvent reformer un losange dont les côtés ont pour longueur µT et sont éloignés d’une distance lT , comme l’illustre la partie (2) de la figure 10.22. La surface du losange est λ µT 2 , l’aire du rectangle est donc égale à 1 λ µT 2 , la moitié de celle du losange (il faut utiliser les indices A 2
T
T
µT
λT
0
(1)
0
(2)
Figure 10.22 | La surface de chacun des rectangles de lumière de la figure 10.20 – dont un est représenté ici dans la partie (1) – constitue la moitié de l’aire du losange de la partie (2) puisque la moitié du losange peut être reconstituée à partir des deux triangles qui forment le rectangle. Comme l’aire du losange de la partie (2) est égale au produit de la longueur mT d’un côté par la distance lT entre ses deux côtés, la surface du rectangle 1 de lumière de la partie (1) vaut λµT 2 . 2 221
IL ÉTAIT TEMPS
1 pour le rectangle d’Alice, ce qui donne λ A µAT 2 et les indices B 2 1 pour celui de Bob, ce qui donne λ B µBT 2 ). Les rectangles d’Alice 2 et de Bob ont la même surface, ce qui démontre que le produit λµ est indépendant du référentiel. On montre également que la relation entre la surface S de chacun des rectangles de la figure 10.20 et le temps T séparant les deux événements formés par les sommets opposés des rectangles s’exprime de la manière suivante 1 T 2 = S / λ µ (10.6) 2 Il est possible d’en déduire que la surface S de n’importe quel rectangle formé par des portions de trajectoires de photons dont les sommets opposés sont deux événements séparés de genre temps n’est que le produit des coefficients d’échelle indépendant du référentiel 1 S0 = λ µ (10.7) 2 par le carré du temps T entre les deux événements dans le référentiel dans lequel ils se produisent au même endroit : S = S0T 2 (10.8) 2 Mais T , le carré du temps qui sépare deux événements dans le référentiel où ils se produisent au même endroit, a été défini dans le chapitre 8 comme étant le carré de l’intervalle I 2 entre ces événements. Par conséquent, le carré de l’intervalle entre deux événements séparés de genre temps est simplement la surface (exprimée en nombre de S0, la surface du rectangle unité indépendante du référentiel choisi) du rectangle de lumière dont deux sommets opposés sont constitués par ces deux événements : I 2 = S /S0 (10.9) Grâce à la symétrie des diagrammes par rapport à la permutation de l’espace et du temps nous pouvons aussi conclure que la surface S du rectangle formé par les trajectoires de photons et dont ses sommets opposés sont deux événements séparés de genre espace est égale au produit de S0 par le carré de la distance D entre les deux événements dans le référentiel 222
La géométrie de l’espace-temps
où ils se produisent au même moment. Mais D2 a été défini dans le chapitre 8 comme étant le carré de l’intervalle entre deux événements quand leur séparation est de genre espace. Par conséquent, (10.9) nous fournit une représentation géométrique de l’intervalle entre deux événements séparés du genre espace basée sur la surface du rectangle de lumière dont deux sommets opposés sont constitués par ces deux événements. Cette interprétation géométrique de l’intervalle nous permet de voir directement à partir de la figure 10.23 que le carré de l’intervalle entre deux événements séparés de genre temps est égal à la différence entre le carré du temps séparant les événements et le c
d
E3
θ
E2
θ b
a
E1 Figure 10.23 | Les deux gros points noirs sont deux événements E1 et E2. Les lignes en pointillé sont des lignes de photons. Les deux lignes en trait plein sont des équitemps et des équilocs du référentiel d’Alice qui, par conséquent, forment les mêmes angles avec chaque ligne de photon passant par un troisième événement E3. Par conséquent, le triangle rectangle de côtés d et c est une version réduite du triangle rectangle de côtés a et b. Comme les deux triangles rectangles sont analogues a/b = c/d et par conséquent ad = bc.
223
IL ÉTAIT TEMPS
carré de la distance entre eux, quel que soit le référentiel dans lequel ce temps et cette distance sont mesurés. On a représenté en trait plein une équitemp et une équiloc du référentiel d’Alice reliant chaque événement E1 et E2 à un troisième événement E3. Le carré de l’intervalle I 2 entre les événements E1 et E2 est proportionnel à la surface (a − c)(b + d) du rectangle de lumière dont les deux sommets opposés sont constitués par ces deux événements, qui, vu que ad = bc (comme cela a été démontré dans la légende de la figure 10.23), est simplement ab − cd :
I 2 = (ab − cd) / S0 (10.10)
Mais (d’après la figure 10.23) ab est proportionnel au carré de l’intervalle entre les événements E1 et E3, alors que cd est proportionnel au carré de l’intervalle entre E2 et E3. Comme E1 et E3 se produisent au même endroit dans le référentiel d’Alice, le carré de l’intervalle qui les sépare est T 2, le carré du temps d’Alice qui les sépare ; comme E2 et E3 se produisent au même moment dans le référentiel d’Alice, le carré de l’intervalle entre eux est D2, le carré de la distance qui les sépare, mesurée par Alice. Mais comme E3 se produit au même endroit que E1 et au même moment que E2 dans le référentiel d’Alice, T et D sont aussi le temps et la distance entre E1 et E2. Comme
T 2 = ab /S0 , D2 = cd /S0 , (10.11)
à partir de (10.10), nous en déduisons que
I 2 = T 2 − D2 (10.12)
Une conclusion similaire (I 2 = T 2 − D2 ) peut être obtenue pour des événements dont la séparation est de genre espace en analysant une image symétrique de la figure 10.23 par rapport à n’importe quelle ligne de photons montant à 45° vers la droite. La démonstration de (10.12) à partir de la figure 10.23 nous a obligés à faire un peu d’algèbre. Une démonstration alternative basée uniquement sur des arguments géométriques est fournie par 224
La géométrie de l’espace-temps
la figure 10.24. La partie (1) de la figure 10.24 reproduit la figure 10.23, sauf que les trois rectangles de lumière ayant chacun pour diagonale une des trois droites qui relient les événements ont été remplacés par des losanges de surface double dont les côtés sont formés par des segments appartenant à ces droites. Pour former un quadrilatère, dans la partie (2), on fusionne les deux plus petits losanges avec deux copies du triangle ayant pour sommets les événements E1, E2 et E3.
E3
E2
E3
(1)
(2)
E1 E3
E2
E2
E1
(3)
E1
D2
I2
T2 (4) Figure 10.24 | Une démonstration purement géométrique de la relation I2 = T2 – D2.
225
IL ÉTAIT TEMPS
Dans la partie (3), on fusionne le plus grand losange et deux copies du même triangle pour former exactement le même quadrilatère. Par conséquent, il existe une relation entre les surfaces des trois losanges, comme cela est illustré sur la partie (4) de la figure : ce qui démontre (10.12) uniquement en faisant appel à un raisonnement de type géométrique, étant donné que les surfaces sont proportionnelles respectivement à T 2 , D2 et I 2 . Nous pouvons aussi utiliser des diagrammes d’espace-temps pour démontrer la méthode qui consiste à mesurer précisément l’intervalle entre deux événements en utilisant uniquement des signaux lumineux et une seule horloge. Nous avons décrit cette méthode à la fin du chapitre 8 sans la démontrer. La figure 10.25 illustre une situation dans laquelle les événements E1 et E2 (les cercles gris) ont une séparation de genre temps. La ligne en trait épais et plein est la ligne d’univers de l’horloge d’Alice qui est présente à l’événement E1 où elle affiche un temps t1. La ligne de photons en trait pointillé épais qui relie l’horloge d’Alice lorsqu’elle affiche t2 à E2 montre que Bob qui est présent à l’événement E2 et qui regarde l’horloge d’Alice voit qu’elle affiche t2 quand E2 se produit. La ligne de photons en trait pointillé épais qui relie E2 à l’horloge d’Alice lorsqu’elle affiche t3 montre que l’horloge d’Alice indique t3 quand elle voit E2 se produire. Le carré de l’intervalle séparant l’événement où l’horloge d’Alice affiche t3 et celui où elle affiche t1 est tout simplement le produit de 1/S0 par la surface du grand rectangle de lumière dont les côtés sont notés b et f × b. Étant donné que le carré de l’intervalle séparant deux événements de genre temps est simplement égal au carré du temps qui les sépare, mesuré avec une horloge en mouvement rectiligne uniforme présente aux deux événements, ce qui nous donne
226
(t3 − t1 ) 2 = f × b 2 /S0
(10.13)
La géométrie de l’espace-temps
Pour la même raison, nous avons 2
(t2 − t1 )
= f × a 2 / S0 (10.14)
Finalement, I 2 , le carré de l’intervalle séparant les deux événements E1 et E2 qui nous intéressent, est égal au produit de 1/S0 par la surface du rectangle très long et étroit ayant pour côtés b et f × a : I 2 = f × ab /S0
(10.15) t3
E2 b
t2
f×a
a
f×b
t1
E1
Figure 10.25 | Les cercles gris sont deux événements E1 et E2 dont la séparation est de genre temps. La ligne en trait épais et plein représente une horloge attachée à Alice qui se déplace avec elle en mouvement rectiligne uniforme et qui affiche un temps t1 lorsqu’elle est présente à l’événement E1. La ligne de photons en trait épais pointillé qui relie le cercle blanc t2 au cercle gris E2 montre qu’un observateur présent à l’événement E2 voit l’horloge d’Alice afficher t2 quand l’événement E2 se produit. La ligne de photons en trait épais pointillé partant de E2 vers t3 montre que l’horloge d’Alice affiche t3 quand Alice voit l’événement E2 se produire. Le rectangle de lumière entre t1 et t2 est une version réduite du rectangle situé entre t1 et t3. Le rapport f du côté court sur le côté long est le même pour les deux rectangles (f = [f × a]/a = [f × b]/b), c’est pourquoi les largeurs des rectangles ont été notées f × a et f × b.
227
IL ÉTAIT TEMPS
En comparant (10.15) avec (10.13) et (10.14), nous voyons que
I 2 = (t3 − t1 ) ⋅ (t 2 − t1 ) , (10.16)
il s’agit bien de la relation énoncée au chapitre 8. Remarquez bien la puissance de ce diagramme. Non seulement il nous permet de représenter clairement sur une feuille la situation délicate où nous avons Bob et Alice qui s’observent l’un l’autre, mais, en plus, les règles reliant les intervalles aux surfaces des rectangles de lumière contiennent les informations quantitatives nécessaires pour établir de façon géométrique la relation (10.16) sans compliquer l’histoire de Bob et d’Alice par des calculs fastidieux. La figure 10.26 est une construction similaire, adaptée à des événements E1 et E2 séparés de genre espace (Notons que la légende de la figure 10.26 est identique à celle de la figure 10.25). Comme elle serait exactement identique à celle que nous venons de faire, il est parfaitement inutile de répéter la démonstration qui donnerait l’expression suivante pour le carré de l’intervalle entre deux événements :
I 2 = (t3 − t1 ) ⋅ (t1 − t 2 ) (10.17)
Étant donné que l’intervalle entre des événements séparés de genre espace est égal à la distance entre les événements dans le référentiel dans lequel ils se produisent au même moment, cette procédure nous fournit un moyen de mesurer les distances en utilisant une seule et unique horloge. Si Alice et son horloge sont immobiles dans le référentiel où les deux événements se produisent au même moment, alors il est très facile de comprendre pourquoi la procédure fonctionne. Ce qui est prodigieux, c’est que la procédure fonctionne même lorsqu’Alice est en mouvement. Nous avons démontré que les deux rectangles de lumière de la figure 10.20 ont la même surface, mais comment leurs formes sontelles reliées ? Il est possible de caractériser la forme d’un rectangle de lumière en indiquant le rapport entre les longueurs de ses côtés, ce rapport est appelé le rapport d’aspect. Tous les rectangles de lumière 228
La géométrie de l’espace-temps
t3
f×b
E2
b
E1 t1
a
f×a
t2 Figure 10.26 | Les cercles gris sont deux événements E1 et E2 séparés de genre espace. La ligne en trait épais et continu représente une horloge attachée à Alice qui se déplace avec elle en mouvement rectiligne uniforme et qui affiche un temps t1 lorsqu’elle est présente à l’événement E 1. La ligne de photons en trait épais pointillé qui relie le cercle blanc t2 au cercle gris E2 montre qu’un observateur présent à l’événement E2 voit l’horloge d’Alice afficher t2 quand l’événement E2 se produit. La ligne de photons en trait épais pointillé partant de E2 vers t3 montre que l’horloge d’Alice affiche t3 quand Alice voit l’événement E2 se produire.
dont les diagonales sont parallèles ont le même rapport d’aspect, ainsi nous pouvons répondre à la question en comparant n’importe lequel des deux rectangles dont les diagonales sont des équilocs pour Alice et Bob. De tels rectangles se trouvent sur la figure 10.27, sur laquelle on peut voir une équiloc de Bob reliant les points P et R ainsi que des équilocs et des équitemps d’Alice passant par P et R et se coupant au point Q. Les rectangles de lumière de Bob ont un rapport d’aspect f/F tandis que ceux d’Alice ont pour rapport d’aspect e/E. 229
IL ÉTAIT TEMPS
R θ
Q θ
F E e f
P
Figure 10.27 | La ligne qui joint le point P au point R est une équiloc dans le référentiel de Bob. La ligne épaisse qui joint les points P à Q est une équiloc pour Alice et celle qui joint Q à R constitue, pour elle, une équitemp. Elles forment le même angle q avec la ligne du photon lorsqu’elles se coupent en Q. La vitesse v de Bob dans le référentiel d’Alice est égale au rapport des longueurs de ces deux segments en trait épais. Chacune de ces lignes constitue l’hypoténuse d’un triangle rectangle dont les deux autres côtés sont constitués par des segments appartenant à d’autres lignes de photons. Comme les deux angles q sont égaux, les triangles rectangles sont analogues et les rapports des côtés correspondants donnent tous deux v.
Il est possible de relier les deux rapports d’aspect à la vitesse v de Bob dans le référentiel d’Alice en remarquant que v est le rapport de la longueur de l’équitemp d’Alice qui va de Q à R sur la longueur de son équiloc qui va de P à Q. Chacun de ces segments est l’hypoténuse d’un triangle rectangle et, comme ces segments sont des portions d’équitemp et d’équiloc d’Alice, les deux triangles rectangles sont analogues. Par conséquent, le rapport v des longueurs des deux segments est égal au rapport des longueurs des côtés correspondants deux à deux et nous avons alors 230
La géométrie de l’espace-temps
v=
F−E e− f = (10.18) e E
Ces relations nous permettent d’écrire que
f / e = 1 − v et F / E = 1 + v (10.19)
Par conséquent, le rapport d’aspect f / F du rectangle de Bob est relié au rapport d’aspect e / E d’Alice par
f / F 1− v = (10.20) e / E 1+ v
dans lequel v est la vitesse de Bob dans le référentiel d’Alice. À partir de cette relation, nous pouvons en déduire l’expression littérale du décalage Doppler relativiste de la figure 10.21. Si on applique (10.20) aux deux rectangles de photons de la figure 10.21, on peut écrire que 1− v b / B = . (10.21) 1+ v a / A Mais les deux rectangles de photons de la figure 10.21 ont la même surface : Bb = Aa (10.22) Grâce à (10.22), on en déduit que b /a = A/B , il devient possible de réécrire (10.21) de la manière suivante : 1− v = (b /a) ⋅ ( A/B) = (b /a)2 = ( A/B)2 (10.23) 1+ v Mais comme le montre la relation (10.4), les rapports a/b et A/B sont tous deux égaux au coefficient Doppler f = t /T , le rythme avec lequel Alice ou Bob voient le temps s’écouler sur l’horloge de l’autre par rapport à ce que lui ou elle mesure sur leur propre horloge. Par conséquent,
f =
1− v , (10.24) 1+ v
dans lequel v représente leur vitesse relative en pieds par nanoseconde, exactement comme nous l’avons démontré dans le chapitre 7.
231
11 E = Mc2
On ne peut pas écrire un livre sur la relativité sans consacrer un chapitre à E = Mc2, la deuxième équation la plus célèbre de tous les temps. Seulement détrônée par le théorème de Pythagore que nous avons déjà eu l’occasion d’utiliser et qui dit que l’aire du carré adjacent à l’hypoténuse d’un triangle rectangle est égale à la somme des aires des carrés adjacents aux deux autres côtés : C 2 = A2 + B2. Pour comprendre la fameuse relation d’Einstein entre l’énergie (E) et la masse (M), nous allons devoir nous pencher sur une troisième grandeur, la quantité de mouvement (P). Pour démarrer notre voyage vers E = Mc2, voyons d’abord comment la masse est définie en physique non relativiste. Je vous rappelle que « non relativiste » ne signifie pas qu’on ignore le principe de relativité, mais au contraire, qu’on en tient compte, sauf qu’on l’applique uniquement à des situations où les vitesses mises en jeu sont très petites par rapport à c, la vitesse de la lumière. Ce n’est qu’après avoir exploré le système de pensée non relativiste que nous pourrons partir à la recherche d’une définition de la masse valable également pour les 233
IL ÉTAIT TEMPS
objets dont la vitesse n’est pas petite comparée à celle de la lumière. Nous allons voir, qu’à une clause restrictive près, la définition non relativiste sera conservée telle quelle dans les situations relativistes. Au risque d’enfreindre les principes pédagogiques, je commencerai par énoncer deux mauvaises manières de définir la masse. Nous devons la première à Newton qui a défini la masse en tant que « quantité de matière ». Il y a au moins deux raisons qui font que cette définition est inutile. Comment est-il possible de compter la quantité de matière dans un objet ? Si la matière était faite de petites briques identiques, on imagine qu’il suffirait de compter le nombre de briques, mais malheureusement la matière (telle que nous la concevons de nos jours) est faite à partir d’une multitude de briques de types différents, ce qui nous obligerait à avoir une définition indépendante de la quantité de matière pour chaque type de briques. Et en plus, même quand on assemble des briques identiques, il se trouve que – dans le cadre relativiste – la masse d’un objet dépend de la manière avec laquelle ces briques sont assemblées. Dire que « la masse c’est le poids » n’est pas non plus une bonne manière de définir la masse. Nous savons cela depuis le collège, on ne nous l’a que trop rabâché. Le poids correspond à la force de gravité subie par les objets et elle dépend de l’endroit où l’objet se trouve dans l’univers. Le poids d’un objet sur la Lune est six fois plus petit que sur la Terre (qui lui-même varie légèrement en fonction de la position autour de la Terre) et son poids est nul lorsqu’il se trouve dans l’espace, loin de tout astre. Alors que sa masse, elle, reste la même, quelle que soit la position dans l’univers : sur Terre, sur la Lune ou dans l’espace interstellaire. Voici enfin une définition qualitative correcte : la masse est une mesure de la résistance qu’oppose un objet aux tentatives de modifi cation de son vecteur vitesse (le vecteur vitesse v inclut la direction et le sens en plus de la valeur v de la vitesse). Autrement dit, plus la masse d’un objet est importante, plus il est difficile de modifier son vecteur vitesse. Cet énoncé est bien trop qualitatif pour qu’on puisse 234
E = Mc2
s’en satisfaire, mais il résume bien le concept. C’est facile de mettre en mouvement un ballon de football, ce serait beaucoup plus difficile si le ballon était en bois et carrément impossible avec un ballon en plomb. En reliant la définition de la masse à un changement de vecteur vitesse, nous transformons la mesure d’une masse en mesures de temps et de distances, cette définition est donc idéale si nous voulons réexaminer la notion de masse en suivant un schéma de pensée relativiste. Pour aller plus loin que cette définition qualitative de la masse, il faudrait qu’on dégage quelques propriétés simples qui puissent nous aider à produire une définition quantitative. Pour cela, il faut se replonger dans les collisions que nous avons considérées dans le chapitre 1, au cours desquelles deux particules sont lancées l’une vers l’autre avec certaines vitesses, s’entrechoquent et repartent avec des vitesses différentes. Nous devons faire très attention à lever d’emblée toute ambiguïté de notation entre les valeurs des vitesses et les coordonnées des vecteurs vitesses. Certaines grandeurs que nous allons manipuler dans ce chapitre, notamment la vitesse et la quantité de mouvement, sont en réalité des grandeurs vectorielles. Comme nous continuerons à n’envisager qu’une seule direction de l’espace, il est possible d’éviter de manipuler des vecteurs, à condition de prendre certaines précautions : dorénavant, les lettres en gras (comme u, v ou w) représenteront les coordonnées des vecteurs qui peuvent être des nombres positifs ou négatifs et les lettres en italique (comme u, v ou w) représenteront des quantités toujours positives (les valeurs des vitesses – ou normes des vecteurs). C’est ainsi que la coordonnée u du vecteur vitesse d’une particule (par la suite, on dira seulement coordonnée u de la vitesse) qui se déplace à une vitesse u est égale à u si elle se déplace vers l’est le long des rails et à − u si elle se déplace vers l’ouest (ce qui revient à dire qu’on a choisi arbitrairement d’orienter les rails positivement vers l’est – c’est-à-dire vers la droite). Remarquons que le carré d’une coordonnée est égal au carré de la valeur de la vitesse correspondante : u2 = u2. 235
IL ÉTAIT TEMPS
La définition quantitative de la masse que nous cherchons est basée sur une caractéristique essentielle de ces expériences de collisions. Il est possible d’associer à chaque particule un nombre positif m qu’on appelle sa masse et qui mesure la résistance au changement de la coordonnée de la vitesse de la particule lorsqu’elle est soumise à des collisions, autrement dit plus la masse est importante et moins la coordonnée de la vitesse sera sujette aux variations. Pour formuler clairement une relation quantitative entre les masses de deux particules et les variations des coordonnées de leurs vitesses, notons 1 et 2 les particules et m1 et m2 leurs masses. Notons u1i et u2i les coordonnées de leurs vitesses avant la collision et u1f et u2f les coordonnées de leurs vitesses après la collision, ainsi les variations des coordonnées des vitesses seront u1f − u1i et u2f − u2i (l’indice f pour final et i pour initial). Historiquement, les nombreuses expériences réalisées ont démontré que le rapport des variations des coordonnées des vitesses est fixé par le rapport des masses selon la relation très simple :
u1 f − u1i u 2 f − u 2i
=−
m2 (11.1) m1
Comme les masses sont positives, le signe moins veut simplement dire que le rapport des variations des coordonnées des vitesses est négatif – c’est-à-dire que lorsqu’une particule subit une certaine variation de sa coordonnée de vitesse, l’autre subit une variation opposée. Si la coordonnée u de la vitesse de l’une augmente, celle de l’autre doit forcément diminuer. Notons bien qu’une augmentation (ou une diminution) de la coordonnée u de la vitesse n’est pas équivalente à une augmentation (ou une diminution) de la valeur u de la vitesse. Si une particule se déplace vers l’est en allant de moins en moins vite, la coordonnée u de sa vitesse diminue. Mais si une particule se déplace vers l’ouest en allant de plus en plus vite, la coordonnée u de sa vitesse diminue aussi, car elle devient de plus en plus négative. Si une particule se déplace vers l’ouest en allant de moins en moins vite, la coordonnée u de sa vitesse augmente parce qu’elle devient de moins en moins négative. 236
E = Mc2
La relation (11.1) est simple et intuitive. Si deux particules s’entrechoquent et subissent une variation identique mais opposée de coordonnée de vitesse, alors (11.1) nous dit qu’elles ont la même masse. Si la variation de coordonnée de vitesse d’une particule n’est que la moitié de celle de l’autre, alors la particule qui subit la plus petite variation de coordonnée de vitesse aura une masse deux fois plus importante que l’autre. Si une particule subit une variation de coordonnée de vitesse égale à 1 % de la variation de l’autre, alors sa masse est 100 fois plus importante. La relation (11.1) fait partie de ce qu’on appelle la mécanique classique (qui est non relativiste), où les coordonnées des vitesses peuvent à priori prendre n’importe quelle valeur. On peut s’attendre à ce qu’elle présente des problèmes de validité lorsque les vitesses mises en jeu deviennent des fractions trop importantes de la vitesse de la lumière et c’est effectivement le cas, comme nous allons le voir. Cependant, dans le cadre plus précis de la théorie relativiste, comme on peut s’y attendre – plutôt comme il faut l’exiger –, la relation conserve un excellent niveau de précision lorsque les vitesses des particules restent petites par rapport à celle de la lumière. L’exigence de précision ne nous empêche pas de continuer à nous appuyer sur la définition non relativiste de la masse contenue dans la relation (11.1) pour définir la masse dans le cadre plus global de la théorie relativiste. Il suffira d’y ajouter une clause restrictive : les vitesses des particules mises en jeu dans la collision spécialement conçue pour comparer les masses de deux particules doivent être petites par rapport à la vitesse de la lumière. « Petites jusqu’à quel point ? » me direz-vous. Cela dépend de la précision avec laquelle vous voulez connaître le rapport des masses. Comme aucune masse n’est connue avec une précision supérieure à 10 chiffres, une erreur de 1 sur 10 milliards est suffisante pour toutes les applications pratiques, ce qui, nous allons le voir, signifie que les vitesses doivent rester inférieures à 1/100 000e de la vitesse de la lumière, ce qui représente environ 3 km/s – environ 10 fois la vitesse du son dans l’air –, ce qui reste donc extrêmement rapide ! 237
IL ÉTAIT TEMPS
La définition (11.1) de la masse comporte une part d’implicite : c’est toujours le même nombre m qui est attribué à une particule donnée, quelle que soit l’autre particule qui vienne la heurter. Par conséquent, même si notre définition nous permet seulement de comparer les résistances qu’offrent les particules aux tentatives de modification de leur coordonnée de vitesse, nous obtiendrons toujours la même série de masses pour un jeu donné de particules, quelles que soient les paires de particules que nous choisissons de lancer l’une contre l’autre. Par exemple, en testant les particules 1 et 2, nous pourrons déterminer le rapport m2/m1 et en testant les particules 2 et 3 nous déterminerons le rapport m3/m2. Le produit de ces deux rapports vaut m3/m1 et, en testant les particules 1 et 3, nous obtiendrons précisément ce résultat. Notons bien qu’il n’y a aucune raison logique inhérente à ces expériences de collision qui obligerait les particules à se comporter ainsi. Il s’agit là d’une propriété plus générale de la nature qui impose aux particules ce comportement très simple lorsqu’elles s’entrechoquent à des vitesses non relativistes. Bien sûr, avec cette technique, il est seulement possible de déterminer le rapport des masses de toutes les particules. Mais ce n’est pas un problème puisque la valeur d’une masse est arbitraire, elle est fixée par une convention qui attribue à une masse étalon la valeur particulière de « 1 kg ». Il est très important que notre définition non relativiste de la masse soit cohérente avec le principe de relativité. Les valeurs que l’on obtient pour les rapports de masses ne doivent pas dépendre du référentiel dans lequel les collisions sont décrites, à condition d’utiliser la loi de composition non relativiste des vitesses. Si nous observons toutes les collisions à partir d’un référentiel se déplaçant vers la droite avec la vitesse v – c’est-à-dire avec une coordonnée v de vitesse positive –, alors chaque coordonnée u de vitesse mise en jeu dans (11.1) doit être remplacée par u − v, les variations des coordonnées des vitesses ne sont donc pas affectées et, précisément, nous n’avons que des variations dans (11.1). 238
E = Mc2
Ici et dans ce qui va suivre, il faut faire très attention à ne pas confondre la coordonnée v de la vitesse du référentiel avec les coordonnées u des vitesses des particules participant à la collision : v est fixée et constante tout le long de la collision et n’a rien à voir avec la collision elle-même. v est simplement la coordonnée de la vitesse d’un référentiel par rapport à l’autre, elle nous est utile pour comparer les descriptions de la collision dans ces deux référentiels. En revanche, la coordonnée u de la vitesse de chaque particule varie en général d’une particule à l’autre et pour une particule donnée avant et après la collision. Il est essentiel que notre définition non relativiste de la masse soit valable dans n’importe quel référentiel inertiel pour qu’elle puisse être considérée comme une loi de la nature vu que le principe de relativité requiert qu’une loi de la nature soit valable dans tous les référentiels inertiels. Cela nous indique d’ores et déjà que quelque chose se passe mal dans le cas relativiste, car la loi de composition u−v relativiste exige de transformer u en lorsqu’on passe d’un 1 − uv /c 2 référentiel inertiel à l’autre. Bien entendu, si les vitesses u et v sont toutes deux petites par rapport à c, la différence est tellement faible qu’elle est imperceptible. Mais si u et v sont comparables à la vitesse de la lumière, les modifications de coordonnée de la vitesse peuvent dépendre fortement du référentiel dans lequel on se place pour les mesurer. Par conséquent, la relation (11.1) est seulement valable dans le cas non relativiste. Cette définition non relativiste de la masse va nous conduire naturellement vers la définition non relativiste de la quantité de mouvement. Avec un peu d’algèbre, on peut écrire (11.1) sous une forme mathématique équivalente :
m1u1i + m2u2i = m1u1f + m2u2f (11.2)
Même si, du point de vue mathématique, le contenu de (11.2) est exactement le même que (11.1), l’information est présentée sous 239
IL ÉTAIT TEMPS
une forme différente. La partie gauche de (11.2) ne contient que des coordonnées de vitesse avant la collision, alors que la partie droite ne contient que des coordonnées de vitesse après celle-ci. Nous avons donc trouvé une quantité qui n’est pas modifiée par la collision, on dit qu’elle se conserve. Cette grandeur correspond à la coordonnée de la quantité de mouvement totale, habituellement notée P (que nous désignerons simplement par « quantité de mouvement » sans préciser qu’il s’agit d’une coordonnée). Nous l’appelons quantité de mouvement « totale » pour la distinguer de la quantité de mouvement individuelle p d’une particule. Pour une particule de masse m dont la coordonnée de la vitesse est u, on a :
p = mu, (11.3)
ainsi P, la quantité de mouvement totale des deux particules est donnée par :
P = p1 + p2 (11.4)
L’équation (11.2) constitue l’équation non relativiste de conservation de la quantité de mouvement. De notre point de vue, ce n’est qu’une reformulation de notre définition de la masse. Mais tout comme cette « définition », la relation (11.2) a une portée bien plus profonde qu’une simple définition ordinaire. C’est un fait remarquable qu’il soit possible d’attribuer à chaque particule un nombre m unique de façon à ce que la quantité de mouvement totale – la somme pondérée des coordonnées des vitesses des particules dans laquelle chaque particule est pondérée par sa propre masse – se conserve à chaque fois au cours de toutes les collisions non-relativistes entre toutes les paires possibles de particules. La conservation de la quantité de mouvement s’applique de manière très générale à toutes les situations non relativistes. Elle est également valable quand il y a plus de deux particules mises en jeu. Elle se vérifie même lorsque les particules ne sont pas astreintes à se déplacer le long d’une droite. Dans ce cas, le vecteur vitesse de 240
E = Mc2
chaque particule doit être exprimé par ses coordonnées le long de trois directions différentes – par exemple, les directions verticale, nord-sud et est-ouest. La loi générale stipule alors que la quantité de mouvement est conservée indépendamment le long de chacune des trois directions de l’espace. La quantité de mouvement est conservée même lorsque la collision provoque un changement de la population des particules mises en jeu (si par exemple une particule d’un certain type se transforme en deux nouvelles particules de types différents). Supposons par exemple que deux particules 1 et 2 se collent l’une à l’autre pour former une nouvelle particule 3 unique. Lorsque cela se produit, la masse de la nouvelle particule est simplement égale à la somme des deux particules initiales et la quantité de mouvement totale continue à se conserver. L’égalité de m3 avec m1 + m2 est d’une importance capitale. Car si toutes les coordonnées u de vitesse doivent être remplacées par u – v, alors il faut retrancher à la quantité de mouvement totale le terme (m1 + m2)v avant la collision et le terme m3v après. Par conséquent si (m1 + m2)v n’était pas égal à m3v, la quantité de mouvement ne serait pas conservée dans le nouveau référentiel. Cet aspect est si important qu’il s’énonce sous la forme d’une loi de conservation de la masse : si deux particules de masse m1 et m2 fusionnent pour former une nouvelle particule de masse M, alors
M = m1 + m2 (11.5)
Si la loi de conservation de la masse n’était pas valable dans les cas non relativistes, alors la loi de conservation de la quantité de mouvement ne pourrait pas être valable dans tous les référentiels. Comme nous allons le voir, la signification de E = Mc2 est étroitement liée au fait que, souvent, la conservation de la masse n’est plus valable dans les situations relativistes. Pour comprendre comment l’énergie (E) apparaît dans cette histoire, il est nécessaire d’étudier une collision entre deux particules dans un référentiel particulier où la quantité de mouvement totale 241
IL ÉTAIT TEMPS
est nulle. Dans ce référentiel à quantité de mouvement nulle – les physiciens préfèrent l’appeler « référentiel du centre de masse », mais nous utiliserons l’appellation la plus parlante –, nous avons avant la collision :
m1u1i + m2u2i = 0
(11.6)
et vu que la quantité de mouvement est conservée, on a :
m1u1f + m2u2f = 0
(11.7)
après la collision également. Dans le référentiel à quantité de mouvement nulle, les particules se déplacent en sens inverse vu que les coordonnées des vitesses de 1 et 2 ont des signes opposés pour que la quantité de mouvement totale soit nulle. Ainsi, dans le référentiel à quantité de mouvement nulle, les particules s’entrechoquent et repartent avec des vitesses dont le rapport reste le même avant et après la collision : u2i m1 u2 f = = (11.8) u1i m2 u1 f Mais même si les rapports restent identiques, il n’y a rien dans la loi de conservation de la quantité de mouvement qui oblige les vitesses à rester individuellement les mêmes. La loi de conservation de la quantité de mouvement est compatible à la fois avec une augmentation ou avec une diminution des vitesses des particules, à condition que le pourcentage de diminution ou d’augmentation soit le même pour les deux particules. Toutefois, la situation où les vitesses ne sont pas modifiées est un cas particulier intéressant. Dans ce cas, les deux particules s’entrechoquent et repartent chacune de leur côté avec leur vitesse de départ. De telles collisions sont dites élastiques, par opposition aux collisions dites inélastiques au cours desquelles les vitesses des particules sont modifiées dans le référentiel à quantité de mouvement nulle. Une collision inélastique avec diminution de la vitesse des deux particules peut par exemple se produire si les deux particules se collent au moment de leur contact puis perdent un peu 242
E = Mc2
de vitesse lorsqu’elles se décollent. Une collision inélastique avec augmentation des vitesses peut par exemple se produire si la collision a été réglée pour déclencher au moment du choc la détente d’un ressort qui pousserait les particules plus vite qu’elles ne sont venues l’une vers l’autre. Il est important de voir que la quantité de mouvement se conserve même dans des cas comme ceux-ci. Quelles que soient les raisons qui font qu’une collision est élastique ou inélastique, en mécanique classique les collisions élastiques ont droit à un traitement particulier, car, en plus de la quantité de mouvement, il y a une autre grandeur qui se conserve. Certes, la vitesse de chaque particule se conserve dans le référentiel à quantité de mouvement nulle, mais ceci est valable uniquement dans ce référentiel et seulement lorsque deux particules sont mises en jeu. Il est facile de voir quelle doit être cette grandeur si on exige qu’elle se conserve dans tous les référentiels. Définissons « l’énergie cinétique » ec d’une particule de masse m et de coordonnée de vitesse u comme étant
ec =
1 mu 2 (11.9) 2
et Ec l’énergie cinétique totale
Ec = ec1 + ec2 (11.10) 1 Le facteur est une simple convention, il est là pour simplifier 2 les choses ultérieurement (il est possible de redéfinir n’importe quelle grandeur m, p ou ec en introduisant des coefficients arbitraires d’ajustement identiques pour toutes les particules). Comme u1 et u2 se conservent chacun séparément au cours d’une collision élastique dans un référentiel à quantité de mouvement nulle, alors ec1 et ec2 se conservent également ainsi que leur somme Ec. Un nombre illimité d’autres définitions de ec pourraient partager cette propriété. La particularité de la définition (11.9) réside dans le fait que si Ec se conserve dans un référentiel, alors elle est conservée nécessairement dans tous les autres référentiels. C’est une propriété 243
IL ÉTAIT TEMPS
importante, car il n’est pas nécessaire de se placer dans le référentiel à quantité de mouvement nulle pour savoir si une collision est élastique 1 1 m1u12 + m2 u 22 avant et après la 2 2 collision : elle est élastique si et seulement si on trouve la même valeur de Ec avant et après la collision. Comment Ec est-elle modifiée lorsqu’on change de référentiel ? La coordonnée u de la vitesse est transformée en u − v, ce qui transforme 1 l’énergie cinétique ec = mu 2 en 2 1 1 1 1 ec´ = m(u − v )2 = mu 2 − muv + mv 2 = ec − pv + mv 2 (11.11) 2 2 2 2 ou pas. Il suffit de calculer Ec =
Si nous avons deux particules ou plus, il suffit d’additionner les modifications en énergie cinétique de chacune, c’est ainsi que l’énergie cinétique totale dans le nouveau référentiel est 1 Ec´ = Ec − Pv + Mv 2 (11.12) 2 où P est la quantité de mouvement totale et M est la masse totale. Supposons que l’énergie cinétique totale soit la même avant et après la collision dans le référentiel à quantité de mouvement nulle. Alors, vu que la quantité de mouvement totale P et la masse M sont conservées, il s’ensuit que l’énergie cinétique Ec′ est la même avant et après la collision dans le nouveau référentiel. La conservation de la masse et celle de la quantité de mouvement totale entraînent donc la conséquence suivante : si l’énergie cinétique totale se conserve dans un référentiel, alors elle se conserve dans tous les autres référentiels. Si une collision élastique se caractérise par la conservation de l’énergie cinétique totale, alors le caractère élastique d’une collision ne dépend pas du référentiel choisi. Nous arrivons à la fin de notre tour d’horizon des concepts utilisés en mécanique classique. Pour résumer, en mécanique classique, les grandeurs masse, quantité de mouvement et énergie cinétique ont les propriétés suivantes : 244
E = Mc2
Masse : Nous associons à chaque particule une masse m qui est un nombre caractéristique de la particule, indépendant du référentiel dans lequel la particule est décrite. La masse totale d’un groupe de particules est seulement la somme des masses individuelles de ces particules. La masse totale des particules est conservée au cours des collisions. La masse totale est la même dans tous les référentiels : si M est la masse totale dans un référentiel et si M′ est la masse totale dans un second référentiel en mouvement avec une vitesse de coordonnée v par rapport au premier, alors
M′ = M (11.13)
Quantité de mouvement : Si une particule de masse m se déplace avec une vitesse de coordonnée u, nous définissons la quantité de mouvement p par :
p = mu (11.14)
La quantité de mouvement totale P d’un groupe de particules est simplement la somme des quantités de mouvement p individuelles de chaque particule. La quantité de mouvement totale est conservée dans toutes les collisions. P′ est la quantité de mouvement totale dans un second référentiel en mouvement avec une vitesse de coordonnée v par rapport au référentiel d’origine dans lequel la quantité de mouvement est P. P′ est reliée à P de la façon suivante :
P′ = P − Mv (11.15)
où M est la masse totale. Énergie : Si une particule de masse m se déplace avec une vitesse de coordonnée u, on définit son énergie cinétique ec par 1 ec = mu 2 (11.16) 2 245
IL ÉTAIT TEMPS
L’énergie cinétique totale Ec d’un groupe de particules est simplement la somme des énergies cinétiques individuelles. L’énergie cinétique totale est conservée uniquement dans un type particulier de collisions dites élastiques. Si une collision est élastique dans un référentiel, alors elle est élastique dans tous les autres référentiels. Cette propriété découle du fait que l’énergie cinétique totale Ec′ dans un second référentiel en mouvement avec une vitesse de coordonnée v est reliée à l’énergie Ec dans le référentiel d’origine par 1 Ec´ = Ec − Pv + Mv 2 (11.17) 2 où M est la masse totale et P la quantité de mouvement totale dans le référentiel d’origine. Il y a une grande interdépendance entre les lois de conservation (qui précisent les quantités qui sont les mêmes avant et après la collision) et les règles de transformation (qui explicitent comment les grandeurs changent quand on passe d’un référentiel à l’autre). Une loi de conservation met en relation la valeur d’une grandeur avant la collision avec la valeur de la même grandeur après la collision, les deux valeurs étant calculées dans le même référentiel. Pour accéder au statut de loi, elle doit être valable dans tous les référentiels, c’est ainsi que nous devons utiliser les règles de transformation pour vérifier qu’une grandeur candidate à une loi de conservation est bien valable dans tous les référentiels. Dans le cas de la conservation de la masse, c’est facile vu que la masse est la même dans tous les référentiels. La quantité de mouvement se conserve dans tous les référentiels parce qu’elle obéit à la loi de transformation (11.15) et parce que la masse totale est la même avant et après la collision. L’énergie cinétique est conservée dans tous les référentiels (si elle est conservée dans au moins un référentiel) parce qu’elle obéit à la fois à la règle de transformation (11.17) et parce que la quantité de mouvement totale et la masse totale restent identiques avant et après la collision. Il est également important que la grandeur Ec qui n’est qu’occasionnellement conservée n’apparaisse pas dans les règles gouvernant 246
E = Mc2
les transformations des grandeurs P ou M qui, elles, se conservent toujours. Si Ec apparaissait dans la règle de transformation soit de P soit de M alors, vu que Ec n’est pas toujours conservée, ni P ni M ne pourraient être toujours conservées. Nous venons de faire le point sur les conceptions non relativistes de la masse, de la quantité de mouvement, de l’énergie cinétique et sur leurs conservations. Mais quand des vitesses comparables à la vitesse de la lumière sont mises en jeu, toute cette construction non relativiste s’écroule. La belle compatibilité de ces lois de conservation et leurs validités dans tous les référentiels reposent sur la loi de composition non relativiste des vitesses, u′ = u − v. Or dans le cadre relativiste, qui donne une description plus globale du monde, cette règle n’est pas respectée. Dans ce cas, on ne peut plus étendre la conservation de la quantité de mouvement à tous les référentiels si on constate sa validité dans l’un d’entre eux, car la règle simple de transformation (11.15) de la quantité de mouvement n’est plus valable. Nous avons le même problème avec l’énergie cinétique. Ceci ne doit pas nous surprendre. Il n’y a aucune raison de penser que les formules non relativistes de la quantité de mouvement et de l’énergie cinétique d’une particule sont identiques aux formules relativistes. Après tout, même le rythme d’une horloge en mouvement et la longueur d’une règle en mouvement sont modifiés dans le cadre de la théorie relativiste. La question est de savoir s’il est possible de trouver de nouvelles lois de conservation vérifiées par des grandeurs issues de généralisations appropriées des notions non relativistes de masse, de quantité de mouvement et d’énergie cinétique. La recherche de ces généralisations sera guidée par leur obligation de satisfaire à deux contraintes essentielles : 1°) Elles doivent se réduire aux formes non relativistes quand les vitesses des particules deviennent petites par rapport à celle de la lumière, car nous savons que, dans ce cas, le degré de précision des lois de conservation non relativistes est très élevé. 2°) Si les grandeurs correctement généralisées sont conservées dans un référentiel, alors elles doivent l’être aussi dans tous les autres. 247
IL ÉTAIT TEMPS
Commençons par la définition relativiste adéquate de la masse qui est la plus facile à obtenir. Nous garderons exactement la même définition de la masse qu’en mécanique classique en ajoutant uniquement la condition que les vitesses de toutes les particules au cours de la collision utilisée pour déterminer leurs masses doivent être petites par rapport à la vitesse de la lumière. Petites par rapport à quoi ? Cela dépend avec quelle précision nous souhaitons déterminer les masses. Un bon critère pratique serait de dire qu’elles doivent être tellement petites que, si on répétait l’expérience avec des vitesses encore plus petites, les valeurs obtenues pour les masses seraient inchangées et les incertitudes seraient uniquement dues à l’imprécision sur les mesures des vitesses mises en jeu. Vous pourriez objecter que cette procédure ne nous permet pas de déterminer la masse des photons vu que les photons dans le vide ne peuvent pas se déplacer à une autre vitesse que celle de la lumière. Nous considérerons le cas particulier des photons à la fin de ce chapitre. Définie de cette façon, la masse d’une particule continue à être une propriété intrinsèque de la particule, n’ayant rien à voir avec les différentes valeurs de vitesse que la particule peut prendre au cours des collisions successives qu’elle peut être amenée à subir. Sa masse est un invariant indépendant du référentiel. Si jamais il existait une particule dont la masse n’était pas invariante, alors nous pourrions différencier un référentiel inertiel d’un autre en effectuant dans chaque référentiel une collision avec des vitesses réduites pour déterminer la masse de la particule (Dans les débuts de la relativité, tout le monde n’était pas forcément d’accord sur la définition relativiste de la masse, de sorte qu’il était possible de trouver des définitions qui stipulaient que la masse d’une particule dépendait de sa vitesse. Grâce à des modifications compensatoires sur les définitions relativistes de l’énergie et de la quantité de mouvement, leurs expressions étaient les mêmes que celles que nous allons maintenant établir. Par contre, de nos jours, la masse d’une particule est toujours définie comme étant indépendante de sa vitesse). 248
E = Mc2
Pour le moment, nous laisserons de côté la question de savoir si la masse totale définie comme la somme des masses individuelles des particules continue à se conserver dans les collisions où le nombre et le type de particules sont modifiés. Remarquons cependant que tout défaut de conservation de masse doit forcément être très faible lorsque les vitesses des particules mises en jeu dans la collision sont petites par rapport à celle de la lumière, vu qu’en mécanique classique la conservation de la masse totale est vérifiée avec une très grande précision quand toutes les vitesses sont petites par rapport à c. Nous allons maintenant nous occuper de la définition relativiste de la quantité de mouvement d’une particule de masse m. Étant donné que m continue à être un invariant, caractéristique de la particule, quelle grandeur est susceptible de jouer le rôle de la coordonnée u de la vitesse ? Deux critères doivent être respectés : (a) la nouvelle grandeur doit se réduire à u lorsque u est petite par rapport à c ; (b) lorsqu’on se place dans un autre référentiel, la nouvelle grandeur doit être modifiée d’une manière aussi simple que u′ = u − v pour espérer assurer la conservation de la quantité de mouvement dans tous les référentiels. La coordonnée u de la vitesse n’est pas une bonne candidate puisque par changement de référentiel elle est transformée selon la loi de composition relativiste en u−v u´ = (11.18) 1 − uv /c 2 Ici, u′ est la coordonnée de la vitesse dans le nouveau référentiel, u est la coordonnée de la vitesse dans l’ancien référentiel et v est la coordonnée de la vitesse du nouveau référentiel par rapport à l’ancien. C’est le dénominateur de (11.18) qui empêche la transformation de la quantité de mouvement totale P′ = m1u1′ + m2u2′ d’avoir une forme suffisamment simple pour assurer sa conservation dans le nouveau référentiel. Comme u apparaît au dénominateur (ainsi qu’au numérateur) de (11.18), si nous continuons à utiliser la définition non relativiste de la quantité de mouvement (11.14), mais avec la loi de composition relativiste des vitesses (11.18), alors la quantité de 249
IL ÉTAIT TEMPS
mouvement dépendra étroitement des coordonnées u des vitesses de chaque particule dans l’ancien référentiel (lorsque nous avons utilisé la loi de composition non relativiste des vitesses (11.15), les coordonnées individuelles des vitesses apparaissaient aussi dans l’expression de la quantité de mouvement totale non relativiste dans le nouveau référentiel, mais leur combinaison correspondait exactement à la quantité de mouvement totale dans l’ancien référentiel). Pourquoi la relativité introduit-elle ce dénominateur compliqué dans (11.18) ? Rappelez-vous la définition de la vitesse : la distance parcourue divisée par la durée du parcours. Dans le cas non relativiste, le changement de référentiel change la distance parcourue, mais pas la durée du parcours, alors seul le numérateur est affecté. En revanche, dans le cas relativiste, la distance et la durée sont à la fois modifiées, ce qui conduit à l’expression (11.18), plus complexe. Ce qui nous suggère une façon simple et élégante de résoudre ce problème. Pour trouver une définition de la quantité de mouvement, il faut généraliser la vitesse d’une particule à la distance parcourue par une particule divisée par la durée de son parcours, mais en mesurant cette durée dans un référentiel choisi de façon à mettre d’accord tous les observateurs entre eux. Quel pourrait être ce référentiel ? Poser la question, c’est y répondre. Chaque particule ne peut juger spécifique qu’un seul et unique référentiel : le référentiel dans lequel elle est au repos. Supposons alors que nous définissions la coordonnée w de vitesse généralisée comme étant la distance que parcourt une particule en un temps donné en imposant que ce temps soit toujours mesuré avec une horloge qui suit la particule dans son mouvement. Ceci respecte bien le fait que w est indifférenciable de u lorsque la particule se déplace à des vitesses faibles, étant donné que le rythme de l’horloge qui suit la particule est très peu modifié. C’est ainsi qu’à présent, lorsque nous passons d’un référentiel à l’autre, la distance mise en jeu dans la définition de w change, mais pas le temps. Ainsi, si nous redéfinissons la quantité de mouvement p comme étant mw, ce qui 250
E = Mc2
est très peu différent de p = mu à des vitesses faibles, nous pouvons espérer trouver une règle de transformation simple pour p. Comme m est un invariant, il nous reste à voir comment w va se transformer. La coordonnée w de vitesse généralisée se distingue de la coordonnée u de vitesse ordinaire uniquement parce que le mouvement de la particule est chronométré par une horloge qui se déplace avec la particule plutôt que par des horloges immobiles et synchronisées entre elles dans le référentiel où la particule est en mouvement. Cette horloge en mouvement fonctionne plus lentement par rapport aux horloges immobiles, par conséquent elle mesurera un temps moins long pour une certaine distance parcourue. Le facteur de ralentissement
1 − u2 /c 2 permet de calculer la réduction du temps de par-
cours, w sera donc plus grande que u d’un facteur 1 / 1 − u2 /c 2 :
w = u / 1 − u2 /c 2 (11.19)
À partir de l’expression (11.19), on peut utiliser la règle de transformation relativiste (11.18) pour trouver comment w est modifiée quand on passe dans un référentiel en mouvement à la vitesse v. Dans le nouveau référentiel, w′ est donné par :
w ´ = u ´ / 1 − u 2 /c 2 , (11.20)
où u′ est reliée à u par la loi de composition des vitesses (11.18). En remplaçant u′ dans (11.20) par son expression donnée par (11.18) et en simplifiant l’expression obtenue, on obtient u−v . (11.21) w´ = 2 1 − v / c 2 1 − u2 /c 2 La démonstration de ce résultat est la difficulté mathématique la plus épineuse de toute cette affaire, mais nous allons aboutir à des conclusions si profondes que cette épreuve vaut la peine d’être endurée au moins une fois dans sa vie. Si vous ne trouvez pas la motivation nécessaire pour effectuer ces manipulations algébriques, remarquez au moins que l’égalité (11.21) est vérifiée lorsqu’on pose que v = 0 (auquel 251
IL ÉTAIT TEMPS
cas elle se réduit à w = w′), lorsque v = u (auquel cas on se place dans un référentiel où la vitesse de la particule est nulle) et lorsque u = 0 (auquel cas la particule est immobile dans le référentiel d’origine et se déplace avec une vitesse de coordonnée − v dans le nouveau référentiel). Ainsi, si nous définissons la quantité de mouvement relativiste par mu p = mw = , (11.22) 1 − u2 / c 2 alors (11.21) nous dit que p − p0 v p´ = , (11.23) 1 − v 2 /c 2 où j’ai défini une nouvelle grandeur p0 par
p0 =
m 1 − u2 / c 2
. (11.24)
Nous approchons du but, car la relation (11.23) relie assez simplement la quantité de mouvement dans le nouveau référentiel à celle dans l’ancien. Le facteur 1 − v 2 /c 2 au dénominateur dans (11.23) peut vous effrayer, mais n’oubliez pas qu’il s’agit juste d’un nombre qui est déterminé par le mouvement du nouveau référentiel par rapport à l’ancien. Il est indépendant de la vitesse de la particule et par conséquent c’est exactement le même nombre qui apparaîtra dans la règle qui donne la quantité de mouvement dans le nouveau référentiel pour chaque particule participant à la collision. Le seul vrai problème – et il est sérieux –, c’est l’apparition de ce nouveau terme p0 dans la règle (11.23). Pour comprendre l’apparition de cet intrus, il faut d’abord considérer une situation où la vitesse u de la particule est petite par rapport à la vitesse de la lumière. Dans ce cas, (11.24) nous dit que p0 et la masse m deviennent si proches qu’il est impossible de les différencier. Si on remplace p0 par m dans la règle de transformation (11.23) et qu’on l’applique à la quantité de mouvement totale de deux particules, on obtient
252
P´ =
P − Mv 1 − v 2 /c 2
, (11.25)
E = Mc2
qui, à part le dénominateur, est simplement la règle de transformation non relativiste. La présence du dénominateur ne doit pas nous inquiéter vu que ce n’est qu’un nombre (fixé par le mouvement relatif des deux référentiels) qui reste le même avant et après la collision. Nous pouvons donc conclure à partir de (11.25), exactement comme nous l’avons fait dans le cas non relativiste, que si P est le même après et avant une collision, alors P′ le sera également à condition que la masse totale M se conserve au cours de la collision. Mais pour une particule dont la vitesse n’est pas faible devant celle de la lumière, p0 n’est pas assimilable à la masse m. Si nous voulons que la quantité de mouvement, telle qu’elle a été définie en (11.22), se conserve dans tous les référentiels, alors nous devons remplacer la loi de conservation de la masse totale par une nouvelle loi : la conservation du p0 total. Avec ce remplacement, nous restons dans l’esprit de notre tentative de généralisation de la loi de conservation non relativiste de la quantité de mouvement et le p0 total s’exprime donc par : m1 m2 P 0 = p10 + p20 = + . (11.26) 2 2 1 − u1 /c 1 − u 22 /c 2 Vu que ceci se réduit à la conservation de la masse totale quand les deux vitesses sont petites par rapport à c, nous découvrons que la loi non relativiste de conservation de la masse est un cas particulier d’une loi relativiste générale, exactement comme la loi non relativiste de conservation du mu total est un cas particulier de conservation de la grandeur relativiste issue de la généralisation du concept de quantité de mouvement
P = p1 + p2 =
m1u1 1 − u12 /c 2
+
m2 u 2 1 − u 22 /c 2
(11.27)
Mais avant d’ériger la conservation de P0 au statut de loi, il est impératif de vérifier qu’elle est effectivement valable dans tous les référentiels. Ce qui va nécessiter une nouvelle série d’affreux calculs 253
IL ÉTAIT TEMPS
du type de ceux qui nous ont conduits à (11.23). Nous devons appliquer la loi relativiste de composition des vitesses (11.18) à la définition m p0´ = (11.28) 1 − u 2 /c 2 pour exprimer p0′ en fonction des grandeurs associées à l’ancien référentiel. Une fois ceci fait, on obtient p0 − pv /c 2 p0´ = . (11.29) 1 − v 2 /c 2 (On peut extraire de façon plus élégante le résultat (11.29) en divisant le côté gauche de la loi de conservation de la quantité de mouvement (11.23) par le côté gauche de la règle de transformation de la vitesse (11.18) et le côté droit par le côté droit et identifier ce que l’on obtient avec les définitions de p0 et p.) La forme obtenue est semblable à celle de la règle de transformation (11.23) pour la quantité de mouvement. Grâce aux deux formes très simples des règles de transformation (11.23) et (11.29) de p et p0 pour une particule individuelle, les transformations de P (la quantité de mouvement totale) et de P0 (le p0 total) ont exactement la même forme que (11.23) et (11.29) : P − P0 v P´ = , (11.30) 1 − v 2 /c 2
P 0´ =
P 0 − Pv / c 2
. (11.31) 1 − v 2 /c 2 Comme ces deux relations expriment P′ et P0′ entièrement en fonction de P et P0 (et de la vitesse relative v des deux référentiels) si P et P0 sont conservées par la collision, alors P′ et P0′ le sont forcément aussi. Si P tout comme P0 sont conservées dans un référentiel, alors elles le seront toutes deux dans n’importe quel autre référentiel. La généralisation relativiste (11.22) du concept de quantité de mouvement que nous avons proposée possède toutes les propriétés requises pour être une grandeur conservée, tout comme la nouvelle grandeur P0 dont la conservation doit être également prise en compte. 254
E = Mc2
Quelles sont les implications du remplacement de la conservation non relativiste de la masse totale par la conservation relativiste de P0 ? Comment pouvons-nous interpréter p0 et la somme P0 des valeurs p0 de tout un groupe de particules ? En examinant la forme que prendrait p0 si la vitesse u est petite devant celle de la lumière, nous pourrions obtenir quelques indications intéressantes. Dans ce cas limite, l’expression (11.24) nous dit simplement ce que nous savons déjà : p0 devient très proche de m, la masse de la particule. Mais comme nous sommes en train d’essayer de comprendre la différence entre l’ancienne loi de conservation non relativiste de la masse totale M et la nouvelle loi de conservation relativiste de p0, nous avons donc besoin d’une estimation de la différence entre p0 et m lorsque u est petite par rapport à c. D’accord, nous savons déjà que la différence est très petite, mais nous souhaiterions en savoir un peu plus. Un peu plus loin dans ce chapitre (page 263), nous montrerons que lorsque u est très petite par rapport à c, l’expression suivante est une bonne approximation de la différence (p0 − m) : 1 p0 − m = mu2 / c 2 (11.32) 2 Par conséquent, pour des vitesses non relativistes, la différence (p0 − m) est simplement égale à l’énergie cinétique non relativiste divisée par c2 (les calculs menant à (11.32) ne sont pas compliqués, mais il vaut mieux laisser cela pour plus tard pour ne pas interrompre le fil de l’histoire). Ainsi, si nous définissons l’énergie cinétique relativiste par
ec = p0c 2 − mc 2 (11.33)
alors ec se réduit à l’énergie cinétique classique non relativiste pour des vitesses faibles devant celle de la lumière, et nous avons notre interprétation de p0 : la grandeur intéressante n’est pas p0 en soi, mais le produit de p0 par c2 qui est la somme de deux termes :
p0c 2 = mc 2 + ec . (11.34)
255
IL ÉTAIT TEMPS
Nous avons maintenant atteint notre objectif. Pour que la quantité de mouvement relativiste totale P soit conservée, il faut que P0 le soit aussi
P 0c 2 = Mc 2 + Ec , (11.35)
M et Ec étant respectivement la masse totale et l’énergie cinétique totale. Rappelons-nous de la conception non relativiste des choses. La masse totale M est toujours conservée, alors que l’énergie cinétique totale n’est conservée qu’au cours des collisions élastiques. Dans la théorie relativiste, on peut continuer à qualifier d’élastique une collision au cours de laquelle l’énergie cinétique Ec se conserve. Mais P0 doit se conserver dans tous les cas (que les collisions soient élastiques ou inélastiques), car sinon la quantité de mouvement ne pourrait pas se conserver dans tous les référentiels. Comme P0 est reliée à Ec et à M par la relation (11.35), il s’ensuit que si Ec est conservée, alors M aussi doit être conservée. Mais si Ec n’est pas conservée, il est impossible que M le soit. Dans une collision inélastique, si l’énergie cinétique totale change d’une quantité Ec = Ecf − Eci , alors pour que P0 soit conservée au cours de la collision, (11.35) requiert que la variation d’énergie cinétique soit compensée exactement par la variation de la masse totale par M = M f − Mi :
Mc 2 = Ec (11.36)
Ce rééquilibrage d’une perte (ou d’un gain) en énergie cinétique par un gain (ou une perte) compensatoire en masse doit être valable que les vitesses soient petites ou proches de la vitesse de la lumière puisque la théorie de la relativité doit être valable pour toutes les valeurs de vitesse. Alors pourquoi n’avons-nous jamais remarqué ce phénomène dans les collisions non relativistes où la masse totale semblait se conserver ? Tout simplement parce que dans des conditions non relativistes, la différence de masse est si faible qu’il est impossible de la détecter. La différence est M = Ec /c 2 et l’ordre de grandeur de la variation d’énergie cinétique Ec est égal au produit de la masse totale M par 256
E = Mc2
u2, le carré de l’ordre de grandeur des vitesses des particules. Donc la variation de masse M est égale au produit de la masse totale M par un facteur dont l’ordre de grandeur est u2/c2. Pour des vitesses plus faibles que la vitesse du son, u2/c2 est plus petit que 1/1 000 000 000 000. Mais jamais aucune masse n’a été mesurée avec un niveau de précision aussi important (une partie pour mille milliards). Ainsi, la variation de masse au cours des collisions inélastiques prévue par la théorie de la relativité est bien trop petite pour être observée dans des conditions non relativistes. La conservation exacte de p0c2 se déguise en conservation de la masse totale lorsque les vitesses sont faibles devant celle de la lumière. Mais à des vitesses relativistes, les conséquences de la loi exacte de conservation relativiste peuvent être significatives. Au risque de quitter le sublime pour des choses plus académiques, il faut noter qu’on définit P0c2 comme étant E, l’énergie totale et p0c2 comme étant l’énergie individuelle e d’une particule. Nous avons donc défini l’énergie et la quantité de mouvement d’une particule de masse m et se déplaçant à la vitesse u :
e=
p=
mc 2 1 − u2 / c 2 mu 1 − u2 / c 2
, (11.37) . (11.38)
Les règles de transformation (11.30) et (11.31) deviennent E − Pv
E´ =
P − E v /c 2 P´ = . (11.40) 1 − v 2 /c 2
1 − v 2 /c 2
, (11.39)
Remarquons que la relation (11.37) stipule que l’énergie e d’une particule de masse m au repos est égale à mc2. Ceci est souvent avancé 257
IL ÉTAIT TEMPS
comme étant la signification de E = Mc2. La véritable signification est à chercher dans les collisions inélastiques, dans l’expression (11.36) qui impose qu’une variation de masse soit compensée par une variation d’énergie cinétique : si de l’énergie cinétique est gagnée au cours de la collision, alors la masse totale doit diminuer ; si de l’énergie cinétique est perdue, alors la masse totale doit augmenter. Si par exemple deux objets s’entrechoquent dans leur référentiel à quantité de mouvement nulle pour fusionner et former un nouvel objet immobile, la masse de ce nouvel objet est supérieure à la somme des masses des deux objets incidents d’une quantité égale à la somme des énergies cinétiques des objets incidents divisée par c2. Les physiciens qui souhaitent produire de nouvelles particules « élémentaires », beaucoup plus massives que toutes celles qu’ils ont observées jusqu’à présent, doivent projeter des particules plus légères les unes contre les autres à des vitesses proches de celle de la lumière dans l’espoir que leur énergie cinétique se transforme en supplément de masse après la collision. D’où la popularité des accélérateurs de particules dans ces milieux scientifiques. Et inversement, lorsqu’une particule « mère » immobile se décompose spontanément en deux particules « filles » éjectées à très grande vitesse, la masse totale en présence diminue d’une quantité exactement égale à l’énergie cinétique des particules filles divisée par c2. On entend souvent dire que l’impressionnante puissance des explosions nucléaires est une manifestation directe de E = Mc2. Il serait tout aussi correct de dire cela à propos des explosions chimiques ordinaires. Dans les deux cas, la masse totale de toute la matière éjectée au cours de l’explosion est plus faible que la masse des ingrédients initiaux de l’explosion, la différence étant égale à l’énergie cinétique totale produite par l’explosion divisée par c2. La différence, c’est que, dans le cas d’une explosion chimique, la matière est projetée à des vitesses faibles par rapport à la vitesse de la lumière, le changement de masse est donc beaucoup trop petit pour être détecté (en supposant qu’on puisse rassembler toute la matière éjectée par l’explosion). Comme 258
E = Mc2
les forces responsables d’une explosion nucléaire sont beaucoup plus importantes que les forces chimiques, la matière est éjectée à des vitesses beaucoup plus importantes et le changement de masse peut représenter jusqu’à 0,1 % de la masse initiale : la proportion est toujours faible, mais elle n’est plus trop petite pour être mesurée. Les forces électriques gouvernent les explosions ordinaires, car elles sont responsables des liaisons chimiques. Il serait donc plus correct de dire qu’une explosion nucléaire est beaucoup plus puissante qu’une explosion chimique ordinaire parce qu’elle met en œuvre des forces nucléaires qui sont beaucoup plus puissantes que les forces électriques. Le fait que les forces nucléaires soient si puissantes qu’il est possible de détecter des changements de masse (certes faibles, mais pas trop pour être mesurés) est une impressionnante manifestation de la puissance de ces forces. Une des preuves les plus anciennes de la puissance considérable des forces responsables de la cohésion du noyau atomique fut apportée par le fait que les masses des noyaux diffèrent de quelques parties par milliers des masses des constituants qui forment le noyau. Dans son premier article à propos de E = Mc2, à peine quelques mois après son premier article sur la relativité, Einstein a suggéré que sa formule pouvait expliquer cette différence : « Il n’est pas exclu que l’on puisse vérifier la théorie avec des corps dont le contenu en énergie varie dans de grandes proportions, par exemple avec les sels de radium5. » Le fait que l’énorme quantité d’énergie produite au cours d’une explosion nucléaire ne corresponde qu’à peine à environ 1/1 000e de la masse du corps qui explose nous apporte une mesure de la difficulté à produire (ou à arrêter) un mouvement dont la vitesse est comparable à celle de la lumière. Supposons par exemple qu’un objet de masse m se 3 déplace à de la vitesse de la lumière de façon que son énergie (11.37) 5 5. A. Einstein, « L’inertie d’un corps dépend-elle de l’énergie qu’il contient ? », Annalen der Physik 18 (1905) : 639-41. 259
IL ÉTAIT TEMPS
5 2 1 mc et par conséquent ec = e − mc 2 = mc 2. Faire explo4 4 ser une bombe atomique de masse M produit une énergie égale à Mc 2 3 , c’est pour cela que le lancement d’un objet à de la vitesse 1 000 5 de la lumière nécessite l’énergie libérée par une bombe atomique de masse égale à 250 fois celle de l’objet. 3 Autrement dit, si un objet se déplace à de la vitesse de la lumière 5 et qu’il entre brutalement en collision avec une impressionnante barrière immobile et impénétrable, alors l’énergie produite par la collision serait celle d’une bombe atomique dont la masse serait 250 fois celle de l’objet. Les voyages en fusée à une vitesse proche de celle de lumière comme au cinéma : ce n’est pas pour demain ! Mais, alors que la définition relativiste (11.37) de l’énergie implique que l’énergie d’une particule augmente sans limites alors que sa vitesse s’approche de plus en plus de celle de la lumière, il y a tout de même des particules (les photons par exemple) qui se déplacent à la vitesse de la lumière. Pourtant, la production d’un photon ne nécessite pas une énergie infinie : comment pouvons-nous expliquer cela ? La première chose à noter est que (11.37) permet à une particule de se déplacer à une vitesse u égale à la vitesse de la lumière c sans avoir une énergie infinie à condition que la masse de la particule soit nulle. Par contre, les définitions relativistes de l’énergie et de la quantité de mouvement (11.37) et (11.38) ne nous apprennent rien sur les particules de masse nulle dont la vitesse u = c étant donné que la division par zéro n’a pas de sens. Ces deux équations renferment deux conséquences qui restent parfaitement définies, même dans le cas limite où la masse est nulle. On peut facilement déduire de (11.37) et (11.38) que soit e =
et que
260
e 2 = p2c 2 + m2c 4 , (11.41) p = eu / c 2 (11.42)
E = Mc2
Et réciproquement, il est possible de partir de (11.42) et (11.43) pour en déduire facilement (11.37) et (11.38). Les deux paires d’équations sont parfaitement équivalentes. Mais, contrairement à (11.37) et (11.38), les formes équivalentes (11.42) et (11.41) ont une forme tout à fait interprétable même lorsqu’elles sont appliquées aux particules de masse nulle. Quand m = 0, (11.41) se réduit à p = e/c (11.43) La relation (11.42) est vérifiée à condition que la vitesse u de la particule de masse nulle soit égale à la vitesse invariante c. Par conséquent, les définitions relativistes de l’énergie et de la quantité de mouvement peuvent être appliquées à une particule de masse nulle à condition que la vitesse de cette particule soit égale à la vitesse de la lumière c et que l’énergie d’une telle particule soit égale au produit de c par sa quantité de mouvement. Il se trouve que dans de très nombreuses situations (11.41) et (11.42) sont beaucoup plus faciles à utiliser que (11.37) et (11.38), même pour les particules de masse non nulle, ainsi, tandis que (11.37) et (11.38) jouent un rôle fondamental dans la justification des nouvelles définitions de l’énergie et de la quantité de mouvement, c’est (11.41) et (11.42) qui résument le mieux leurs caractéristiques. Il est possible d’envisager la quantité p0 suivant une perspective qui relie entre eux les concepts relativistes d’énergie et de quantité de mouvement d’une façon qui n’est pas concevable en mécanique classique non relativiste. La quantité de mouvement d’une particule dans un référentiel donné est le produit de la masse de la particule par le taux horaire avec lequel la particule se déplace à travers l’espace (on mesure la distance parcourue dans le référentiel pendant qu’une horloge qui se déplace avec la particule avance de 1 seconde). De façon analogue, p0 est le produit de la masse de la particule par le taux horaire avec lequel la particule se déplace à travers le temps (on mesure de combien avancent les horloges du référentiel pendant qu’une horloge qui se déplace avec la particule avance de 1 seconde). Cela semble absurde pour des oreilles non relativistes : comment quelque chose peut-il se déplacer dans le temps à un taux horaire 261
IL ÉTAIT TEMPS
différent de 1 seconde par seconde ? Voilà pourquoi la conservation non relativiste de p0 se réduit à la conservation de la masse. Mais, dans le cadre relativiste, on peut le voir comme une façon élégante d’exprimer le facteur de ralentissement d’une horloge en mouvement. Plus une particule a une vitesse importante (dans un référentiel donné), plus elle traversera une longue durée de ce même référentiel pendant 1 seconde mesurée par une horloge qui la suit dans son mouvement (car lorsque sa vitesse augmente, les horloges du référentiel avancent d’un temps de plus en plus long pendant 1 seconde de son temps propre). Par exemple, si une particule se déplace à une vitesse égale à 3 de la vitesse de la lumière dans un certain référentiel, elle se déplace 5 5 à travers le temps à un taux horaire de de seconde par seconde 4 propre. C’est une manière inversée de voir les choses, qui est peut-être plus profonde et plus porteuse de sens et qui revient à dire que n’importe quel processus interne se déroulant dans le temps de la particule est ralenti d’un certain facteur de ralentissement : pour chaque seconde qui passe sur n’importe quelle horloge se déplaçant avec la particule, les horloges du référentiel dans lequel la particule se déplace avancent de 1,25 seconde. Quand un objet va de plus en plus vite à travers l’espace, il lui faut de moins en moins de temps propre pour aller d’un point A à un point B, mais on peut tout aussi bien dire qu’il traverse le temps plus rapidement puisqu’il lui faut de moins en moins de temps propre pour aller d’un instant tA à un instant tB du référentiel dans lequel il est en mouvement (à la fin du chapitre 8, nous avons dit, au contraire, que lorsqu’une horloge va de plus en plus vite à travers l’espace, son parcours à travers le temps ralentit. La contradiction n’est qu’apparente, car dans le chapitre 8 on exprimait la vitesse à travers le temps d’une horloge en mouvement dans un certain référentiel en notant le temps qui passe sur l’horloge en mouvement chaque fois que le temps avance de 1 seconde dans le référentiel, alors qu’ici nous notons le temps qui passe sur les horloges du référentiel à chaque fois que l’horloge en mouvement avance de 1 seconde). 262
E = Mc2
Il nous reste encore un peu de travail à faire : nous devons démontrer l’expression (11.32) de p0 − m valable quand la vitesse u de la particule est petite par rapport à la vitesse de la lumière c. Les définitions (11.22) et (11.24) de p et p0 nous permettent d’écrire que : ou
p02 − p2 /c 2 = m2 (11.44) p02 − m2 = ( p0 − m)( p0 + m) = p2 /c 2 (11.45)
ou
( p0 − m) =
p2 (11.46) ( p0 + m)c 2
Le côté gauche de (11.46) représente exactement ce que nous cherchons : la différence entre p0 et m. Mais malheureusement, le côté droit contient aussi p0, mais comme nous ne sommes intéressés que par la valeur de p0 − m lorsque u est petit par rapport à c, alors on peut assimiler p0 à la masse m. Quand u est petit par rapport à c, il est possible de donner une estimation très précise du côté droit de (11.46) en remplaçant seulement p0 par m. Dans ces mêmes conditions, p est aussi très proche de la grandeur non relativiste mu. Ces petits ajustements sur le côté droit de (11.46) nous permettent d’obtenir une très bonne approximation de (11.46). Lorsqu’une particule se déplace avec une vitesse faible par rapport à celle de la lumière, l’égalité suivante est valable avec une excellente précision : 1 p0 − m = mu2 /c 2 (11.47) 2 Le tableau 11.1 synthétise toutes les caractéristiques de la masse, de la quantité de mouvement et de l’énergie et permet de comparer la théorie relativiste avec la mécanique classique (non relativiste). Nous conclurons le chapitre avec des exemples d’utilisations des lois relativistes de conservation dans des problèmes simples de collisions qui ressembleront à celles que nous avons étudiées au chapitre 1.
263
IL ÉTAIT TEMPS
Tableau 11.1 | Comparaison des propriétés relativistes et non relativistes de l’énergie, de la quantité de mouvement et de la masse de deux particules
Non relativiste
Relativiste
Masse
M = m1 + m2
M = m1 + m2
Conservée ?
Toujours
Seulement au cours des collisions élastiques
Transformation
M′ = M
M′ = M
Quantité de mouvement
P = m1u1 + m2u2
P=
Conservée ?
Toujours
Toujours
Transformation
P´ = P – Mv
P´ =
Énergie
E =
Conservée ?
Seulement au cours des collisions élastiques
Transformation
E´ = E – Pv +
1 1 m1 u12 + m2 u22 2 2
1 2 Mv 2
E =
m1u1 1 – u12 /c 2
+
m2u2 1 – u22 /c 2
P – vE /c 2 1 – v2 /c 2 m1c2 1 – u12 /c 2
+
m2c 2 1 – u22 /c 2
Toujours E´ =
E – vP 1 – v 2 /c 2
Remarques : « Conservée » signifie que la grandeur reste la même avant et après la collision. Les lignes « Transformation » donnent l’expression d’une grandeur prime (′) valable dans un référentiel se déplaçant avec une vitesse de coordonnée v par rapport à un référentiel d’origine où les valeurs des grandeurs sont notées sans prime. Les lois de conservation obéissent au principe de relativité : si elles sont valables dans un référentiel inertiel, elles sont alors valables dans tous les autres. Mais ceci est seulement vrai pour des grandeurs non relativistes si on utilise la loi (généralement fausse) de composition non relativiste des vitesses pour passer d’un référentiel à l’autre. Pour comparer les conceptions relativistes et non relativistes, il est utile de remarquer que lorsque la vitesse d’une particule est petite vis-à-vis de celle de la lumière, alors son mc 2 énergie est presque égale à mc 2 + 1 mu 2 . Remarquez les différents rôles 2 1 − u 2 /c 2 joués par les collisions inélastiques dans les théories relativistes et non relativistes. En mécanique classique, la masse est conservée au cours des collisions inélastiques, mais ce n’est pas le cas de l’énergie cinétique ; en relativité restreinte, l’énergie est conservée même au cours des collisions inélastiques, alors que la masse ne l’est pas. Même si les entrées du tableau sont spécifiées pour une paire de particules, les mêmes types de relations sont valables pour un nombre quelconque de particules.
264
E = Mc2
Il n’est pas nécessaire que le nombre de particules avant et après la collision reste identique. S’il ne reste plus qu’une seule particule après la collision, il s’agit alors d’un phénomène où plusieurs particules fusionnent pour n’en former qu’une seule ; s’il n’y a qu’une particule avant la « collision », il s’agit alors d’un phénomène de désintégration d’une particule en plusieurs autres.
En guise d’illustration concrète des lois de conservation relativistes, nous allons examiner une situation où un photon (qui se déplace évidemment à une vitesse c, extrêmement relativiste) entre en collision avec une particule au repos de masse mi. Nous supposerons que le photon est absorbé par la particule. Ceci est une version relativiste (et asymétrique, car les deux particules ne sont plus du tout identiques) de la collision que nous avons examinée dans le chapitre 1 où deux particules se collent l’une à l’autre pour former une nouvelle particule unique. Si le photon a une énergie ω, avec quelle vitesse la particule qui absorbe le photon va-t-elle être projetée après avoir absorbé le photon et quelle sera la masse mf de la particule ? (les indices i et f signifiant respectivement initiale et finale). Les réponses à ces questions nous sont directement fournies par les lois de conservations de l’énergie totale et de la quantité de mouvement. Avant la collision, le photon a une énergie ω et la particule a une énergie mic2, c’est ce que nous dit (11.37) – ou bien l’association de (11.41) et (11.42) – pour une particule de masse mi et de vitesse u = 0. Après la collision, la particule a absorbé le photon et se retrouve avec une énergie e. La conservation de l’énergie exige que :
ω + mi c 2 = e (11.48)
Si nous notons k la quantité de mouvement du photon avant la collision, (11.43) nous dit qu’elle est reliée à son énergie ω par la relation suivante : k = ω /c (11.49) 265
IL ÉTAIT TEMPS
et la quantité de mouvement initiale de la particule est nulle, car elle est au repos. Après la collision, la quantité de mouvement de la particule est p et le photon a disparu. Par conséquent, la conservation de la quantité de mouvement totale implique que la particule finale s’empare de toute la quantité de mouvement initialement possédée par le photon : p = k = ω /c (11.50) Si nous connaissons l’énergie et la quantité de mouvement d’un objet, il est très facile d’en déduire sa vitesse directement de (11.42) : si un objet se déplace avec une vitesse de coordonnée u, son énergie e et sa quantité de mouvement p sont reliées par l’expression p = eu/c2. Par conséquent, le rapport de la vitesse u sur la vitesse de la lumière est donné par : u/c = cp/e (11.51) L’utilisation des expressions (11.50) et (11.48) de p et de e nous donne la réponse suivante : 1 u /c = (11.52) 1 + mi c 2 /ω Si mic2 est grand par rapport à l’énergie ω du photon, alors la vitesse de la particule est une faible fraction de la vitesse de la lumière. Mais quand ω est de l’ordre de grandeur de mic2 de la particule, la particule acquiert une vitesse qui peut s’approcher de celle de la lumière. Pour que la vitesse de la particule soit très proche de celle de la lumière, il faut que ω soit très largement supérieur à mic2. Remarquons toutefois que quelle que soit la valeur prise par ω , (11.52) impose à la vitesse u de la particule de ne jamais pouvoir être tout à fait égale à c. La façon la plus simple de trouver la masse mf de la particule après qu’elle ait absorbé le photon est d’utiliser la relation (11.41) entre l’énergie, la quantité de mouvement et la masse. Lorsqu’on l’applique à la particule une fois qu’elle a absorbé le photon, on obtient : (m f c 2 )2 = e 2 − ( pc)2 (11.53) 266
E = Mc2
En remplaçant p et e par leurs expressions (11.50) et (11.48), nous en déduisons que mf vérifie la relation suivante :
(m f c 2 )2 = (ω + mi c 2 )2 − ω2 = (mi c 2 )(2ω + mi c 2 ) (11.54) Ainsi, une fois le photon absorbé, la masse de la particule devient
m f = mi 1 + 2ω / mi c 2 (11.55)
La masse mf de la particule, après avoir absorbé le photon, peut augmenter de façon significative par rapport à mi si la valeur de ω est comparable ou largement supérieure à mic2. Notons qu’il est possible d’utiliser (11.52) pour exprimer la relation (11.55) entre la masse initiale et la masse finale à partir de la vitesse u de la particule finale. Le résultat s’obtient facilement et il est curieux de constater que le rapport des masses est tout simplement égal au facteur Doppler du chapitre 7 :
m f /mi =
1 + u /c (11.56) 1 − u /c
Il est possible de procéder à un traitement relativiste précis du problème abordé dans le chapitre 1 où deux objets identiques se collent l’un à l’autre pour n’en former qu’un seul. Dans le référentiel où ils sont lancés l’un vers l’autre avec des vitesses égales, la symétrie de la situation exige que l’objet composé formé après la collision reste immobile, et cela, même dans le cadre relativiste. Mais qu’arrive-til si un des objets est initialement immobile et que l’autre est lancé directement sur lui ? Dans le cadre non relativiste, nous avons facilement trouvé un référentiel dans lequel cette nouvelle situation correspond à l’ancienne : le référentiel se déplaçant dans le sens du premier objet avec la moitié de la vitesse u. Cela nous a conduits à la conclusion que dans le référentiel de départ, l’objet composé devra se déplacer à la u vitesse . Nous pouvons résoudre le problème de la même façon 2 267
IL ÉTAIT TEMPS
dans le cadre relativiste, mais la recherche de la vitesse du référentiel dans lequel la collision est symétrique est plus complexe, car nous devons utiliser la loi relativiste de composition des vitesses. Si nous observons la collision dans un référentiel se déplaçant dans le même sens que le premier objet avec une vitesse v, alors, dans ce référentiel, le second objet immobile dans le référentiel de départ se déplace dans le sens opposé avec la vitesse v. La vitesse du premier objet dans ce nouveau référentiel est u−v w= (11.57) 1 − uv J’ai choisi ici de mesurer les distances en pieds et le temps en nanosecondes de façon à ce que c soit égale à 1 pied par nanoseconde, ce qui fait qu’elle n’apparaît pas dans la loi de composition, ce qui nous facilite grandement la tâche. C’est une astuce que les utilisateurs professionnels de la relativité utilisent de manière courante. Toutes les vitesses qui apparaîtront à la fin seront en pieds par nanoseconde et par conséquent peuvent être directement interprétées comme des fractions de la vitesse de la lumière. Si vous le souhaitez, vous pouvez réintroduire c à la fin en remplaçant chaque vitesse par la fraction v/c. Pour que la collision soit symétrique dans le référentiel en mouvement, nous avons besoin que la vitesse w du premier objet dans ce référentiel soit aussi égale à v, par conséquent la vitesse v doit vérifier la relation suivante : u−v v= (11.58) 1 − uv La vitesse finale de l’objet composé sera v dans le référentiel de départ étant donné qu’il reste immobile dans ce référentiel qui a justement été choisi pour que la collision soit symétrique. La condition (11.58) nous oblige à résoudre une équation du second degré où la vitesse v est l’inconnue (alors même que nous avons utilisé une forme simplifiée où le facteur c n’apparaît pas). La résolution de cette équation n’est pas au-dessus de nos capacités, mais sa difficulté 268
E = Mc2
dépasse le seuil du niveau mathématique que je me suis fixé pour ce livre. Il est plus facile de trouver la réponse directement dans le référentiel de départ en utilisant les lois de conservation. La vitesse finale uf de l’objet composé est reliée à sa quantité de mouvement pf et à son énergie ef par (11.42) qui donne (en prenant c = 1 pi/ns) : u f = p f /e f (11.59) Comme il n’y a qu’un seul objet après la collision, pf est la quantité de mouvement totale finale. Avant la collision, seul le premier objet se déplace, la quantité de mouvement totale initiale est donc la quantité de mouvement pi de chaque objet en mouvement. La conservation de la quantité de mouvement totale nous permet donc d’écrire p f = pi (11.60) L’énergie totale initiale est la somme de l’énergie ei de l’objet en mouvement et de l’énergie m de l’objet immobile (son énergie se réduit simplement à sa masse m parce que sa vitesse u est nulle et c2 = 1 lorsqu’on exprime c en pieds/nanoseconde). Ainsi, la conservation de l’énergie nous permet d’écrire que : e f = ei + m (11.61) Nous pouvons utiliser ces deux lois de conservation pour réécrire la vitesse uf en (11.59) en fonction des grandeurs avant la collision : pi eu ui uf = = i i = . (11.62) ei + m ei + m 1 + m/ei Et en appliquant (11.37) (avec c = 1) sur m/ei, nous trouvons la relation cherchée entre les vitesses initiale et finale : ui uf = . (11.63) 1 + 1 − ui2 Quand ui est très petit par rapport à 1 pi/ns, (11.63) est, comme il u se doit, très proche de la réponse non relativiste u f = i . Lorsque le 2 premier objet est lancé sur le deuxième objet immobile à une vitesse ui proche de 1 pi/ns, (11.63) nous dit que la vitesse uf de l’objet composé est à peine inférieure à ui. Un objet qui se déplace à une 269
IL ÉTAIT TEMPS
vitesse proche de celle de la lumière est très difficile à ralentir. Si on essaye de le ralentir en plaçant sur son chemin un objet identique, il le capte et l’emporte avec lui et au final, sa vitesse n’est que très légèrement modifiée. Comme je l’ai indiqué, nous aurions pu déduire (11.63), mais avec beaucoup plus d’efforts, par la vieille astuce du changement de référentiel que nous avons employée au chapitre 1. Par contre, il n’est pas possible de déterminer la masse M du composé final avec cette méthode. Mais grâce à (11.41) (une fois de plus, simplifiée en prenant c = 1 pi/ns) on obtient
M 2 = e 2f − p2f = (ei + m)2 − pi2 , (11.64)
la deuxième formulation est obtenue en remplaçant les quantités ef et pf par leurs expressions en fonction des quantités initiales ei et pi grâce aux lois de conservation de l’énergie totale et de la quantité de mouvement totale. Avec un peu d’algèbre, nous obtenons :
M 2 = ei2 + 2eim + m2 − pi2 (11.65)
Mais (11.41) nous dit que ei2 − pi2 = m2 , c’est ainsi que (11.65) se simplifie pour donner : M 2 = 2m(ei + m) (11.66) Il est commode de remplacer ei par (m + ec), où ec est l’énergie cinétique de l’objet en mouvement. Nous avons alors :
M = 2m 1 + ec /2m (11.67)
Dans le cas non relativiste, ui est une petite fraction de la vitesse 1 de la lumière, donc ec = mui2 est une très petite fraction de m et 2 (11.67) nous donne la réponse non relativiste attendue : la masse finale M de l’objet composé est le double de la masse m des deux objets identiques qui se sont rassemblés pour le former. Dans un cas relativiste « extrême » où un des objets se déplace à une vitesse proche de celle de la lumière, son énergie cinétique ec est bien plus grande 270
E = Mc2
que sa masse m (multipliée par c2, mais c = 1 pi/ns), alors 1 peut être négligé par rapport à ec /2m et (11.67) nous donne :
M = 2ec m (11.68)
C’est un résultat qui a une véritable importance pratique. Il nous dit que si on souhaite produire une unique particule en projetant une petite particule de petite masse m contre une particule identique de même masse m immobile, alors la masse M que l’on produit est proportionnelle à la racine carrée de l’énergie cinétique de la particule incidente. Si on veut multiplier par 10 la masse d’une particule, il faut multiplier par 100 l’énergie cinétique de la particule incidente. Si, d’un autre côté, on essaye de faire la même chose en projetant l’une vers l’autre deux particules identiques de masse m à la même vitesse, alors la conservation de la quantité de mouvement exige que la particule composée finale reste immobile après la collision et toute l’énergie cinétique initiale peut ainsi être convertie en masse. Pour augmenter la masse d’un facteur 10, il suffit d’augmenter l’énergie cinétique des particules incidentes d’un facteur 10. C’est pourquoi les accélérateurs de particules sont conçus pour projeter des particules les unes contre les autres (dans d’énormes collisionneurs où deux faisceaux de particules sont orientés l’un vers l’autre). L’avantage de faire entrer en collision deux faisceaux opposés plutôt que d’envoyer des particules projectiles sur des particules cibles n’apparaît que dans le cadre relativiste où les particules ont des vitesses proches de celle de la lumière. Nous avons là une application de la relativité directement en lien avec l’ingénierie de base des collisionneurs de particules.
271
12 Un peu de relativité générale
Comme nous l’avons vu dans le chapitre 2, les extraordinaires découvertes faites par Einstein sur la nature du temps lui ont été inspirées par sa conviction profonde que les lois de l’électromagnétisme devaient, comme celles de la mécanique, être entièrement compatibles avec le principe de relativité. Les forces électriques et magnétiques n’étaient cependant pas les seules interactions fondamentales connues en 1905. Il y avait aussi l’interaction gravitationnelle. Einstein passa dix autres années à essayer d’étendre la relativité aux phénomènes gravitationnels. Il y parvint en 1915 et depuis lors, sa théorie de la relativité générale a pris une importance capitale en cosmologie, en astrophysique et jusque dans la mise au point du système GPS ici sur Terre (ce qui est remarquable pour un sujet qui a longtemps été considéré comme une simple curiosité intellectuelle). Contrairement à la relativité restreinte, la relativité générale constitue un vrai défi pour celui qui souhaite, comme dans l’esprit de ce livre, en faire une présentation approfondie en n’utilisant que des outils mathématiques simples. Il est toutefois possible, en restant dans cet esprit, de parler 273
IL ÉTAIT TEMPS
d’une des toutes premières découvertes d’Einstein. Il a découvert que la gravité affecte le rythme du fonctionnement des horloges (ce qui est crucial pour le système GPS qui dépend d’horloges embarquées dans des satellites en orbite au-dessus de la Terre). C’est une petite (mais importante) pièce qui vint s’ajouter à un puzzle achevé plus tard en 1915 par la formulation complète de la théorie. L’effet de la gravité sur le rythme avec lequel fonctionne une horloge découle d’un nouveau principe énoncé par Einstein assez tôt dans sa recherche d’une théorie relativiste de la gravité. Il a appelé ce principe le principe d’équivalence et il est aussi général et puissant que les deux principes qui sous-tendent la relativité restreinte. Le principe d’équivalence a été insufflé à Einstein par une propriété découverte par Galilée (qui joue ici encore un autre rôle dans la construction des fondations de la relativité) qui a constaté que l’effet de la gravité sur le mouvement d’un objet est indépendant de sa masse. Dans le vide, où il n’y a pas de frottement avec l’air, une balle légère en bois met autant de temps à tomber d’une même hauteur qu’une balle en plomb beaucoup plus lourde. Près de la surface de la Terre, les deux objets subissent chacun une accélération uniforme identique : chaque seconde, leur vitesse vers le bas augmente d’environ 10 m par seconde. Ce phénomène était connu depuis tellement de temps que les gens ne s’intéressaient même plus à la question, c’était quelque chose d’évident qui a toujours fait partie du décor. Mais si, comme Einstein, vous regardez les choses d’un œil neuf et curieux, tout ceci n’a plus rien d’évident. La masse d’un objet, comme nous l’avons discuté au chapitre 11, est une mesure de la difficulté avec laquelle on parvient à modifier son vecteur vitesse. Pourquoi la gravité agirait-elle plus fortement sur les objets les plus lourds pour, au bout du compte, provoquer exactement le même changement de vecteur vitesse quelle que soit la masse ? Une conséquence immédiate de ce curieux comportement de la gravité est que si Alice tombe d’une grande hauteur entourée de nombreux objets comme son homonyme du pays des merveilles et 274
Un peu de relativité générale
qu’elle observe les objets tombant autour d’elle, ils vont lui apparaître soit immobiles, soit en mouvement rectiligne uniforme comme si elle était immobile dans un référentiel inertiel dans lequel la gravité n’agirait plus du tout. Le même phénomène se retrouve dans le comportement des objets à l’intérieur de la station spatiale internationale. Même si la gravitation terrestre au niveau de la station spatiale est presque aussi forte qu’à la surface de la Terre, les objets dans la station spatiale se comportent dans son référentiel comme si la gravitation terrestre était complètement absente. Vous pouvez être tenté de penser que la station spatiale internationale n’est pas un bon exemple. Elle ne tombe pas vu qu’elle évolue toujours à la même altitude au-dessus de la surface terrestre. Mais il ne faut pas oublier que la Terre est ronde. La station spatiale tombe effectivement vers la Terre à chaque instant, mais on lui a transmis une vitesse horizontale tellement importante que lorsqu’elle chute d’une certaine hauteur, la surface de la Terre s’écarte d’elle exactement de la même distance à cause de sa forme arrondie. Au final, elle peut continuer à tomber indéfiniment sans jamais s’approcher du sol. Quand elle tombe, le sol descend sous le plan tangent à la surface terrestre, ce qui fait qu’elle est capable de faire tout le tour de la Terre, comme le montre la figure 12.1. L’arc de cercle de la trajectoire d’un satellite doit suivre la courbure de la Terre, c’est cette condition qui impose l’énorme valeur de la vitesse horizontale nécessaire (environ 10 km/s). Effectivement, presque toute l’énergie nécessaire pour placer un satellite en orbite basse est utilisée, non pas pour le monter jusqu’à l’altitude de son orbite, mais surtout pour lui transmettre l’énergie cinétique qu’il faut pour qu’il reste sur cette orbite. La direction suivant laquelle les objets accélèrent sous l’influence de la gravitation terrestre n’est pas constante à grande échelle : elle est, en chaque point de la surface, dirigée vers le centre de la Terre. Et l’intensité de cette accélération dépend de la distance au centre de la Terre : elle est par exemple plus faible au niveau de l’orbite de la Lune que sur la surface terrestre. Mais si nous sommes intéressés 275
IL ÉTAIT TEMPS
uniquement par une région qui est petite par rapport à l’échelle de la planète (par exemple la ville de New York et l’espace qui se situe à quelques kilomètres au-dessus d’elle), alors l’intensité et la direction de l’accélération gravitationnelle varient très peu. On a l’habitude de dire, dans ces conditions, que le champ gravitationnel est uniforme. Nous nous garderons bien de traiter les champs de gravitation non uniformes, nous limiterons ici nos explorations aux régions dans lesquelles l’intensité et la direction de l’accélération gravitationnelle ne varient pas. Une grosse part de la difficulté mathématique propre à la relativité générale provient de la nécessité de recoller entre eux les petits morceaux d’espace dans lesquels on applique facilement le principe d’équivalence en considérant que la gravité y est uniforme. C’est ainsi qu’on traite les situations où les champs gravitationnels ne sont pas uniformes comme pour le mouvement d’un satellite où on doit considérer la Terre de façon globale. Une autre composante importante de la théorie – que nous ne traiterons pas – est comment le champ gravitationnel est modelé par la distribution spatiale de la matière qui lui donne naissance. La formulation du principe d’équivalence est donc la suivante : dans un espace où règne un champ gravitationnel uniforme (c’est-àdire une région dans laquelle la gravité agit selon la verticale vers le bas, imposant la même accélération constante g sur tous les objets au cours de la chute), tous les effets de ce champ gravitationnel sur tous les phénomènes physiques sont indifférenciables de la façon dont les phénomènes se dérouleraient, en l’absence de toute gravité, mais dans un référentiel qui est uniformément accéléré verticalement vers le haut par rapport à un référentiel inertiel avec une accélération a dont l’intensité serait égale à g. Il est remarquable qu’on puisse conclure directement à partir de ce principe que la gravité affecte le rythme de fonctionnement des horloges. C’est cette question qui va nous préoccuper pendant le reste de ce chapitre. Ce sera la petite fenêtre que nous ouvrirons sur la relativité générale. 276
Un peu de relativité générale
Figure 12.1 | (D’après un dessin de Newton lui-même) Le grand cercle blanc représente la Terre. Le petit cercle noir représente une plate-forme de lancement maintenue immobile au-dessus de la Terre par des moteurs de fusée. Si un objet est lâché de la plate-forme sans vitesse initiale, il tombe directement sur la Terre le long d’une ligne verticale. Les lignes courbes à droite de la verticale représentent les trajectoires d’objets lancés depuis la plate-forme avec des vitesses horizontales de plus en plus grandes. Si la vitesse horizontale est suffisamment grande, comme c’est le cas pour la ligne la plus à droite, l’objet tombe sans jamais s’approcher de la surface de la Terre. On voit effectivement que l’objet tombe à cause de la gravitation terrestre en remarquant que sa trajectoire s’éloigne de plus en plus de la ligne horizontale en pointillé qui représente la trajectoire que suivrait l’objet s’il n’était pas soumis à la gravitation terrestre.
Supposons que nous ayons deux horloges identiques séparées par une certaine distance D. Prenons une droite orientée d’une horloge vers l’autre qui nous servira à définir la direction que nous appellerons « verticale », nous pourrons ainsi désigner une des horloges comme étant celle du haut et l’autre celle du bas quelle que soit la cause de l’accélération vers le bas le long de cette droite (soit la gravité, soit l’accélération vers le haut des horloges par rapport à un référentiel inertiel). Supposons que l’horloge du haut émette fH (f pour fréquence) petits éclairs de lumière pendant 1 tic-tac (la durée entre un tic et le tac qui suit) et que la lumière de ces éclairs se déplace (à la vitesse c, bien sûr) jusqu’à l’horloge du bas. Il est important de choisir pour fH un nombre très important, disons quelques millions d’éclairs par seconde, de façon à ce que le temps entre deux éclairs mesuré sur l’horloge du haut soit égal à 1 millionième de tic-tac. Nous souhaitons 277
IL ÉTAIT TEMPS
déterminer combien d’éclairs l’horloge du bas reçoit de l’horloge du haut pendant ses propres tic-tacs, nous appellerons cette fréquence fB. Si ces deux horloges sont immobiles dans un référentiel inertiel en l’absence de gravité, la réponse est claire. Chaque éclair doit parcourir la même distance et par conséquent ils mettent tous le même temps pour aller de l’horloge du haut vers l’horloge du bas et ainsi la fréquence de réception des éclairs par l’horloge du bas est la même que la fréquence de leur émission par l’horloge du haut. De plus – et c’est très important –, comme les deux horloges sont identiques et immobiles dans le même référentiel inertiel, leurs tic-tacs permettent de mesurer le temps de manière aussi fiable l’une que l’autre. Nous pouvons donc utiliser l’horloge du haut pour déterminer la fréquence avec laquelle les éclairs quittent l’horloge f = fH. Et nous pouvons utiliser l’horloge du bas pour mesurer la fréquence avec laquelle les éclairs arrivent à l’horloge du bas : f = fB. Par conséquent, fH = fB. Le raisonnement que nous venons de faire a dû vous paraître particulièrement évident et inutile. Passons à présent à une situation plus intéressante et moins évidente dans laquelle deux horloges sont immobiles dans un champ gravitationnel uniforme où l’horloge du haut est directement au-dessus de celle du bas. Imaginons que l’horloge du haut soit par exemple située au dernier étage et l’horloge du bas au rez-de-chaussée d’une grande tour verticale érigée à la surface de la Terre. Nous souhaiterions savoir si la gravité affecte la relation entre fH et fB et, si c’est le cas, quelle sera l’horloge qui fonctionnera au rythme le plus élevé. À priori, on devrait être tenté de penser qu’il n’y a pas de différence. Nous sommes toujours dans une situation où les horloges sont immobiles l’une par rapport à l’autre. Chaque éclair émis par l’horloge du haut est reçu par l’horloge du bas et il n’y a aucune accumulation d’éclairs entre les deux horloges. Ainsi, la fréquence de réception des éclairs par l’horloge du bas est la même que la fréquence de leur émission par l’horloge du haut. Ceci est entièrement exact, mais cela ne répond pas à notre problème qui est de déterminer les fréquences 278
Un peu de relativité générale
fH et fB mesurées par les horloges. Ces fréquences ne sont pas nécessairement les mêmes si l’horloge du haut fonctionne à un rythme différent de l’horloge du bas en présence d’un champ gravitationnel. Il est possible de trouver la relation entre fH et fB en présence de gravité en faisant appel au principe d’équivalence. Nous savons que la relation entre deux horloges immobiles dans un champ gravitationnel doit être la même que la relation qui existe entre deux horloges qui accélèrent uniformément vers le haut selon une direction verticale en l’absence de champ gravitationnel. Nous devons donc nous placer dans un vide total où il ne règne aucune gravité et examiner la situation dans laquelle les deux horloges accélèrent vers le haut selon une direction verticale. L’horloge du bas s’approche de plus en plus rapidement de l’horloge du haut tandis que l’horloge du haut s’éloigne de plus en plus rapidement de celle du bas. Nous décrivons tout ceci depuis un référentiel inertiel dans lequel les deux horloges subissent cette accélération. Comme les deux horloges accélèrent dans le référentiel inertiel, elles auront chacune une vitesse u égale à gt où g est l’accélération et t est le temps qui s’est écoulé depuis l’instant t = 0 où elles étaient au repos. Faut-il alors prendre en compte le facteur de ralentissement 1 − u2 /c 2 ? Si les deux horloges démarrent avec une vitesse nulle et si on ne les laisse pas accélérer trop longtemps, leur vitesse sera toujours très petite vis-à-vis de celle de la lumière. Dans ce cas, u/c restera toujours une très petite fraction et (u/c)2 sera une très petite fraction d’une très petite fraction, c’est-à-dire une fraction extrêmement petite. Comme les effets gravitationnels que nous étudions produisent des différences entre les horloges du même ordre de grandeur que la fraction u/c, les différences extrêmement petites de type (u/c)2 ne seront pas perceptibles et peuvent donc être négligées. Ce qui fait qu’au final, nous allons pouvoir traiter cette situation de façon non relativiste ! Comme les horloges sont distantes d’une longueur D, il faut un temps t = D/c à chaque éclair émis par l’horloge du haut pour 279
IL ÉTAIT TEMPS
atteindre l’horloge du bas. Pour être plus précis, ils ont en fait besoin d’un tout petit peu moins de temps vu que l’horloge du bas se déplace vers le point d’émission de l’éclair. Mais comme la vitesse v de l’horloge du bas est très petite par rapport à la vitesse c de chaque éclair, la différence n’est pas perceptible. Ce qui est par contre d’une importance capitale, c’est que chacune des horloges a accéléré pendant le temps t = D/c qui est nécessaire à une série de quelques éclairs successifs pour aller de l’horloge du haut vers celle du bas. Supposons que D soit suffisamment grand et que le temps entre deux éclairs successifs soit suffisamment petit par rapport au temps nécessaire à un éclair pour aller d’une horloge à l’autre. Ainsi, quand l’horloge du bas reçoit une série d’éclairs, sa vitesse a augmenté (par rapport à la vitesse qu’avait l’horloge du haut lorsqu’elle a émis ces mêmes éclairs) d’une quantité u = gt = g(D/c) (12.1) Comme l’horloge du bas va à la rencontre des éclairs avec une vitesse additionnelle u, elle les reçoit avec une fréquence supérieure à la fréquence avec laquelle ils ont été émis par l’horloge du haut. Ceci n’est rien d’autre que l’effet Doppler que nous avons étudié en détail dans le chapitre 7. La différence entre la fréquence avec laquelle les éclairs sont reçus par l’horloge du bas et émis par l’horloge du haut u est donnée par le facteur non relativiste 1 + (La différence entre c ce facteur et le facteur relativiste que nous avons trouvé dans le chapitre 7 est complètement négligeable, il suffit d’écrire l’égalité suivante (1 + u /c ) / (1 − u / c ) = (1 + u / c ) 1 − (u / c )2 et de remarquer que la valeur de (u / c)2 est extrêmement petite par rapport à 1). Le temps du référentiel inertiel dans lequel nous nous plaçons pour faire cette étude est donc le même que le temps indiqué par chacune des deux horloges, vu qu’elles ne se déplacent pas assez vite pour que le facteur de ralentissement soit différenciable de 1. Chacune des deux horloges peut donc être utilisée pour faire des mesures précises 280
Un peu de relativité générale
de temps dans le référentiel inertiel. Comme, pendant un laps de temps donné, l’horloge du bas reçoit un nombre d’éclairs supérieur au nombre d’éclairs émis par l’horloge du haut et comme les deux horloges mesurent le temps aussi précisément l’une que l’autre, on en déduit que l’horloge du bas reçoit plus d’éclairs pendant ses tic-tacs que l’horloge du haut n’en émet pendant ses propres tic-tacs. Cette u différence est donnée par le facteur Doppler 1 + . Nous avons par c conséquent répondu à la question à propos de la relation entre fH et fB quand les horloges accélèrent dans le référentiel inertiel :
fB = fH 1 +
u = fH (1 + gD /c 2 ) (12.2) c
Mais le principe d’équivalence nous assure que la relation (12.2) entre le nombre d’éclairs fB que l’horloge du bas reçoit pendant ses tic-tacs et le nombre d’éclairs fH que l’horloge du haut émet entre ses propres tic-tacs doit aussi être valable dans un référentiel dans lequel les deux horloges sont immobiles et placées dans un champ de gravitation uniforme. Si nous avons deux horloges construites à l’identique, l’une étant à une distance D au-dessus de l’autre dans un champ gravitationnel uniforme caractérisé par une accélération g, alors si l’horloge du haut émet fH éclairs de lumière entre ses tictacs, l’horloge du bas recevra un nombre plus important d’éclairs fB entre ses propres tic-tacs. Les fréquences fH et fB sont reliées de la façon suivante :
fB = fH (1 + gD /c 2 ) (12.3)
Mais comme nous l’avons déjà noté, dans un champ gravitationnel, la fréquence de réception des éclairs par l’horloge du bas est la même que la fréquence de leur émission par l’horloge du haut. La seule manière pour que cette situation soit entièrement compatible avec la différence exprimée par la relation (12.3) entre les fréquences fH et fB mesurées pendant les tic-tacs des horloges émettrice et réceptrice 281
IL ÉTAIT TEMPS
consiste à envisager que la présence du champ gravitationnel a un effet sur le rythme de fonctionnement de ces horloges. Pour que les deux situations aboutissent au même résultat lorsqu’on compare les fréquences fH et fB, il faut forcément que dans un champ de gravitation uniforme l’horloge du bas fonctionne plus lentement que celle du haut précisément du facteur 1 + gD /c 2 qui apparaît dans (12.3). Voilà donc ce qu’Einstein a conclu à propos de l’effet de la gravitation sur le rythme d’une horloge. Démontrons à présent que l’effet gravitationnel 1 + gD /c 2 qui provoque une différence de rythme entre deux horloges est effectivement beaucoup plus important que l’effet du facteur de ralentissement 1 − u2 /c 2 que nous avons négligé au cours de notre analyse dans le référentiel inertiel vu que nous avons utilisé une valeur de u extrêmement gD u proche de gt = gD /c. Si, de son côté, 1 + = 1 + 2 = 1 + 0,000 01 , c c on a 1 − u2 /c 2 = 1 − 0,000 000 000 1 , ce qui est environ égal à 1 − 0,000 000 000 05 : nous avons donc bien fait de négliger l’effet u de 1 − u2 /c 2 par rapport à celui induit par 1 + . c Cet effet nous permet de porter un nouveau regard intéressant sur le paradoxe des jumeaux présenté au chapitre 10. Imaginons qu’Alice parte pour un voyage à très grande vitesse vers une destination très éloignée de la Terre puis revienne à nouveau retrouver Carol, sa sœur jumelle restée sur Terre. En rentrant, Alice découvrira qu’elle aura moins vieilli que sa sœur jumelle qui est restée à la maison. Ce ralentissement de tous ses processus biologiques a été provoqué par son mouvement par rapport à Carol qui, elle, est restée immobile dans un référentiel inertiel pendant tout le voyage. On pourrait voir cela comme un « paradoxe » puisqu’Alice pourrait objecter, qu’au contraire, c’est Carol qui a moins vieilli, car, pour elle, c’est Carol qui est partie et revenue à très grande vitesse. Mais pour voir cette histoire comme un paradoxe, il faut avoir oublié que contrairement à Carol, Alice n’est pas immobile dans un 282
Un peu de relativité générale
seul et même référentiel inertiel. Elle est immobile dans le référentiel du vaisseau spatial qui assure son voyage aller et immobile dans le référentiel de l’autre vaisseau qui la ramène sur Terre. Du point de vue d’Alice, il est tout à fait vrai que Carol rajeunit pendant son voyage aller et pendant son voyage retour (la dilatation du temps est réciproque), mais Alice ne doit pas oublier d’apporter une correction à ses calculs. Cette correction correspond au vieillissement soudain de 2T = 2 Du /c 2 qui apparaît lorsqu’elle change de vaisseau : elle passe alors d’un référentiel dans lequel la notion de « le temps sur Terre à cet instant » passe de T = Du /c 2 plus tôt à T = Du /c 2 plus tard où u est la vitesse de chaque vaisseau et D est la distance qui sépare Carol de la Terre au moment de son demi-tour. Avec la prise en compte de ce brusque vieillissement de la Terre, Alice peut tout à fait prévoir que c’est bien Carol qui sera plus âgée qu’elle à son retour. Supposons maintenant qu’Alice n’utilise qu’un seul vaisseau et accomplisse sa manœuvre de demi-tour en modifiant le sens de son mouvement par un procédé d’accélération uniforme orienté dans le sens du retour vers la Terre. Nous pouvons alors envisager ce processus complet en gardant Alice au repos dans un seul référentiel inertiel à condition qu’un champ gravitationnel approprié agisse pendant la période où Alice et Carol passent d’une phase d’éloignement à une phase de rapprochement. Dans le référentiel d’Alice, nous devons répondre à deux questions : pourquoi Alice est-elle restée immobile dans un référentiel inertiel malgré le fait que ses moteurs étaient allumés pendant toute la phase de demi-tour et comment Carol et la Terre sur laquelle elle est restée pendant cette même phase ont pu passer d’une phase où elle s’éloigne d’Alice à une vitesse u à une phase où elle revient vers elle à la même vitesse. Les deux mystères peuvent être expliqués en faisant intervenir un champ gravitationnel uniforme pendant toute la période de demitour en considérant que Carol est directement au-dessus d’Alice dans ce champ. Les moteurs d’Alice ont été allumés pour compenser la présence de ce champ et pour la maintenir dans un référentiel inertiel 283
IL ÉTAIT TEMPS
en lui évitant d’être accélérée vers le bas par la gravité. Carol, de son côté sur la planète Terre, a fait demi-tour parce que rien n’est venu contrecarrer les effets de ce même champ gravitationnel au voisinage de la Terre. Supposons que ce champ magique agisse pendant un temps t dans le référentiel d’Alice. Comme la vitesse de Carol doit subir une variation de valeur 2u (elle doit passer de u dans un sens à u dans l’autre sens), la valeur de l’accélération uniforme doit satisfaire 2u = gt, ainsi
g = 2u /t (12.4)
Pendant tout le temps où Carol fait demi-tour grâce à la gravité, elle est située plus haut qu’Alice dans le champ (étant donné que l’effet du champ consiste à la ramener vers Alice). Par conséquent, comme nous l’avons établi, ses horloges doivent fonctionner plus rapidement que celle d’Alice d’un facteur 1 + gD /c 2 = 1 + 2uD /tc 2. Comme le champ gravitationnel est présent pendant tout le temps t du demi-tour, pendant qu’Alice vieillit d’un temps t pendant le demi-tour, Carol, quant à elle, vieillit de t (1 + 2uD /tc 2 ) = t + 2uD /c 2. Par conséquent, les 2uD /c 2 manquant au vieillissement de Carol apparaissent maintenant sous la forme d’un effet gravitationnel sur le rythme avec lequel Carol et ses horloges et tout ce qui se trouve sur la Terre fonctionnent pendant le temps d’action du champ gravitationnel nécessaire pour assurer le demi-tour et son retour vers Alice. Ceci n’est qu’une petite pièce du puzzle résolu par la théorie de la relativité générale, mais, comme nous l’avons déjà noté plus tôt, il s’agit d’un effet dont la prise en compte est essentielle pour assurer la précision du système GPS.
284
13 Quel est le « mécanisme » à l’œuvre ?
Au bout du compte, il se peut que vous soyez tenté de penser que ceci n’est qu’une sorte de tour de passe-passe intellectuel. Sauf qu’Einstein a bâti sa théorie autour d’un noyau solide et inébranlable formé par sa découverte publiée en 1905 : la simultanéité de deux événements qui se produisent à deux endroits différents n’est pas une relation absolue et inconditionnelle entre ces événements, ce n’est qu’une manière spécifique de décrire les choses dans un référentiel particulier. La simultanéité n’est plus valable dans d’autres référentiels en mouvement par rapport à ce référentiel particulier le long de la droite qui passe par les lieux des événements. Lorsqu’on applique ce qui précède à la relation spatiale entre deux événements se produisant à différents moments, on obtient une propriété qui était connue bien avant 1905 : le fait que ces événements aient lieu au même endroit ou en deux endroits différents dépend évidemment du référentiel dans lequel on se place. Mais ce qui a longtemps échappé aux hommes, depuis l’époque où ils ont commencé à parler du temps jusqu’à l’année 1905, c’est qu’il existe aussi 285
IL ÉTAIT TEMPS
une propriété analogue pour les relations temporelles. Seulement, la quantité de temps associée à une distance donnée n’est que de 1 nanoseconde par pied, ce qui est bien trop petit pour être perceptible sur les échelles humaines des temps et des distances. Nous avons vu que les découvertes d’Einstein à propos du caractère relatif de la simultanéité des événements exigent que le rythme de fonctionnement d’une horloge et que la longueur d’une règle dépendent du référentiel dans lequel ils sont mesurés. Pour mesurer la longueur d’une règle en mouvement, il est indispensable de repérer ses deux extrémités au même moment, mais comme « au même moment » peut varier d’un référentiel à l’autre, alors la longueur d’une même règle peut aussi varier. Pour déterminer à quel rythme fonctionne une horloge, vous devez savoir l’heure qu’elle a affichée à deux moments différents, mais dans le cas d’une horloge qui se déplace, vous devez comparer son affichage avec celui d’horloges immobiles synchronisées entre elles et situées à deux endroits différents. Mais si la simultanéité d’événements lointains dépend du référentiel, alors il en va de même pour la synchronisation des horloges éloignées. Ainsi, des désaccords sur la simultanéité entre deux référentiels conduisent nécessairement à des désaccords sur le rythme des horloges en mouvement et sur la longueur des règles en mouvement. Il n’en reste pas moins qu’on peut raisonnablement se demander par quel « mécanisme » les règles en mouvement se contractent et par quel « mécanisme » les horloges en mouvement ralentissent. Ces phénomènes ont-ils vraiment lieu ? Ou s’agit-il seulement de manifestations secondaires dues à des désaccords sur la simultanéité conduisant à des désaccords sur la validité des protocoles de mesure ? L’opinion sur le sujet au sein de la communauté des physiciens est loin d’être unanime. Par exemple, on rencontre fréquemment des gens qui disent que les horloges en mouvement semblent ralentir par rapport aux horloges immobiles ou que les règles en mouvement semblent raccourcir. 286
Quel est le « mécanisme » à l’œuvre ?
Mais de telles précautions de langage sont inutiles. Les horloges en mouvement ralentissent réellement et les règles en mouvement raccourcissent réellement, si toutefois le concept de rythme d’une horloge ou de longueur d’une règle a la moindre signification. Elles sont obligées d’obéir à ces phénomènes, ce comportement leur est dicté directement par la règle T = Dv/c2 des événements simultanés et des horloges synchronisées. Il est nécessaire que les horloges et les règles se comportent ainsi pour que tous les aspects de la théorie soient cohérents entre eux et qu’il ne surgisse aucune contradiction interne. Mais, évidemment, ceci n’est pas une réponse qui peut pleinement nous satisfaire. On a envie de trouver un mécanisme. Quelle est la cause du ralentissement des horloges en mouvement ? Quelle est la cause du raccourcissement des règles en mouvement ? Si la nécessité de maintenir la cohérence de la relativité est la seule explication à avancer pour justifier le ralentissement des horloges en mouvement et la contraction des règles en mouvement, impossible de ne pas se dire : « Mais depuis quand les horloges et les règles se soucient-elles de la cohérence de la relativité ? » Ce que nous voudrions, c’est une explication fondée sur quelque chose, intégrée à la structure des règles, qui exige qu’elles raccourcissent le long de la direction de leur mouvement et quelque chose, intégré dans le mécanisme des horloges, qui exige qu’elles ralentissent lorsqu’elles sont en mouvement avec une contraction et un ralentissement tous deux donnés par le facteur s = 1 − (u /c)2 . Même s’il est souvent difficile d’expliciter en détail de tels mécanismes, il est quand même possible de les mettre en évidence. Quel que soit le référentiel dans lequel on se place, les lois physiques qui régissent la longueur des règles et le rythme des horloges fournissent toutes les raisons implacables expliquant le raccourcissement d’une règle mise en mouvement parallèlement à sa longueur et le ralentissement du rythme d’une horloge mise en mouvement. Voilà ce qui a échappé aux gens qui enrobent des phénomènes bien réels avec le verbe « sembler ». 287
IL ÉTAIT TEMPS
À titre d’exemple, considérons un modèle d’horloge très simple dont le rythme ralentit pour des raisons évidentes. Prenons une règle immobile de longueur D, fixons un miroir à chacune de ses extrémités et supposons qu’un éclair de lumière fasse des allers-retours le long de cette règle entre les deux miroirs comme dans la partie (1) de la figure 13.1. L’horloge produit un tic lorsque l’éclair est réfléchi en haut et un tac lorsqu’il est réfléchi en bas. Ce n’est sûrement pas facile de fabriquer une vraie horloge fonctionnant sur ce principe, mais cette horloge a l’avantage d’être d’une grande simplicité conceptuelle. De ce fait, il nous suffira de savoir uniquement deux choses sur l’univers pour prévoir comment elle va se comporter lorsqu’elle sera mise en mouvement : (a) quelle est la vitesse de la lumière dans l’horloge en mouvement ? (b) quelle est la longueur de la règle lorsqu’elle est en mouvement ? Nous savons que la vitesse de la lumière reste égale à c, quel que soit le référentiel inertiel : ce qui répond déjà à la première question. Devra-t-on prendre en considération le mécanisme qui provoque la contraction des règles en mouvement pour évaluer la longueur de l’horloge en mouvement ? Heureusement, il y a une façon simple de s’affranchir de cette contrainte : il suffit de faire en sorte que la règle ne se déplace pas parallèlement elle-même, mais selon une direction perpendiculaire comme le montre la partie (2) de la figure 13.1. Une règle qui se déplace perpendiculairement à sa longueur ne raccourcit pas (ou ne s’allonge pas). Contrairement à ce qui se passe pour deux référentiels en mouvement le long d’une droite passant par les deux événements, aucun désaccord sur la simultanéité de deux événements distants n’existe entre deux référentiels qui se déplacent perpendiculairement à la direction joignant les événements. La symétrie de la situation fait que dans le référentiel en mouvement, il est impossible de désigner l’événement qui va se produire en premier : ils sont tout simplement simultanés. Il est facile de comprendre que si les événements se produisent aux extrémités opposées d’un train immobile, alors, contrairement à la situation que nous avons étudiée 288
Quel est le « mécanisme » à l’œuvre ?
D
D
ct
ut (1)
(2)
Figure 13.1 | (1) Le segment épais vertical représente la règle immobile de longueur D. Les traits fins et horizontaux qui dépassent sur la droite aux extrémités de la règle représentent les deux miroirs. Le cercle blanc est un éclair de lumière qui fait l’allerretour entre les deux miroirs à la vitesse c en suivant la ligne en pointillé. (2) La même règle représentée à deux moments différents du référentiel qui se déplace avec la vitesse u vers la gauche. Il faut un temps t pour que l’éclair de lumière aille du miroir supérieur au miroir inférieur, pendant ce temps la règle se déplace vers la droite d’une distance ut. La ligne en pointillé représente la trajectoire de la lumière. La distance ct parcourue par l’éclair de lumière lorsqu’il va du miroir supérieur vers le miroir inférieur est maintenant D2 + (ut )2 .
au chapitre 5, la lumière émise au milieu du train produit, en atteignant les extrémités, deux événements exactement au même moment dans n’importe quel référentiel qui se déplace perpendiculairement au train. Il n’y a donc aucun désaccord entre tous les référentiels se déplaçant perpendiculairement à la règle à propos des positions des deux extrémités au même moment. Il n’y a donc pas de désaccord sur la validité du protocole de mesure de la longueur. Par exemple, Alice peut simplement comparer la règle en mouvement de Bob avec une règle identique, immobile dans son propre référentiel et orientée parallèlement à celle de Bob. Du point de vue des deux référentiels, tous les fragments de la règle d’Alice seront adjacents à tous ceux de celle de Bob au même moment. Si Alice trouve que la règle de Bob est plus courte que la sienne alors, vu que Bob est d’accord avec le protocole de mesure, 289
IL ÉTAIT TEMPS
il confirmera que la règle d’Alice est effectivement plus longue que la sienne. Mais le principe de relativité interdit à Alice de trouver que la règle en mouvement perpendiculairement à sa longueur se contracte alors que Bob trouve qu’elle s’allonge. Le principe exige maintenant (alors qu’il ne l’exige pas pour des règles qui se déplacent le long de leur propre direction, dans ce cas il y a désaccord sur la validité du protocole de mesure) que la longueur d’une règle en mouvement perpendiculairement à elle-même ne soit pas affectée par son mouvement. Nous pouvons donc utiliser la notation D pour la longueur de la règle, qu’elle soit immobile ou en mouvement perpendiculairement à sa longueur. Quand l’horloge est immobile, la lumière va d’une extrémité à l’autre en un temps D/c (qui sépare un tic d’un tac), le temps T entre deux tics (la durée d’un aller-retour) vaut alors T = 2 D /c (13.1) Quand l’horloge est en mouvement, la lumière doit parcourir une plus grande distance pour aller d’une extrémité à l’autre de la règle (voir la partie (2) de la figure 13.1) et, comme la vitesse de la lumière est la même dans tous les référentiels, les tics s’espacent dans le temps du référentiel dans lequel elle est en mouvement et par conséquent le rythme de l’horloge diminue : le mécanisme est aussi simple que cela. De surcroît, il est possible d’en déduire une relation qui exprime précisément le ralentissement de cette horloge. Si la vitesse de la règle est u et le temps nécessaire à la lumière pour aller d’une extrémité à l’autre de la règle est t, alors la règle se déplace d’une distance ut perpendiculairement à sa longueur entre le départ de la lumière d’une extrémité et son arrivée à l’autre. La distance que doit parcourir la lumière est alors l’hypoténuse d’un triangle rectangle dont un des côtés est la longueur D de la règle (qui reste inchangée), l’autre côté étant la longueur ut. Étant donné que cette hypoténuse correspond à la distance ct parcourue par la lumière pendant le temps t, le théorème de Pythagore nous indique que
290
(ct )2 = D2 + (ut )2 (13.2)
Quel est le « mécanisme » à l’œuvre ?
Et par conséquent,
t=
D /c 1−
u c
2
. (13.3)
Comme le temps T′ entre deux tics de l’horloge en mouvement est le double de t, en comparant (13.3) et (13.1), on en déduit que
Tʹ =
T u 1− c
2
(13.4)
L’horloge en mouvement bat plus lentement que l’horloge immobile et la relation entre les deux rythmes nous amène exactement au même facteur de ralentissement s que nous avions trouvé à partir d’une démonstration complètement différente au chapitre 6. Il se peut qu’un soupçon persiste sur le fait que cet exemple ait été choisi non pas pour sa simplicité, mais pour tirer parti de l’invariance de la vitesse de la lumière pour parvenir artificiellement au « mécanisme » qui se cache derrière le ralentissement. Cette objection serait totalement infondée. L’invariance de la vitesse de la lumière est une propriété de notre univers bien plus fondamentale que la plupart de ses autres propriétés physiques. Ce serait vieux jeu (en retard d’un siècle) et totalement absurde de s’obstiner à ne pas s’en servir dans la conception de nos instruments. En outre, il est toujours possible de trouver un mécanisme quel que soit le principe de fonctionnement de l’horloge, mais, dans la plupart des cas, il est beaucoup plus compliqué. Par exemple, le principe d’une horloge atomique moderne est basé sur la fréquence des vibrations d’un certain type d’atome placé dans des circonstances particulières. Les fréquences de ces vibrations sont régies par des équations complexes de la mécanique quantique découvertes par Paul Dirac. Mais si vous utilisez l’équation de Dirac pour calculer la fréquence des vibrations de ce type d’atomes dans les mêmes conditions sauf que 291
IL ÉTAIT TEMPS
toute l’horloge se déplace maintenant avec la vitesse u, vous obtiendrez – après beaucoup d’efforts – que l’effet du mouvement conduit au ralentissement du rythme des vibrations d’un facteur s précisément égal à 1 − (u /c)2 . Même le rythme d’une vieille montre mécanique ordinaire est régi par des choses telles que l’élasticité de certains ressorts ou l’inertie de certaines roues. Ceux-ci à leur tour sont gouvernés par des forces d’origine presque exclusivement électromagnétique qui assurent la cohésion des atomes constituant les ressorts et les roues, mais également par les lois de la mécanique quantique qui déterminent la structure de ces atomes en présence de ces forces. Et même si, à ma connaissance, personne n’a jamais fait le calcul détaillé du rythme d’une montre en mouvement en partant de ces principes de base, je peux vous garantir que l’effet du mouvement sur l’action de ces forces est tel que le rythme de la montre sera réduit d’un facteur égal au facteur de ralentissement. Comment puis-je vous garantir une chose pareille sans jamais avoir effectué ce calcul difficile ? Rappelons-nous du premier postulat d’Einstein : les lois de l’électromagnétisme, comme celle de la mécanique, doivent être compatibles avec le principe de relativité. Une des réussites d’Einstein dans son article de 1905 a été de démontrer explicitement que ces lois pouvaient être formulées en cohérence totale avec le principe de relativité. Comme ces lois prédisent également que la vitesse de la lumière dans le vide ne dépend pas de la vitesse de la source, elles sont parfaitement compatibles avec tous les aspects de la relativité restreinte. Le ralentissement des horloges en mouvement est un des aspects de la relativité restreinte, par conséquent, n’importe quelle horloge dont le fonctionnement est basé sur les lois de l’électromagnétisme est astreinte par ces mêmes lois à fonctionner plus lentement lorsqu’elle est mise en mouvement. Pour analyser pleinement le fonctionnement de l’horloge, il est nécessaire de faire appel également aux lois de la mécanique quantique pour expliquer les effets de son mouvement sur la structure des atomes qui constituent 292
Quel est le « mécanisme » à l’œuvre ?
l’horloge et, justement, une des contraintes imposées par Dirac à ses équations, c’est précisément qu’elles doivent être cohérentes avec la relativité restreinte. En d’autres termes, les lois de la mécanique quantique (sous leur forme complète de « mécanique quantique relativiste ») et de l’électromagnétisme, telles que nous les connaissons aujourd’hui, ont été conçues pour garantir que leur application au calcul du rythme d’une horloge en mouvement débouche sur un ralentissement. Elles sont aussi conçues pour garantir que les forces de cohésion d’une règle se comportent de façon à ce que la règle raccourcisse lorsqu’elle est mise en mouvement. Ces lois doivent, lorsqu’elles sont appliquées à de telles situations, nous permettre d’établir, avec de grosses difficultés et après d’énormes efforts de calcul, une représentation physique détaillée de la raison précise qui fait que les horloges et que les règles raccourcissent lorsqu’elles sont mises en mouvement. Pour exprimer le fait que les lois d’une théorie sont conçues de cette façon, on dit que la théorie est « invariante de Lorentz » ou « covariante de Lorentz ». Cette désignation a été choisie en hommage à H. A. Lorentz qui a publié en 1904 les formes covariantes de Lorentz pour les lois de l’électromagnétisme, sans toutefois en saisir toute la portée. La signification profonde de ce résultat n’est apparue qu’en 1905 grâce au regard clairvoyant qu’Einstein a posé sur la nature du temps. Est-ce que cette insistance à faire en sorte que toute théorie physique exige que les horloges en mouvement ralentissent et que les règles en mouvement raccourcissent n’est qu’une gigantesque tricherie ? Avons-nous des explications mécanistes pour ces phénomènes uniquement parce que nous avons refusé de considérer toute autre théorie fondamentale qui ne les prévoit pas ? Considérons un des autres principes d’invariance, plus intuitif, mentionné au chapitre 2. Posons comme condition que toute théorie fondamentale acceptable ne doit comporter aucune distinction basée sur l’orientation absolue dans l’espace. De telles théories intègrent dans leur structure 293
IL ÉTAIT TEMPS
l’invariance vis-à-vis de la rotation. Elles nous permettent de donner une explication mécaniste des raisons qui font qu’une personne peut lancer un ballon aussi loin en direction du nord-est qu’en direction du nord-ouest (en l’absence de vent, de rotation de la Terre et de tout autre paramètre pertinent). Tout ceci est-il une tromperie ? Non ! Si jamais nous découvrons un jour qu’il y a en fait une direction spéciale cachée dans la structure de l’espace, cela voudra dire qu’une erreur s’est glissée dans une de nos lois fondamentales, ce qui constituerait une information d’une précieuse importance. Mais jusqu’à présent, personne n’a pu prouver que le principe d’invariance vis-à-vis de la rotation est faux, il serait donc tout à fait stupide de ne pas l’intégrer dans la formulation fondamentale de nos théories physiques. C’est exactement la même chose pour le principe de relativité et pour le principe de l’invariance de la vitesse de la lumière qui correspond dans ce contexte général au principe de l’existence d’une vitesse invariante ou, si vous préférez, au principe de l’invariance de l’intervalle. Ces principes sont maintenant si bien établis que lorsqu’on cherche de nouvelles théories pour expliquer de nouveaux phénomènes qui n’appartiennent pas aux lois de l’électromagnétisme, nous faisons en sorte que ces nouveaux phénomènes soient compatibles avec les principes de la relativité restreinte. Depuis 1905 par exemple, de nouvelles forces ont été découvertes : d’une part l’interaction forte, responsable de la cohésion du noyau atomique par sa capacité à s’opposer à la répulsion électrique entre les protons qui constituent le noyau et, d’autre part, l’interaction faible qui régit certaines formes de désintégrations radioactives telles que la transformation d’un neutron en proton, électron et antineutrino. Malgré le fait que ces forces n’aient directement rien à voir avec l’électromagnétisme, l’interaction faible et les forces électromagnétiques ont été maintenant unifiées en une même et unique force dite « électrofaible » qui se manifeste dans les deux phénomènes. Au moment d’élucider les lois qui gouvernent ces forces, des contraintes très fortes furent imposées par les principes d’invariance : elles 294
Quel est le « mécanisme » à l’œuvre ?
doivent être compatibles avec l’invariance vis-à-vis de la rotation, avec l’invariance vis-à-vis de la translation dans l’espace et dans le temps, avec le principe de relativité et avec le principe d’invariance de la vitesse de la lumière. Finalement, cela nous garantit que toute horloge conçue sur un principe mettant en jeu l’interaction forte ou faible ralentira, exactement comme une montre électromagnétique, d’une certaine proportion, donnée par le facteur de ralentissement s. Et effectivement, les neutrons, qui se désintègrent en environ 12 minutes lorsqu’ils sont au repos, peuvent par ailleurs tenir beaucoup plus longtemps sans se désintégrer lorsqu’ils se déplacent à des vitesses proches de la lumière. Leur désintégration est principalement régie par l’interaction faible (exactement comme les muons dont nous avons parlé aux pages 121 et 122) : ils jouent ainsi le rôle d’une horloge fonctionnant au ralenti. Tout ceci se tient donc parfaitement. Si le mot « réel » a une quelconque signification, les horloges en mouvement ralentissent réellement et les règles en mouvement raccourcissent réellement. Dorénavant, nous posons un regard nettement moins naïf sur ce que le mot « réel » signifie réellement. Le mécanisme qui donne l’explication réelle d’un phénomène dans un référentiel peut être très différent du mécanisme qui donne l’explication réelle dans un autre. Considérant l’exemple suivant6 : Deux fusées sont reliées par une longue corde tendue à bloc. À un moment donné, les deux fusées commencent à se déplacer le long de la direction de la corde (disons vers l’est) avec la même vitesse u. Comme les fusées commencent à se déplacer au même moment et avec la même vitesse, la distance entre elles ne change pas. Comme leur distance reste constante, le raccourcissement de la corde en mouvement est contrarié et elle devra s’étirer au-delà de la longueur qui correspond à ses nouvelles conditions de mouvement. Si les fusées 6. Lire également l’essai de John S. Bell, “How to Teach Special Relativity” dans Speakable and Unspeakable in Quantum Mechanics (Cambridge University Press, 1987), 67-90. 295
IL ÉTAIT TEMPS
se déplacent suffisamment rapidement, cet allongement va dépasser la limite de résistance mécanique de la corde et elle finira par casser. Cette situation constitue une excellente démonstration de la réalité de la contraction des longueurs. Pourtant, l’histoire est vue d’une manière très différente dans un autre référentiel qui se déplace le long de la corde vers l’est avec une vitesse u. Initialement, les deux fusées et la corde (contractée dans ce référentiel) se déplacent vers l’ouest avec une vitesse u. Ensuite, la fusée du côté est s’arrête alors que la fusée du côté ouest continue à avancer pendant un certain temps avant de s’arrêter à son tour : ce qui provoque l’étirement de la corde au-delà de son point de rupture. Les deux histoires sont en fait bien plus compliquées que cela parce que les contraintes appliquées par chaque fusée aux extrémités de la corde se propagent de proche en proche le long de la corde à la vitesse des ondes élastiques qui est extraordinairement faible par rapport à la vitesse de la lumière. Mais quoi qu’il en soit, l’histoire plus élaborée a aussi ses deux versions très différentes. Chaque version est absolument correcte dans le référentiel dans lequel elle est racontée. La validité simultanée de chaque histoire en lien avec son référentiel n’est ni plus ni moins étrange que lorsque les New-Yorkais disent que les habitants de Sydney en Australie vivent la tête en bas et réciproquement. Ce sont deux visions, chacune utile, qui constituent deux facettes d’une même histoire. Une leçon importante de la relativité est que les objets ont moins de caractéristiques intrinsèques que ce nous avions coutume de penser. La plupart des choses qu’habituellement nous considérions intrinsèques aux phénomènes découlent en fait du référentiel dans lequel on se place pour en parler. Cela ne veut pas dire que les phénomènes n’ont rien d’intrinsèque. Mais nous avons appris que ce qui est intrinsèque aux phénomènes (l’intervalle entre deux événements par exemple) est plutôt étrange et non familier, alors que ce que nous croyions inséparable des événements (par exemple le temps qui les sépare) se révèle complètement arbitraire. 296
Quel est le « mécanisme » à l’œuvre ?
C’est ce procédé qui consiste à prendre conscience de l’imperfection des idées anciennes, de rechercher scrupuleusement les vieilles erreurs pour les remplacer par des hypothèses plus solides, qui rend la recherche scientifique si captivante. Le monde serait un endroit bien plus agréable à vivre si le plaisir de mettre en avant ses propres idées fausses était plus répandu dans d’autres secteurs de l’activité humaine.
297