243 103 16MB
French Pages 437 [433] Year 2020
Sébastien Trilles et Pierre Spagnou
Le temps dans la géolocalisation par satellites
Dans la même collection Physique quantique - Tomes 1 et 2 Michel Le Bellac Comprenons-nous vraiment la mécanique quantique ? 2e édition Franck Laloë Mécanique Quantique - Tomes 1, 2 et 3 - Nouvelle édition Claude Cohen-Tannoudji, Bernard Diu et Franck Laloë La théorie statistique des champs François David Physique quantique, information et calcul Pascal Degiovanni, Natacha Portier, Clément Cabart, Alexandre Feller et Benjamin Roussel Retrouvez tous nos ouvrages et nos collections sur http://laboutique.edpsciences.fr Ouvrage publié avec le concours de Thales Alenia Space. c ESA-P. Carril/Wikimedia Commons/G. Porter. Illustration de couverture : Imprimé en France c 2020, EDP Sciences, 17, avenue du Hoggar, BP 112, Parc d’activités de Courtabœuf, 91944 Les Ulis Cedex A et CNRS Éditions, 15, rue Malebranche, 75005 Paris. Tous droits de traduction, d’adaptation et de reproduction par tous procédés réservés pour tous pays. Toute reproduction ou représentation intégrale ou partielle, par quelque procédé que ce soit, des pages publiées dans le présent ouvrage, faite sans l’autorisation de l’éditeur est illicite et constitue une contrefaçon. Seules sont autorisées, d’une part, les reproductions strictement réservées à l’usage privé du copiste et non destinées à une utilisation collective, et d’autre part, les courtes citations justifiées par le caractère scientifique ou d’information de l’œuvre dans laquelle elles sont incorporées (art. L. 122-4, L. 122-5 et L. 335-2 du Code de la propriété intellectuelle). Des photocopies payantes peuvent être réalisées avec l’accord de l’éditeur. S’adresser au : Centre français d’exploitation du droit de copie, 3, rue Hautefeuille, 75006 Paris. Tél. : 01 43 26 95 35. EDP Sciences ISBN (papier) : 978-2-7598-2434-2, ISBN (ebook) : 978-2-7598-2468-7 CNRS Éditions ISBN (papier) : 978-2-271-13542-1, ISBN (ebook) : 978-2-271-13544-5
Remerciements Nous tenons à témoigner notre gratitude à Michèle Leduc et Michel Le Bellac pour avoir accueilli notre projet dans leur riche collection « Savoirs actuels ». Outre leurs encouragements stimulants, nous avons également pu bénéficier de leurs suggestions précieuses lors de la revue du manuscrit. Nous souhaitons également remercier Jean Poumailloux, Michel Monnerat, Christophe Bourga, Hanaa Al Bitar, Damien Serant, Jean-Claude Fort et Flavien Mercier pour leurs efforts de relecture du texte ainsi que pour leurs conseils avisés. Une mention spéciale pour Julie Anton en ce qui concerne la production des figures qui portent son nom. Nous n’oublions pas non plus le travail remarquable réalisé par Sophie Hosotte et son équipe pour la mise en forme du document. Nous sommes bien sûr redevables à de nombreux auteurs pour leurs propres publications citées en référence.
Table des matières Avant-propos 1 La mesure du temps 1.1 La réalisation de la seconde . . . . . . . . . . . . . . . . . . . 1.1.1 Le postulat de reproductibilité . . . . . . . . . . . . . 1.1.2 Le temps propre . . . . . . . . . . . . . . . . . . . . . 1.2 Fréquence, phase et temps d’un oscillateur . . . . . . . . . . . 1.3 Fréquence et accroissement de temps propre . . . . . . . . . . 1.4 Exactitude et stabilité de fréquence . . . . . . . . . . . . . . . 1.5 Mesure de l’instabilité des oscillateurs . . . . . . . . . . . . . 1.5.1 Définition théorique de la variance d’Allan . . . . . . 1.5.2 Incertitudes de prédiction . . . . . . . . . . . . . . . . 1.5.3 Calculs de la variance d’Allan . . . . . . . . . . . . . 1.5.4 Variance d’Allan en présence d’effets systématiques . 1.5.5 Variance d’Allan et densité spectrale de puissance . . 1.6 Différents types d’oscillateurs . . . . . . . . . . . . . . . . . . 1.7 L’échelle de temps . . . . . . . . . . . . . . . . . . . . . . . . 1.7.1 Réalisation d’une échelle de temps atomique intégrée 1.7.2 Propriétés d’une échelle de temps . . . . . . . . . . . 1.7.3 L’échelle de temps TAI . . . . . . . . . . . . . . . . . 1.7.4 L’échelle de temps universel UT . . . . . . . . . . . . 1.7.5 Le temps universel coordonné UTC . . . . . . . . . . 2 Les signaux et messages des systèmes GPS et Galileo 2.1 Les deux concepts de transmission de signaux de navigation : CDMA/FDMA . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Lien satellite et récepteur . . . . . . . . . . . . . . . . . . . . 2.3 La modulation en quadrature . . . . . . . . . . . . . . . . . . 2.4 La modulation de phase . . . . . . . . . . . . . . . . . . . . . 2.4.1 La modulation de phase BPSK . . . . . . . . . . . . . 2.4.2 La modulation de phase BOC . . . . . . . . . . . . . 2.4.3 Reconstruction de l’information par le récepteur . . . 2.5 Les codes des signaux GPS et Galileo . . . . . . . . . . . . . 2.5.1 Les registres à décalages et retours linéaires . . . . . . 2.5.2 Propriété des codes PRN . . . . . . . . . . . . . . . . 2.5.3 Caractéristiques des codes PRN . . . . . . . . . . . . 2.5.4 Les codes publics GPS (Coarse Acquisition) . . . . . 2.5.5 Les codes cryptés GPS P(Y) . . . . . . . . . . . . . . 2.5.6 Le code militaire GPS . . . . . . . . . . . . . . . . . . 2.6 Les informations de navigation des systèmes GPS et Galileo .
xiii . . . . . . . . . . . . . . . . . . .
1 1 2 3 3 6 7 10 10 11 12 14 15 16 17 17 18 18 18 20 23
. . . . . . . . . . . . . . .
24 25 26 27 27 29 31 31 33 39 40 41 41 42 43
vi
Le temps dans la géolocalisation par satellites 2.6.1 Les codes de convolution . . . . . . . . . . . . . . . Le message de navigation du système GPS . . . . . . . . . . 2.7.1 Format du message L/NAV . . . . . . . . . . . . . . 2.7.2 L’accès au temps GPS (GPST) . . . . . . . . . . . . 2.8 Le message de navigation du système Galileo . . . . . . . . 2.8.1 Format du message F/NAV . . . . . . . . . . . . . . 2.8.2 Format du message I/NAV . . . . . . . . . . . . . . 2.8.3 L’accès au temps Galileo (GST) . . . . . . . . . . . 2.9 Encodage des signaux de navigation : le cas GPS . . . . . . 2.10 Traitement des signaux de navigation par le récepteur . . . 2.11 Limitation du débit de transfert des données de navigation 2.12 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.7
. . . . . . . . . . . .
. . . . . . . . . . . .
46 49 49 51 51 52 54 56 57 59 61 62
3 La mesure de code 65 3.1 Le principe de base du positionnement par GNSS . . . . . . . . 65 3.2 Le calcul du temps de propagation du signal . . . . . . . . . . . 66 3.3 La modélisation de la mesure de code . . . . . . . . . . . . . . 71 3.3.1 Variation temporelle de la distance géométrique . . . . 73 3.3.2 Le rôle de la référence de temps dans les systèmes de navigation . . . . . . . . . . . . . . . . . . . . . . . . 73 3.3.3 Corrélation entre la position du satellite et son horloge dans la mesure de pseudo-distance . . . . . . . . . . . . 74 3.4 Mesures de codes délivrées par le système GPS et produites par les récepteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 3.5 Événement de prise de mesure et datation par le récepteur . . . 75 3.6 Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 4 La mesure de Doppler 4.1 Effet Doppler classique . . . . . . . . . . . . . 4.2 La mesure du Doppler dans le récepteur . . . 4.2.1 Dérive en fréquences . . . . . . . . . . 4.2.2 La modélisation de la mesure Doppler
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
79 79 84 85 85
5 La mesure de phase 5.1 Concept général . . . . . . . 5.2 Les biais de phase . . . . . 5.3 L’accumulation de Doppler 5.4 L’enroulement de phase . . 5.5 Résumé . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
87 87 91 92 92 94
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
6 Les effets des erreurs système sur les mesures GNSS 97 6.1 Les centres de phases . . . . . . . . . . . . . . . . . . . . . . . . 98 6.2 Effet des erreurs d’orbite et d’horloge sur la mesure de pseudo-distance . . . . . . . . . . . . . . . . . . . . . . . . . . . 99 6.2.1 Corrélation entre la direction radiale du satellite et l’horloge . . . . . . . . . . . . . . . . . . . . . . . . . 105
Table des matières
vii
6.2.2
6.3
6.4
Majorant des erreurs d’orbites et d’horloge dans la pseudo-distance . . . . . . . . . . . . . . . . . . . 6.2.3 Corrélation spatiale des erreurs d’orbites . . . . . 6.2.4 Corrélation spatiale des erreurs d’horloge . . . . . Les biais instrumentaux – TPG . . . . . . . . . . . . . . . 6.3.1 Les biais de code et de phase différentiels (DCB, DPB, IFB) . . . . . . . . . . . . . . . . . . . . . . La déformation de la forme d’onde . . . . . . . . . . . . .
7 Les effets de propagation dans l’atmosphère sur les mesures GNSS 7.1 Les effets ionosphériques . . . . . . . . . . . . . . . . . . . 7.2 Les effets troposphériques . . . . . . . . . . . . . . . . . . 7.2.1 Modélisation des effets atmosphériques dans les mesures GNSS . . . . . . . . . . . . . . . . . . 7.3 Effet de l’environnement sur la mesure de pseudo-distance 7.4 Le filtrage du code par la phase . . . . . . . . . . . . . . .
. . . .
. . . .
117 . . . 117 . . . 119 . . . 120 . . . 121 . . . 121
différentes combinaisons de mesures GNSS Le modèle standard des mesures de code et de phase . . . . . Combinaison ionosphérique . . . . . . . . . . . . . . . . . . . Combinaison en longueur d’onde équivalente étroite (narrowlane) . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.4 Combinaison en longueur d’onde équivalente large (widelane) 8.5 Combinaison de Melbourne-Wübbena . . . . . . . . . . . . . 8.6 Combinaison géométrique . . . . . . . . . . . . . . . . . . . .
9 La diffusion des biais d’horloge satellite dans le message de navigation 9.1 La diffusion des biais d’horloge dans le message de navigation 9.2 La diffusion des biais l1-l2 dans le message de navigation, TGD , BGD . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9.3 Utilisation des signaux civils . . . . . . . . . . . . . . . . . . . 9.4 Le calcul du délai ionosphérique . . . . . . . . . . . . . . . . .
. . . . . . . .
106 107 109 109
. . . 113 . . . 115
8 Les 8.1 8.2 8.3
10 Les références d’espaces 10.1 Changement de base et transformations de coordonnées 10.2 Mouvements de l’axe de rotation de la Terre . . . . . . . 10.2.1 La sphère céleste, pôles et origines . . . . . . . . 10.2.2 Origine non tournante . . . . . . . . . . . . . . . 10.3 Référentiel terrestre et céleste . . . . . . . . . . . . . . . 10.3.1 Notions de système et repères de référence . . . 10.3.2 Référentiel terrestre . . . . . . . . . . . . . . . . 10.3.3 Référentiel céleste . . . . . . . . . . . . . . . . . 10.3.4 Les transformations entre les référentiels céleste et terrestre . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . . . . . .
. . . . . . . .
125 . 125 . 126 . . . .
127 128 129 129
133 . 133 . 137 . 141 . 142
. . . . . . . .
143 144 147 149 150 152 152 153 154
. . . . 154
viii
Le temps dans la géolocalisation par satellites 10.3.5 Les référentiels pour le calcul du positionnement par GNSS . . . . . . . . . . . . . . . . . . . . . . . . . 160
11 Positionnement avec le système GPS 11.1 Le calcul du temps d’émission . . . . . . . . . . . . . . . 11.2 Le calcul de la position des satellites GPS et Galileo au temps d’émission . . . . . . . . . . . . . . . . . . . . . . 11.3 Le calcul de la position et du temps du récepteur . . . . 11.3.1 Positionnement en événement récepteur . . . . . 11.3.2 Positionnement en événement satellite . . . . . . 11.4 Calculs dans le repère WGS84 . . . . . . . . . . . . . . . 11.5 Calcul des erreurs d’estimation . . . . . . . . . . . . . . 11.6 L’ellipsoïde de confiance . . . . . . . . . . . . . . . . . .
163 . . . . 165 . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
167 175 176 182 188 191 195
12 Positionnement en combinant les systèmes GPS et Galileo 197 12.1 Le GPS/Galileo Time Offset – GGTO . . . . . . . . . . . . . . 197 12.2 Les biais inter systèmes – ISB . . . . . . . . . . . . . . . . . . . 198 12.3 La résolution du positionnement avec les systèmes GPS et Galileo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 200 13 La théorie de la relativité restreinte 13.1 Introduction : relativité galiléenne et relativité einsteinienne 13.2 La relativité galiléenne . . . . . . . . . . . . . . . . . . . . . 13.2.1 Les référentiels inertiels . . . . . . . . . . . . . . . . 13.2.2 Les transformations de Galilée . . . . . . . . . . . . 13.3 La relativité einsteinienne . . . . . . . . . . . . . . . . . . . 13.3.1 La chronogéométrie de Minkowski . . . . . . . . . . 13.3.2 Temps propre et temps-coordonnée . . . . . . . . . 13.3.3 La relativité sans la lumière . . . . . . . . . . . . . 13.4 Quelques précisions sur la genèse de la relativité restreinte . 13.4.1 Les expériences pour détecter des variations dans la vitesse de propagation de la lumière . . . . 13.4.2 Le problème théorique posé par les lois de l’électromagnétisme . . . . . . . . . . . . . . . . . . 14 Les nouveaux effets physiques sur le temps prédits par la relativité restreinte 14.1 Relativité de la simultanéité . . . . . . . . . . . . . . . . 14.2 La désynchronisation cinématique des horloges parfaites 14.3 La dilatation des temps . . . . . . . . . . . . . . . . . . 14.4 La contraction des longueurs . . . . . . . . . . . . . . . 14.5 L’effet Doppler relativiste . . . . . . . . . . . . . . . . . 14.5.1 Effet Doppler transverse . . . . . . . . . . . . . 14.5.2 Application en navigation . . . . . . . . . . . . . 14.6 L’effet Sagnac . . . . . . . . . . . . . . . . . . . . . . . . 14.6.1 Déduction relativiste de l’effet Sagnac optique à partir du référentiel du laboratoire . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . . .
. . . . . . . . .
203 203 204 204 204 205 206 207 208 209
. . 210 . . 211
. . . . . . . .
. . . . . . . .
213 213 214 218 219 219 221 222 222
. . . . 222
Table des matières
14.7
ix
14.6.2 Déduction de l’effet Sagnac universel à partir du référentiel du laboratoire . . . . . . . . . . . . . . 14.6.3 Raisonnement physique à partir de la multiplicité des temps propres . . . . . . . . . . . . . . . . . . . . 14.6.4 Déduction de l’effet Sagnac par le calcul différentiel et les transformations de Lorentz . . . . . 14.6.5 Déduction relativiste de l’effet Sagnac dans le référentiel tournant . . . . . . . . . . . . . . . Rôle de la relativité restreinte dans les systèmes de navigation par satellites . . . . . . . . . . . . . . . . . . . . . . . . . . . .
224 225 227 229 232
15 La théorie de la gravitation de Newton 235 15.1 Les deux lois de la théorie newtonienne de la gravitation . . . 235 15.2 La loi fondamentale de la dynamique newtonienne . . . . . . 235 15.3 La force de gravitation newtonienne . . . . . . . . . . . . . . 236 15.4 Une hypothèse supplémentaire : l’universalité de la chute libre 236 15.5 Les lois de Kepler conséquences de la théorie de Newton . . . 237 16 La théorie de la gravitation d’Einstein 16.1 Analyse critique de la théorie newtonienne de la gravitation 16.2 Le principe d’équivalence locale entre accélération et gravitation . . . . . . . . . . . . . . . . . . . . . . . . . . 16.3 Un nouvel effet prédit grâce au principe d’équivalence locale entre accélération et gravitation . . . . . . . . . . . . 16.4 Le principe des géodésiques . . . . . . . . . . . . . . . . . . 16.5 Une première théorie métrique de la gravitation fondée uniquement sur la courbure temporelle . . . . . . . . . . . . 16.6 Les équations générales du champ gravitationnel . . . . . . 16.7 Les deux lois de la théorie de la gravitation d’Einstein . . . 16.8 La métrique de Schwarzschild . . . . . . . . . . . . . . . . . 16.8.1 Une solution du vide de l’équation d’Einstein . . . . 16.8.2 La coordonnée radiale . . . . . . . . . . . . . . . . . 16.8.3 Le temps-coordonnée . . . . . . . . . . . . . . . . . 16.8.4 Courbure temporelle et courbure spatiale . . . . . . 16.9 La métrique de Kerr . . . . . . . . . . . . . . . . . . . . . . 16.10 La toile en caoutchouc : une analogie presque entièrement fausse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16.10.1 La chute de mon stylo d’Aristote à Einstein . . . . 17 Les nouveaux effets physiques sur le temps prédits par la relativité générale 17.1 La désynchronisation gravitationnelle des horloges parfaites 17.1.1 Vérifications expérimentales . . . . . . . . . . . . . 17.2 L’effet Einstein (décalage spectral gravitationnel) . . . . . . 17.2.1 L’universalité de l’effet Einstein . . . . . . . . . . . 17.2.2 Une erreur fréquente à éviter . . . . . . . . . . . . .
239 . 239 . 240 . 240 . 243 . . . . . . . . .
244 246 247 247 248 248 249 249 250
. 251 . 253
. . . . .
255 255 257 257 259 259
x
Le temps dans la géolocalisation par satellites 17.2.3 17.3 L’effet 17.3.1 17.3.2
Vérifications expérimentales Shapiro . . . . . . . . . . . . Deux erreurs fréquentes . . . Vérifications expérimentales
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
18 Les expériences sur la désynchronisation des horloges parfaites 18.1 L’expérience de Hafele et Keating . . . . . . . . . . . . . . . . . 18.1.1 L’hypothèse de l’horloge . . . . . . . . . . . . . . . . . 18.1.2 De combien nos horloges sont-elles censées se décaler ? 18.1.3 La dépendance selon la direction et la faisabilité de l’expérience . . . . . . . . . . . . . . . . . . . . . . . 18.1.4 Le compteur d’intervalles de temps . . . . . . . . . . . 18.1.5 Pourquoi quatre horloges atomiques embarquées ? . . . 18.1.6 Un dérèglement commun aux quatre horloges ? . . . . . 18.1.7 Comparaison entre les valeurs théoriques et les valeurs mesurées . . . . . . . . . . . . . . . . . . . . 18.1.8 En quoi l’expérience de Hafele et Keating se démarque-t-elle des précédentes ? . . . . . . . . . . . . 18.1.9 Le pseudo-paradoxe des jumeaux . . . . . . . . . . . . . 18.1.10 Pourquoi l’expérience de Hafele et Keating peut être qualifiée de cruciale . . . . . . . . . . . . . . . . . 18.2 L’expérience de Carroll Alley . . . . . . . . . . . . . . . . . . . 18.2.1 Le transfert de temps par lien laser (T2L2) . . . . . . . 18.2.2 De combien nos horloges sont-elles censées se décaler ? 18.2.3 Comparaison entre les valeurs théoriques et les valeurs mesurées . . . . . . . . . . . . . . . . . . . . 18.2.4 Une expérience cruciale ? . . . . . . . . . . . . . . . . . 18.2.5 Des incompréhensions chroniques . . . . . . . . . . . . 18.3 Expériences ultérieures . . . . . . . . . . . . . . . . . . . . . . . 19 Effets relativistes sur le temps pour la géolocalisation par satellites 19.1 Première approche (principales contributions) . . . . . . . . . 19.2 Synchronisation des horloges GPS avec les horloges terrestres 19.2.1 Temps terrestre et temps atomique international . . . 19.2.2 Désynchronisation des horloges terrestres par rapport au temps-coordonnée selon leur altitude . . . . . . . . 19.2.3 Temps-coordonnée géocentrique et temps propre . . . d’un satellite GPS . . . . . . . . . . . . . . . . . . . . 19.2.4 Temps terrestre et temps propre GPS . . . . . . . . . 19.3 Compensation des effets relativistes dans les systèmes de navigation . . . . . . . . . . . . . . . . . . . . . . . . . . . 19.3.1 Biais en fréquence des horloges à bord . . . . . . . . . 19.3.2 L’effet de l’excentricité des orbites GPS . . . . . . . .
260 261 262 262
265 265 265 266 267 267 268 269 269 270 271 271 272 273 274 275 276 276 277
279 . 279 . 281 . 282 . 284 . . 284 . 285 . 287 . 287 . 288
Table des matières
xi
19.3.3 Raccordement des temps systèmes GPS et Galileo au temps UTC . . . . . . . . . . . . . . . 19.4 Effet Shapiro pour les signaux de navigation . . . . . . . . . 19.4.1 Équation de propagation en temps terrestre . . . . 19.5 Le rôle de la relativité dans le GPS : une légende urbaine ? 20 Transfert de temps et transfert de fréquence 20.1 Transfert de fréquence . . . . . . . . . . . . . . . . . . 20.1.1 La méthode à une voie . . . . . . . . . . . . . 20.1.2 La méthode à deux voies . . . . . . . . . . . . 20.2 Transfert de temps . . . . . . . . . . . . . . . . . . . . 20.2.1 La méthode à une voie . . . . . . . . . . . . . 20.2.2 La méthode à deux voies . . . . . . . . . . . . 20.3 Le transfert de temps avec les signaux GPS . . . . . . 20.3.1 Repères inertiels et repère terrestre . . . . . . 20.3.2 L’effet Sagnac dans les systèmes GNSS . . . . 20.3.3 Le transfert de temps avec les signaux GPS . . 20.3.4 Intégration implicite de l’effet Sagnac dans le positionnement en événement récepteur . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . . . . . . . .
. . . .
. . . .
290 291 293 293
. . . . . . . . . .
. . . . . . . . . .
297 297 297 301 301 301 302 303 303 304 305
. . . . . 310
21 Principes généraux de la restitution d’orbite GPS par moindres carrés 21.1 Introduction au principe de la détermination d’orbite par moindres carrés . . . . . . . . . . . . . . . . . . . . . . 21.2 Le principe des moindres carrés . . . . . . . . . . . . . . . . 21.2.1 Dynamique des satellites . . . . . . . . . . . . . . . 21.2.2 Génération des mesures théoriques et calcul des résidus de mesures . . . . . . . . . . . . . . . . 21.2.3 La pondération des mesures . . . . . . . . . . . . . 21.2.4 Filtrage par estimation paramétrique . . . . . . . . 21.2.5 Les résidus de mesures . . . . . . . . . . . . . . . . 21.2.6 Les erreurs d’identifications . . . . . . . . . . . . . . 21.3 Algorithme général . . . . . . . . . . . . . . . . . . . . . . . 21.4 Prise en compte de contraintes . . . . . . . . . . . . . . . . 21.5 Traitement des informations a priori . . . . . . . . . . . . . 21.6 La restitution des orbites et horloges des satellites GPS . . 21.6.1 Dynamique appliquée pour les GPS . . . . . . . . . 21.6.2 Modélisation de la mesure GPS . . . . . . . . . . . 21.6.3 Filtrage du problème GPS . . . . . . . . . . . . . . 21.7 Le besoin de synchronisation du temps dans les algorithmes de navigation . . . . . . . . . . . . . . . . . . . . . . . . . . 21.7.1 Observation d’un biais d’horloge récepteur . . . . . 21.7.2 Observation d’un biais d’horloge satellite . . . . . . 21.7.3 Observation simultanée de biais d’horloge satellite et station . . . . . . . . . . . . . . . . . . .
313 . . 313 . . 317 . . 318 . . . . . . . . . . . .
. . . . . . . . . . . .
322 325 326 329 330 335 336 337 339 339 341 346
. . 353 . . 353 . . 354 . . 354
xii
Le temps dans la géolocalisation par satellites 21.7.4 21.8 21.9
Effet d’une dérive d’horloge satellite sur un réseau sol dont la prise de mesure est dispersée La datation des mesures . . . . . . . . . . . . . . . . . . Traitement des mesures de phase en ambiguïtés entières 21.9.1 Combinaisons simples et doubles différences . . 21.9.2 Le cas zéro-différence . . . . . . . . . . . . . .
. . . . .
22 Les systèmes d’augmentation par satellites 22.1 Le rôle d’un système SBAS . . . . . . . . . . . . . . . . . 22.2 Les standards applicables . . . . . . . . . . . . . . . . . . 22.3 Architecture des systèmes SBAS . . . . . . . . . . . . . . 22.4 Les budgets d’erreurs de mesures pris en compte dans . . le standard MOPS . . . . . . . . . . . . . . . . . . . . . . 22.5 Génération des corrections SBAS L1 . . . . . . . . . . . . 22.6 Application des corrections SBAS L1 . . . . . . . . . . . . 22.6.1 Application de la correction d’horloge : calcul du temps d’émission et construction de . . . . . la pseudo-distance . . . . . . . . . . . . . . . . . 22.6.2 Correction de la pseudo-distance . . . . . . . . . 22.6.3 Correction de l’orbite du satellite au temps d’émission corrigé . . . . . . . . . . . . . 22.7 Compensation partielle des erreurs d’orbites et d’horloges 22.8 Application des marées terrestres . . . . . . . . . . . . . . 22.9 La correction du retard ionosphérique d’EGNOS . . . . . 22.10 La notion d’intégrité . . . . . . . . . . . . . . . . . . . . . 22.10.1 UDRE . . . . . . . . . . . . . . . . . . . . . . . . 22.10.2 GIVE . . . . . . . . . . . . . . . . . . . . . . . . 22.10.3 Caractérisation de l’intégrité . . . . . . . . . . . 22.11 La construction des volumes de protection . . . . . . . . . 22.12 Les performances d’un système SBAS . . . . . . . . . . . 22.12.1 Précision . . . . . . . . . . . . . . . . . . . . . . 22.12.2 Disponibilité . . . . . . . . . . . . . . . . . . . . 22.12.3 Intégrité . . . . . . . . . . . . . . . . . . . . . . . 22.12.4 Continuité . . . . . . . . . . . . . . . . . . . . . 22.13 Introduction au SBAS bi-fréquence multi-constellations (DFMC) . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . . . .
. . . . . . .
355 355 357 358 359 365 365 366 367 369 371 372
. . . . 374 . . 375 . . . . . . . . . . . . . .
. . . . . . . . . . . . . .
375 376 377 378 381 382 384 385 387 391 391 392 393 395
. . 396
Épilogue : La géolocalisation par satellites, système relativiste par excellence
399
Glossaire
401
Bibliographie
415
Avant-propos Qui n’a pas entendu parler de la localisation par GPS ou Galileo en 2020 ? Les smartphones d’aujourd’hui sont pratiquement tous équipés d’un récepteur GPS qui permet de les localiser précisément partout à la surface de la Terre. Par contre, la richesse des concepts physiques et de l’algorithmique sousjacente dans les logiciels associés reste largement méconnue. De même, la connaissance des techniques subtiles mises en œuvre est souvent superficielle. Nous pensons que cet ouvrage vient combler une importante lacune dans ces deux thématiques associées à la géolocalisation par satellites : permettre d’accéder à une compréhension fine des effets physiques (principalement relativistes) et proposer une vision détaillée de la façon concrète de les prendre en compte dans les logiciels contemporains. La géolocalisation par satellites couvre pratiquement tous les domaines de la physique et fait appel à une grande variété de technologies. Nous nous intéressons dans ce livre à l’algorithmique des systèmes de navigation par satellites avec le temps comme thème central. L’originalité de notre contribution, au sein d’une littérature abondante 1 consacrée à la géolocalisation par satellites, consiste à présenter et détailler l’algorithmique la plus récente intervenant effectivement dans l’estimation de la position du récepteur tout en exposant le plus clairement possible la riche thématique associée au temps où la relativité joue un rôle 2 crucial. Ce livre est articulé en différentes parties comme suit. Nous décrivons d’abord en quoi consiste la mesure du temps, qui est à la base de la géolocalisation par satellites, quelles sont les caractéristiques des horloges, ainsi que les principales références de temps utilisées. 1. Parmi les ouvrages de référence, citons ceux de Parkinson et Spilker (1995), Leick (2004), Kaplan et Hegarty (2006), Misra et Enge (2012), Teunissen et Montenbruck (2017) et celui en langue française de Duquenne et al. (2005). 2. Pour une première approche (simplifiée mais assez complète) du rôle de la relativité dans la géolocalisation par satellites, voir le livre de Spagnou (2012). Pour une synthèse claire et d’accès aisé sur les relativités (restreinte et générale), voir l’ouvrage de Le Bellac (2015). Pour une explication des nombreux effets relativistes où le temps joue un rôle essentiel et une revue des idées fausses chroniques, voir le livre de Spagnou (2017).
xiv
Le temps dans la géolocalisation par satellites
Nous abordons ensuite les signaux, fréquences, modulation et informations utilisés par les satellites pour la navigation avant de présenter les mesures générées par un récepteur qui vont servir à calculer sa géolocalisation. La discussion suivante porte sur les différents postes d’erreurs qui affectent les mesures GNSS (Géolocalisation et Navigation par un Système de Satellites) et donc la précision de géolocalisation. Afin de réduire certains postes de ces erreurs, les combinaisons classiques de mesures GNSS sont présentées ainsi que leurs principales caractéristiques. L’étape suivante consiste à détailler les données de navigation satellites qui contiennent les informations d’orbites et d’horloges ainsi que les biais en fréquences nécessaires à la géolocalisation. La géolocalisation suppose de disposer de mesures de géolocalisation, mais également d’une carte sur laquelle on reporte les coordonnées, donc d’une référence d’espace. Ce sujet important et délicat fait l’objet d’une discussion dédiée en se basant sur les conventions IERS (International Earth Rotation and Reference Systems Service). À ce stade nous disposons de tous les concepts et informations pour faire un calcul de géolocalisation, que ce soit avec la constellation GPS seule ou avec les constellations GPS et Galileo combinées. Cette première présentation étant faite, nous passons ensuite aux aspects relativistes et aux effets spécifiques sur le temps, tant du point de vue de la relativité restreinte, avec en particulier l’étonnant et méconnu effet Sagnac, que de celui de la relativité générale. Pour comprendre les implications de cette dernière, nous mettons préalablement en perspective la théorie de la gravitation développée par Isaac Newton et la révolution conceptuelle proposée par la théorie de la gravitation développée par Albert Einstein. Pour illustrer la richesse des effets relativistes sur le temps, nous décrivons en détail les deux expériences fondatrices qui ont visé à mettre en évidence ces effets au travers de la désynchronisation des horloges. Puis nous présentons une introduction aux techniques de génération d’une référence de temps prenant en compte les effets relativistes au moyen d’un réseau dense d’horloges et nous décrivons les moyens déployés pour compenser les effets relativistes dans les systèmes de géolocalisation par satellites. Un chapitre est dédié au transfert de temps et de fréquence et leur réalisation avec les systèmes GPS, notamment la prise en compte de l’effet Sagnac. La fin de l’ouvrage propose une introduction à la restitution d’orbites de satellites de constellations et aux systèmes d’augmentation par satellites. Cet ouvrage s’adresse aux physiciens désireux de mieux comprendre le rôle de la relativité dans la géolocalisation par satellites, mais aussi aux ingénieurs souhaitant maîtriser l’algorithmique requise dans les systèmes de navigation par satellites, ou encore aux enseignants qui disposent ici d’un sujet aux vertus pédagogiques immenses. Comme la technologie de la navigation a été développée par les Américains, il n’est pas étonnant de trouver dans ce domaine un vocabulaire technique comprenant beaucoup d’anglicismes. Nous avons évité autant que possible les termes anglo-saxons et seuls demeurent ceux qui servent à la clarté de l’exposé.
Chapitre 1 La mesure du temps Le temps physique est ce que mesure une horloge 3, une horloge étant un système composé d’un processus physique périodique et d’un compteur du nombre de cycles. On mesure en fait toujours une durée, le temps indiqué par une horloge correspondant à un nombre de cycles comptés depuis une origine donnée. L’unité de base du système international d’unités dans le domaine temporel est une unité de durée : la seconde. La définition de la seconde et la réalisation de cet étalon de mesure ont posé plusieurs difficultés techniques. La mesure d’une durée passe par la mesure d’une autre grandeur issue d’un mouvement répétitif et régulier. Le mouvement de rotation de la Terre sur elle-même, puis celui de la Terre autour du Soleil ont servi de définition pour le jour et l’année. Cependant, les mouvements en question sont plutôt lents en comparaisons des activités qui règlent la vie des hommes et des phénomènes physiques qu’ils étudient. Pour mesurer le temps, il faut disposer de mécanismes qui génèrent une oscillation périodique (voilà pour l’aspect répétitif) et l’entretiennent (voilà pour l’aspect régularité). De plus, dans le but de discerner avec précision des événements fugitifs, il est nécessaire que la fréquence de battement de l’oscillation soit rapide. Les pendules mécaniques, par leurs mouvements d’aller-retour en sont un premier exemple, les oscillateurs basés sur les propriétés atomiques de la matière fournissent des oscillations à haute fréquence et d’une très grande régularité.
1.1
La réalisation de la seconde
Théoriquement, on pourrait obtenir l’unité de durée (la seconde) par une seule oscillation. Pour cela, il faut définir un point de référence sur cette oscillation et obtenir l’information du prochain passage du mouvement périodique sur 3. Cette définition que nous adoptons ne repose que sur un seul concept : celui de « vieillissement » d’un mobile entre deux points-événements, un événement étant défini par quatre coordonnées.
2
Le temps dans la géolocalisation par satellites
ce point. Du moment que l’on connaît parfaitement la position du point de référence et l’instant où le mouvement se replace parfaitement sur ce point, l’unité de temps est définie comme étant la durée écoulée entre ces deux événements. Cependant, la réalisation pratique de cette expérience va se heurter aux incertitudes de mesures et au caractère non instantané de la transmission de l’information. Par exemple, si l’information de passage de l’oscillation au point de référence est affectée d’une erreur Δt alors la seconde n’est fournie qu’à Δt près en valeur relative. Se pose ensuite le problème de la reproductibilité de l’expérience. Dans ce domaine comme dans d’autres, l’écart entre la théorie et la pratique se révèle plus important en pratique qu’en théorie.
1.1.1
Le postulat de reproductibilité
Lorsque l’on utilise un mouvement oscillatoire pour mesurer la durée, on admet implicitement que le phénomène peut être reproduit exactement à l’identique à tout moment et à la demande. Cependant, nous savons que pour des systèmes déterministes mais chaotiques, des variations infimes dans les conditions initiales, que ce soit la position, la vitesse ou tout autre paramètre physique, peuvent conduire à des divergences considérables du mouvement au bout d’un certain temps. La reproductibilité parfaite repose sur la maîtrise complète de l’ensemble des causes et des conditions de génération du mouvement périodique. Or, cette maîtrise complète n’est jamais possible car il existera toujours des facteurs sur lesquels notre contrôle est forcément limité comme la précision du montage et des réglages, mais aussi par des phénomènes physiques parasites qui viennent perturber le système tels que les courants induits, les frottements, ainsi que l’usure naturelle. Le postulat de reproductibilité suppose que l’on puisse construire et isoler un phénomène qui soit autonome, permanent et singulier. L’analyse scientifique poussée des phénomènes physiques montre que ces derniers apparaissent de façon transitoire, et qu’ils sont en constante transformation. Les phénomènes surgissent en dépendance par rapport à un ensemble de causes et conditions. En conséquence, tous les phénomènes observables existent sur les modes de l’impermanence et de l’interdépendance, ce qui est en contradiction avec le postulat de reproductivité. En effet, ce dernier suppose que l’on peut isoler le système périodique de tout le reste pour en faire un système singulier, permanent et indépendant. Si l’on connaissait parfaitement l’ensemble complet de toutes les causes qui participent au phénomène physique étudié ainsi que sa loi d’évolution dans sa formulation la plus exacte, son futur serait parfaitement prédictible donc déterministe (si l’on fait abstraction des lois de la physique quantique applicables aux systèmes microphysiques selon lesquelles il existe un indéterminisme fondamental pour les mesures réalisées). Mais la chaîne causale d’un phénomène physique est toujours indéfinie, ce qui fait que l’approche déterministe est en fait une réduction des facteurs
La mesure du temps
3
causaux sur un ensemble connu et nécessairement fini. La mesure du temps doit donc se faire sur la base de processus physiques et de dispositifs qui dépendent peu de ces causes perturbatrices et dont il est possible d’estimer les amplitudes de façon à garantir une stabilité que l’on peut mesurer et contrôler à long terme. Les secondes réalisées en pratique diffèrent donc inévitablement des secondes idéales (qui correspondraient à un processus physique périodique à la régularité parfaite) : ces différences sont corrélées d’une seconde à l’autre et ne sont pas nulles en moyenne. Pour construire une donnée précise sur la base de ces différences, on choisit d’effectuer une moyenne sur un certain nombre de secondes réalisées. Dans la pratique, il apparaît une durée optimale pour ce calcul de moyenne au-delà de laquelle on ne gagne plus en précision. Chaque laboratoire de temps fournit une réalisation propre de la seconde et la livre au Bureau International des Poids et Mesures (BIPM). Il revient au BIPM de construire ensuite une moyenne pondérée de toutes les réalisations de la seconde qu’il reçoit et de délivrer le temps unique. La seconde que l’on obtient offrira toutes les qualités d’un produit consolidé mais elle est affectée d’incertitudes ayant deux origines bien distinctes : la première est une incertitude expérimentale propre à chaque laboratoire, la seconde est due à la façon de faire la moyenne entre plusieurs réalisations.
1.1.2
Le temps propre
L’unité de durée, la seconde, désignée comme l’unité de temps est, dans sa définition actuelle, une unité à réaliser localement par un dispositif présentant de très bonnes propriétés de reproductibilité du phénomène oscillatoire. Le temps ainsi défini est le temps propre de l’oscillateur. Il est propre à l’oscillateur considéré car un oscillateur possède des imperfections qui lui sont propres. Nous verrons à partir du chapitre 13 que la théorie de la relativité enrichit considérablement la notion de temps propre, ce dernier jouant un rôle central dans la théorie.
1.2
Fréquence, phase et temps d’un oscillateur
Une base de temps (Frequency Standard) est un composant qui produit un étalon de fréquence (ou de phase). La construction d’un étalon de fréquence tente de produire une onde aussi proche que possible d’une sinusoïde, autrement dit de garantir la pureté spectrale (une raie), et dont la fréquence est aussi proche que possible de sa valeur nominale. Mais aucune des périodes de cette onde n’est identifiée ou numérotée. L’oscillateur (base de temps) devient une horloge si on lui adjoint un compteur continu permettant cette identification des périodes accumulées et donnant ainsi le nombre de secondes, minutes, heures, etc. Ceci est réalisé le plus
4
Le temps dans la géolocalisation par satellites
souvent en numérotant des impulsions à la fréquence de 1 Hz que l’on nomme top à la seconde. Si l’horloge était parfaite avec la fréquence f0 , son oscillateur produirait le signal temporel parfait suivant (d’amplitude A) : S0 (t) = A sin (2πf0 t) = A sin (Φ0 (t)) .
(1.1)
Cependant, le signal temporel qui est délivré par l’oscillateur d’une horloge H est perturbé à la fois en amplitude et en phase : SH (t) = (A + δA (t)) sin (2πf0 t + ϕH (t)) = (A + δA (t)) sin (ΦH (t)) . (1.2) Ici, la quantité ΦH (t) représente la phase totale accumulée à l’instant t depuis une origine donnée, en général définie à zéro, et δA est la variation d’amplitude du signal. Comme on s’intéresse uniquement à la variation de phase de l’oscillateur, on néglige les variations en amplitude (δA = 0), ce qui revient à considérer le signal « réel » suivant : SH (t) = A sin (2πf0 t + ϕH (t)) = A sin (ΦH (t)) .
(1.3)
La grandeur f0 est la fréquence nominale, constante et t est le temps propre idéal fondé sur la définition de la seconde. La fréquence représente le taux de répétitivité d’un événement périodique. De façon équivalente, la fréquence représente la variation de la phase accumulée ΦH dans le temps : fH =
1 dΦH . 2π dt
(1.4)
L’intervalle de temps TH correspondant à une période de répétitivité du signal se calcule simplement comme l’inverse de la fréquence : TH =
1 . fH
(1.5)
La lecture d’une horloge est incrémentée de la valeur théorique de la durée d’une période T0 = f10 chaque fois que la phase totale ΦH (t) augmente de 2π. Ainsi, une horloge permet de mesurer une durée par un comptage du nombre entier de périodes contenues dans cette durée plus une partie fractionnaire. La mesure du temps sera d’autant plus précise que le nombre de périodes comptées est plus grand, autrement dit que la fréquence du signal est plus élevée. On voit donc tout l’intérêt à considérer des oscillations à grande fréquence, c’est-à-dire dont la période de répétitivité est très petite. Actuellement, la seconde est définie à partir de la durée d’une transition électronique dans un atome de césium. L’émission d’une radiation par un atome excité se fait par le saut d’un électron situé à un certain niveau d’énergie vers un niveau inférieur. Ce phénomène est appelé transition électronique. Pour certains isotopes, la fréquence de la radiation émise est parfaitement connue. On a choisi le césium
La mesure du temps
5
133 et une radiation déterminée. La seconde est ainsi définie comme la durée de 9 192 631 770 périodes de cette radiation, correspondant à une transition électronique dans le césium 133. Dans ce contexte, l’incertitude de comptage est évaluée à l’erreur de mesure de radiation correspondant à une transition entre les deux niveaux hyperfins. Par conséquent, l’erreur relative de la seconde en un jour est le rapport entre une erreur d’une transition sur les 9 192 631 770 périodes, moyennée sur un jour, soit de 1/ (9 192 632 770 × 86 400) ∼ = 10−15 . Le temps indiqué par l’horloge H à partir de l’origine est donné par : tH = t +
ϕH (t) . 2πf0
(1.6)
La quantité tH est le temps propre de l’horloge H, de telle sorte que le signal délivré par l’oscillateur puisse s’écrire : SH (tH ) = A sin (2πf0 tH ) .
(1.7)
L’écart de temps propre, résultat de l’imperfection de l’oscillateur, est donc égal à : ϕH (t) . (1.8) xH (t) = 2πf0 Cette quantité représente l’instabilité de temps de l’horloge par rapport à l’échelle de temps idéale de référence. On l’appelle encore biais de temps, ou biais de synchronisation entre le temps propre donné par une horloge tH et le temps propre de référence donné par une horloge parfaite t. On a alors la relation fondamentale : xH (t) = tH − t . (1.9) Si les deux sinusoïdes étaient synchronisées au démarrage, on verrait alors un déphasage ϕH (t) s’accumuler au cours du temps entre les deux sinusoïdes. La phase ϕH (t) contient les écarts, aléatoires et systématiques, par rapport à une phase de référence Φ0 (t) = 2πf0 t issue d’un oscillateur idéal : ϕH (t) = ΦH (t) − Φ0 (t). La figure 1.1 illustre l’évolution de la fluctuation de phase ϕ (t) au cours du temps. Cette fluctuation de phase est associée à une fluctuation de fréquence. La fréquence instantanée fH (t) délivrée par l’horloge H est définie par l’expression : 1 dΦH 1 dϕH (t) = f0 + (t) . (1.10) fH (t) = 2π dt 2π dt La perturbation en phase ϕH du signal généré par l’oscillateur s’interprète donc comme une erreur appliquée à la fréquence fondamentale f0 . L’écart de fréquence relative instantanée yH (t) est défini par le rapport suivant : fH (t) − f0 1 dϕH yH (t) = (t) . (1.11) = f0 2πf0 dt
6
Le temps dans la géolocalisation par satellites
Signal de référence fréquence f0
Signal réel fréquence f
Différence de phase M(t)
Fig. 1.1 – L’écart entre la fréquence f du signal réel et la fréquence de consigne f0 génère un changement de phase ϕ (t) entre deux signaux qui évolue au cours du temps. L’écart de fréquence relative traduit la variation instantanée de la fluctuation de phase. Il s’agit d’une quantité sans dimension, petite devant l’unité pour les oscillateurs très stables. Elle représente l’écart normalisé de la fréquence instantanée par rapport à sa valeur nominale. À partir des relations provenant des définitions précédentes, on a l’égalité : yH (t) =
dxH (t) . dt
(1.12)
L’écart de fréquence relative représente la variation des écarts de temps propres.
1.3
Fréquence et accroissement de temps propre
On regarde ici comment établir la relation entre le temps indiqué par une horloge (sa lecture) et sa fréquence propre. Si tH représente le temps propre de l’horloge H exprimé en secondes et si t représente le temps propre d’une horloge idéale placée à côté, on a, d’après les relations précédentes : tH = t + xH (t) .
(1.13)
En dérivant cette expression par rapport au temps propre idéal, on obtient : dtH dxH fH (t) =1+ (t) = 1 + yH (t) = . dt dt f0
(1.14)
La mesure du temps
7
La dérivée du temps propre donné par une horloge physique par rapport au temps propre donné par une horloge parfaite est le rapport des fréquences des deux oscillateurs. Cette relation illustre bien les liens de dépendance temps et fréquences.
1.4
Exactitude et stabilité de fréquence
La performance d’un générateur de fréquence est définie en termes d’exactitude et de stabilité. L’exactitude mesure l’écart moyen de la fréquence générée f par rapport à la fréquence voulue f0 . L’exactitude doit se considérer en valeur moyenne et non en valeur instantanée pour lisser les effets des fluctuations à court terme. C’est pourquoi la déviation moyenne en fréquence est définie par la convolution de la variation temporelle en fréquence à l’aide créneau eT qui prend la valeur de la fonction 1/T sur l’intervalle de temps − T2 , + T2 et 0 ailleurs : Δf (t) = (f ∗ eT ) (t) − f0 =
f (x) eT (t − x) dx − f0 = R
1 T
t+ T2
t− T2
f (x) dx − f0 .
(1.15) Cette opération de convolution consiste à remplacer la fréquence instantanée f (t) par sa moyenne évaluée sur l’intervalle de temps T . Les valeurs d’exactitude sont calculées comme l’écart relatif de fréquence, ce qui correspond à la mesure de l’exactitude y¯ : y¯ (t) =
Δf (t) . f0
(1.16)
Un oscillateur ayant une fréquence spécifique de 10 MHz mais fonctionnant à 9 999 999 Hz a une erreur d’un battement tous les dix millions. Son exactitude y¯ est de 10−7 et l’erreur commise est de 0,00001 %. Le temps généré sur la base de l’oscillateur à la fréquence f ayant une exactitude y¯ produit une erreur de temps moyen x ¯ sur une période T donnée par x ¯ = y¯T . La stabilité de fréquence est définie par la capacité de la source de fréquence à maintenir la génération de fréquence à celle spécifiée sur une période d’observation. La stabilité indique donc dans quelle mesure un oscillateur peut produire le même temps – ou le même décalage de fréquence – sur un intervalle de temps donné. Il ne précise pas si le temps ou la fréquence est « juste » ou « fausse », mais seulement si elle reste la même. En revanche, l’exactitude indique dans quelle mesure un oscillateur a été réglé à la bonne fréquence. La fluctuation de fréquence d’un oscillateur au voisinage de sa fréquence nominale résulte de perturbations telles que le bruit thermique des composants électroniques, le bruit intrinsèque au résonateur qui fournit la fréquence d’oscillation, le vieillissement de l’instrument et les variations de conditions
8
Le temps dans la géolocalisation par satellites
ambiantes. Ces différents bruits sont considérés comme des bruits blancs et peuvent atteindre des amplitudes de 10 ns pour les satellites GNSS. Si l’oscillateur fonctionne en horloge, son instabilité de fréquence entraîne des fluctuations de l’échelle de temps qu’il produit par rapport au temps idéal construit à partir de sa fréquence nominale. Ces définitions permettent de modéliser la fréquence mesurée f par l’expression : f = f0 × (1 + y¯ + β) . (1.17) Ici f0 est la fréquence nominale. L’exactitude y¯ est la partie déterministe de la perturbation de la fréquence nominale soit un biais de fréquence inconnu. Dans le cas où la valeur de y¯ serait connue, l’exactitude deviendrait alors l’incertitude sur cette valeur. La stabilité correspond donc à l’amplitude des fluctuations β. Ces fluctuations représentent la partie stochastique de la perturbation, c’est un bruit de fréquence. Dans la suite, on considère l’exactitude y0 d’une horloge à une date donnée, disons t0 et on étudie le comportement de la fréquence autour de cette date. La figure 1.2 illustre la relation entre l’exactitude et la stabilité. Un oscillateur stable peut produire un fort décalage en fréquence. Un oscillateur instable qui vient d’être ajusté pourrait produire temporairement une fréquence proche de sa valeur nominale. Parmi les différentes sources d’instabilité, on distingue celles qui sont d’origines aléatoires et celles qui sont déterministes. Dans le premier cas, les fluctuations observées sont traitées comme des variables aléatoires avec un bruit associé (blanc ou coloré). Dans le second cas, les fluctuations sont des fonctions de paramètres tels que la température ou le vieillissement. On peut maintenant préciser la modélisation de la fréquence par un développement à l’ordre un : f (t) = f (t0 ) + f˙ × (t − t0 ) + f˜(t) , = f0 + (f (t0 ) − f0 ) + f˙ × (t − t0 ) + f˜(t) , = f0 + f0 · y0 + f˙ × (t − t0 ) + f˜(t)
(1.18)
avec f0 la fréquence de consigne, f˙ la dérive en fréquence et f˜ une erreur de génération aléatoire de fréquence qui représente f0 β, où le paramètre β, défini au début de cette section, représente l’instabilité de l’horloge. Passons à une équation faisant intervenir l’écart de fréquence relative instantanée : f (t) − f0 f˙ f˜ y (t) = = y0 + · (t − t0 ) + (t) . (1.19) f0 f0 f0 On intègre cette équation pour exhiber l’évolution du décalage de temps (offset) à l’instant t : t ˜ f f˙ 2 x(t) = x0 + y0 · (t − t0 ) + · (t − t0 ) + (s)ds . 2f0 f t0 0
(1.20)
Les trois premiers termes représentent des effets systématiques qui peuvent être estimés en comparant l’horloge considérée à une horloge de référence. Le terme
La mesure du temps
9
f
f0 Stable mais pas exact
t
f f0 t Ni stable ni exact f f0 Exact mais pas stable
t
f f0 t Stable et exact
Fig. 1.2 – Différentes qualités d’oscillateurs en exactitude et stabilité.
x0 représente le biais de synchronisation à t0 , le terme y0 représente un biais en fréquence soit un accroissement constant de l’erreur, et le troisième représente une dérive en fréquence. Le dernier terme représente la fluctuation aléatoire de la fréquence qui dépend de conditions matérielles et environnementales. Cette fluctuation aléatoire se caractérise par des outils propres aux traitements du signal comme la variance, particulièrement la variance d’Allan (que nous décrivons plus loin) et la fonction d’autocorrélation. En multipliant l’équation décrivant l’évolution du décalage de temps par 2πf0 , on retrouve l’erreur commise sur la fluctuation de phase (avec t0 = 0) : ϕ (t) = 2π a0 + a1 t + a2 t2 ,
(1.21)
où : a0 : est le biais de phase, c’est-à-dire le biais de temps ; a1 : est le biais de fréquence, c’est-à-dire la dérive de l’horloge ; df a2 : est défini par a2 = 12 df dt avec dt la dérive en fréquence ou « ageing ».
10
1.5
Le temps dans la géolocalisation par satellites
Mesure de l’instabilité des oscillateurs
La stabilité est définie comme l’estimation statistique de la fréquence ou de fluctuations temporelles d’un signal sur un intervalle de temps donné. Ces fluctuations sont mesurées par rapport à une fréquence moyenne ou un biais de temps moyen. La stabilité court terme se réfère généralement à des fluctuations sur des intervalles de moins de 100 secondes. La stabilité long terme se réfère généralement à des périodes plus longues, d’un jour environ. Les estimations de stabilité peuvent être effectuées soit dans le domaine des fréquences soit dans le domaine temporel, et peuvent donc être calculées soit à partir d’un ensemble de mesures de décalage en fréquence soit à partir d’intervalles de temps. On pourrait imaginer que l’instabilité, dans le domaine temporel, est estimée en prenant l’écart-type de l’ensemble des données de mesures. Cependant, le calcul de l’écart-type ne converge que sur des données stationnaires, c’està-dire des données qui fluctuent autour d’une valeur constante. Dans le cas non stationnaire, l’ajout d’une nouvelle donnée fera évoluer le calcul de la moyenne et de la variance entraînant la divergence de dette dernière. Or, les horloges ont un comportement majoritairement non stationnaire puisqu’elles contiennent une composante de bruit dépendante du temps. Pour cette raison, une variable statistique non classique est utilisée pour estimer la stabilité dans le domaine temporel : la variance d’Allan (AVAR), du nom de son inventeur David Allan et publié dans son article fondateur (Allan, 1987). L’écart-type associé porte le nom de déviation d’Allan.
1.5.1
Définition théorique de la variance d’Allan
La définition théorique de la variance d’Allan fait intervenir la notion d’Espérance mathématique en considérant un flot de données contiguës d’écarts de fréquence relative moyennés sur un intervalle de temps τ . On regarde donc la série temporelle d’écarts de fréquence relative aux instants discrets tk tels que tk+1 − tk = τ . La moyenne de l’écart de fréquence relative instantanée y (t) sur un intervalle de temps de durée τ à partir de la date tk s’écrit : y (tk ) =
1 τ
tk+1
y (s) ds.
(1.22)
tk
Par abus de langage, on écrit y¯k à la place de y (tk ). D’après les équations précédentes, et à partir du lien entre écart de temps et écart normé de fréquence, on obtient : y¯k =
1 τ
tk +τ
tk
dx x (tk + τ ) − x (tk ) (s) ds = . ds τ
(1.23)
La mesure du temps
11
On constate que la moyenne de l’écart de fréquence relative entre deux instants consécutifs dépend de la durée de l’intervalle τ considéré. On utilisera pour x (tk ) la notation xk . La variance d’Allan est définie comme l’écart quadratique moyen entre deux échantillons successifs de l’écart de fréquence relative instantanée : 1 yk+1 − y¯k )2 . σy2 (τ ) = E (¯ (1.24) 2 C’est une quantité sans dimension. On peut également exprimer la variance d’Allan en fonction des écarts de temps instantanés (qui représentent des écarts de phases instantanés). 1 2 σy2 (τ ) = 2 E (xk+1 − 2xk + xk−1 ) . (1.25) 2τ Contrairement à la variance classique, la variance d’Allan converge quelles que soient les composantes de bruit qui affectent l’exactitude de l’oscillateur.
1.5.2
Incertitudes de prédiction
On s’intéresse ici à la prédiction d’un écart de temps calculé à un instant t sur un instant ultérieur, disons t + τ . Typiquement, nous cherchons à mesurer la qualité, en prédiction, d’un calcul de biais d’horloge, ou si l’on préfère, à caractériser le vieillissement d’une correction d’horloge. Pour mener cette caractérisation, on commence par faire une prédiction de l’écart de temps à t par l’extrapolation linéaire : x ˜ (t + τ ) = x (t) + τ y¯k−1 (t) ,
(1.26)
où x (t) et x ˜ (t + τ ) sont respectivement l’écart de temps à l’instant présent t et la valeur prédite à l’instant t + τ . La quantité y¯k−1 (t) est la valeur de l’écart de fréquence relative moyennée entre l’instant antérieur t − τ et l’instant t. Cette prédiction est entachée d’une erreur aléatoire, Δx (t, τ ), égale à : Δx (t, τ ) = x (t + τ ) − x ˜ (t + τ ) ,
(1.27)
où x (t + τ ) est l’écart de temps qui sera effectivement observé à l’instant t + τ . La quantité Δx (t, τ ) représente donc l’erreur de prédiction du biais d’horloge. La variance de cette erreur caractérise donc l’incertitude de la prédiction (par extrapolation linéaire). Pour calculer cette variance, on utilise les définitions précédentes : Δx (t, τ ) = x (t + τ ) − x (t) + τ y¯k−1 (t) = x (t + τ ) − 2x (t) + x (t − τ ) , (1.28) 2 (1.29) E Δx2 (t, τ ) = E (xk+1 − 2xk + xk−1 ) = 2τ 2 σy2 (τ ) . Le RMS (Root Mean Square, autrement dit la moyenne quadratique) des erreurs de prédiction du biais d’horloge est alors : √ RMS = E[Δx2 (t, τ )] = 2τ σy (τ ). (1.30)
12
Le temps dans la géolocalisation par satellites
Ce calcul conduit à l’utilisation très pratique de la variance √ d’Allan : Le RMS des écarts de temps accumulés sur une durée τ est 2τ σy (τ ) secondes. Autrement dit, si une horloge était synchronisée à une échelle de temps vrai (serveur de temps de référence) au début d’un intervalle de temps de longueur τ , alors la déviation constatée à la fin de l’intervalle sera en moyenne de √ 2τ σy (τ ) secondes.
1.5.3
Calculs de la variance d’Allan
En pratique, on estime cette espérance par un calcul de moyenne. La variance d’Allan est obtenue à partir d’une suite de N mesures de moyennes successives et adjacentes de l’écart de fréquence relative y¯i identiquement espacées d’un intervalle de temps τ . Dans la réalité, on ne dispose jamais d’une infinité d’échantillons et c’est pourquoi on évalue la variance à partir d’un nombre fini de valeurs disponibles. On ne peut donc obtenir qu’une estimation de la variance d’Allan. Par ailleurs, on est le plus souvent en présence d’échantillons prélevés (mesurés) suivant une période d’échantillonnage τ0 . Il faut considérer la période τ d’analyse comme étant toujours un multiple entier de la période d’échantillonnage τ0 . On dispose donc d’une série temporelle de M +1 valeurs de xj à des instants séparés de τ0 ou bien d’une série temporelle de M valeurs moyennes d’écart de fréquence relative y¯kτ0 sur l’intervalle de temps élémentaire de durée τ0 . Ensuite, on regroupe ces données pour en déduire la variance d’Allan pour τ = nτ0 (voir la figure 1.3)
Fig. 1.3 – Regroupement des termes pour le calcul de la variance d’Allan. Les échantillons élémentaires ont une durée d’égale valeur donnée par à τ0 . À partir de ces échantillons élémentaires, on construit les écarts de fréquence relative y¯kτ0 correspondant à la période d’échantillonnage élémentaire ou bien les écarts de fréquence relative y¯kτ correspondant à un multiple de cette période τ = nτ0 (schéma d’après Audoin et Guinot [1998]).
Première méthode de calcul par paquets disjoints La combinaison la plus simple et la plus directe consiste à moyenner des écarts moyens de fréquence relative sur l’intervalle de temps τ . La figure 1.4 présente la situation pour n = 3.
La mesure du temps
13
Fig. 1.4 – Le premier calcul se réalise à partir d’écarts de fréquence relative y¯kτ construits en considérant des paquets disjoints de durée τ (schéma d’après Audoin et Guinot [1998]).
Le calcul s’exprime également en fonction des écarts de temps xj . y¯kτ =
1 n
nk
i=n(k−1)+1
y¯kτ0 =
1 xnk+1 − xn(k−1)+1 . nτ0
(1.31)
Le nombre de paires adjacentes de valeurs de y¯kτ que l’on peut former est égal à: M p= − 1. (1.32) n La valeur estimée de la variance d’Allan est calculée par la moyenne : p p 2 1 11 τ 1 . (¯ yi+1 − y¯iτ )2 = 2 xn(k+1)+1 − 2xnk+1 + xn(k−1)+1 p i=1 2 p i=1 2 (nτ0 ) (1.33) La caractérisation du même oscillateur à partir de séries temporelles différentes mais de même longueur fournit des valeurs différentes de l’estimateur de la variance d’Allan. La valeur moyenne des estimateurs est égale à l’espérance mathématique avec laquelle on a défini la variance d’Allan.
σy2 (τ ) =
Seconde méthode de calcul par recouvrements de paquets Une autre combinaison des données expérimentales fournit des écarts-types de distribution des estimateurs de la variance d’Allan plus petits. Au lieu de former un ensemble de valeurs de y¯kτ comme décrit précédemment, on forme des écarts moyens de fréquence relative qui se recouvrent comme cela est illustré dans la figure 1.5. Le nouveau calcul donne : y¯kτ =
n+k−1 1 τ0 1 y¯ = (xn+k − xk ) . n i=k i nτ0
(1.34)
Cependant, pour le calcul de la variance d’Allan, on ne considère que des valeurs de y¯kτ appartenant à des intervalles adjacents, typiquement des valeurs comme y¯kτ et τ y¯k+n (dans notre dessin du haut y¯1τ et y¯4τ par exemple).
14
Le temps dans la géolocalisation par satellites
Fig. 1.5 – Le second calcul se réalise à partir d’écarts de fréquence relative y¯kτ construits en considérant des paquets de durée τ qui se recouvrent (schéma d’après Audoin et Guinot [1998]).
De nouveau, le nombre de paires adjacentes que l’on peut former est égal à p = M − 2n + 1. Le nouvel estimateur de la variance d’Allan sur la durée d’échantillonnage τ est : σy2 (τ ) =
p p 1 11 τ 1 (xk+2n − 2xk+n + xk ) . (¯ yi+n − y¯iτ )2 = p i=1 2 p i=1 2 (nτ0 )2
(1.35)
Cette façon de calculer est celle qui est recommandée car, pour des données M et n fixées et avec n petit devant M/2, le nombre de paires que l’on forme avec un tel regroupement est très supérieur à celles que l’on forme avec la méthode précédente. La moyenne est donc réalisée sur un ensemble plus riche de valeurs, ce qui lui confère une meilleure qualité d’estimation de l’espérance. On utilise donc pour le calcul de σy2 (τ ) des échantillons y¯k adjacents par période τ . Cette procédure limite le nombre d’échantillons y¯k pour le calcul de la variance d’Allan, ce qui a une influence importante sur l’intervalle de confiance du résultat du calcul. Par ailleurs, on voit également que la période d’analyse τ la plus grande pour laquelle on pourra calculer une variance d’Allan σy2 (τ ) ne peut dépasser la moitié de la durée totale des mesures, puisqu’il faut au moins deux échantillons y¯k pour faire le calcul. Dans ce cas extrême, on ne disposera donc que de deux échantillons y¯k pour calculer la variance d’Allan et l’intervalle de confiance de la valeur calculée sera particulièrement mauvais, au point d’en rendre le résultat inexploitable.
1.5.4
Variance d’Allan en présence d’effets systématiques
Une autre propriété intéressante est le comportement de la variance d’Allan sur l’évolution des signaux : la variance d’Allan supprime la partie linéaire de l’évolution d’une variable aléatoire, ce qui est parfaitement adapté à la variable de mesure du temps, qui est une fonction croissante par construction. Prenons un signal linéaire entaché d’un bruit blanc vk : uk = a + bk + vk .
(1.36)
La mesure du temps
15
La variance d’Allan de ce signal ne va porter que sur la partie bruitée du signal car : uk+1 − 2uk + uk−1 = vk+1 − 2vk + vk−1 .
(1.37)
Du fait de la dé-corrélation du bruit du signal (en utilisant la notation de l’espérance), on a : 2 2 + 4E vk2 + E vk−1 = 6E vk2 . (1.38) E (vk+1 − 2vk + vk−1 )2 = E vk+1 2 2 La formule de calcul de la variance (formule de Köning-Huygens), σv = E vk − E [vk ]2 , nous donne dans ce cas une expression simple de la variance d’Allan : σy2 (τ ) =
3σv2 1 E (vk+1 − 2vk + vk−1 )2 = . 2 2τ τ
(1.39)
La variance d’Allan décroît ici en fonction de l’inverse du carré de l’intervalle d’observation τ . Ce calcul vaut pour les bruits blancs vk car leur espérance E [vk ] est nulle.
1.5.5
Variance d’Allan et densité spectrale de puissance
Pour un oscillateur parfait, toute l’énergie est concentrée sur la fréquence centrale f0 . L’introduction de la phase ϕH (t) dans le signal (équations (1.2) et (1.10)) va distribuer l’énergie du signal sur des fréquences autour de cette fréquence centrale. L’instabilité de l’oscillateur peut alors être caractérisée par cette dispersion d’énergie dans le domaine fréquentiel. La quantité d’énergie répartie sur le spectre en fréquence est donnée par la densité spectrale de puissance 4 du signal. On peut montrer que la variance d’Allan s’exprime en fonction de la densité spectrale de puissance Sy (f ) de la fluctuation de fréquence relative y (t). La variance d’Allan, évaluée sur la durée τ , est une somme pondérée de la densité spectrale de puissance sur tout le spectre de fréquence : ∞ sin4 (πf τ ) Sy (f ) df (1.40) σy2 (τ ) = 2 (πf τ )2 0 Pour le calcul de cette intégrale, on applique un modèle mathématique de la densité spectrale de puissance Sy (f ) dont on a vérifié la validité par l’expérience. Ce modèle consiste à identifier Sy (f ) comme une fonction polynomiale à cinq paramètres : Sy (f ) = h−2 f −2 + h−1 f −1 + h0 + h1 f + h2 f 2 =
2
hα f α
(1.41)
α=−2
4. Dans le formalisme de l’analyse spectrale, la densité spectrale de puissance Sx (f ) 2 1 où E |X (f )| T T
d’un processus aléatoire x (t) se calcule comme la limite Sx (f ) = lim
T →∞
XT (f ) est la transformée de Fourrier de la version tronquée du signal x (t) sur la fenêtre T 2
temporelle de longueur T : XT (f ) = ∫ x (t) e−2πif t dt. La moyenne quadratique du signal −T 2
est la somme de la densité spectrale de puissance sur toute la gamme des fréquences sur ∞ la bande de fréquence Δf est donné par : E g 2 (t) = ∫ Sg (f ) df . Par analogie, le RMS 0
des valeurs du carré g 2 calculé sur la bande de fréquence Δf se calcule par l’intégrale : 2 gRMS = ∫ Sg (f ) df . Δf
16
Le temps dans la géolocalisation par satellites
Cette représentation est valide pour les signaux aléatoires qui vérifient les propriétés suivantes : le processus est ergodique et la densité de probabilité de la fluctuation en fréquence y (t) suit une loi normale centrée. Chacun des cinq paramètres du modèle qui contribuent à l’instabilité de l’oscillateur correspondent à des processus de bruits spécifiques qui déforment la porteuse pure. Chacun de ces processus porte un nom spécifique comme indiqué dans le tableau ci-dessous. α 2 1 0 -1 -2
Appellation du processus de bruit Bruit blanc de phase Bruit de scintillation de phase Bruit blanc de fréquence Bruit de scintillation de fréquence Bruit de fréquence en marche aléatoire
p -2 -2 -1 0 1
Bien que l’existence de ces bruits soit expérimentalement démontrée et admise par la communauté, leur origine est plus ou moins bien connue. On trouvera une discussion à ce sujet dans le livre d’Audoin et Guinot (1998). À chacun de ces bruits correspond un développement de la variance d’Allan en puissance p de l’intervalle de temps τ (voir le tableau ci-dessus) : σy2 (τ ) = kp τ p
(1.42)
Dans la pratique, le calcul de la variance d’Allan est réalisé sur des échantillons de temps supérieurs à une seconde. La densité spectrale de puissance est mesurée pour des fréquences supérieures à 1 Hz (typiquement entre 1 Hz et 1 MHz) pour des raisons d’instrumentation. Cela limite fortement l’intérêt d’utilisation de la formule (1.40) pour les valeurs de τ qui nous intéressent (c’est-à-dire supérieures à 1 s). En pratique, on calcule donc la variance d’Allan à partir des biais de temps xk ou la moyenne des fluctuations de fréquence relative y¯k selon les formules (1.33) ou (1.35). Selon l’allure de la variance d’Allan, la formule (1.42) permet d’identifier le type de bruit qui affecte l’oscillateur.
1.6
Différents types d’oscillateurs
Les récepteurs GNSS ont besoin d’un générateur de fréquence pour répondre à un besoin de prise et de datation de mesures. Ses caractéristiques se définissent en termes de dérive, de vieillissement de la dérive et de bruit. Pour la plupart des applications, cette fréquence est générée par un cristal de quartz grâce à ses propriétés de piézoélectricité. La taille et la forme du cristal déterminent la fréquence de résonance. La dérive de ces oscillateurs peut cependant être importante. Un oscillateur à cristal de quartz (XO pour X(Crystal) Oscillator) a une stabilité court terme (∼ 1 s) de 10−9 à 10−11 et une stabilité long terme (∼ 1 jour) de 10−6 à 10−9 . La fréquence de résonance du cristal dépend de la température. La stabilité d’un cristal dépend donc du contrôle de cette température. Un oscillateur à cristal de quartz à températures compensées (TCXO pour Temperature Compensated X(Crystal) Oscillator) utilise des données de température pour contrôler le voltage à appliquer à l’oscillateur. Un oscillateur à cristal de quartz thermostaté (OCXO pour Oven Controlled X(Crystal) Oscillator) est maintenu à une température constante à l’intérieur d’une enceinte thermostatée.
La mesure du temps
17
Une horloge atomique génère une fréquence très stable (10 MHz). Une horloge atomique de type césium ne présente pas de dérive (car le césium sert actuellement de base à la définition de la seconde) mais un bruit important. Une horloge atomique de type rubidium présente une caractéristique de bruit faible mais une dérive non nulle. Toutes deux ont une stabilité long terme de 10−12 à 10−14 . Un générateur de fréquence de type XO peut perdre ou gagner 1 milliseconde par jour tandis qu’une horloge atomique peut perdre ou gagner quelques dizaines de nanosecondes selon la technologie. Pour utiliser une horloge atomique dans un récepteur, plusieurs architectures sont possibles. Le récepteur peut utiliser directement l’horloge atomique pour générer la réplique et définir le déclenchement de la mesure. Une autre architecture consiste à utiliser l’horloge atomique pour piloter le quartz local au récepteur. Le quartz local produira une mesure de phase très peu bruitée et sa dérive long terme sera asservie sur celle de l’horloge atomique. Avec cette dernière architecture, on a l’avantage d’avoir une mesure de phase de bonne qualité tout en bénéficiant des propriétés de faible dérive des horloges atomiques.
1.7
L’échelle de temps
Pour décrire les phénomènes évolutifs de la physique, il nous faut une échelle de repérage dans le temps (attribuer une position à une date donnée par exemple) dont la qualité essentielle est qu’elle soit accessible et acceptée par tous. L’échelle de temps idéale est celle obtenue par accumulation de secondes idéales – donc rigoureusement exactes – ce que l’on appelle parfois échelle de temps intégrée. La réalisation d’une échelle de temps est faite par accumulation (ou intégration) de secondes réalisées. Or, en même temps que l’on cumule les secondes, on cumule également les erreurs de réalisation de cette seconde. En conséquence, la divergence entre échelle réalisée et échelle idéale croît sans cesse. Cette divergence peut prendre rapidement une ampleur gênante. En reprenant par exemple la performance de 5 × 10−15 d’incertitude de la seconde, l’échelle de temps intégrée sur dix ans pourra diverger d’une microseconde par rapport à une échelle de temps idéale (5 × 10−15 × 86 400 (s/j)×365 (j/a)×10 (a)). Pour certaines applications (évaluation de la rotation des pulsars), cet écart n’est pas négligeable.
1.7.1
Réalisation d’une échelle de temps atomique intégrée
Il s’agit ici d’étalonner la fréquence d’une horloge à quartz par rapport à la fréquence délivrée par une horloge atomique. Il est alors possible d’établir une échelle de temps atomique, fondée sur la fréquence de transition atomique, à partir de l’horloge à cristal de quartz. On suppose fixée la valeur de la fréquence nominale de transition fCs,0 . La fréquence de l’horloge à quartz externe étant fQ , on commence par mesurer les différences de fréquences relatives yCs (θi ) − yQ (θi ) aux dates épisodiques θi . Connaissant ces valeurs, on essaye d’estimer au mieux l’évolution de la fonction yCs (θ) − yQ (θ). On s’intéresse alors à l’écart Δ = tA − tQ qui va ramener le temps de l’horloge à quartz vers le temps donné par l’horloge atomique (le temps atomique).
18
Le temps dans la géolocalisation par satellites
De l’équation générique tH = t + xH (t), on déduit que [tA − tQ ] (θ) = [xA − xQ ] (θ). On obtient alors directement le temps atomique tA par correction des lectures d’horloges à quartz tQ en calculant l’écart Δ (θ) à chaque instant θ : θ [yCs − yQ ] (s) ds. (1.43) Δ (θ) = Δ (θ0 ) + θ0
On construit ainsi un temps atomique intégré tA en appliquant continument sur tQ la correction : (1.44) tA (θ) = tQ (θ) + Δ (θ) . L’origine de tQ (θ0 ) est celle qui est lue sur l’horloge à quartz au début. Celle de tA (θ0 ) est arbitraire mais a été fixée égale au 1er janvier 1958 à 0h00 UT2 (la définition de l’UT2 sera donnée plus bas). Le lecteur intéressé sur la réalisation des échelles de temps pourra se référer au livre d’Audoin et Guinot (1998).
1.7.2
Propriétés d’une échelle de temps
Une échelle de temps doit être continue, accessible, stable et exacte. Par continuité, il faut entendre que la génération de l’échelle de temps ne doit pas être interrompue, elle ne doit donc pas reposer sur une horloge unique mais plutôt sur un ensemble d’horloges pour apporter la redondance nécessaire. L’échelle repose donc sur une horloge composite à partir des différences des lectures de toutes les horloges qui participent au calcul. L’accessibilité dépend du degré de stabilité cherché : une génération d’une échelle de temps en « temps différé » sera d’autant plus stable qu’elle intègrera des processus de lissage et d’exclusion de mesures dans sa génération à partir de mesures brutes de temps.
1.7.3
L’échelle de temps TAI
Le temps atomique international (TAI) est la réalisation de l’échelle de temps terrestre. Il doit être exact et stable, ce qui signifie le maintien de l’exactitude et de la pureté de la fréquence générée par l’oscillateur étalon. Le TAI est produit en temps différé. Il est continu : aucun saut n’est possible, aucune interruption ne peut être rattrapée. C’est le temps de la physique. Il est généré et distribué par le BIPM (Bureau International des Poids et Mesures) à partir de la donnée de plusieurs centaines d’horloges atomiques réparties dans plusieurs dizaines de laboratoires appartenant à différents pays. Ce temps est réalisé par des corrections calculées aux lectures des horloges participantes, ce qui conduit à prendre en compte des données de qualités différentes via des algorithmes de pondération. Le TAI est donc une échelle de temps moyenne dont les algorithmes générateurs permettent de retirer ou d’ajouter une horloge sans perturber la moyenne restituée.
1.7.4
L’échelle de temps universel UT
Le temps universel UT est fondé sur la rotation de la Terre. Comme la rotation de la Terre ne présente pas de caractère uniforme, ni dans la position de son axe ni dans la vitesse de rotation, plusieurs échelles vont être dérivées afin de pallier ces différentes irrégularités. Les mesures précises sur la rotation de la Terre sont données par l’interférométrie à très longue base (VLBI pour Very Long Baseline Interferometry). Cette technique
La mesure du temps
19
consiste à enregistrer les signaux émis par des objets stellaires lointains (les quasars par exemple) au moyen de plusieurs radiotélescopes. La réception des signaux est datée très précisément par des horloges atomiques. Pour un même signal reçu par deux radiotélescopes, les données sont assemblées et corrélées au moyen de la datation. Les franges d’interférence que l’on obtient fournissent des informations sur la différence de longueur du chemin optique. L’effet de la rotation de la Terre va modifier ces longueurs et donc engendrer une variabilité des franges d’interférences. L’analyse de la variation temporelle de la figure d’interférence des deux signaux assemblés permet de remonter à la vitesse de rotation de la Terre. Plus les stations de réceptions sont éloignées, plus la précision de la mesure est importante. De grandes lignes de base permettent d’atteindre une résolution angulaire de quelques dizaines de microsecondes de degrés et une précision de quelques millimètres sur la position du pôle de la Terre. Cette technique, illustrée en figure 1.6, permet d’évaluer la vitesse de dérive des plaques continentales, on a pu mesurer par exemple que les plaques américaines et européennes s’écartent d’environ 2 cm par an.
Fig. 1.6 – Principe de mesure VLBI. La réception de signaux en phase ou en opposition de phase crée des franges d’interférences. Leurs variations dans le temps sont fonction de la variation temporelle de la distance d qui représente l’écart de distance entre les deux chemins parcourus par le signal. La variabilité de d est directement issue de la vitesse de rotation de la Terre. La technique VLBI permet donc d’inférer cette dernière. Des observations faites sur de longues périodes ont permis d’établir que la vitesse de rotation de la Terre est affectée d’un ralentissement de 2 millisecondes par siècle soit environ une perte d’une heure par millénaire à laquelle s’ajoutent des fluctuations irrégulières. Cette variabilité dépend de plusieurs facteurs dont l’effet prépondérant est dû aux échanges d’énergie entre la Terre et la Lune. D’une part, les phénomènes de marées génèrent des frottements des masses d’eau sur la croûte terrestre. D’autre part, tout comme l’influence gravitationnelle de la Terre sur la Lune a eu pour effet de fixer la vitesse de rotation de la Lune à sa période orbitale autour de la Terre – de ce fait la Lune nous présente toujours la même face, l’influence gravitationnelle de la Lune sur la Terre se traduit par un ralentissement de sa vitesse de rotation. En effet, la force d’attraction de la Lune sur la Terre agit à la fois sur les océans mais aussi sur la structure de la croûte terrestre entraînant des déformations de celle-ci appelées les marées terrestres ou marées solides. Sous l’action de ces marées, la Terre présente un bourrelet orienté dans la direction Terre-Lune. Ce bourrelet se déplace
20
Le temps dans la géolocalisation par satellites
donc sur la Terre, suite à la rotation diurne autour des pôles. Un point sur la surface de la Terre monte et descend deux fois par jour avec des amplitudes allant de 20 à 45 cm selon le lieu géographique. Cependant, comme la rotation de la Terre sur elle-même est plus rapide que la période de rotation de la Lune autour de la Terre, la Terre emporte ce bourrelet dans sa rotation, le positionnant légèrement en avance par rapport à la direction Terre-Lune. Le fait que ce bourrelet ne soit pas exactement dans la direction Terre-Lune mais légèrement décalé va générer un couple qui va tendre à faire diminuer le moment cinétique de rotation de la Terre. Si l’on considère la conservation des moments cinétiques du couple Terre-Lune, le ralentissement de la période de rotation de la Terre va augmenter le moment cinétique de la Lune et donc éloigner cette dernière de la Terre d’environ 4 cm par an. D’autres contributions de natures fluctuantes participent à la variabilité de la vitesse de rotation. Le temps UT0 est rapporté à l’axe polaire géographique de la Terre : il n’est pas corrigé du mouvement du pôle de rotation instantanée. Il est donc affecté à la fois par la variation de la vitesse de rotation de la Terre et par le mouvement du Pôle de rotation. Le temps UT1 est rapporté à l’axe instantané de rotation de la Terre. Il est obtenu à partir de l’UT0 en éliminant les effets du mouvement du pôle de rotation terrestre. Le temps UT2 est obtenu à partir de l’UT1 en éliminant les variations saisonnières, ce qui le fait correspondre à une version lissée de ce dernier. Le caractère variable de la rotation de la Terre a conduit à l’abandon de l’UT1 comme échelle de temps. Cependant, il reste indispensable pour les transformations de repères terrestre et céleste. La détermination de l’angle de rotation de la Terre (ERA pour Earth Rotating Angle) et de l’UT1 est sous la responsabilité de l’IERS (International Earth Rotating Service) situé à l’Observatoire de Paris. On a défini l’origine du TAI de telle sorte qu’il était égal à l’UT1 le 1er janvier 1958 à 0h00.
1.7.5
Le temps universel coordonné UTC
L’échelle de temps UTC (Universel Time Coordinated) est la référence de temps officielle utilisée pour la datation d’événements. Sa construction doit satisfaire à deux contraintes : la première est d’être aussi proche que possible du temps terrestre UT1, la seconde est d’être une échelle de temps ayant les mêmes qualités que le temps TAI. Pour répondre à ces exigences, l’UTC est défini selon les deux critères suivants : – la seconde UTC est définie de façon à être exactement égale à la seconde TAI, ce qui rend l’échelle de temps UTC parallèle à l’échelle de temps TAI à un nombre entier n de secondes près (qui peut être positif ou négatif) : UTC − TAI = n,
(1.45)
– l’UTC reste proche à moins d’une seconde de l’UT1, c’est-à-dire que le nombre n est choisi de telle sorte que : |UTC − UT1| < 0, 9.
(1.46)
L’échelle de temps UTC donne donc un accès au TAI modulo un nombre entier de secondes, ainsi qu’à l’UT1 à une précision inférieure à la seconde. Le nombre de secondes intercalaires (Leap seconds) entre l’UTC et le TAI n’est changé que si
La mesure du temps
21
nécessaire à la fin du mois de juin (30 juin à 23h59m59s) ou de décembre (31 décembre à 23h59m59s). Quand on ajoute une seconde, elle porte le numéro 60 ; quand on la retire, on omet de compter la seconde 59. La figure 1.7 présente une illustration de ces trois échelles de temps ainsi que les sauts de secondes intercalaires.
Fig. 1.7 – Les différentes échelles de temps TAI, UT1 et UTC et effet des secondes intercalaires. Les sauts de secondes sont définis par l’IERS. Pour l’instant, tous les sauts ont été positifs (voir la figure 1.8). Parfois le rythme d’introduction des secondes intercalaires ralentit, ce qui traduit une accélération de la vitesse de rotation de la Terre. Mais la tendance sur le long terme est bien un ralentissement de la vitesse de rotation et donc à des cumuls de secondes intercalaires positives. Le dernier saut de seconde (état au 1er janvier 2020) s’est produit le 31 décembre 2016, ce qui porte l’écart UTC-TAI à -37 secondes. L’UTC sert de base pour les heures légales en usage dans les pays en lui ajoutant ou en lui soustrayant en général un nombre entier d’heures selon le fuseau horaire. Il existe cependant des pays dans lesquels le décalage n’est pas un nombre entier d’heures (1/2 heure voire 1/4 heure) par exemple l’Inde (UTC+05:30) ou le Népal (UTC+05:45). Comme l’échelle de temps TAI, la génération de l’UTC est sous la responsabilité du BIPM. Ce dernier prend en compte les secondes intercalaires définies par l’IERS qui est en charge de fournir l’échelle de temps UT1. La figure 1.9 présente une illustration des fournitures respectives des deux institutions et le mécanisme des échanges entre eux. Le défaut de l’UTC est de ne pas être une échelle de temps continue contrairement au TAI. L’introduction de secondes intercalaires génère de fait une succession d’échelles de temps parallèles. Pourtant l’accès à l’UT1 peut se faire directement par la dissémination de l’écart UT1-UTC maintenu par l’IERS. C’est en tous les cas l’avis que défend le Bureau des longitudes concernant l’avenir de l’UTC à savoir l’abandon de l’introduction des secondes intercalaires et que, in fine, la distribution de l’UT1 se fasse par le maintien de l’écart UT1-TAI, ce qui reviendrait à l’abandon pur et simple de l’UTC. On trouvera une présentation accessible des calculs de l’UTC et TAI dans les travaux de Proia (2012).
22
Le temps dans la géolocalisation par satellites
Fig. 1.8 – L’UTC est une approximation de l’UT1 par palier (graphe provenant du SYRTE). L’UT1 décroît de façon irrégulière du fait du ralentissement de la rotation de la Terre.
Fig. 1.9 – Connexions entre le BIPM et l’IERS pour générer les différentes échelles de temps. L’IERS fournit l’UT1 et définit le moment d’injection d’une seconde intercalaire. Le BIPM fournit le TAI et l’UTC éventuellement modifié de la seconde intercalaire.
Chapitre 2 Les signaux et messages des systèmes GPS et Galileo Un système de navigation est conçu pour permettre à son utilisateur de se positionner par rapport à un référentiel connu et cartographié. Le principe de base est très simple : le positionnement est obtenu par trilatération à partir de balises dont on connaît la position. Si les objets par rapport auxquels on se repère sont en mouvement, il devient alors nécessaire pour se positionner que le mouvement de ces objets soit bien connu et parfaitement prévisible à l’avance, aussi bien dans l’espace que dans le temps. Dans le cadre de la navigation par satellites, les balises vont être les satellites eux-mêmes. Pourquoi des satellites ? Car leurs mouvements sont prédictibles : ils obéissent aux lois de la mécanique céleste. Ils sont en outre visibles d’une grande zone géographique, ce qui minimise le nombre de balises nécessaires au positionnement (il en suffit de 24 seulement). Les mesures qui vont être utilisées sont les temps de propagation des ondes électromagnétiques envoyées depuis ces satellites jusqu’au récepteur utilisateur. Ces différents temps de propagation vont être convertis en distance entre le récepteur et le satellite. Connaissant avec précision la position des satellites et les distances qui séparent ces derniers du récepteur, le positionnement est alors possible. Si le principe de base est simple, sa réalisation pose d’énormes difficultés techniques et conceptuelles. Tout d’abord, les satellites ne sont pas de simples points fixes dans le référentiel choisi : ils évoluent constamment avec des vitesses élevées, environ quatre kilomètres par seconde. Il faut donc disposer de moyens précis pour les localiser et prédire leurs mouvements. Ensuite, la mesure du temps de propagation nécessite une référence de temps précise que l’on obtient avec des horloges. Il faut une horloge à bord de chaque satellite de navigation pour que le temps d’émission du signal soit connu ; il faut également une horloge au niveau du récepteur pour connaître le temps de réception. Quand on construit le temps de propagation du signal comme les différences de datation entre les instants d’émission et de réception, on fait l’hypothèse implicite que les horloges sont parfaitement synchronisées.
24
Le temps dans la géolocalisation par satellites
D’une part, il n’y a aucune raison pour que l’horloge du récepteur soit synchrone avec les horloges des satellites de la constellation. D’autre part, les horloges des satellites, comme tout mécanisme physique, se dérèglent dans le temps et chacune dérive selon sa propre marche. Il faut donc un moyen précis pour synchroniser toutes les horloges entre elles, ce qui suppose que l’on sache construire une référence de temps la plus stable possible et que l’on sache rapporter tous les biais d’horloges, les différents retards ou avances possibles, à cette référence. Cette section est dédiée à la description des signaux de navigation qui permettent de réaliser des mesures de distance ainsi que ceux qui permettent de transmettre les informations nécessaires qui permettent de calculer à tout moment la position des satellites de navigation ainsi que de synchroniser toutes les horloges des satellites entre elles.
2.1
Les deux concepts de transmission de signaux de navigation : CDMA/FDMA
Les concepteurs des systèmes de navigation par satellites ont proposé deux techniques différentes pour transmettre les informations nécessaires pour le positionnement : le CDMA et le FDMA. Le CDMA, accès multiple par division de code (ou Code Division Multiple Access pour son équivalent anglo-saxon) consiste à réaliser l’ensemble des liaisons radio des satellites de la constellation de navigation simultanément sur la même fréquence. Le récepteur a donc besoin de reconnaître et de différencier les signaux en provenance des satellites en visibilité. Ainsi, chaque satellite module son signal par un code qui lui est spécifique, ce qui étale le spectre de la porteuse unique. Les codes présentent des caractéristiques telles qu’il est aisé de séparer les signaux entre eux au niveau récepteur. Cette technique est utilisée par les systèmes américain GPS et européen Galileo. Le FDMA, accès multiple par division de fréquence (ou Frequency Division Multiple Access pour son équivalent anglo-saxon) attribue une ou plusieurs bandes de fréquences distinctes à chaque satellite. Ces fréquences sont modulées par un unique code d’étalement pour tous les satellites de la constellation. Cette technique est utilisée par le système russe Glonass. Cependant, la multiplication des fréquences introduit des délais instrumentaux spécifiques à chacune d’entre elles, particulièrement au niveau récepteur, ce qui complexifie les techniques de résolution du positionnement. C’est cette raison qui fait prévaloir maintenant le choix du CDMA par rapport au FDMA. Dans cet ouvrage, seul le CDMA est considéré. Récemment de nouvelles techniques ont vu le jour afin de renforcer la bonne réception et le traitement des données pour la navigation en milieu urbain. Parmi ces techniques, citons l’utilisation de la modulation OFDM, Orthogonal Frequency Division Multiplexing, largement utilisée dans les télécommunications, et dont le concept consiste à répartir les données à transmettre sur un
Les signaux et messages des systèmes GPS et Galileo
25
ensemble de sous-porteuses orthogonales proches en fréquences (l’espacement en fréquence de chaque sous-porteuse est un multiple de l’inverse de la durée des symboles à transmettre). Voir les travaux de Serant (2012) pour le traitement des signaux modulés OFDM appliqués à la navigation.
2.2
Lien satellite et récepteur
Chaque satellite GNSS transmet plusieurs signaux différents, utilisant plusieurs fréquences (nombre de fois qu’un phénomène périodique se reproduit par unité de mesure du temps), au moins deux. Tous ces signaux sont construits à partir d’une référence commune qui est un signal sinusoïdal généré par l’horloge atomique du satellite. Cette fréquence fondamentale a pour valeur f0 = 10, 23 MHz. Les fréquences utilisées par les systèmes GPS et Galileo sont des multiples de la fréquence f0 . Le système GPS utilise les fréquences L1, L2 et L5 = E5a : Multiplicateur n1 = 2 × 77 n2 = 2 × 60 n5a = 115
Fréquence (MHz) L1 = 1575, 42 = n1 × f0 = f1 L2 = 1277, 60 = n2 × f0 = f2 L5 = E5a = 1176, 45 = n5a × f0
Longueur d’onde λ = c/f (cm) 19, 05 24, 45 25, 5
Le système Galileo utilise les fréquences E1 = L1, E5a = L5, E5b et E6 : Multiplicateur n5b = 118 n6 = 125
Fréquence (MHz) E5b = 1207, 14 = n5b × f0 E6 = 1278, 75 = n6 × f0
Longueur d’onde λ = c/f (cm) 24, 83 23, 44
La représentation temporelle de la porteuse de fréquence f est modélisée par la sinusoïde : s (t) = A · cos (2πf t) . (2.1) La représentation fréquentielle de la porteuse, par transformation de Fourier, est un point en f (on ne considère que la partie positive du spectre). La porteuse permet d’établir un lien entre l’émetteur et le récepteur mais elle ne porte en elle aucune information. En particulier, elle ne permet de transmettre ni l’information de temps d’émission permettant au récepteur de réaliser sa mesure de pseudo-distance, ni les informations permettant de retrouver la position du satellite au temps d’émission. Il faut donc la moduler, c’est-à-dire effectuer des modifications sur le signal de façon interprétable. Cette information peut être codée en binaire, c’est-àdire une succession de 0 et de 1. La période d’un bit d’information correspond à sa durée dans le temps, elle définit la largeur du bit d’information élémentaire. Cette période est l’inverse de la vitesse de l’information à transmettre : la largeur du bit sera d’autant plus petite que le nombre de bits à transmettre par seconde est élevé. La densité de l’information à transmettre est caractérisée
26
Le temps dans la géolocalisation par satellites
par le nombre d’informations binaires à encoder par seconde, autrement dit un nombre de bits par seconde, lequel est assimilable à une vitesse de défilement. L’enrichissement de la porteuse par l’introduction de cette information binaire va produire un spectre en fréquence continue sur toutes les fréquences possibles. Mais seule une certaine largeur de bande dans le domaine fréquentiel concentre l’information utile, le reste se noyant dans le bruit ambiant. Plus cette information sera riche, plus la largeur de la bande de fréquence autour de la porteuse, où se concentre l’information utile, devra être large. L’Union internationale des télécommunications (IUT – International Telecommunication Union) a réservé et attribué une bande de fréquence autour de chacune des fréquences centrales allouées à la radionavigation selon le schéma de la figure 2.1.
Fig. 2.1 – Répartition des fréquences et bandes de fréquences des systèmes GPS (bleu) et Galileo (vert). La méthode la plus simple pour encoder une information binaire est d’utiliser un signal temporel rectangulaire d’amplitude ±1, le rectangle +1 correspond à l’information « 1 » et le rectangle −1 correspond à l’information « 0 ». Les principales modulations possibles sont la modulation en amplitude (variation de A), la modulation en fréquence (variation de f ) ou la modulation de la phase du signal. C’est cette dernière technique que les systèmes de géolocalisation par satellites ont sélectionnée.
2.3
La modulation en quadrature
Le fait de prendre un signal quelconque et d’effectuer un déphasage de 90◦ à toutes les fréquences crée un nouveau signal qui est indépendant du premier. On dit que ce nouveau signal est en quadrature de phase par rapport au premier. Les signaux qui sont transmis aux utilisateurs sont la somme de deux signaux linéairement indépendants : S (t) = A (t) cos (ωt) + B (t) sin (ωt) ,
(2.2)
Les signaux et messages des systèmes GPS et Galileo
27
où ω = 2πf est la pulsation du signal. Le premier signal porté par le cosinus est couramment noté « I » pour « in » phase et le second, porté par le sinus est noté « Q » pour son pendant en quadrature. On sépare les informations portées par les voies I et Q en multipliant respectivement le signal S par cos (ωt) et sin (ωt). cos (ωt) S (t) = A (t) cos2 (ωt) + B (t) sin (ωt) cos (ωt) 1 1 = A (t) + [A (t) sin (2ωt) + B (t) cos (2ωt)] , 2 2 sin (ωt) S (t) = A (t) sin (ωt) cos (ωt) + B (t) sin2 (ωt) 1 1 = B (t) + [A (t) sin (2ωt) − B (t) cos (2ωt)] . 2 2
(2.3)
(2.4)
Les amplitudes A et B sont extraites des signaux modulés en ôtant les composantes périodiques par un filtre passe bas qui enlève les fréquences supérieures à f.
2.4
La modulation de phase
Les systèmes de navigation GPS et Galileo utilisent deux types de modulation pour transmettre l’information, la modulation de phase BPSK pour Binary Phase Shift Keying (principalement pour le GPS) et la modulation de phase BOC pour Binary Offset Carrier (principalement pour Galileo). Ces deux types de modulations se caractérisent, entre autres, par des étalements de spectre différents autour de la fréquence de la porteuse.
2.4.1
La modulation de phase BPSK
Ce type de modulation consiste à introduire des inversions de phase dans l’oscillation de l’onde porteuse pour coder un signe binaire : la présence de saut indique un bit signé à 1, l’absence de saut indique un bit signé à 0. La fonction de saut X (t) définie par : +1 X (t) = , (2.5) −1 est donc introduite dans le signal : s(t) = A · X(t) · cos (2πf t) .
(2.6)
Le principe est illustré par la figure 2.2. L’onde porteuse est modulée de façon à ce qu’un front montant ou descendant du signe binaire correspond à un phasage prenant les valeurs zéro où pi. À ce moment-là, puisque − cos (ϕ) = cos (ϕ + π), la phase est retournée de 180◦ .
28
Le temps dans la géolocalisation par satellites
Fig. 2.2 – Insertion d’une information binaire par modulation de la phase de la porteuse.
Le signal rectangulaire est une fonction du temps valant −1 ou 1 et la longueur d’un signe binaire à transmettre occupe la durée T . La représentation fréquentielle de la fonction indicatrice 1[−T /2,T /2] qui vaut +1 sur l’intervalle [−T /2, T /2] et 0 ailleurs, et code le signe binaire « 1 », est un sinus cardinal centré sur 0 d’amplitude T et qui coupe l’axe des abscisses fréquentielles en la série de points ±n/T (voir la figure 2.3).
Fig. 2.3 – La transformée de Fourier d’un signal carré est un sinus cardinal. La représentation fréquentielle de la porteuse modulée par BPSK est donnée par le produit de convolution des transformées de Fourier 5 de la porteuse et du train de signes binaires. Le résultat est un sinus cardinal centré sur la fréquence de la porteuse. On trouvera dans l’ouvrage de Misra et Enge (2012), une présentation des techniques de traitement des signaux appliqué à la navigation. 5. On note L1 (R) l’ensemble des fonctions réelles x de la variable réelle, continues par morceaux, de module intégrable, c’est-à-dire que l’intégrale
∞
∫ |x (t)| dt existe. La trans-
−∞
formée de Fourier d’un signal x ∈ L1 (R) est la fonction X de la variable réelle à valeur ∞
complexe définie par : X (f ) = ∫ x (t) e−2πif t dt. −∞
Les signaux et messages des systèmes GPS et Galileo
29
La technique de modulation par signe binaire sur la phase va permettre de réaliser deux types d’opération. La première consiste à encoder une information, de type binaire forcément, dans la porteuse, par exemple les données de navigation que transmet chaque satellite vers les utilisateurs. Il est d’usage de nommer les signes binaires utilisés par « bits » d’information. La seconde vient étaler le spectre de la porteuse en surmultipliant le signal par un code connu. Cette dernière opération va permettre d’utiliser simultanément plusieurs canaux de transmission à la même fréquence de la porteuse. Il est d’usage de nommer les signes binaires utilisés pour l’étalement par « chip ». Par la suite on note BPSK(k) pour désigner la modulation débitée à la vitesse de production de k × 1, 023 × 106 chips par seconde ou k × 1, 023 mega chips par seconde (on parle aussi de Chip Rate pour son équivalent anglosaxon).
2.4.2
La modulation de phase BOC
Ce type de modulation a été défini par John Betz et décrite dans son article (Betz, 2001). Elle utilise, entre l’information binaire à encoder et la porteuse, un train de bits intermédiaire, appelée sous-porteuse à onde carrée. La fréquence fs de la sous-porteuse, également appelée facteur de fréquence de sousporteuse, est un multiple de fréquence f de la porteuse fondamentale fsc = mf . Le signal contenant l’information binaire c (t) et le signal de la sous-porteuse sc (t) sont synchrones entre eux (voir illustration en figure 2.4), le signal sc (t) a une fréquence égale ou supérieure à la fréquence de c (t).
Fig. 2.4 – Bit d’information codé en signal carré BPSK puis en signal BOC m = 1 et BOC m = 2.
On parle de BOCsin si l’onde carrée de la sous-porteuse s’écrit sig (sin (2πfsc t)) et BOCcos si la sous-porteuse s’écrit sig (cos (2πfsc t)). Les phases de ces deux modulations sont séparées de 90◦ puisque sin 2πfsc t + π2 = cos (2πfsc t). La différence entre les modulations BOCsin et BOCcos est illustrée en figure 2.5. La fréquence fc de l’information binaire à encoder (le signal c (t)), également appelée facteur de code d’étalement, est également un multiple de la porteuse fondamentale fc = nf . Les transitions des informations du code sont alignées avec celles de la sous-porteuse à onde carrée. Le rapport 2m/n
30
Le temps dans la géolocalisation par satellites
Fig. 2.5 – Signal BOCsin (a) et BOCcos (b).
représente le nombre de demi-périodes de la sous-porteuse dans un bit de code binaire. Le processus de modulation se fait à deux étages : le premier consiste à encoder l’information primaire dans la sous-porteuse, ce qui produit le signal « BOC », le second à encoder le signal « BOC » dans la porteuse par une modulation BPSK. La représentation fréquentielle de la porteuse modulée par BOC (m, n) est une série de lobes symétriques autour de la fréquence de la porteuse. La distance entre les deux lobes principaux est 2fs . Plus la granularité du signal est élevée (m grand), plus les lobes principaux s’éloignent de la fréquence centrale. Chaque lobe porte la même information. L’intérêt de cette modulation est de minimiser les interférences possibles avec la modulation BPSK. D’autre part, la modulation BOC, du fait de son encodage en cascade, occupe une bande spectrale plus étalée que la modulation BPSK ce qui augmente en théorie la performance du positionnement fait avec ces signaux. Cette technique permet d’encoder une unique séquence d’information en concentrant l’énergie du signal sur deux bandes disjointes séparées de 2fs . On peut également augmenter la résistance du signal modulé BOC aux effets d’environnement local au récepteur en faisant des combinaisons linéaires de deux modulations BOC. Par exemple, la combinaison MBOC est formée par la pondération des modulations BOC(1, 1) et BOC(6, 1) par les poids w1 et w2 tels que w1 + w2 = 1 : M BOC (6, 1, w2 ) = w1 BOCsin (1, 1) + w2 BOCsin (6, 1).
(2.7)
La modulation Alternative BOC (ou AltBOC) permet d’utiliser les deux lobes principaux pour encoder deux séquences d’informations différentes. Cette optimisation ingénieuse est due à Christophe Bourga qui a considéré chaque lobe du BOC comme le spectre d’un signal complexe spécifique dont la recombinaison fournie le signal réel que l’on cherche à moduler. Le concept a ensuite été perfectionné par Ries et al. et présenté dans leur article (Ries et al., 2002).
Les signaux et messages des systèmes GPS et Galileo
2.4.3
31
Reconstruction de l’information par le récepteur
Comme il est physiquement impossible d’effectuer des transitions instantanées dans le signal, la modulation ne s’effectue pas exactement à la valeur de la phase souhaitée. Par ailleurs, le signal reçu est traité par des chaînes électroniques qui filtrent le signal sur certaines fréquences, ce qui introduit une déformation de l’information reconstruite. Le fait de réduire le spectre en fréquence du signal d’origine à une certaine largeur de bande produit une déformation du signal reconstruit. C’est du reste pourquoi plus la bande allouée au signal de navigation autour de la fréquence centrale est importante plus de la reconstruction est précise. Un des problèmes principaux de la reconstruction est la difficulté d’identifier temporellement la transition du signal carré entre les valeurs +1 et −1 car elle n’est maintenant plus instantanée mais occupe un intervalle de temps Δ en fonction de la pente du signal reconstruit à cet endroit (représentation en figure 2.6). Cela introduit une erreur dans la datation de la transition du signal réel qui se situe dans l’intervalle Δ autour de la transition théorique. Comme nous le verrons plus loin, ce phénomène est une source d’erreur dans la construction des mesures de navigation.
Fig. 2.6 – Reconstruction imparfaite de l’information d’origine introduisant une incertitude pour localiser la transition. Maintenant que l’on dispose de techniques de transport de l’information par modulation de la porteuse par la phase, on peut diffuser aux utilisateurs des informations sous la forme de flux de données binaire. La section qui suit décrit un mécanisme de génération de flux binaire largement employé en navigation et qui est à la base de la technique CDMA. Ce concept est basé sur des traitements arithmétiques et algébriques de l’information.
2.5
Les codes des signaux GPS et Galileo
Un récepteur reçoit simultanément, sur une même fréquence, tous les signaux provenant des satellites visibles des constellations GPS et Galileo. Comme ces signaux apparaissent tous mélangés, la technique du CDMA permet de
32
Le temps dans la géolocalisation par satellites
discriminer chaque signal reçu et de l’attribuer sans ambiguïté au satellite qui l’a émis. Son fonctionnement est le suivant. Un code spécifique est attribué à chaque satellite, et chaque satellite utilise ce code pour moduler son signal. Un index arbitraire est attribué à chacun de ces polynômes afin de l’identifier de manière unique et non ambiguë. C’est cet index que l’on appelle PRN (Pseudo Random Noise) et que l’on utilise pour identifier un code particulier. Chaque satellite se voit attribuer un PRN différent. Les codes sont générés à partir de registres à décalage et retour linéaire. Les codes sont générés à partir de registres à décalage et retour linéaire ou LFSR de son acronyme anglais Linear Feedback Shift Register. Ce concept fait appel à des traitements arithmétiques et algébriques de l’information. Pour rentrer dans le cadre de cette théorie, on rappelle succinctement les définitions d’algèbres commutatives utiles pour la compréhension de l’exposé. Un ensemble G est muni d’une structure de groupe commutatif s’il existe une loi de composition interne notée + qui soit : – associative : pour tout élément x, y, z ∈ G on a (x + y) + z = x + (y + z) ; – possède un élément neutre e : pour tout x ∈ G, e + x = x, et ; – tout élément de G admet un inverse : pour tout x ∈ G il existe y ∈ G tel que x + y = e. Un ensemble A est muni d’une structure d’anneau commutatif s’il existe deux lois de composition interne notées + et × telles que : – (A, +) est un groupe commutatif ; – la loi × est associative, possède un élément neutre, et est distributive par rapport à l’addition : pour tout élément a, b, c ∈ A on a a × (b + c) = a × b + a × c. Un élément a de l’anneau A est un diviseur de 0 s’il existe b ∈ A non nul tel que a × b = b × a = 0. Un anneau commutatif (A, +, ×) est dit intègre si 0 est le seul diviseur de 0, autrement dit si a × b = 0, alors a = 0 ou b = 0. Si l’anneau A est intègre et a, b ∈ A, on dit que a divise b si et seulement s’il existe c ∈ A tel que ca = b. L’anneau (A, +, ×) est un corps si tous les éléments de A autres que 0 sont inversibles pour la loi ×, autrement dit (A\0, ×) est un groupe. Tout corps est un anneau intègre. On appelle idéal d’un anneau (A, +, ·) une partie I de A telle que : – (I, +) est un sous-groupe de (A, +), autrement dit pour tout x, y ∈ I, x−y ∈I; – pour tout élément x ∈ I, et tout élément a ∈ A, alors ax ∈ I. Si x est un élément de A, alors l’ensemble de tous les multiples de x par les éléments de A est un idéal de A et c’est le plus petit idéal contenant x, on l’appelle idéal engendré par x et on le note : x = xA = {ax|a ∈ A} . Un idéal est dit principal s’il est engendré par un seul élément.
(2.8)
Les signaux et messages des systèmes GPS et Galileo
33
L’anneau A est principal s’il est intègre et si tous ses idéaux sont principaux. Si I est un idéal de A, la relation xRy ⇔ x − y ∈ I est une relation d’équivalence : elle est réflexive (xRx), symétrique (si xRy alors yRx) et transitive (si xRy et yRz alors xRz). La classe d’équivalence x ˜ d’un élément x de A est définie par : x ˜ = {y ∈ A|xRy} . (2.9) Le quotient A/I est l’ensemble des classes d’équivalence définies par la relation R. L’ensemble quotient peut être muni d’une structure d’anneau. Cette structure repose sur les propriétés suivantes : pour tout x, y, x , y ∈ A si x − y ∈ I et x − y ∈ I alors : – (x + x ) − (y + y ) ∈ I et ; – x × x − y × y = x × (x − y ) + (x − y) × y ∈ I. On en déduit que : xRy et x Ry ⇒ (x + x ) R (y + y ) et, xRy et x Ry ⇒ (x × x ) R (y × y ), ce qui donne un sens à la somme et au produit de classes d’équivalences.
2.5.1
Les registres à décalages et retours linéaires
Considérons une suite (bi ) récurrente linéaire d’ordre L dans le corps F2 = Z/2Z définie par : ∀i ≥ L bi = α1 bi−1 + α2 bi−2 + · · · + αL bi−L =
L
αk bi−k ,
(2.10)
k=1
où α1 , α2 , · · · , αL sont L scalaires de F2 . Un registre à décalage et retour linéaire est un dispositif logique qui réalise la suite (bi ) : il produit un flot de bits à partir d’un registre de L bits dont l’état initial est {bL−1 , · · · , b0 }. Les lois de compositions du corps F2 sont remplacées par des fonctions logiques booléenne. L’addition est remplacée par son équivalent logique « OU exclusif » notée ⊕, ou XOR pour son équivalent anglosaxon, qui fournit la valeur 1 si les deux entrées du registre sont différentes et 0 si elles sont identiques : A = B ⇒ A ⊕ B = 1,
(2.11)
A = B ⇒ A ⊕ B = 0.
(2.12)
La multiplication est remplacée par la conjonction logique notée ∧. À chaque top d’horloge, le contenu du registre de « droite » bi du registre {bL−1+i , · · · , bi } est copié dans la séquence de sortie. Les autres bits sont décalés vers la droite : le contenu du registre j est déplacé dans le registre j + 1. Le nouveau contenu du registre de « gauche » bi+L est le bit rentrant appelé bit de « rétroaction ». Il est calculé comme une combinaison linéaire modulo deux des bits du contenu du registre précédent : bi+L =
L ⊕ αk ∧ bi+L−k . k=1
(2.13)
34
Le temps dans la géolocalisation par satellites
Fig. 2.7 – Schéma d’un registre linéaire à décalage et retour. La figure 2.7 illustre le processus de calcul. La séquence de démarrage {bL−1 , · · · , b0 } détermine entièrement la suite produite (bi ). Bien sûr, si l’état initial est nul, on ne produira pas autre chose que la suite nulle, c’est pourquoi on suppose que les bits de l’état initial sont non tous nuls. Comme au départ chaque bi ne peut prendre que deux valeurs, le nombre de combinaisons que l’on peut former est 2L et, comme la combinaison nulle est interdite, cela conduit à un nombre maximal de 2L − 1 combinaisons différentes possibles. Dans le cas qui nous intéresse, à savoir la génération de code spécifique à chaque satellite, nous souhaitons disposer de séquences répétitives. Pourquoi alors s’intéresser à ce type de dispositif ? Il se trouve que toute séquence binaire cyclique peut être générée à partir d’un registre à décalage. Tout d’abord on peut se demander si toute séquence donnée (bi ) peut être produite par un registre LFSR. Il existe en fait une condition algébrique simple pour déterminer si une séquence (bi ) est générée par un registre LFSR. La série produite par un LFSR est entièrement définie par les coefficients αi et une séquence de démarrage. On lui associe alors deux objets algébriques. Le premier est le polynôme de rétroaction P (X) construit uniquement avec les coefficients αi : P (X) = 1 + α1 X 1 + · · · + αL X L =
L
αi X i ∈ F2 [X] .
(2.14)
i=0
Par convention, on pose α0 = 1. Comme on travaille dans F2 , on a αi ≡ −αi mod 2, ce qui signifie que l’on peut, s’ils sont non nuls, mettre indistinctement les αi à +1 ou −1. Le second est la série formelle bâtie à partir de la suite (bi ) : B (X) = b0 + b1 X 1 + b2 X 2 + · · · =
∞ i=0
bi X i ∈ F2 [X] .
(2.15)
Les signaux et messages des systèmes GPS et Galileo
35
En développant le produit B (X) P (X), on trouve : L ∞ i i bi X αi X B (X) P (X) = i=0 i=0 . L−1 i ∞ L i αi−k bk X + αk bi−k X i = i=0
k=0
i=L
(2.16)
k=0
Comme la suite (bi ) est le résultat d’un LFSR, on a par construction : bi =
L
(2.17)
αk bi−k .
k=1
On a alors : L
αk bi−k = bi +
k=0
L
αk bi−k = 2bi ≡ 0 mod 2.
(2.18)
k=1
Par conséquent, le produit des polynômes B (X) et P (X) dans F2 [X] s’écrit : i
L−1 B (X) P (X) = αi−k bk X i = Q (X) . (2.19) i=0
k=0
Ainsi, une séquence (bi ) donnée peut être produite par un registre LFSR de polynôme de rétroaction P (X) seulement s’il existe un polynôme Q (X) ∈ F2 [X] tel que deg (Q) < deg (P ) et B (X) = Q (X) /P (X). Réciproquement, étant donné deux polynômes P (X) , Q (X) ∈ F2 [X] tels que deg (Q) < deg (P ), la division selon les puissances croissantes de Q par P définie une suite (bi ) par : Q (X) = b0 + b1 X 1 + b2 X 2 + b3 X 3 + · · · . P (X)
(2.20)
En multipliant le polynôme B (X) = b0 + b1 X 1 + b2 X 2 + b3 X 3 + · · · par P (X) et en imposant que le résultat du produit soit égal au polynôme Q (X) de degré inférieur au degré de P , on arrive nécessairement, dans F2 [X], à une relation L entre les bi et les αj du type bi = αk bi−k , ce qui définit la longueur L d’un k=1
registre à décalage linéaire et sa loi de décalage. Dans le cas d’une séquence binaire périodique de période n, on a bi+n = bi . En multipliant la série B (X) par le monôme X n , on remarque que : X n B (X) = X n
∞ i=0
bi X i =
∞
bi X i+n =
i=0
∞
bi+n X i+n = B (X) −
i=0
n−1
bi X i .
i=1
(2.21) On vient donc d’établir (dans F2 ) que : (X n − 1) B (X) =
n−1 i=1
bi X i = Q (X) .
(2.22)
36
Le temps dans la géolocalisation par satellites
En posant P (X) = X n − 1, on se retrouve dans les conditions du résultat précédent : B (X) = Q (X) /P (X) et deg (Q) < deg (P ) = n.
(2.23)
Par conséquent, toute suite binaire périodique de période n peut toujours être générée par un LFSR de registres de longueur n. Remarquons au passage que si on peut écrire Q (X) = Q (X) D (X) et P (X) = P (X) D (X), alors on a toujours B (X) = Q (X) /P (X) et deg (Q ) < deg (P ), ce qui signifie que l’on peut générer la même séquence cyclique de période n par un nouveau LFSR de longueur L < n. Quand le plus grand diviseur commun D entre les polynômes P et Q est 1, alors on dit que P et Q sont premiers entre eux. Si c’est le cas, alors aucune séquence binaire produite par un LFSR de polynôme de rétroaction P ne peut être générée par un LFSR de polynôme de rétroaction de degré plus petit, on parle alors de polynôme minimal. Réciproquement, si le coefficient de plus haut indice αL est non nul, alors la séquence de bits de sortie {bi } est cyclique de plus petite période n inférieure à N = 2L − 1. En examinant de près les propriétés algébriques du polynôme de rétroaction, on peut en déduire des caractéristiques sur le code généré par le registre à décalage, ce qui fait l’objet de ce qui suit. On se place maintenant dans le cadre de séquences binaires cycliques c’està-dire que αL ≡ 1 mod 2. On appelle mot du registre à décalage toute séquence successive de n bits de la suite (bi ). L’alphabet des mots ainsi défini est donc l’ensemble Fn2 . Comme la suite est répétitive, tous les n bits il y a exactement n mots différents. La propriété de linéarité du registre à décalage permet de constater que la somme modulo deux de deux mots différents parmi les n est encore un mot du registre. Ceci s’établit par le jeu de recombinaison des éléments sous le signe somme. Un code correcteur C est un sous-ensemble de Fn2 , il est linéaire si ce sous-ensemble est un sous-espace vectoriel de Fn2 , il est cyclique s’il est linéaire et si pour tout élément c = (c0 , · · · , cn−1 ) ∈ C, l’élément décalé σc = (cn−1 , c0 , · · · , cn−2 ) ∈ C où σ est l’opérateur de décalage à droite. D’après ce qui précède, l’ensemble des n mots d’un registre à décalage forme un code correcteur cyclique. C’est ici que la force et la beauté de l’algèbre va entrer en jeu avec en particulier la théorie des corps finis d’Evariste Galois 6 . Tout d’abord, n’importe quel mot c = (c0 , · · · , cn−1 ) d’un code C sur Fn2 peut être identifié par un polynôme de F2 [X] défini par : C (X) = c0 + c1 X + · · · + cn−1 X n−1 .
(2.24)
Ensuite, un simple agencement de monômes : (σC) (X) = cn−1 + c0 X · · · + cn−2 X n−1 = XC (X) − cn−1 (X n − 1) , (2.25) 6. Voir le cours de Reversat et Zhang (2003).
Les signaux et messages des systèmes GPS et Galileo
37
montre que, modulo X n − 1, on a l’égalité (σC) (X) = XC (X), ce qui signifie que la multiplication par X correspond à l’opérateur de décalage circulaire droite σ dans l’algèbre : F2 [X] A2 [X] = n . (2.26) X −1 De la même façon, la multiplication par X m correspond à m décalages circulaires droites successifs. On peut donc représenter les mots du code C comme des éléments de A2 [X]. Par conséquent, le code C peut être identifié comme un sous-espace vectoriel de A2 [X]. Comme le code C est cyclique si et seulement s’il est stable par multiplication par X m , il est donc également stable par multiplication par tout polynôme : c’est donc un idéal de A2 [X]. La surjection canonique π : F2 [X] → A2 [X] établit que tous les idéaux de A2 [X] sont en bijection avec les idéaux de F2 [X] qui contiennent le polynôme X n −1. Comme l’anneau F2 [X] est un corps, donc un anneau principal, un idéal de A2 [X] est engendré par un unique polynôme π (C) tel que C soit unitaire. Puisque l’idéal généré par C contient X n − 1, alors il existe un polynôme P non nul tel que : X n − 1 = C (X) P (X) . (2.27) Autrement dit, C divise X n − 1. Il en résulte qu’un code cyclique C est entièrement caractérisé par un unique polynôme, unitaire et qui divise X n − 1. Le code cyclique C se construit alors comme le sous-espace vectoriel C = {π (CQ) |Q ∈ F2 [X]} .
(2.28)
Comme tous les éléments de A2 [X] sont assimilés à des polynômes de degré inférieur à n − 1, on peut construire C en utilisant uniquement des polynômes Q de F2 [X] de degrés inférieurs à n − d − 1, où d le degré du polynôme C. Or, les polynômes de F2 [X] de degrés inférieurs à n − d − 1 forment un sous-espace vectoriel E ⊂ F2 [X] de dimension n − d. Ainsi la bijection : E→C Q → π (CQ) .
(2.29)
établit que C est également de dimension n − d. La série formelle B (X) qui représente la sortie du registre à décalage se construit facilement à partir du polynôme C de la façon suivante : B (X) = C (X)
∞
X in .
(2.30)
i=0
Comme précédemment, on vérifie immédiatement que : X n B (X) = C (X)
∞
X in = B (X) − C (X) ,
(2.31)
i=1
à partir de quoi on obtient l’égalité (X n − 1) B (X) = C (X). D’un autre côté, nous avons établi qu’il existe un polynôme P tel que X n − 1 = C (X) P (X), ce qui, assemblé avec l’équation précédente, permet d’établir, après simplification, la relation fondamentale suivante :
38
Le temps dans la géolocalisation par satellites 1 = B (X) . P (X)
(2.32)
Ceci nous permet d’établir que la séquence binaire cyclique donnée par la série formelle B peut être obtenue par un LFSR de polynôme de rétroaction P qui est automatiquement minimal. Autrement dit, le polynôme de rétroaction contient toute la structure qui permet de reconstruire le code cyclique, son degré est égal à la dimension du code cyclique C. On appelle ordre d’un polynôme P (X) de F2 [X] le plus petit entier r tel que X r ≡ 1 mod P (X), autrement dit le plus petit entier tel que P (X) divise X r − 1. Le résultat d’algèbre qui est abondamment exploité dans les systèmes de navigation est celui-ci : Propriété : si le polynôme de rétroaction P (X) est irréductible dans F2 [X] (il ne peut pas s’écrire comme produit de plusieurs polynômes, autrement dit il n’est pas divisible), unitaire (αL ≡ 1 mod 2) et d’ordre maximal N , alors la séquence produite par le LFSR associé est cyclique de période maximale N = 2L − 1 et les éléments du code sont fournis en inversant P (X). Examinons à présent l’exemple d’un LFSR à 3 bits (L = 3) dont l’état initial est (1, 1, 1) avec comme polynôme de rétroaction P (X) = 1 + X + X 3 . Ce polynôme est unitaire, irréductible de degré 3. Il divise X 7 − 1 car : 1 + X + X 3 1 + X + X 2 + X 4 = 1 + 2X + 2X 2 + 2X 3 + 2X 4 + 2X 5 + 2X 6 + X 7 = X 7 − 1 mod 2. (2.33) Par ailleurs, on peut vérifier que P (X) ne divise aucun polynôme X r − 1 de degré r < 7. Le code généré C est donc cyclique de période maximale 23 −1 = 7 et on a immédiatement C (X) = 1 + X + X 2 + X 4 . Par conséquent, le code attendu associé au polynôme C : 1 + X + X 2 + X 4 = (1) + (1) X + (1) X 2 + (0) X 3 + (1) X 4 + (0) X 5 + (0) X 6 , (2.34) est donné par le mot c = (1, 1, 1, 0, 1, 0, 0). Tous les autres éléments de l’idéal engendré par C (X) s’obtiennent par les multiples X p C (X) qui correspondent au mot σ p c. On vérifiera que l’idéal est bien un sous-groupe : si on ajoute l’élément c à l’élément décalé σc on obtient à nouveau un mot du code : c + σc = (1, 1, 1, 0, 1, 0, 0) + (0, 1, 1, 1, 0, 1, 0) = (1, 0, 0, 1, 1, 1, 0) = σ4 c. (2.35) En inversant le polynôme de rétroaction dans F2 [X], on retrouve la séquence complète du LFSR : 1 = 1 + X + X 2 + X 4 + X 7 + X 8 + X 9 + X 11 + · · · . 1 + X + X3
(2.36)
On arrive bien sûr au même résultat par l’approche arithmétique. La donnée du polynôme de rétroaction spécifie le calcul du registre : bi+3 = bi+2 + bi mod 2.
(2.37)
Les signaux et messages des systèmes GPS et Galileo
39
Fig. 2.8 – Exemple d’un registre linéaire à décalage de longueur 3. La représentation schématique du LFSR associé est donnée par la figure 2.8. En utilisant les règles de calcul du registre, on peut vérifier que l’on retrouve bien le code prédit par l’algèbre. Le tableau suivant déroule le processus du LFSR selon les cycles consécutifs de calculs. Cycle 1 2 3 4 5 6 7 8
bi+2 1 0 1 0 0 1 1 1
bi+1 1 1 0 1 0 0 1 1
bi 1 1 1 0 1 0 0 1
Au cycle 8 de calcul, les registres se retrouvent à leur état initial, la période du code est bien de longueur 7 et on retrouve bien le code attendu. Une application fondamentale des LFSR, et des puissants développements algébrique et galoisienne qui lui sont associés, est la génération des codes spécifiques à chaque satellite qui est à la base du CDMA.
2.5.2
Propriété des codes PRN
Le code utilisé par le satellite d’indice k est noté C k ; il s’agit d’une succession de caractères binaires. Tous ces codes sont cycliques de longueur N . L’opération de translation à droite du code C k de n entiers est définie pour tout entier i par : Cnk (i) = C k (i + n) . (2.38) Par ailleurs, on définit un produit scalaire sur ces codes par la relation : C k , C l =
N 1 k C (i) C l (i) . N i=1
(2.39)
Ce produit scalaire porte également le nom de corrélateur ou encore fonction de corrélation.
40
Le temps dans la géolocalisation par satellites
Ces codes ont les propriétés suivantes. Propriété de périodicité : les séquences sont répétitives de période de répétition de N caractères k CN = Ck. (2.40) Propriété d’orthogonalité : les codes ne se ressemblent pas entre eux. Autrement dit, ils sont orthogonaux entre eux lorsque l’on projette le code Cnl sur le code C k par le produit scalaire : pour tout entier n tel que i + n < N , on a C k , Cnl ∼ =0 Propriété de décorrélation : chaque code est décorrélé, c’est-à-dire que le signal ne se ressemble pas à lui-même lorsqu’il est décalé en temporel : pour tout entier n non nul tel que i + n < N on a : C k , Cnk ∼ = 0,
(2.41)
C k , C k = 1.
(2.42)
L’effet de ce produit scalaire au niveau du récepteur permet de « dé-étaler » le signal sans perdre d’énergie car la norme est maximale (égale à 1). Ces codes sont pseudo-aléatoires car, bien que déterministes, ils ont la caractéristique d’un bruit blanc car la fonction d’autocorrélation du code est semblable à celle d’un bruit blanc. La séquence étant périodique, la fonction d’autocorrélation est aussi périodique. La version temporelle du corrélateur entre codes s’écrit alors : 1 T k C k , Cτl = C (t) C l (t + τ ) dt. (2.43) T 0 où T est le temps d’intégration qui se calcule par la formule : T =
N . CR
(2.44)
où CR est la cadence de production des chips des codes par l’oscillateur bord (en Hertz). Ce temps d’intégration correspond à la durée du code contenant N chips. Les codes sont fondamentaux dans la technique CDMA. Tout d’abord, grâce à ces codes différents par satellite, le récepteur peut séparer les signaux de navigation qu’il reçoit en reconnaissant ce code via la génération d’une réplique locale. Cela fait partie de la fonction de corrélation du récepteur. Ensuite les codes permettent de faire des mesures des pseudo-distances.
2.5.3
Caractéristiques des codes PRN
Les codes se caractérisent par leurs longueurs et leurs vitesses de défilement, le Chip Rate, mais aussi par le choix de modulation de l’information binaire dans la porteuse. Plus un code est long, plus la décorrélation sera importante car on intègre sur une fenêtre de temps longue. Ce long temps d’intégration va fournir des
Les signaux et messages des systèmes GPS et Galileo
41
sorties de la fonction de corrélation moins bruitées. Il est possible de rallonger le temps d’intégration en intégrant sur des multiples de la durée des codes nT .
2.5.4
Les codes publics GPS (Coarse Acquisition)
Les codes publics C/A sont générés en prenant la somme modulo deux de deux LFSR de L = 10 registres avec les bits de séquence initiale tous égaux à 1. Le polynôme de rétroaction du premier registre à décalage LFSR est le polynôme : G1 (X) = 1 + X 3 + X 10 .
(2.45)
Le second est le polynôme : G2 (X) = 1 + X 2 + X 3 + X 6 + X 8 + X 9 + X 10 .
(2.46)
Le registre G1 fournit toujours la donnée qui intervient dans le premier élément de la somme « S » modulo deux des deux LFSR. Pour le registre G2, un sélecteur extrait de la séquence générée deux chips du registre, les additionne et fournit le résultat à la somme S modulo 2. La sélection des deux chips du registre G2 est unique pour chaque satellite. Une représentation de ce calcul est donnée par la figure 2.9 pour la sélection des bits numéros 2 et 6 du second registre. Le code généré en sortie de la somme S est appelé code de « Gold » du nom du mathématicien Robert Gold qui l’a défini pour le système GPS (voir l’article de Gold [1967]). Ces codes fournissent un positionnement peu précis. Ils ont été initialement conçus pour permettre au récepteur militaire d’accrocher les codes cryptés P(Y). Néanmoins, comme ces codes sont devenus publics, ils permettent à tous d’utiliser le système GPS pour se positionner. Ces codes sont cycliques de période N = 210 − 1 = 1023 caractères ou chips. Ce nombre est à l’origine de la fréquence choisie de l’oscillateur bord. La cadence RC de production des chips du code PRN par l’oscillateur bord est de f0 /10 = 1, 023 MHz soit 1 023 000 chips par seconde. Cela donne une durée d’intégration de 1 ms pour le code L1 C/A. Ce code est donc répété 1000 fois par seconde. Chaque chip du code C/A dure 10−3 /1023 soit à peu près 1 μs (plus précisément 0,977 μs) ce qui, en multipliant par la vitesse de la lumière, représente une distance de 293,1 m. Le nombre d’oscillations de la porteuse L1 dans un chip de code C/A est de f1 /1, 023 × 106 = 1540.
2.5.5
Les codes cryptés GPS P(Y)
Initialement, le système GPS était destiné à un usage exclusivement militaire. La précision maximale du positionnement est fournie en utilisant ces codes. Les codes P sont cryptés et forment les codes Y, d’où la notation classique P(Y) pour les désigner. Ces codes sont cycliques de période N = 248 − 1 caractères. Un récepteur a donc besoin d’une clef de cryptage pour reconnaître ces PRN. La cadence RC de production des codes P(Y) par l’oscillateur bord est de f0 = 10, 23 MHz soit 10 230 000 chips par seconde. Il y a f1 /10, 23 × 106 = 154 oscillations de la porteuse L1 dans un chip de code P. Chaque chip du code
42
Le temps dans la géolocalisation par satellites
Fig. 2.9 – Système de deux LFSR pour la génération des codes C/A. Le premier
étage fournit la valeur séquentielle du bit n◦ 10. Pour le second, un sélecteur de bits extrait préalablement la valeur de deux bits du registre (ici les bits n◦ 2 et n◦ 6 mais cela peut être une autre combinaison) et les additionne dans Z2 . Le code de Gold est la somme modulo 2 des deux valeurs fournies. Les opérations sont cadencées par un oscillateur qui donne le top des opérations de calcul.
P représente une distance de 29,3 m. Le code P se répète tous les 266,4 jours. En pratique, ce code est divisé en segments de 7 jours et chaque segment correspond à un PRN spécifique. Chaque segment hebdomadaire est réinitialisé chaque samedi à minuit soit au début de la semaine. Étant donné la longueur de ce code, le code C/A, distribué uniquement à la fréquence L1, a été conçu pour faciliter l’accrochage des récepteurs.
2.5.6
Le code militaire GPS
La corrélation spectrale entre les codes P(Y) et C/A ne permet pas l’augmentation de puissance du code P(Y) car cela engendrerait une interférence avec le code C/A. Le code M a été conçu pour pallier ce défaut. Il partage les mêmes bandes que les signaux existants, à la fois en L1 et en L2 mais il est modulé par décalage binaire BOC(10,5) ce qui permet un chevauchement minimal avec les densités de puissance spectrale maximales du code P(Y) et du code C/A, qui se produisent autour de la fréquence centrale, alors que le code M a sa plus grande densité de puissance distribuée de chaque côté de la fréquence centrale. Cette architecture simplifie à la fois la mise en œuvre au niveau des satellites et des récepteurs et atténue également les interférences avec les codes existants du fait de la séparation spectrale entre le code M et les
Les signaux et messages des systèmes GPS et Galileo
43
signaux plus anciens P(Y) et C/A. Par ailleurs, le code M peut être accroché directement par un récepteur militaire, ce que ne permet pas le code P(Y) car il faut préalablement acquérir le code C/A pour le faire. Pour le code M, la notation BOC(10,5) indique que les deux fréquences fsc et fc sont des multiples de f = 1, 023 MHz ; en d’autres termes, leurs valeurs m et n sont m = 10 × 1, 023 = 10, 23 MHz et n = 5 × 1, 023 = 5, 115 MHz. La densité spectrale de puissance des signaux modulés C/A, P(Y) et M est donné en figure 2.10. Dans cette figure, on voit bien la séparation des deux lobes du signal modulé M autour de la fréquence centrale.
Fig. 2.10 – Densité spectrale de puissance des signaux C/A, P(Y) et M à 1W. Figure extraite de l’article de Betz (2001).
2.6
Les informations de navigation des systèmes GPS et Galileo
On appelle signal pilote la porteuse étalée avec un code propre au satellite. Le signal pilote ne module aucune information. L’intérêt de diffuser un signal pilote est, au niveau du récepteur, d’allonger le temps d’intégration cohérent (multiple de la longueur du code) pour la fonction de corrélation, ce qui diminue le bruit de sortie de cette fonction. Selon la technologie des satellites GPS, plusieurs types d’informations sont transmis dans les bandes de fréquence suivantes : – le code civil C/A pour « coarse acquisition » uniquement transmis sur la fréquence L1-I (« in phase ») en modulation BPSK(1). Il est répété toutes les millisecondes. Chaque satellite se voit attribuer un code C/A unique ce qui permet de l’identifier. La résolution de ce code est de 293 mètres environ ; – le code civil L2C uniquement transmis sur la fréquence f2 en modulation BPSK(1) pour les blocs GPS IIR-M, IIF et III ;
44
Le temps dans la géolocalisation par satellites – le code civil L1C uniquement transmis sur la fréquence f1 en modulation BOC(1, 1) pour le bloc GPS III ; – le code civil L5 transmis sur la fréquence f5 en modulation BPSK(10) pour les blocs GPS IIF et III, avec deux composantes, une en phase (L5I, canal I) et une en quadrature de phase (L5-Q canal Q) émises avec un même niveau de puissance. Chaque composante module des codes d’étalements différents émis de façon synchrone. Les deux composants modulent deux codes PRN différents (mais orthogonaux). Le canal Q est un signal pilote (canal sans données). Voir le document d’interface IS-GPS-705 ; – le code crypté P(Y) à usage militaire permettant un positionnement plus précis, transmis sur les deux fréquences L1-Q et L2-Q en modulation BPSK(10). Il est répété tous les 267 jours et sa résolution est dix fois supérieure au code C/A soit 29,3 m ; – le code militaire M , transmis sur les deux fréquences f1 et f2 pour le bloc GPS IIR-M en modulation BOC(10, 5). Il remplacera probablement le code P(Y) car peut être émis avec une puissance supérieure pour éviter le brouillage ; – le message de navigation est encodé par BPSK sur les fréquences f1 et f2 avec un débit très faible de 50 bits par seconde codés sous forme de 100 symboles par seconde. Bande de fréquences L1
L2
L5
Signal L1C/A L1P(Y) L1C M L2P(Y) L2C − I L2C − Q M L5 − I L5 − Q
Modulation BPSK(1) BPSK(10) BOC(1, 1) BOC(10, 5) BPSK(10) BPSK(1) BPSK(1) BOC(10, 5) BPSK(10) BPSK(10)
Applications Civile Militaire Civile Militaire Militaire Civile Pilote Militaire Civile Pilote
Un utilisateur civil mono-fréquence va utiliser uniquement le code civil C/A sur L1 tandis qu’un utilisateur militaire va utiliser le code P(Y) et le code M sur les deux bandes L1 et L2. Prochainement, les utilisateurs civils pourront utiliser les codes L1C et L2C sur les bandes L1 et L2, puis la totalité des signaux émis sur la bande de fréquence L5. Le signal L1C 7 comporte une voie pilote et une voie de données. Les codes d’étalement de ce signal sont dit longs car ils contiennent 10 230 bits, ce qui, à la fréquence de 1,023 MHz, correspond à une période de répétition de 10 ms. Sur la voie de données, les bits d’informations ont un débit de 100 bits par seconde (voir également le document d’interface IS-GPS-800). 7. La description du signal se trouve dans l’article de Betz et al. (2006).
Les signaux et messages des systèmes GPS et Galileo
45
Le signal L2C 8 est transmis en quadrature sur la porteuse L2. Il contient également une voie pilote et une voie de données, chacune avec un code d’étalement propre en modulation BPSK, le code CM et le code CL, de longueurs différentes. Le code CM a une longueur de 10 230 bits et une période de répétition de 20 ms. Sur la voie pilote, le code CL est de longueur 767 250 bits et a une période de répétition de 1,5 s. Les satellites Galileo transmettent : – des codes civils sur les fréquences E1-B en modulation CBOC(6, 1, 1/11), E5a-I et E5b-I (« in phase ») en modulation AltBOC(10, 5) ; – des codes cryptés (PRS pour Public Regulated Service) sur les fréquences E1-A en modulation BOCcos (15, 2, 5) et E6-A en modulation BOCcos (10, 5) ; – des données sur E6-B en modulation BPSK(5) ; – des signaux pilotes sur E1-C, E5a-Q, E5b-Q (« en quadrature ») et E6-C ; – des messages de navigation différents selon les signaux. Il existe quatre types de données de navigation dans le système Galileo. Le flux F/NAV (Freely accessible NAVigation) dédié au service ouvert et diffusé sur le signal E5a-I, le flux I/NAV (Integrity NAVigation) dédié au service de sauvegarde de la vie (SOL pour l’acronyme anglo-saxon de Safety of Life) mais également pour le service ouvert et commercial, diffusé sur les signaux E5b-I et E1-B, le flux C/NAV (Commercial NAVigation) dédié au service commercial et diffusé sur le signal E6-B, et enfin le flux G/NAV (Governmental NAVigation) dédié au service public régulé (PRS) et diffusé sur les signaux E6-A et E1-A. Le système Galileo diffusera également un service de corrections précises (orbites, horloges, biais instrumentaux, ionosphère), transmises sur les signaux E6-B à un débit maximum de 448 bits par seconde, pour un positionnement utilisateur précis d’une vingtaine de centimètres dans le domaine horizontal. Ce service mondial est dénommé HAS pour High Accuracy Service. Il sera suivi par un service commercial d’authentification (CAS pour Commercial Authentification Service) qui fournira un service de contrôle d’accès par des signaux encryptés sur la bande E6-C. Bande de fréquences Signal Modulation Applications E1-A BOCcos (15, 2, 5) Régulées E1 E1-B CBOC(6, 1, 1/11) Civile E1-C Pilote E6-A BOCcos (10, 5) Régulées E6 E6-B BPSK(5) Commerciale, HAS E6-C Pilote CAS E5a-I AltBOC(10, 5) Civile E5b-I AltBOC(10, 5) Civile E5 E5a-Q Pilote E5b-Q Pilote 8. La description du signal se trouve dans l’article de Fontana et al. (2001).
46
Le temps dans la géolocalisation par satellites
Pour faire son calcul de positionnement, l’utilisateur a besoin de connaître la position des satellites aux temps d’émission. Il a également besoin de l’écart de synchronisation de chaque satellite par rapport à la référence de temps de sa constellation GNSS. Ces données sont calculées dans le centre de contrôle sol du système GNSS et transmises régulièrement (en général quotidiennement) aux satellites lorsqu’ils sont en visibilité d’une station montante. Les données de navigation transmises par les systèmes GPS et Galileo se ressemblent beaucoup, en particulier les modèles d’éphémérides, d’horloges et de biais instrumentaux sont rigoureusement identiques. Les protocoles de transmission sont structurés en trames de données binaires. Les données de navigation contiennent tous les paramètres requis pour permettre à l’utilisateur de calculer une solution complète de position, vitesse et temps (PVT). Ils sont stockés à bord de chaque satellite avec une durée de validité prédéterminée et diffusés dans le monde entier par tous les satellites de la constellation GNSS. Les 4 types de données nécessaires pour effectuer le positionnement sont : – les paramètres des éphémérides, nécessaires pour indiquer au récepteur utilisateur la position des satellites au temps d’émission des signaux ; – les paramètres de temps d’émission des signaux en temps propre satellite ainsi que les paramètres de synchronisation de l’horloge satellite à la référence de temps système, nécessaires au calcul de la pseudo-distance ; – un ensemble de paramètres dédié à plusieurs services comme le service de temps (raccrochement au temps UTC), des corrections ionosphériques, identification des satellites et état de santé du signal ; – les paramètres d’almanach, nécessaires pour indiquer avec une précision réduite la position de tous les satellites de la constellation. Les nouveaux signaux GPS L2C, GPS L5, Galileo E1 et E5 OS bénéficient de nouvelles améliorations de codage apportant plus de résilience en condition de réception dégradée comme cela peut être le cas dans les canyons urbains, ou, plus généralement, lors de situations qui offrent des rapports signal sur bruits défavorables. Ces gains de robustesses reposent sur un schéma de codage par convolution (FEC – Forward Error Correction pour son acronyme anglo-saxon), cas particulier de codes correcteurs d’erreurs, qui dupliquent l’information à envoyer. Cette redondance permet au récepteur de détecter un nombre limité d’erreurs qui peuvent se produire n’importe où dans le message, et souvent de corriger ces erreurs.
2.6.1
Les codes de convolution
Considérons la suite (bi ) dans le corps F2 = Z/2Z et L + 1 scalaires α0 , α1 , · · · , αL de F2 . On définit une nouvelle suite (ci ) par : ci = α0 bi + α1 bi−1 + · · · + αL bi−L =
L k=0
αk bi−k .
(2.47)
Les signaux et messages des systèmes GPS et Galileo
47
Un encodage par convolution est un dispositif logique qui réalise la suite (ci )par un registre à décalage : il produit un flot de bits à partir d’un registre de L + 1 bits. Ce registre est alimenté par les bits de la suite (bi ). À chaque top d’horloge, les bits du registres sont décalés vers la droite : le bit entrant est stocké dans le premier registre du codeur, le contenu du registre j est déplacé dans le registre j + 1, enfin le bit le plus ancien contenu dans le dernier registre est éliminé. La séquence de sortie ci est calculée comme une combinaison linéaire modulo deux des bits du contenu du registre à décalage pondérée par les coefficients αi . L’ensemble du processus est illustré en figure 2.11.
Fig. 2.11 – Génération d’un code de convolution. Le code de convolution est la sortie d’un traitement par combinaison linéaire de bits du registre à décalage alimenté par une suite de bits en entrée du processus. Le terme convolution est utilisé ici car, en convenant que les termes de la suite (αi ) sont tous nuls, le calcul de la suite (ci ) est obtenue comme produit de convolution des suites b = (bi ) et α = (αi ) : ci =
∞
αk bi−k = (b ∗ α) (i) .
(2.48)
k=0
La transformée 9 en z de l’équation précédente transpose le produit de convolution en multiplication dans le domaine fréquentiel : Z (c) = Z (α) Z (b) .
(2.49)
Ainsi, un code de convolution se caractérise complètement par la fonction de transfert A = Z (α) qui s’écrit, avec la variable s = z −1 , comme un polynôme, appelé polynôme générateur : A (s) = α0 + α1 s + · · · + αL sL .
(2.50)
Par définition, la longueur du registre (L + 1) est appelée « longueur de contrainte » du code. 9. Utilisée pour la modélisation des signaux en temps discret, la transformée en z d’un ∞ x (k) z −k ,
signal x (k), k ∈ Z est la fonction complexe de la variable complexe X (z) =
k=−∞
z ∈ C. Le signal x (k)peut-être un échantillon (une suite de nombres) à pas de temps variables. La série converge sur une couronne R− < |z| < R+ .
48
Le temps dans la géolocalisation par satellites
Afin d’offrir une meilleure immunité aux erreurs de transmission, les messages de navigations modulés sur les signaux GPS L2C, GPS L5, Galileo E1 et E5 OS sont encodés avec un séquencement alternatif de deux codes de convolution de longueur de contrainte 7. Les polynômes générateurs sont respectivement : G1 (s) = 1 + s + s2 + s3 + s6 , (2.51) G2 (s) = 1 + s2 + s3 + s5 + s6 .
(2.52)
Pour chaque bit entrant à gauche dans le registre à décalage linéaire, le processus calcule deux nouveaux bits de sortie. Chacun de ces deux nouveaux bits est calculé à partir de la somme modulo deux entre le nouveau bit d’entrée et les L bits d’entrée précédents, où tous les bits sont pondérés par un polynôme générateur. Ensuite, le bit calculé à partir de G1 est d’abord transmis au canal suivi du bit G2 et ainsi de suite (voir le schéma en figure 2.12). Il y a donc 2 symboles transmis pour chaque bit en entrée du codeur par application d’un code de convolution ce qui double le débit.
Fig. 2.12 – Codage du message de navigation par un FEC. Le processus double le nombre de bits en alternant successivement les sorties du registre G1 et G2.
L’alternance des deux registres remplit la fonction de duplication de l’information en entrée du codeur. Le décodage du message de navigation s’effectue par application de l’algorithme de Viterbi. Le décodeur de Viterbi implémente un algorithme de décision, optimal au sens du maximum de vraisemblance, pour démoduler les données numériques à partir d’un signal analogique corrompu par du bruit. La technique de Viterbi consiste à rechercher la séquence la plus probable de bits transmis en minimisant la probabilité d’erreur de la séquence décodée. Ces nouveaux signaux implémentent également un code de redondance cyclique ou CRC-24, Cyclic Redundancy Check pour son acronyme anglo-saxon, qui génère 24 bits de parités à partir d’un ensemble de bits d’informations. Maintenant que l’on dispose de techniques de transport de l’information par modulation de la porteuse, on peut diffuser aux utilisateurs les informations de navigation qui leur permettront de retrouver la position des satellites à tout instant.
Les signaux et messages des systèmes GPS et Galileo
2.7
49
Le message de navigation du système GPS
La section qui suit ne décrit que le message L/NAV (Legacy NAVigation) pour les PRN 1 à 32. Il y a une autre forme de message L/NAV pour les PRN 33 à 63. Par ailleurs, le signal L2C, présent sur les satellites « récents », diffuse un nouveau message de navigation appelé C/NAV pour Civil NAVigation, plus flexible que le L/NAV et offre plus de fonctionnalités comme une détection d’erreur améliorée et un encodage différent des paramètres de navigation qui améliore la précision des éphémérides.
2.7.1
Format du message L/NAV
Toutes ces données sont transmises dans un format et une séquence bien définis et standardisés (IS-GPS-200 10 ). Le message de navigation est composé de 25 pages (ou frame) : c’est la longueur nécessaire pour envoyer à l’utilisateur l’ensemble des almanachs. Chaque page contient 5 sous-trames de 300 bits chacune. Chaque sous-trame est composée de 10 mots, chaque mot faisant 30 bits. Un schéma synthétique de cet enchaînement est proposé en figure 2.13. La diffusion des informations est réalisée à un débit très faible de 50 bits/s (ce qui équivaut à la transmission de 7 caractères ASCII).
Fig. 2.13 – Structure du message de navigation GPS en trames, sous-trames, mots et bits dans le mot.
Les sous-trames 1, 2 et 3 contiennent des informations qui sont spécifiques au satellite GPS ; les sous-trames 4 et 5 contiennent des informations qui concernent tous les satellites GPS. Comme la mise à jour des données des satellites n’est pas immédiate, le contenu des sous-trames 4 et 5 peut varier d’un satellite à l’autre au même instant. 10. Ce document est disponible http ://www.gps.gov/technical/.
dans
sa
dernière
version
sur
le
site
:
50
Le temps dans la géolocalisation par satellites – La sous-trame 1 contient la correction d’horloge du satellite par rapport à la référence de temps GPS. – Les sous-trames 2 et 3 sont dédiées à la transmission de l’éphéméride du satellite émetteur. – Les sous-trames 4 et 5 contiennent des données de corrections ionosphériques (paramètres de Klobuchard) ainsi que les almanachs de tous les satellites.
Une présentation un peu plus détailée du contenu des sous-trames 1 à 5 est proposée en figure 2.14.
Fig. 2.14 – Séquences du message de navigation GPS. Les deux premiers mots de chaque sous-trame ont une signification dédiée. Le premier mot de télémétrie (TLM) contient un préambule immuable de 8 bits 10001011 (0x8B) qui permet au récepteur de trouver de manière fiable le début de chaque sous-trame et de résoudre l’ambiguïté de phase liée à la modulation BPSK. Le deuxième mot de chaque sous-trame est ce qu’on appelle le HOW (HandOver Word) qui comprend une version tronquée du temps dans la semaine GPS (TOW pour l’acronyme anglo-saxon Time of Week). Le TOW est codé sur 17 bits et balaye les valeurs [0, 100799], il représente le nombre de sous-trames de 6 secondes diffusées depuis le début de la semaine GPS. Il s’incrémente donc de 1 à chaque sous-trame et commence par 1 au début de la semaine GPS car le temps codé dans le TOW émis par les satellites pour une sous-trame donnée correspond à l’instant d’émission du premier bit de la sous-trame suivante. Enfin le WN (Week Number) est le numéro de la semaine GPS modulo 1024. Une semaine GPS représente 604 800 secondes. Le WN est contenu dans les 10 premiers bits du troisième mot de la sous-trame 1 uniquement. À la fin de la 1023e semaine, le WN repasse à zéro et c’est aux utilisateurs de prendre en charge ce roll-over pour retrouver une datation correcte. Le premier GPS roll-over a eu lieu le 21 août 1999 à 23:59:47 UTC et le second roll-over s’est effectué le 7 avril 2019.
Les signaux et messages des systèmes GPS et Galileo
51
Fig. 2.15 – Rapport de proportion entre le HOW, le Z-count et les secondes rondes du temps système GPS.
2.7.2
L’accès au temps GPS (GPST)
Le Z-count est un compteur de secondes qui permet de retrouver le temps d’émission du premier bit de la sous-trame, exprimé dans la référence de temps propre au satellite. Le Z-count compte les séquences de 1,5 secondes depuis le temps zéro du système (minuit UTC de la nuit du 5 janvier 1980 au 6 janvier 1980) sur 29 bits. Il se construit à partir des informations du HOW et du WN. Les 10 premiers bits spécifient le numéro de la semaine GPS module 1024. Les 19 suivants spécifient la durée dans la semaine GPS actuelle, comptée en 1,5 secondes (époque X1 dans l’ICD GPS : IS-GPS-200). Ce compteur, qui évolue dans l’intervalle [0, 403199], s’incrémente par 4 entre deux sous-trames successives, ce qui représente 6 secondes. Une représentation commensurable des valeurs du HOW, le Z-count et les secondes rondes du temps GPS est proposée en figure 2.15. Le passage entre la valeur du TOW et le nombre de secondes GPS écoulées depuis le début de la semaine GPS est donné par : ΔGP S = (T OW − 1) ∗ 6 mod [604 800].
2.8
(2.53)
Le message de navigation du système Galileo
Le système Galileo est conçu pour diffuser plusieurs types de données de navigation en fonction du service visé. Comme le système se veut plus complet que le GPS, il est plus complexe à utiliser et les combinaisons de signaux et de messages plus variées. Un utilisateur civil mono-fréquence utilisera la bande E1 et décodera le message de navigation I/NAV. Cet utilisateur n’exploitera pas la bande E5a car le débit du message F/NAV est trop faible par rapport au message I/NAV,
52
Le temps dans la géolocalisation par satellites
ce qui retarde le temps de calcul du premier point (TTFF pour l’acronyme anglais Time To First Fix). Actuellement le signal E5b, bien qu’encodant le message (I/NAV) n’est pas utilisé pour la navigation. Comme pour le système GPS, les messages de navigation Galileo sont encodés sous la forme d’une séquence binaire de 0 et de 1. Le taux de diffusion est variable selon le type de message comme l’indique le tableau suivant : Message F/NAV I/NAV C/NAV G/NAV
Débit (bits/s) 25 125 500 50
Débit (symboles/s) 50 250 1000 100
Un utilisateur civil multifréquences accédant au service ouvert (OS pour l’acronyme anglo-saxon Open Service) a la possibilité d’utiliser soit la combinaison E1 (I/NAV) + E5a (F/NAV), qui est l’utilisation la plus classique pour le positionnement dans les récepteurs standards, soit la combinaison E1 (I/NAV) + E5a (F/NAV) + E5b (I/NAV) avec E5 traité en AltBOC, ce qui permet d’être plus robuste vis-à-vis des multi-trajets et des interférences. Pour le récepteur, le traitement des signaux E5a et E5b en AltBOC correspond à sortir une seule mesure E5 à la fréquence 1191,795 Mz qui peut ensuite être combinée avec celle provenant de E1.
2.8.1
Format du message F/NAV
Toutes ces données sont transmises dans un format et une séquence bien définis et standardisés (Galileo-OS-SIS-ICD 11 ). La section qui suit décrit le message F/NAV dédié au service ouvert diffusé sur le signal E5a. Les données complètes du message de navigation F/NAV sont transmises sous la forme d’une séquence de trames. Une trame dure 600 secondes et est composée de douze sous-trames de 50 secondes chacune. Une sous-trame est elle-même composée de cinq pages. La page est la structure de base pour la construction du message de navigation et dure 10 secondes (voir la figure 2.16). Chaque bit de donnée est codé par deux symboles. Le débit de transmission du message F/NAV est de 25 bits/s ce qui est très faible et explique que le temps de calcul du premier point pour un utilisateur mono-fréquence E5a sera très long. Pour cette raison, le choix de cette fréquence pour le positionnement n’est jamais sélectionné par un utilisateur mono-fréquence. Les pages 1, 2, 3 et 4 contiennent des informations qui sont spécifiques au satellite Galileo ; la dernière page contient des informations qui concernent tous les satellites (détails en figure 2.17). 11. Ce document est disponible http ://www.gsc.europa.eu/technical/.
dans
sa
dernière
version
sur
le
site
:
Les signaux et messages des systèmes GPS et Galileo
53
Fig. 2.16 – Structure du message de navigation F/NAV Galileo, en sous-trames, pages et bits d’information.
Fig. 2.17 – Séquences du message de navigation F/NAV Galileo en différentes pages. Chaque page contient un préambule, un identifiant de la page, un identifiant des données de navigation (IOD) et les informations pour la navigation.
Chaque satellite Galileo insère à intervalles réguliers les données d’horodatages dans le message de navigation afin d’identifier le temps d’émission du signal en temps Galileo, le GST (Galileo System Time). – la page 1 contient la correction d’horloge du satellite par rapport à la référence de temps GST, la correction ionosphérique pour un utilisateur mono-fréquence basé sur le modèle de NeQuick, les biais BGD ; – les pages 2 à 4 sont dédiées à la transmission de l’éphéméride du satellite émetteur ; – la page 4 contient les écarts du temps Galileo par rapport aux échelles de temps UTC et GPS ; – la page 5 contient les almanachs de tous les satellites. Les paramètres de navigation sont diffusés par flot de données, chacun étant identifié par un numéro dédié, l’IOD pour l’acronyme anglo-saxon Issue of Data. Le rafraîchissement de ces paramètres se caractérise par un nouveau numéro d’IOD qui n’est pas nécessairement un incrément du précédent. Un
54
Le temps dans la géolocalisation par satellites
contexte de navigation complet doit être réalisé avec les données ayant le même indicateur d’IOD. Les deux premiers et deux derniers champs de chaque page ont une signification dédiée. Le premier champ est un paramètre de synchronisation de la page qui contient un préambule immuable de 12 symboles 101101110000 permettant au récepteur de trouver de manière fiable le début de chaque page. Le second champ est un identificateur de la page codé sur 6 bits. Le quatrième champ est réservé au code correcteur d’erreur CRC sur 24 bits. Enfin, le dernier champ clôt la séquence de la page avec 6 bits à zéro.
2.8.2
Format du message I/NAV
Toutes ces données sont transmises dans un format et une séquence bien définis et standardisés (Galileo-OS-SIS-ICD 12). La section qui suit décrit le message I/NAV dédié au service ouvert diffusé sur les signaux E5b et E1-B. Les données complètes du message de navigation I/NAV sont transmises sous la forme d’une séquence de trames. Une trame dure 720 secondes et est composée de vingt-quatre sous-trames de 30 secondes chacune. Une sous-trame est elle-même composée de quinze pages. La page est la structure de base pour la construction du message de navigation et dure 2 secondes dans le mode dit « nominal » (voir la figure 2.18). Chaque bit est codé par deux symboles.
Fig. 2.18 – Structure du message de navigation I/NAV Galileo en sous-trames, pages et bits d’informations. 12. Ce document est disponible http ://www.gsc.europa.eu/technical/.
dans
sa
dernière
version
sur
le
site
:
Les signaux et messages des systèmes GPS et Galileo
55
Le débit de transmission du message I/NAV est de 125 bits/s ce qui est deux fois et demie plus rapide que pour le système GPS et cinq fois plus rapide que pour le message F/NAV. Ce haut débit permet d’augmenter la performance de positionnement notamment en bi-fréquence. C’est donc préférentiellement sur l’une des fréquences E5b ou E1 qu’un utilisateur Galileo mono-fréquence effectuera ses calculs de positionnement. Les structures des pages du message I/NAV sont pratiquement identiques pour les signaux E5b et E1-B. Ces structures reposent sur les conventions suivantes : – une page est toujours divisée en deux parties que l’on nomme parties paire et impaire ; – quelle que soit la parité, la transmission d’une partie dure 1 seconde ; – sur chaque canal de transmission E5b ou E1-B, le séquencement des parties alterne la parité, c’est-à-dire que l’on aura toujours une succession de parties paire, impaire, paire, impaire et ainsi de suite ; – les deux canaux E5b et E1-B diffusent toujours les parties de façon synchrone et alternée. Le dernier point consiste à optimiser le temps de réception du contexte de navigation pour un utilisateur bi-fréquence qui utiliserait E5b et E1-B pour le positionnement. Ainsi, pour une époque donnée, chaque satellite Galileo diffusera une page paire sur E5b et une page impaire sur E1-B et inversement, pour l’époque suivante, chaque satellite diffusera une page impaire sur E5b et une page paire sur E1-B. Les pages paires sont identiques pour les deux signaux E5b et E1-B. Par contre, les pages impaires sont légèrement différentes car le signal E1-B contient une information de type Search and Rescue (SAR) que ne transmet pas le signal E5b. L’interface Galileo prévoit deux modes de diffusion et de transmission de données : le mode « nominal » et le mode « alerte » (voir la figure 2.19). Ce dernier mode est prévu pour que le système ait la capacité de diffuser des messages d’alertes associés à l’intégrité des satellites, c’est-à-dire des informations qui permettent de garantir à l’utilisateur que son calcul de positionnement basé sur le système Galileo est « sûr » à un très haut degré de confiance. Dans le mode « nominal », les deux parties d’une page sont diffusées séquentiellement dans le temps sur chacun des canaux de transmission E5b-i et E1-B, on parle de page « verticale ». La diffusion d’une page en mode nominal dure donc 2 secondes. Dans le type « alerte », chaque partie d’une même page est affectée à un canal de transmission et les deux parties sont envoyées simultanément, par exemple l’une part sur la voie E5b et l’autre sur la voie E1, on parle de page « horizontale ». Cette diffusion optimisée consiste donc à envoyer toute l’information d’une page en la répartissant sur les deux canaux et en envoyant le tout à la même époque. Cette transmission est répétée à l’époque suivante en commutant la parité des deux parties entre les deux canaux. La transmission d’une page en mode alerte dure donc 1 seconde.
56
Le temps dans la géolocalisation par satellites
Fig. 2.19 – Séquencement des pages du message I/NAF en mode nominal et alerte. En mode « nominal », le système Galileo diffuse deux pages en 4 secondes alors qu’il en diffuse quatre en mode « alerte ».
Chaque message I/NAV porté par chacun des signaux E5b et E1-B est autosuffisant, c’est-à-dire que l’ensemble du contexte de navigation est transmis indépendamment sur les deux fréquences. Les deux premiers et deux derniers champs de chaque page ont une signification dédiée. Le premier champ est un paramètre de synchronisation de la page qui contient un préambule immuable de 10 symboles 0101100000 permettant au récepteur de trouver de manière fiable le début de chaque page. Le second champ contient l’indicateur de parité pair (0) et impair (1). Le troisième champ est un identificateur de la page codé sur 6 bits. Enfin le dernier champ clôt la séquence de la page avec 6 bits à zéro. Chaque partie d’une page contient un mot type qui encode les données de navigation. Il y a dix types de mots différents et l’ordre chronologique d’envoi dans les pages est celui de l’ordre lexicographique. Le détail des différents contenus des mots est proposé en figure 2.20.
2.8.3
L’accès au temps Galileo (GST)
Le GST pour Galileo System Time, codé sur 32 bits, est composé du numéro de la semaine GST (WN) et du Time Of Week (TOW). Le WN est un compteur incrémental entier qui donne le numéro de la semaine Galileo à partir de l’époque de début du temps Galileo. Ce paramètre est codé sur 12 bits ce qui couvre 4096 semaines (environ 78 ans). Arrivé à son terme, le compteur est remis à zéro pour couvrir une période supplémentaire modulo 4096. L’heure de la semaine est définie comme le nombre de secondes écoulées depuis le passage de la semaine précédente. Le TOW couvre une semaine entière de 0 à 604799 secondes et est remis à zéro à la fin de chaque semaine. Comme pour le système GPS, c’est aux utilisateurs de prendre en charge ce roll-over pour retrouver une datation correcte.
Les signaux et messages des systèmes GPS et Galileo
57
Fig. 2.20 – Mots types contenus dans les pages du message I/NAV. Chaque mot débute par son identifiant. Les informations de navigation sont assorties d’un identifiant (IOD). L’information contenue dans l’assemblage du WN et du TOW contenus dans le champ GST permet d’avoir accès au temps de transmission du front montant du premier bit de la page en court, donc contenant le champ GST. Le temps de transmission du message de navigation fourni par le TOW est synchronisé avec le temps propre du satellite qui est la version du GST que chaque satellite maintient avec ses horloges embarquées. L’époque de début du temps GST est définie comme étant 13 secondes avant minuit entre le 21 août et 22 août 1999, autrement dit le GST était égal à 13 secondes au 22 août 1999 00:00:00 UTC. Le système diffuse également le GGTO (GPS/Galileo Time Offset) qui représente l’écart entre les échelles de temps Galileo et GPS, c’est-à-dire le biais à appliquer pour passer de l’échelle de temps GPS à l’échelle de temps Galileo.
2.9
Encodage des signaux de navigation : le cas GPS
Les messages de navigation L/NAV sont numérisés sous la forme d’une séquence binaire de 0 et de 1 avec un taux de 50 valeurs par seconde, soit une valeur 0 ou 1 toutes les 20 ms sur toutes les fréquences. Chaque mot contient un code correcteur d’erreur, constitué de 6 bits de parité, générés à partir des codes de Hamming. Ce code correcteur permet de déterminer si une inversion de bit dans le mot s’est produite. La représentation fréquentielle de la porteuse
58
Le temps dans la géolocalisation par satellites
modulée par le message de navigation, soit un train de bits à la périodicité de 20 ms, est un sinus cardinal centré autour de la fréquence f avec des passages à zéro tous les 50 Hz. Deux familles de codes historiques sont diffusées dans les signaux GPS, les codes publics C/A, pour Coarse Acquisition, présents sur la fréquence L1 uniquement, et les codes P présents sur les deux fréquences L1 et L2, tous deux modulés par BPSK. La modernisation GPS a permis l’introduction de nouveaux codes, le code militaire M, modulé par BOC, et les codes L2C. Le train de bits du message de navigation est noté D(t) pour le message L/NAV et DC (t) pour le message C/NAV. Les codes modifient le signal de la porteuse en y introduisant des sauts de phases. Dans le code C/A, ces sauts peuvent se produire environ tous les millionièmes de seconde. Cela représente un saut toutes les 1540 oscillations de la porteuse. Les codes PRN ont un étalement de spectre large, ce qui permet d’éviter la perte de l’information si une interférence se produit sur une fréquence donnée proche de la fréquence d’émission. La superposition d’une séquence de symboles du message de navigation avec la séquence de code est réalisée en inversant la parité du code C/A pour encoder un « 1 » sur le message de navigation. Cette inversion de bit se fait en début de code C/A et le système est conçu pour synchroniser le début d’une séquence de navigation avec le début du code C/A. Ces symboles de navigation sont introduits dans le signal de la façon suivante : s(t) = A · X(t) · D(t) · cos (2πf t) .
(2.54)
On cherche donc à transmettre un bit de message de navigation, soit 2 symboles en même temps que 20 séquences complètes de code, soit en même temps que 20 000 chips de code. Le récepteur peut facilement déterminer toutes les 10 séquences de code quel bit de symbole a été superposé, ce qui lui permet de reconstruire l’information. La représentation fréquentielle du code C/A, soit un train de chips à la périodicité de 0,977 μs, est un sinus cardinal centré autour de la fréquence nulle avec des passages à zéro tous les 1,023 MHz. Le fait de rajouter à la porteuse modulée par le message de navigation une modulation par le code C/A généré à haute cadence, donne en fréquentiel le produit de convolution entre le sinus cardinal à 50 Hz centré sur la fréquence f et le sinus cardinal à 1,023 MHz centré sur zéro. Le résultat de ce produit est un sinus cardinal centré sur la fréquence f avec des passages à zéro tous les 1,023 MHz. Pour les fréquences f1 et f2 , les signaux s1 et s2 en sortie de satellite sont modélisés par : s1 (t) = AC/A · XC/A (t) · M N (t) · cos (2πf1 t)+AP1 (Y ) · XP1 (Y ) (t) · M N (t) · sin (2πf1 t) . s2 (t) = AP2 (Y ) · XP2 (Y ) (t) · M N (t) · sin (2πf2 t)
(2.55)
Les signaux et messages des systèmes GPS et Galileo
2.10
59
Traitement des signaux de navigation par le récepteur
Le récepteur reçoit par contre des signaux légèrement différents, que ce soit par l’amplitude reçue B mais aussi au niveau de la fréquence reçue. En effet, la vitesse relative du satellite et du récepteur engendre un effet Doppler qui introduit un décalage Δf entre la fréquence émise et celle reçue. De plus il apparaît un déphasage ϕ qui est inconnu. Au final, le récepteur reçoit des signaux qui se modélisent par : s1 (t) = B1 · D1 (t − τ ) · cos (2π (f1 − Δf1 ) (t − τ ) + ϕ1 ) , s2 (t) = B2 · D2 (t − τ ) · cos (2π (f2 − Δf2 ) (t − τ ) + ϕ2 )
(2.56)
où τ est le temps de propagation du signal de l’émetteur vers le récepteur. La donnée D est un mélange entre les informations de navigation et le code d’étalement. Toute l’ingéniosité de la conception du récepteur va être de reussir à estimer les inconnues que sont le temps de propagation τ à partir duquel on va construire la mesure de pseudo-distance, le décalage Doppler Δf ainsi que le déphasage ϕ. Le récepteur va procéder en deux modes : un premier que l’on nomme « signal acquisition » qui consiste à estimer grossièrement le temps τ et le biais en fréquence Δf par balayage, et un second appelé mode « poursuite » qui est dédié à la détermination précise des trois inconnues qui nous intéressent : le temps τ est produit par une boucle de code (Delay Lock Loop – DDL) et la phase ϕ est identifiée par la boucle de phase (Phase Lock Loop – PLL). Les flux et le séquencement entre les grandes fonctions d’un canal de réception sont présentés en figure 2.21.
Fig. 2.21 – Les grandes fonctions de calculs dans un récepteur GNSS. Pour réaliser ces fonctions, le récepteur convertit préalablement l’onde électromagnétique reçue en courant électrique avec son antenne de réception et amplifie la puissance des signaux reçus. Puis, le signal électrique se propage le long des câbles et rentre dans la chaîne électronique de traitement du signal où la fréquence des oscillations électriques est d’abord réduite afin de pouvoir être traitée par les différents canaux de réception. Le récepteur alloue un canal de réception par satellite et décale la fréquence du signal entrant de la fréquence Doppler imputable au mouvement relatif entre le satellite et le
60
Le temps dans la géolocalisation par satellites
récepteur. Le signal est ensuite corrélé avec une ou plusieurs répliques du code généré localement. La fonction de corrélation donne le degré d’alignement du code entrant avec la réplique locale. Elle fournit une valeur maximale bien identifiable dans le cas d’un alignement exact (on parle de pic de corrélation), et une valeur faible, proche de 0 dans les autres cas, en particulier si on corrèle avec un code différent. Le processus itératif entre les boucles de poursuite de code et de la phase explore un domaine en deux dimensions : le décalage de code en chip et le décalage Doppler en hertz. Lorsque les paramètres de la réplique locale (délai de code et fréquence) correspondent à ceux du signal entrant, la fonction de corrélation atteint un maximum. Le pic de corrélation ressort avec une amplitude d’environ 21 dB pour le signal GPS L1C/A dans un cas parfait, tel que représenté en figure 2.22. Une fois ce pic identifié, le récepteur est capable de fournir le nouveau biais en fréquence et le décalage du code entrant par rapport à la réplique.
Fig. 2.22 – Pic de corrélation dans le domaine temps/fréquence. Le processus aboutit à la construction des différentes mesures de navigation. La littérature fournissant une présentation détaillée de la modulation des signaux GNSS ainsi que les traitements de ces signaux au niveau récepteur est florissante. Parmi celle-ci, le lecteur trouvera dans les travaux d’Al Bitar (2007) un exposé clair et très complet de ces sujets.
Les signaux et messages des systèmes GPS et Galileo
2.11
61
Limitation du débit de transfert des données de navigation
Les données de navigation sont transmises aux utilisateurs avec des débits très faibles, exactement 50 bits par seconde pour les données GPS, 250 bits par seconde pour les données SBAS. Pourquoi des débits aussi faibles ? Il y a en fait trois paramètres principaux qui limitent le débit de transfert de données de navigation : 1) la durée du code PRN ; 2) le seuil de démodulation des données reçues au sol ; 3) le respect des normes ITU concernant les densités de puissance totale de signaux reçus au sol dans une bande donnée. Rappelons préalablement qu’un signal de navigation utilise la modulation CDMA (Code Division Multiple Access ou accès multiple à code d’étalement). Cette modulation consiste à multiplier chaque bit de donnée par un code périodique (le code PRN) ayant un nombre de chips assez élevé (les longueurs utilisées actuellement vont de 1023 à 10 230 chips pour une période de code). Cette opération équivaut à étaler le spectre du signal. La largeur de bande fréquentielle occupée est directement liée à la longueur du code PRN et à sa durée, donc en d’autres termes à la fréquence du code PRN. La puissance totale du signal se retrouve ainsi étalée, et le signal qui arrive au niveau du récepteur est noyé dans le bruit. Le récepteur procède à un de-étalement de ce signal en le multipliant par la même séquence de code PRN et en intégrant sur la durée de cette séquence. Ceci a pour conséquence de reconcentrer l’énergie du signal sur une bande beaucoup plus étroite. Ce fonctionnement impose donc que le récepteur soit capable d’intégrer sur toute la durée d’un code PRN, ce qui signifie qu’aucun changement de phase n’est toléré au milieu de cette séquence de code PRN. Ainsi, le débit binaire ne peut pas excéder l’inverse de la durée d’une période de code PRN. À l’inverse, la durée d’un bit de donnée peut excéder celle du code PRN (à condition qu’elle soit un multiple de celui-ci). La durée du code PRN détermine le débit binaire maximum qui peut être acheminé via un signal de navigation. La plus petite période utilisée actuellement pour les codes PRN de navigation est de 1 ms. Ainsi, il est impossible d’augmenter le débit des données de navigation au-delà de 1000 bits (ou symboles en cas de codage canal) par seconde. On pourrait envisager de réduire la période des codes d’étalement mais cela dégraderait leur propriété d’orthogonalité, laquelle permet de garantir une bonne séparabilité des codes entre eux (interférence inter-système) ce qui est absolument nécessaire pour discriminer les différents satellites émetteurs. Le seuil de démodulation est défini comme étant la puissance minimale de réception du signal en dessous de laquelle il n’est plus possible de démoduler le signal, et donc de récupérer les données de navigation. Cette puissance minimale est liée à l’énergie par bit de donnée. L’énergie par bit de donnée est
62
Le temps dans la géolocalisation par satellites
définie comme l’énergie totale du signal ramenée à un bit de donnée, autrement dit la part de l’énergie totale du signal portée par un bit de donnée. Plus la durée du bit de donnée est grande, et donc sa fréquence est faible, plus l’énergie par bit est grande, car une intégration cohérente sur la durée du bit de donnée est possible. Par intégration cohérente on se réfère à une intégration sur plusieurs périodes de code PRN par exemple dans le cas où la durée du bit de donnée correspond à plusieurs codes PRN. Le seuil de démodulation est un facteur limitant étant donné que la puissance reçue au sol d’un signal de navigation est très faible : de l’ordre de −155 dBW (sans considérer les effets d’affaiblissement, d’interférences, de multitrajets, etc.). D’autre part, l’Union internationale des fréquences impose aux systèmes spatiaux de navigation d’émettre leurs signaux avec des niveaux de puissance bien spécifiés et en deçà d’un certain seuil. Cette dernière contrainte limite la puissance des signaux de navigation. En conséquence, la faible puissance isotrope rayonnée équivalente (PIRE) du signal appliquée à l’antenne d’émission des satellites génère de faibles valeurs du rapport entre la puissance du signal reçu et la puissance du bruit, ce qui augmente le seuil de démodulation des données de navigation. Le schéma de la figure 2.23 résume l’intégration des informations de code et de message de navigation dans la porteuse pour le système GPS.
2.12
Résumé
Les satellites de constellation de navigation émettent en permanence des signaux qui contiennent des informations binaires. Pour les constellations GPS et Galileo, la transmission repose sur le principe du CDMA : les satellites émettent tous sur une même fréquence mais « colorent » leurs signaux par un code PRN spécifique, ce qui permet de les reconnaître. Chaque satellite se voit ainsi attribuer un code unique qu’il inscrit dans la porteuse par une modulation en phase, ce qui étale le spectre d’émission. Ces codes vont également servir de base au calcul du temps de transmission des signaux. Les informations de navigation, tels que la position des satellites et les données de synchronisation, sont également intégrées au signal par une modulation en phase. Au niveau du canal de réception, le signal entrant est corrélé dans le temps avec la réplique locale de ce code PRN. Cette réplique locale est générée en faisant varier les paramètres de retard et de phase du code. Le retard de code consiste à maintenir l’alignement entre le code entrant et la réplique, ce qui permet de calculer le décalage temporel entre les deux. Ce décalage sert ensuite au calcul précis du temps de propagation du signal. Le paramètre de phase est utilisé pour identifier le décalage Doppler du signal entrant, conséquence de la variation de la distance entre le satellite et le récepteur au cours du temps. L’exploration combinée du décalage de code et de fréquence (Doppler) fait apparaître un maximum qui permet d’identifier ces paramètres et de fournir les mesures de navigation.
Les signaux et messages des systèmes GPS et Galileo
63
Fig. 2.23 – Relations entre la porteuse, le code et le message pour le code C/A du système GPS. Une seconde contient 50 bits du message de navigation L/NAV GPS. Un bit de navigation dure 20 ms et contient 20 séquences successives de code C/A. Un code C/A dure 1 ms et contient 1023 chips. Un chip de code C/A dure environ 1 µs et contient 1540 oscillations de la porteuse à la fréquence f1 .
Chapitre 3 La mesure de code Depuis ses origines, la géolocalisation nécessite de disposer des éléments suivants : – un système de coordonnées dans lequel on peut repérer n’importe quelle position (longitude, latitude et hauteur par exemple) ; – une cartographie précise (aussi précise que possible) de l’espace dans lequel on évolue et dans laquelle notre position sera référencée ; – des points caractéristiques (amers, phares, étoiles, balises) cartographiés. Ces points possèdent donc une position connue ; – des mesures par rapport à ces points caractéristiques auxquels on va se repérer. Ces mesures peuvent être des mesures d’angle ou de distance. Dans la géolocalisation par satellites, les points caractéristiques sont les satellites eux-mêmes. Contrairement à des points fixes dans l’espace ou sur une carte, ces points sont mobiles. Ils sont en réalité en chute libre et évoluent à grande vitesse : approximativement 13 000 km par heure ! Lorsque l’on voudra se repérer par rapport à ces satellites, il faudra nécessairement connaître leurs positions à tout moment. La mesure de code est la mesure de base que va réaliser un utilisateur de systèmes de géolocalisation par satellites. Cette mesure est en fait une mesure de distance entre l’utilisateur et le satellite. En utilisant plusieurs satellites et en mesurant les distances qui nous séparent d’eux, nous pourrons nous positionner par trilatération.
3.1
Le principe de base du positionnement par GNSS
La base du positionnement par GNSS repose sur des mesures de distance entre un usager et plusieurs satellites GNSS. Les satellites GNSS se trouvant à des endroits différents et parfaitement connus, le calcul de la position se fait par triangulation : on cherche le lieu géométrique qui soit exactement à la distance mesurée de chaque satellite. On sait que l’ensemble des lieux géométriques des points qui sont à distance fixe d’une position de référence est une sphère
66
Le temps dans la géolocalisation par satellites
centrée en ce point. La donnée d’une seule mesure GNSS est donc insuffisante : avec deux mesures l’ensemble des positions possibles se trouvent maintenant sur l’intersection transverse de deux sphères, c’est-à-dire sur un cercle, avec trois il reste l’intersection transverse entre la troisième sphère et le cercle, soit deux points candidats dont un suffisamment éloigné de la surface de la Terre pour pouvoir être exclu. Comment réaliser la mesure de distance entre un utilisateur et un satellite GNSS ? Le principe est le suivant. On suppose que le récepteur et le satellite sont tous deux équipés d’une horloge parfaite et que les deux horloges sont parfaitement synchronisées. Le satellite envoie un signal à une date précise, donnée par son horloge, et insère cette date d’émission dans son signal. Le récepteur reçoit le signal et date cet événement de réception avec son horloge. Ensuite, le récepteur récupère la date d’émission qu’il extrait du signal et la compare avec la date de réception. La différence entre date de réception et la date d’émission correspond au temps de propagation du signal. Il suffit de multiplier ce temps de propagation par la vitesse du signal pour obtenir la distance entre le satellite et le récepteur. Dans ce processus, le récepteur est complètement passif : il ne fait que recevoir et traiter des informations envoyées par les satellites GNSS. Concrètement, le récepteur ne dispose pas d’une horloge parfaite, elle est désynchronisée par rapport à celles des satellites GNSS. Il y a donc une inconnue supplémentaire qui se rajoute au problème de géolocalisation : le biais d’horloge entre l’horloge récepteur et le temps de la constellation. Ce biais représente l’avance ou le retard entre l’horloge récepteur et les horloges, parfaitement synchronisées, des satellites de la constellation GNSS. Pour résoudre cette inconnue supplémentaire, il faut une mesure supplémentaire donc introduire un satellite supplémentaire dans le problème. Bien qu’ils partagent tous les deux les mêmes concepts et principes de base, chaque système de navigation, GPS ou Galileo, présente chacun ses propres spécificités, que ce soit dans la structure des codes de navigation que dans celles des messages de navigation. Aussi, pour illustrer en détail la formation de la mesure de code, on choisit de se focaliser sur un système en particulier, le système GPS. Par conséquent, le calcul du temps de propagation du signal décrit dans la section suivante est spécifique au GPS.
3.2
Le calcul du temps de propagation du signal
Le principe du positionnement par GPS repose sur des mesures de distance entre un utilisateur et plusieurs satellites. Les satellites GPS émettent le signal GNSS en continu. Pour calculer ces mesures de distance, on sélectionne une « marque » particulière dans ce signal et on calcule le temps de propagation de cette « marque » du moment où elle est émise par le satellite jusqu’au moment où elle est reçue par le récepteur.
La mesure de code
67
Dans la suite, nous adoptons la notation suivante : on note en exposant les temps référencés à une horloge satellite et en indice les temps référencés à une horloge terrestre. On comprend par « marque » dans le signal GNSS un caractère de chip particulier du code PRN, n’importe lequel. Notons τ sat le temps à l’émission d’un caractère (un bit du code PRN) daté en horloge émetteur et τrec le temps de réception daté en horloge récepteur. La valeur de τrec est directement donnée par l’horloge du récepteur. Fixons le caractère reçu à la date τrec . Il s’agit de retrouver la date d’émission τ sat de ce même caractère en horloge émetteur. La détermination du temps d’émission du caractère est donnée dans le message de navigation mais elle est délicate à réaliser et utilise le compteur Z. Ce caractère appartient à une sous-trame du message de navigation. Le compteur Z contient la date d’émission du début de la sous-trame suivante. Le compteur Z, le message de navigation ainsi que le code C/A permettent de retrouver le temps d’émission d’un bit de caractère de code PRN. Mais pour que ce calcul de temps d’émission soit possible, il est impératif que le satellite GNSS réalise et maintienne les actions suivantes : 1. le satellite synchronise très précisément le début d’une seconde de son horloge interne avec le début d’une séquence de code PRN transmise dans le signal ; 2. de façon identique, le satellite synchronise le premier bit d’une soustrame du message de navigation avec la seconde ronde de son horloge interne ; 3. le satellite maintient la synchronisation du début d’un bit de navigation (de durée 20 ms) avec le début d’une séquence de code C/A (de durée 1 ms) ; 4. le satellite maintient la cohérence code/porteuse c’est-à-dire qu’il n’y a pas de biais et/ou de dérive du nombre d’oscillations de la porteuse dans un bit d’information de code. Pour connaître le temps d’émission d’un caractère reçu, on commence par identifier la date d’émission du premier bit de la sous-trame contenant le caractère. Cette valeur est directement donnée par le Z-count (défini plus haut) où l’on applique le facteur 1,5 pour obtenir un nombre entier de secondes. Puis on calcule le temps écoulé entre l’émission du caractère et ce premier bit de la sous-trame. Ce temps écoulé se mesure à partir des boucles de poursuite du récepteur qui enregistrent le comptage suivant. On compte d’abord le nombre de bits de navigation déjà transmis Nnav entre le début de la sous-trame et le caractère, chacun de ces bits représente 20 ms. On compte ensuite le nombre de répétitions entières de séquences de code C/A déjà transmis NC/A depuis le début du bit courant de navigation contenant le caractère, chacune de ces séquences représente 1 ms. On compte le nombre entier de chip Nchip dans la séquence de code C/A courante. On mesure enfin la fraction de chip Fchip dans la séquence de code C/A courante.
68
Le temps dans la géolocalisation par satellites
Au final, toute cette mécanique donne, pour le code C/A, le comptage suivant : τ sat = 1, 5 × Zcount × 100 +(Nnav × 20 + NC/A ) × 10−3 . (3.1) 1 + 1,023 (Nchip + Fchip ) × 10−6 On observe une décomposition de ce calcul de temps d’émission, en nombre de secondes, nombre de millisecondes et microsecondes. Le calcul du nombre de millisecondes, qui revient à dénombrer les bits de messages de navigation et les séquences de code C/A, est effectué à l’intérieur du logiciel du récepteur. Le calcul fin du nombre de microsecondes est évalué par la fonction de corrélation du récepteur. Ils permettent une précision de la mesure meilleure que 300 mètres. Si le temps d’émission était déterminé à l’aide des codes cryptés P, le calcul fin permettrait une connaissance de ce temps à la centaine de nanosecondes près, ce qui permettrait d’atteindre une précision de la mesure inférieure à 30 mètres. En fait, le temps d’émission du signal est reconstruit selon un processus très similaire à la lecture de l’heure sur une montre sauf que les heures, minutes, secondes, sont remplacées par secondes, milli et nanosecondes. Le processus est illustré par les figures 3.1 et 3.2 qui se suivent. La première illustre l’estimation du temps d’émission à la précision de la milliseconde, soit une estimation préliminaire, la seconde illustre la recherche de la précision nécessaire pour réaliser la fonction de positionnement soit la microseconde. Le code C/A va servir de repère permettant au récepteur d’affiner sa mesure du temps de propagation. Le récepteur va repérer le début de la séquence de code à la réception du signal et dater l’instant d’arrivée de ce repère par rapport à son temps local donné par son horloge locale. Le code C/A est suivi par acquisition directe c’est-à-dire que le récepteur corrèle le signal provenant du satellite avec une réplique du code qu’il a générée. Le récepteur maintient une réplique locale dont le premier bit se cale sur le début d’une seconde de l’horloge récepteur. Puis, le récepteur décale cette réplique de façon à la superposer sur le signal reçu. Cela donne une information de décalage de code PRN, ce qui donne accès à la connaissance de la milliseconde du temps de transmission. Au final, cela donne accès à une précision de la mesure de distance de 1 mètre environ. La fonction de corrélation du récepteur effectue le produit : C= X s · Xr , (3.2) où : X s : représente la séquence de code émise par le satellite et reçue par le récepteur ; Xr : représente la réplique de code générée par le récepteur. Les propriétés de décorrélation des codes C/A vont conduire à une valeur maximale de la variable C lorsque la réplique est alignée sur la séquence de code reçue.
La mesure de code
69
Fig. 3.1 – Première étape de la construction de la pseudo-distance pour GPS qui consiste à déterminer la durée D1 + D2 + D3 du nombre de bits écoulés depuis le début de la sous-trame jusqu’à la Mme séquence de code C/A du Nme bit du message de navigation au moment de la prise de mesure. Il s’agit d’une estimation préliminaire. Le récepteur se charge de générer une réplique de façon à maintenir le produit de corrélation maximal au cours du temps. La mesure est faite au pic de corrélation. La figure 3.3 illustre l’acquisition du code C/A. Une fois le code acquis, les boucles de poursuite prennent le relais et se chargent de maintenir et d’affiner les pics de corrélations. Quel que soit le système de navigation (GPS ou Galileo), le temps de propagation ΔτR peut être défini comme le temps qu’un caractère a mis pour voyager depuis son émission au centre de phase de l’antenne du satellite jusqu’à sa réception au centre de phase de l’antenne du récepteur : ΔτR = τrec − τ sat .
(3.3)
Il mesure l’écart entre le temps de réception du signal daté en horloge récepteur moins le temps d’émission de ce même signal daté en horloge émetteur. La mesure de code est une mesure de distance (range pour son équivalent anglo-saxon) construite en multipliant le temps de propagation du signal par
70
Le temps dans la géolocalisation par satellites
Fig. 3.2 – Seconde étape de la construction de la pseudo-distance pour GPS qui consiste à calculer, par la fonction de corrélation, la durée D4 écoulée depuis le début de la Mme séquence de code C/A jusqu’au chip correspondant à l’instant de prise de mesure cadencée par l’horloge interne du récepteur.
la vitesse de la lumière (nous justifierons plus précisément l’usage de cette équation simple de propagation lorsque nous aborderons la relativité à partir du chapitre 13) : P R = c τrec − τ sat .
(3.4)
Étant donné que les temps propres d’émission et de réception sont mesurés par deux horloges distinctes, l’horloge du satellite pour l’émission et l’horloge du récepteur pour la réception, le temps de propagation ne représente la distance géométrique que si les deux horloges sont synchronisées entre elles. Or, cette hypothèse de synchronicité n’est jamais respectée en pratique, deux horloges finiront toujours par marquer des tops de secondes différents. On parle alors de pseudo-distance (pseudorange pour son équivalent anglo-saxon) pour indiquer que ces distances, qui peuvent être négatives dans le cas où l’horloge du récepteur est en retard sur l’horloge du satellite, sont affectées des biais de temps de chacune de ces horloges par rapport une référence commune. Dans notre cas, la référence commune est le temps système de la constellation.
La mesure de code
71
Fig. 3.3 – Corrélation du code C/A. Le code est transmis par le satellite au temps
propre τ sat et reçu par le récepteur au temps propre τrec . Le récepteur génère une réplique du code avec son horloge et recherche le temps de propagation du signal en “ superposant ” la réplique au code reçu (acquisition). La superposition est détectée par la fonction de corrélation. La recherche du pic de corrélation se fait à la fois en temps et en fréquence. Le récepteur effectue la poursuite du code en générant plusieurs répliques décalées dans le temps afin d’identifier et de suivre le pic de corrélation. Les horloges sont désynchronisées de la quantité hsat pour le satellite et hrec pour le récepteur (ici elles sont toutes les deux positives mais elles peuvent prendre n’importe quel signe).
3.3
La modélisation de la mesure de code
L’objet de la modélisation est de construire une mesure de pseudo-distance théorique aussi proche que possible de la mesure reçue. La plupart du temps, l’horloge du récepteur n’est pas synchronisée au temps système GPS. Il existe un biais de temps entre le temps local et le temps système τrec = trec + Δtrec (trec ) .
(3.5)
D’un autre côté, l’horloge du satellite n’est pas parfaitement synchronisée par rapport au temps système GPS. Cela se traduit également par un biais de temps émetteur : τ sat = tsat + Δtsat tsat , (3.6) où tsat : est la date de l’événement d’émission daté en temps GPS ; Δtsat (tsat ) : est le biais de temps entre l’horloge satellite et la référence GPS à la date tsat ;
72
Le temps dans la géolocalisation par satellites
trec : est la date de l’événement de réception daté en temps GPS ; Δtrec (trec ) : est le biais de temps entre l’horloge récepteur et la référence GPS à la date trec . Lorsque l’on introduit les biais de désynchronisation des horloges dans la modélisation de la pseudo-distance, on voit apparaître le temps de transmission géométrique plus ces biais d’horloges. Au final, la mesure de code se décompose en une partie géométrique pure plus un biais supplémentaire lié aux désynchronisations des horloges par rapport à une référence de temps commune. Ces biais additionnels sont inhérents au système GPS d’où le nom de « pseudo-distance » donnée à cette mesure. Par la suite, on convient de noter par hrec et hsat les biais d’horloges en mètres : hrec = c.Δtrec (trec ) , hsat = c.Δtsat tsat . La mesure de code s’écrit maintenant : P R = c trec − tsat + hrec − hsat .
(3.7) (3.8)
(3.9)
Dans cette équation, le temps de propagation géométrique : ΔtR = trec − tsat ,
(3.10)
représente le temps que met le signal pour quitter la position du satellite et atteindre la position du récepteur à la vitesse de la lumière. Multiplié par la vitesse de la lumière cela donne la distance géométrique : R = cΔtR ,
(3.11)
séparant l’émetteur à l’instant de l’émission du signal et le récepteur à l’instant de réception du même signal. La modélisation de la mesure de pseudo-distance devient : P R = R + hrec − hsat , (3.12) avec : sat (tsat )||, rec (trec ) − X R = ||X
(3.13)
rec (trec ) et X sat (tsat ) sont exprimés dans un même système où les vecteurs X de coordonnées : rec (trec ) : est la position du récepteur à l’instant de réception trec ; X X sat (tsat ) : est la position du satellite à l’instant bord tsat lié à l’évènement de réception. La figure 3.4 illustre le rapport entre la notion de distance et celle de pseudo-distance.
La mesure de code
73
Fig. 3.4 – Distance et pseudo-distance. Le signal quitte le satellite au temps tsat et est reçu au temps trec dans la référence GPS. Le satellite transcrit dans son message de navigation le temps τ sat au moment de l’émission du signal, commettant ainsi une erreur Δtsat . L’horloge du récepteur est désynchronisée par rapport au temps de référence GPS de la quantité Δtrec et estime le temps d’arrivée du signal à l’instant τrec .
3.3.1
Variation temporelle de la distance géométrique
La variation de la distance géométrique entre un utilisateur et un satellite dépend de l’élévation de ce dernier et de la position de l’utilisateur par rapport au plan de l’orbite du satellite. Pour un utilisateur situé sur le plan orbital du satellite (le satellite passe au zénith de l’utilisateur, autrement dit φ = i), la variation par seconde de cette distance présente les amplitudes maximales (figure 3.5). Pour fixer les idées, la variation temporelle sur une seconde de la distance géométrique à une élévation de 30◦ est approximativement de 800 mètres. Ce sont donc avec des vitesses radiales importantes, de l’ordre de plusieurs centaines de mètres par seconde, que les satellites de navigation s’approchent ou s’éloignent des utilisateurs en début et fin de visibilité.
3.3.2
Le rôle de la référence de temps dans les systèmes de navigation
Analysons maintenant cette formulation plus en détail. Dans le cas où les positions des satellites et du récepteur sont connues et fixées et que l’on souhaite synchroniser globalement les horloges des satellites et du récepteur, aucun calcul n’est possible avec les mesures de pseudo-distances sans informations supplémentaires. En effet, les biais d’horloges ne sont identifiables qu’à une constante près car si l’on décale toutes les horloges de la même quantité cela n’a aucun effet sur les mesures : P R − R = hrec − hsat = (hrec + α) − hsat + α . (3.14) Autrement dit, la valeur de la référence sur laquelle toutes les horloges sont synchronisées ne joue aucun rôle dans le traitement des pseudo-distances.
74
Le temps dans la géolocalisation par satellites
Fig. 3.5 – Variation par seconde de la distance géométrique en fonction de l’élévation du satellite pour un utilisateur situé dans le plan de l’orbite.
3.3.3
Corrélation entre la position du satellite et son horloge dans la mesure de pseudo-distance
Si l’on éloigne le satellite de la position de l’utilisateur de la distance d le long de la ligne de vue et que l’on avance en même temps son horloge de la même proportion (d/c), alors la valeur de la pseudo-distance reste inchangée. P R = (R + d) + hrec − hsat + d .
(3.15)
Cette remarque montre la difficulté qu’il y a à séparer la position du satellite selon la direction de l’axe à vue et le biais d’horloge satellite lorsque l’on a seulement des informations de pseudo-distance. La construction de la mesure de pseudo-distance instaure de fait une forte corrélation entre la géométrie de la constellation dans la direction des axes à vue et les horloges : si l’on fait évoluer les deux de façon cohérente, cela est invisible dans la mesure.
La mesure de code
3.4
75
Mesures de codes délivrées par le système GPS et produites par les récepteurs
Actuellement, les mesures de code disponibles pour le système GPS sont les mesures traditionnellement notées C/A, P1, P2, et C2 (à partir du bloc IIRM) associées aux signaux L1C/A, L1P(Y), L2P(Y) et L2C. Les codes P sont des codes cryptés à usage militaire. Les codes C/A et C sont civils. Selon leur classe, les récepteurs fournissent les données suivantes : Mono-fréquence L1C/A L1C/A, P1
3.5
Bi-fréquences 1C/A, P1, P2 L1C/A, L1C/A + (P2-P1) L1C/A, P2
Exemple de récepteurs Rogue and Trimble 4000 Leica, Novatel, Trimble Dernières générations
Événement de prise de mesure et datation par le récepteur
L’oscillateur interne du récepteur lui permet de construire et de maintenir une base de temps interne. À une fréquence donnée (1 Hz, 10 Hz. . . ), le récepteur réalise ses mesures qu’il date dans son échelle de temps interne. Les principales échelles de temps que l’on considère sont les suivantes : Le temps GPS vrai (mais inaccessible au niveau récepteur) : c’est le temps de la physique, qui suit le TAI à 19 secondes près. Le temps GPS restitué au niveau récepteur par le calcul de position/temps : il est précis à plus ou moins 50 nanosecondes. La seconde restituée peut fluctuer un coup à droite un coup à gauche de la seconde GPS vraie (figure 3.6). Cette construction produit un échantillonnage de secondes irréguliers. Le temps local du récepteur (RLT pour son acronyme anglo-saxon Receiver Local Time) construit de la façon suivante : au démarrage, la seconde RLT se cale sur la seconde GPS restituée par le PVT. Le processus compte x coups d’horloge, marque une nouvelle seconde et recommence. On construit donc un échantillonnage régulier, à la dérive et au bruit de l’horloge interne près. La séquence de Top RLT est donc construite à partir du générateur de fréquence. Ce générateur de fréquence est soit un quartz, un OCXO, un quartz piloté par une horloge atomique externe ou une horloge atomique interne. Ces trois échelles de temps sont représentées en figure 3.6. Deux solutions sont possibles pour la réalisation de prises de mesures proches de la seconde ronde GPS. La première consiste à piloter un quartz par une horloge atomique. Le premier top de l’horloge atomique est calé à la seconde GPS – par un calcul de point – et on laisse le système fonctionner selon son comportement naturel, c’est-à-dire sans recalage. La stabilité est assurée par la qualité de l’horloge
76
Le temps dans la géolocalisation par satellites
Fig. 3.6 – Échelles de temps dans un récepteur. atomique. Les avantages résident dans le fait d’avoir un accès direct au comportement réel de l’horloge. Actuellement, le système européen EGNOS construit et date les mesures en secondes rondes du RLT : la prise de mesure dérive en même temps que la datation (elle n’est pas synchrone entre les stations), mais cette datation reste précise (∼ 1 nanoseconde). Dans la seconde solution, le récepteur pilote l’événement de prise de mesure sur le temps GPS, l’oscillateur local est un OCXO. On demande donc à ce que l’OCXO sorte son top de seconde très proche du 1 pulse par seconde (PPS pour son acronyme) GPS. Le pilotage peut se faire par un calcul de point : le récepteur cale sa prochaine prise de mesure en tenant compte de l’écart de son horloge par rapport au temps système GPS. L’avantage de cette solution est que le pilotage de prise de mesure annule l’effet du mauvais comportement de L’OCXO à long terme (dérive de 10−8 –10−9 ns/s), la qualité de l’oscillateur court terme assure une bonne mesure de phase. Par contre, le récepteur utilise les mesures GPS pour recaler son temps local : on a donc la possibilité qu’un événement redouté dans les mesures perturbe ce recalage.
3.6
Résumé
La mesure de code est la mesure de base que génère un récepteur : elle représente le temps de propagation apparent du signal entre un satellite de navigation et le récepteur. On la définit comme la différence entre l’événement de l’émission en temps émetteur et l’événement de réception du signal en temps récepteur. Ce temps de propagation est mesuré comme la quantité de décalage de temps (modulo une milliseconde) nécessaire pour aligner une réplique du code PRN générée par récepteur avec le code PRN présent dans le signal reçu
La mesure de code
77
du satellite. Cette mesure est biaisée du fait que les horloges du récepteur et des satellites ne sont pas synchronisées. Chaque satellite génère un signal construit sur la base de son horloge embarquée. Le récepteur génère sa propre réplique basée sur les qualités de sa propre horloge. La mesure de distance biaisée, ou pseudo-distance est simplement le temps de propagation du signal multiplié par la vitesse de la lumière dans le vide. Il y a trois références de temps dans une mesure de code : deux d’entre elles sont directement attachées aux horloges du récepteur et du satellite, la dernière est une référence de temps commune, le temps système GPS, qui est un temps « composite ». Le temps GPS a pour référence le temps de l’US Naval Observatory (USNO). Ce laboratoire de temps participe au temps TAI comme expliqué au chapitre précédent (et c’est même le principal contributeur), le temps GPS est donc indirectement lié au TAI, le temps atomique international. Le temps GPS est un temps continu qui a été calé sur le temps UTC le 6 janvier 1980 à 0h00 UTC, au début de la vie du système. À cette date, il y avait un écart de 19 secondes entre le temps TAI et le temps UTC, donc le temps TAI est en avance de 19 secondes sur le temps GPS. Ce dernier s’éloigne du temps UTC à chaque introduction de secondes intercalaires (leap second en anglais). En effet, comme expliqué au chapitre précédent, l’UTC est occasionnellement incrémenté ou décrémenté d’une seconde intercalaire par rapport au TAI pour maintenir la cohérence avec le Soleil à son élévation maximale aux environs de midi UTC. Le temps GPS est en avance de 18 secondes sur le temps UTC (état au 1er janvier 2020). Le dernier saut de +1 seconde (transition de 17 à 18 secondes) s’est produit le 31 décembre 2016 à 23 :59 :60 UTC.
Chapitre 4 La mesure de Doppler Les satellites GNSS maintiennent, grâce à leurs horloges, une base de fréquence fondamentale f0 = 10, 23 MHz. À partir de cette fréquence fondamentale, les chaînes de traitements de signaux construisent les différentes fréquences d’émissions. Si ces fréquences sont celles des signaux en sortie d’antenne GPS, sont-ce réellement celles qui seront reçues par l’utilisateur ? Ce n’est pas vraiment le cas : la fréquence reçue par le récepteur sera la plupart du temps différente de ces valeurs à l’émission du fait principalement du mouvement du satellite sur son orbite. Lorsque le récepteur réalise l’acquisition du signal GNSS, il doit donc prendre en compte ce décalage de fréquence et faire une recherche sur une plage en fréquence de +/− 10 kHz. Une fois l’acquisition du signal GNSS faite, le récepteur continue à poursuivre le signal en ajustant en permanence le décalage Doppler. Le décalage Doppler est la différence entre la fréquence reçue, notée fR , et la fréquence émise, notée fE : Δf = fR − fE .
(4.1)
Le décalage est calculé par le récepteur en mesurant l’écart entre le signal reçu et une réplique locale, de fréquence fE , générée par l’oscillateur. Plusieurs effets contribuent à ce décalage.
4.1
Effet Doppler classique
Le principe de l’effet Doppler classique est un changement de la fréquence pour l’onde reçue par un observateur suite au mouvement relatif entre cet observateur et l’émetteur. La variation de la fréquence reçue est directement liée à la variation de la distance relative entre l’émetteur et le récepteur. Dans le cas qui nous intéresse ici, l’émetteur sera un satellite de la constellation GPS et le récepteur sera quelconque à la surface de la Terre ou proche de celle-ci. Le raisonnement et les calculs sont menés dans le repère inertiel géocentrique ECI (Earth Centred Inertial). Dans ce repère, la lumière se propage en
80
Le temps dans la géolocalisation par satellites
ligne droite à la vitesse c. On considère un lien de communication entre le satellite et le récepteur via un signal électromagnétique à sens unique : le satellite émet et le récepteur accroche le signal. On suppose les horloges parfaites et synchronisées. On choisit une marque quelconque dans l’onde porteuse générée par le satellite et on note tsat le temps de l’émission de cette marque, c’està-dire le moment où cette marque quitte l’émetteur. Cette marque sera reçue par le récepteur au temps trec . Dans le repère inertiel, la position de l’émetteur sat (tsat ), sa vitesse est V sat (tsat ) et au moment de l’émission est notée par X rec (trec ) et sa la position du récepteur au moment de la réception est notée X rec (trec ). vitesse est V L’effet Doppler est dérivé de l’équation du temps de propagation du signal entre l’émetteur et le récepteur : 1 sat tsat ||. trec = tsat + ||X rec (trec ) − X c
(4.2)
Cette équation exprime que le temps de réception de la marque dans le signal est égal au temps à l’émission augmenté du temps de propagation du signal entre l’émetteur et le récepteur. Considérons maintenant une seconde marque sur l’onde porteuse séparée de la première par exactement une période de l’oscillateur. Le temps d’émission et de réception de cette seconde marque s’écrit respectivement tsat + dtsat et trec + dtrec . Pendant les écarts de temps dtrec et dtsat , les observateurs rec et dX sat . émetteur et récepteur se sont déplacés des quantités respectives dX Considérant que la fréquence de la porteuse est élevée, il est licite de calculer les petits écarts de temps dtrec et dtsat avec la différentielle de l’équation de propagation. Pour cela, on rappelle que la différentielle en un vecteur v de la norme est l’application linéaire L (u) telle que, pour tout vecteur h : |||v + h|| − ||v|| − L (v) .h| = o (||h||) .
(4.3)
On rappelle que o(||h||) = ||h||ε(||h||) avec ε(||h||) une fonction réelle de la variable réelle ||h|| telle que ε(||h||) −→ 0 quand ||h|| −→ 0. L’expression de la différentielle de la norme s’obtient aisément en faisant apparaître le produit scalaire ||v|| = v|v qui est une application bilinéaire. Si le vecteur v est non nul alors : d d||v|| 2v|h v|h .h = . (4.4) L (v) .h = v|v.h = = du du ||v|| 2 v|v La différentielle de l’équation de propagation s’écrit : dtrec = dtsat +
sat (tsat ) rec (trec ) − X 1 X sat . rec − dX . dX rec (trec ) − X sat (tsat ) || c ||X
(4.5)
Dans cette équation le vecteur : u =
sat (tsat ) rec (trec ) − X X , rec (trec ) − X sat (tsat ) || ||X
(4.6)
La mesure de Doppler
81
est le vecteur unitaire de la droite reliant les deux observateurs et orienté de l’émetteur satellite vers le récepteur. Enfin, durant les petits intervalles de temps dtrec et dtsat , les déplacements des observateurs sont supposés à vitesse rec = V rec dtrec et dX sat = V sat dtsat . constante ce qui donne dX Ainsi, la différentielle peut se réécrire : 1 dtrec = dtsat + u · Vrec dtrec − V sat dtsat . c
(4.7)
Après réarrangement des termes de l’équation, la formulation que l’on retient est la suivante : dtrec
u · Vrec (trec ) 1− c
= dt
sat
u · V sat (tsat ) 1− c
.
(4.8)
Pour écrire une relation à l’aide de fréquences, il est impératif de se ramener aux temps propres des deux observateurs car les fréquences sont propres aux oscillateurs : 1 f sat = sat , (4.9) dτ 1 frec = . (4.10) dτrec Dans le cadre classique newtonien, le temps-coordonnée est le temps unique pour tous les observateurs ce qui permet de passer directement à une expression en fréquence : 1 f sat = sat , (4.11) dt 1 frec = , (4.12) dtrec pour obtenir la formule classique de l’effet Doppler : f sat frec = . sat 1 − u·Vcrec 1 − u·Vc
(4.13)
Il est possible, après quelques développements et approximations, de simplifier cette expression pour faire apparaître la vitesse radiale R˙ entre le récepteur et l’émetteur. 1 − u·Vcrec u · Vrec frec ∼ = 1− = sat f sat c 1 − u·Vc ⎞ ⎛ sat − V rec u · V sat ˙ u · V R ∼ ⎠= 1− . (4.14) × 1+ = ⎝1 − c c c
82
Le temps dans la géolocalisation par satellites
La relation entre la fréquence de l’émetteur notée f sat et la fréquence reçue (apparente) par le récepteur notée frec est décrite par l’équation classique qui décrit l’effet Doppler : R˙ sat . (4.15) 1− frec = f c Le décalage Doppler est donné par la relation : Δfcin´ematique = frec − f sat = −
R˙ sat f . c
(4.16)
Dans cette écriture, la vitesse radiale est comptée positive si elle correspond à une vitesse d’éloignement. Cependant, il existe plusieurs conventions sur le signe de la vitesse radiale. Les fichiers RINEX compte un effet Doppler positif pour les satellites qui se rapprochent. Les récepteurs Novatel comptent un Doppler positif pour les satellites qui s’éloignent. Pour la suite des écritures, on se place dans la convention des fichiers RINEX autrement dit R˙ < 0 : Δfcin´ematique =
R˙ sat f . c
(4.17)
Quand le satellite se lève au-dessus de l’horizon, son mouvement le rapproche du récepteur et le signal est reçu par ce dernier à une fréquence plus élevée (Δfcin´ematique > 0) que lorsqu’il descend sur l’horizon et s’éloigne du récepteur Δfcin´ematique < 0. Prenons l’exemple de lá fréquence fL1 . Une période complète du signal dure 1/fL1 = 0, 6348 × 10−9 secondes soit environ 0,6 ns. Pendant ce temps, le signal se propage de 19 cm (la longueur d’onde). Cependant, durant ce même laps de temps, le satellite se déplace également en direction de l’utilisateur. La vitesse du satellite relative par rapport au récepteur atteint approximativement la valeur maximale r˙ = 900 m/s. En se rapprochant du récepteur à cette vitesse, le satellite parcourt r/f ˙ L1 = 0, 6 micromètre pendant chaque période du signal. Vu du récepteur, la distance entre le début et la fin de la période de l’ondulation est donc diminuée de la distance parcourue par le satellite. La longueur d’onde λ1 = c/f1 du signal reçu par le récepteur apparaît en conséquence diminuée de 0,6 micron. Cela représente une augmentation de la fréquence f1 de : c − f1 = 4726 Hz, (4.18) c r˙ f1 − f1 soit environ 4,7 kHz. Inversement, lorsque le satellite s’éloigne du récepteur en redescendant sur l’horizon, sa fréquence apparaît plus faible de quelques kHz (voir la figure 4.1). La vitesse apparente du satellite par rapport à l’utilisateur varie tout au long de sa période de visibilité, passant de +1 km/s au maximum au lever du satellite à une valeur nulle quand le satellite est au plus haut sur l’horizon, puis
La mesure de Doppler
83
Fig. 4.1 – Illustration de l’effet Doppler (schéma d’après Piéplu [2006]).
Fig. 4.2 – Variation du Doppler cinématique et effet de l’ionosphère.
à −1 km/s quand il se couche. L’effet Doppler varie donc également, imposant au récepteur de suivre ces variations de fréquence pendant toute la phase de poursuite du satellite. La figure 4.2 illustre une évolution du Doppler cinématique en fonction de l’élévation du satellite.
84
Le temps dans la géolocalisation par satellites
Fig. 4.3 – Extraction du décalage Doppler par filtrage du mixage entre le signal reçu et la réplique.
Typiquement, la variation du décalage Doppler est de 0,25, 0,5, 0,7 Hz par seconde et peut même aller au-delà lorsque l’ionosphère est perturbée.
4.2
La mesure du Doppler dans le récepteur
Le récepteur génère en permanence une réplique R à la fréquence souhaitée (par exemple f1 ) et mixe cette réplique avec le signal E des GNSS reçu à la fréquence f1 + Δf1 . Ce mixage revient à multiplier les deux signaux R et E entre eux puis à en extraire la composante basse fréquence pour capter le décalage Doppler. R × E = R0 sin (φrec ) .E0 sin φsat R0 E0 cos φrec + φsat + cos φrec − φsat . (4.19) = 2 Les hautes fréquences sont filtrées pour faire apparaître le décalage en Doppler : B= avec :
R0 E0 R0 E0 cos φrec − φsat = cos (Δφ) , 2 2
(4.20)
1 dΔφ = Δf = f sat − frec . (4.21) 2π dt Le résultat de cette opération est illustré par la figure 4.3. La fréquence reçue traduit d’abord une diminution de la distance radiale puisqu’il y a augmentation de la fréquence reçue par rapport à la réplique, puis une stabilisation au moment où les deux fréquences coïncident et enfin une augmentation de la distance radiale lorsque la fréquence reçue diminue par rapport à la réplique locale.
La mesure de Doppler
4.2.1
85
Dérive en fréquences
Figeons le mouvement du satellite et du récepteur et supposons que la vitesse de propagation du signal reste inchangée. Dans ce contexte, la fréquence émise est identique à la réplique générée par le récepteur et il n’y a aucun décalage Doppler sauf si : – la fréquence générée à bord du satellite dérive de sa fréquence spécifiée, dans ce cas la fréquence reçue fR est différente de la réplique locale fE . Le décalage Doppler est donc la variation en fréquence émise : Δf = f − f + Δf sat = −Δf sat ,
(4.22)
– la fréquence de la réplique locale générée par le récepteur dérive de la fréquence spécifiée : dans ce cas la fréquence de la réplique locale est différente de la fréquence reçue. Le décalage Doppler est donc la variation en fréquence de la réplique : Δf = (f + Δfrec ) − f = Δfrec .
(4.23)
La contribution au décalage Doppler d’une variation de fréquence entre le récepteur et l’émetteur est donc : Δfhorloge = Δfrec − Δf sat .
(4.24)
Ces écarts contiennent également la compression générée par l’électronique des équipements.
4.2.2
La modélisation de la mesure Doppler
Le décalage Doppler total sera la somme de toutes les contributions aux variations de la fréquence reçue et représente la mesure Doppler en hertz issue de la boucle de phase (PLL – Phase Lock Loop) DHz = frec − f sat = Δfcin´ematique + Δfhorloge .
(4.25)
L’écart de fréquence relative instantanée est directement proportionnel à une mesure de vitesse relative entre le satellite et le récepteur et contient également les écarts de fréquence entre le satellite et le récepteur, ainsi que les erreurs liés aux effets de propagation ionosphérique e et troposphérique T : y (trec ) =
frec − f sat 1˙ ˙ rec (trec ) − Δt ˙ sat tsat . R + Δt = f sat c
(4.26)
La mesure de Doppler DR en mètre par seconde s’obtient en multipliant l’écart de fréquence relative par la vitesse du signal : DR = cy (t) = c
DHz = λsat DHz . f sat
(4.27)
86
Le temps dans la géolocalisation par satellites
C’est cette valeur que l’on trouve dans les fichiers Rinex. La modélisation de la mesure Doppler en mètre/seconde exprime une variation de la vitesse radiale affectée de la dérive des horloges bord et sol et des effets atmosphériques : DR = R˙ + h˙ rec − h˙ sat + εDR ,
(4.28)
où εDo note le bruit de mesure Doppler. Il est également équivalent de dire que la mesure Doppler rend compte de la variation du temps de propagation du signal : DR = c
dΔτR = c τ˙rec − τ˙ sat . dt
(4.29)
Notons que, pour la poursuite en fréquence décrite ici, les effets relativistes sont négligeables (effet Doppler du second ordre et effet Einstein que nous détaillons dans les chapitres ultérieurs).
Chapitre 5 La mesure de phase Une fois résolu le problème de l’effet Doppler qui affecte la fréquence des signaux GNSS, et après que le signal a été démodulé, un récepteur dans un système de géolocalisation par satellites sait reconstruire la phase du signal reçue. Le récepteur peut ainsi avoir accès à la variation de phase entre le signal reçu en provenance d’un satellite et le même signal reproduit localement. Connaissant la longueur d’onde du signal, la variation de phase fournit la variation de la distance entre un satellite et le récepteur. Cependant, il ne s’agit là que d’une variation de distance et non de la distance elle-même, c’est pourquoi la mesure de phase est ambiguë. La mesure de phase a quand même un avantage qui la rend très intéressante à utiliser : elle est bien plus précise que la mesure de code. Typiquement, le bruit de la mesure de phase est, en moyenne, cent fois plus faible que le bruit de la mesure de code. Astucieusement combinée à une mesure de code (la seule qui soit explicite), la mesure de phase autorise des positionnements très précis.
5.1
Concept général
La mesure de phase est la troisième mesure que délivre un récepteur après la mesure de code et la mesure Doppler. Cependant, elle n’est pas indépendante de cette dernière puisque la mesure de phase accumule la mesure de Doppler, ce qui justifie qu’on la nomme également mesure de Doppler intégrée. Commençons la présentation par une approche intuitive de la mesure de phase. Considérons une horloge parfaite embarquée dans un satellite générant le signal sinusoïdal S (t) = A sin (2πf0 t). Ce signal est émis du satellite à l’instant tsat et est reçu à l’instant trec par un récepteur. Au niveau de l’émetteur, notons φsat (tsat ) = 2πf0 tsat la valeur de la phase mesurée à l’instant d’émission et φsat (trec ) = 2πf0 trec la valeur de la phase mesurée à l’instant de réception. La distance entre le satellite et le récepteur peut se retrouver en formant la différence des phases accumulées entre les instants d’émission et de réception,
88
Le temps dans la géolocalisation par satellites
comptés sur l’oscillateur bord : 1 φsat (trec ) − φsat tsat = 2πf0 trec − tsat = 2π R. λ0
(5.1)
Ici R est la distance géométrique qui se calcule comme d’habitude, en multipliant un temps de propagation par la vitesse du signal : R = c (trec − tsat ). Par commodité pour alléger les écritures, on écrit souvent la phase en nombre de cycles. L’équation précédente s’écrit plus simplement en cycles : λ0 φsat (trec ) − φsat tsat = R, (5.2) ce qui montre qu’une mesure de différence de phase permet de construire une mesure de distance. Mais le processus de calcul que nous venons de décrire se déroule au niveau du satellite alors que le besoin est de réaliser une mesure de distance au niveau récepteur. Pour remédier à cela, le récepteur va reproduire une réplique locale du signal généré au niveau satellite et comparer le phasage de la réplique φrec (trec ) à l’instant de réception avec celle de l’onde reçue φsat (tsat ) à l’instant d’émission. Pour l’instant encore, on considère que le signal répliqué au niveau récepteur est parfait et parfaitement synchronisé avec le signal généré au niveau satellite. Le récepteur mesure donc le déphasage φrec (trec ) − φsat (tsat ) et retrouve la distance géométrique : λ0 φrec (trec ) − φsat tsat = λ0 φrec (trec ) − φsat (trec ) (5.3) + λ0 φsat (trec ) − φsat tsat = R. En effet, comme les deux signaux émetteur et récepteur sont supposés synchronisés, on a l’égalité φrec (trec ) = φsat (trec ). Le concept global est schématisé en figure 5.1. En réalité, le récepteur ne peut mesurer que la partie fractionnaire α du déphasage φrec (trec ) = φsat (tsat ) mais il maintient un compteur de cycles n qui s’incrémente à chaque tour complet de phase. La mesure de phase proprement dite s’écrit (en cycles) : L = α + n. (5.4) Lors de la première mesure, le compteur de cycles est initialisé à une valeur arbitraire qui est en général zéro et le déphasage φrec (trec ) = φsat (tsat ) s’écrit comme une partie fractionnaire que le récepteur mesure plus un nombre entier de cycles N entre les satellites et le récepteur qu’il est impossible de mesurer. Au cours des mesures suivantes, la boucle de poursuite de phase fait en sorte que le compteur détecte les nombres entiers de cycles écoulés ce qui garantit le maintien de l’ambiguïté entière N . Tant que les boucles restent accrochées, il y a donc continuité dans le comptage des cycles et donc il existe un entier N unique sur toute la durée du passage tel que l’on ait : φrec (trec ) − φsat tsat = L + N. (5.5)
La mesure de phase
89
Fig. 5.1 – Comptage du déphasage entre l’onde émise et l’onde reçue par utilisation d’une réplique locale.
La figure 5.2 illustre l’évolution temporelle de la mesure de la partie fractionnaire de la phase, du compteur de cycles basé sur un nombre entier N . Ce nombre entier de cycle N est inconnu mais constant sur tout le passage du satellite au-dessus de la station de réception. Examinons le cas de la figure 5.3. Lors de sa première mesure, le récepteur mesure la partie fractionnaire de la phase α1 mais il est incapable de mesurer le nombre entier de cycles N . Le compteur de cycles du récepteur prend la valeur nulle n = 0. Lors de la seconde mesure, le compteur a détecté un cycle, n = 1, et le récepteur mesure la partie fractionnaire α2 . Concrètement pour réaliser cette mesure, il faut avoir accès à la porteuse du signal alors que l’onde reçue a un spectre étalé du fait de la modulation des informations de code. Il faut donc « de-étaler » le spectre du signal pour pouvoir effectuer une mesure de phase. Ce « de-étalage » est effectué par la fonction de corrélation qui se charge d’acquérir puis de poursuivre le décalage temporel du code. Pour traiter l’effet Doppler, les boucles de poursuite de phase se chargent de modifier en permanence la fréquence fondamentale générée par le récepteur pour qu’elle se superpose à la fréquence reçue. Il y a donc imbrication entre les deux boucles de poursuite : l’une pour suivre le décalage Doppler et l’autre pour réaliser les opérations de corrélation. Un problème limitant l’utilisation de cette mesure (et donc la précision des calculs GPS avec les phases) sont les sauts de cycles. Le saut de cycle est une
90
Le temps dans la géolocalisation par satellites
Fig. 5.2 – Interprétation géométrique de l’ambiguïté de phase. Au cours du temps, la partie fractionnaire de la phase αi , de même que le compteur de cycles ni évoluent. Toutes ces mesures de phase (partie fractionnaire et compteur de cycle entier) reposent sur un nombre entier de cycles N inconnu, d’où l’ambiguïté de la mesure.
Fig. 5.3 – Variation de la phase dans le temps entre deux mesures.
discontinuité dans l’enregistrement des phases qui fait perdre la connaissance de la variation du nombre entier de cycles entre deux époques. L’utilisation de la mesure de phase introduit donc des inconnues supplémentaires qui sont les ambiguïtés de phase mais sa précision est 100 fois meilleure que celle de la pseudo-distance.
La mesure de phase
5.2
91
Les biais de phase
En réalité, l’oscillateur qui génère le signal n’est pas parfait et il s’écrit S (t) = A sin (2πf0 t + ϕ(t)) où l’imperfection se traduit par la variation de phase ϕ(t). Au niveau du satellite la phase accumulée s’écrit maintenant : φsat tsat = 2πf0 tsat + ϕsat tsat . (5.6) De la même façon, la phase accumulée de la réplique au niveau récepteur s’écrit : φrec (trec ) = 2πf0 trec + ϕrec (trec ) . (5.7) Les biais ϕsat et ϕrec sont les biais de phases satellite et récepteur. Lorsqu’on passe en cycles, la mesure de phase s’écrit : L + N = φrec (trec ) − φsat tsat = f0 trec − tsat + ϕrec (trec ) − ϕsat tsat . (5.8) En faisant apparaître la longueur d’onde, il vient : λ0 (L + N ) = R + c
ϕrec (trec ) ϕsat (tsat ) −c . f0 f0
(5.9)
La quantité ϕ/f représente (chapitre 1) l’écart de temps propre x de l’oscillateur, autrement dit l’écart de temps entre le temps propre créé par l’oscillateur et le temps de la physique : τ sat = tsat +
ϕsat (tsat ) , f0
(5.10)
τrec = trec +
ϕrec (trec ) . f0
(5.11)
où τrec et τ sat sont les instants d’émission et de réception du signal en temps propre des horloges émetteur et récepteur. Ceci signifie que les biais de phase satellite et récepteur correspondent aux biais d’horloges introduits dans la mesure de code : ϕrec (trec ) = Δtrec (trec ) , (5.12) f0 ϕsat (tsat ) = Δtsat tsat . f0
(5.13)
Au final, la modélisation de la mesure de phase est donnée par l’expression : λ0 L = R + hrec − hsat − λ0 N + εL ,
(5.14)
où εL est le bruit de la mesure de phase (quelques millimètres). La mesure de phase L en cycles est une mesure de la distance de propagation du signal modulo un nombre entier de longueur d’onde. Ce n’est pas une
92
Le temps dans la géolocalisation par satellites
mesure absolue, car il reste une ambiguïté qui est le nombre entier de tours de phase nécessaire pour obtenir la distance entre le satellite et le récepteur. Ce nombre entier est constant par passage aussi longtemps que les boucles restent accrochées. La mesure de phase est faite dans l’échelle de temps propre du récepteur et dépend de la qualité du générateur de fréquence.
5.3
L’accumulation de Doppler
Le récepteur effectue un comptage continu de l’écart de fréquence relative et accumule ces valeurs. On parle alors d’une mesure de Doppler accumulée qui est en fait une mesure de l’écart de phase. Une mesure de phase est une mesure de Doppler intégrée dans le temps, de son acronyme anglais ADR pour Accumulated Doppler Range. Elle s’exprime en mètre et s’écrit : τ ADR (τ, τ0 ) = DR(s)ds. (5.15) τ0
Lorsque l’on calcule cette intégrale, on voit apparaître la phase du signal (en cycles) : τ ADR (τ, τ0 ) = c y(s)ds = c [x (τ ) − x (τ0 )] = λ0 [Δφ (τ ) − Δφ (τ0 )] . τ0
(5.16) La mesure de Doppler intégrée suit l’écart de temps instantané x qui représente le déphasage accumulé entre l’onde reçue et la réplique au moment de prise de mesure à τ0 . Puisque Δφ = φrec (trec ) − φsat (tsat ) = L + N , on a : λ0 L (τ ) = ADR (τ, τ0 ) + λ0 L (τ0 ) .
(5.17)
La modélisation de la mesure de phase (en mètre) hérite, par intégration, de celle définie sur la mesure de Doppler. La mesure de phase est donc ici modélisée comme une mesure de variation de distance entre le satellite et le récepteur depuis l’accrochage (ou le « ré-accrochage ») de la boucle de phase du récepteur. Finalement, on appelle communément (et peut-être abusivement) Doppler de phase la différence finie d’ordre un de la mesure de phase. Au bruit près, ce Doppler est lié à la variation de la mesure de code : λ0 L (τ2 ) − λ0 L (τ1 ) = P R (τ2 ) − P R (τ1 ) = ADR (τ2 , τ1 ) .
5.4
(5.18)
L’enroulement de phase
Les signaux GPS sont des ondes électromagnétiques à polarisation circulaire droite (RHCP pour l’acronyme anglo-saxon Right Hand Circular Polarization). Sur son orbite, le satellite modifie son attitude pour maximiser l’énergie du Soleil reçue sur ses panneaux solaires. Ainsi, le satellite effectue
La mesure de phase
93
des mouvements de rotation tout en gardant les antennes d’émission pointées vers le centre de la Terre. La rotation relative entre les axes dipolaires de l’antenne à bord du satellite et ceux du récepteur modifie la phase du signal reçue. Cet enroulement 13 de la phase de l’onde s’ajoute au déphasage lié à la variation de la distance relative, ce qui introduit une erreur dans le calcul de la distance de propagation. Notons respectivement ( xsat , y sat ) et ( xrec , yrec ) les vecteurs unitaires dans la direction des axes de polarisation de l’émetteur et du récepteur en repère terrestre, k le vecteur unitaire dans la direction de l’émetteur vers le récepteur. Les vecteurs xsat et y sat sont donnés par la loi d’attitude. sat et D rec la projection orthogonale des vecteurs xsat et xrec Notons D respectivement sur le plan orthogonal au vecteur k : sat = xsat − k · xsat k − k ∧ y sat , D (5.19) rec = xrec − k · xrec k − k ∧ yrec . D
(5.20)
rec ortho sat et D L’enroulement est mesuré par l’angle α entre les vecteurs D gonaux à la ligne de vue satellite récepteur. Une représentation est donnée en figure 5.4. La phase totale accumulée par cet enroulement est W = α + 2kπ avec k = nint [(Wpr´ec´edent − α) /2π] car il est nécessaire de conserver la valeur de l’angle précédent pour prendre en compte les sauts de déroulement d’angle que l’on observe lors de la rotation apparente du satellite au-dessus du récepteur. Ici la fonction nint [ ] désigne la fonction qui associe l’entier le plus proche. La valeur de k est arbitrairement choisie à 0 au début d’un passage. L’angle d’enroulement signé est donné par : rec sat · D D −1 α = sign (ζ) cos , (5.21) sat ||||D rec || ||D sat ∧ D rec . ζ = k · D
(5.22)
La convention de signe sur l’angle d’enroulement est telle qu’une valeur positive de W , contribution à l’effet d’enroulement de la phase en cycle, correspond à une augmentation de la distance de propagation géométrique. Chaque fois que le satellite fait un tour complet sur lui-même, la mesure de phase gagne ou perd, selon le sens de l’enroulement, un cycle à la manière d’un tire-bouchon. La correction associée à l’enroulement de la phase (également appelés « wind-up » pour son équivalent anglo-saxon), en mètre, est donnée par la quantité λ0 W et sa contribution à la mesure de phase est : λ0 L = R + λ0 W + hrec − hsat − λ0 N0 + εL . 13. Voir l’article de Wu et al. (1992).
(5.23)
94
Le temps dans la géolocalisation par satellites
Fig. 5.4 – Enroulement de la phase de l’onde électromagnétique entre le satellite et le récepteur.
5.5
Résumé
Un récepteur GNSS construit ses mesures de distances (en réalité des pseudodistances) sur le code et la phase du signal en datant la réception du signal dans sa base de temps propre. Ce temps est construit sur la base d’un générateur de fréquence (oscillateur) qui a des qualités variables en fonction de la gamme du récepteur (faible coût, récepteur pour la géodésie ou autre). Les qualités recherchées sont les propriétés en termes de bruit et de dérive. Pour certains usages, cet oscillateur peut être piloté par une horloge atomique pour assurer la stabilité de cette fréquence sur le long terme. La mesure de code est construite comme la différence entre l’événement de l’émission en temps émetteur et l’événement de réception du signal en temps récepteur. Comme les horloges des deux composants ne présentent pas les mêmes caractéristiques ni (certainement) la même synchronisation, la valeur du code contient l’écart des biais d’horloges par rapport à une échelle de temps commune. C’est pourquoi on parle de pseudo-distance, qui contrairement à une distance, peut devenir négative si les écarts d’horloges sont importants. La mesure de phase est une mesure de variation de distance entre le satellite et le récepteur depuis l’accrochage (ou le « ré-accrochage ») de la boucle de phase du récepteur entre deux instants. Elle représente une mesure du décalage
La mesure de phase
95
de phase entre le signal construit par le générateur interne et la phase du signal reçu. Un compteur de cycles s’incrémente modulo 2π lorsque nécessaire. Elle mesure donc la partie fractionnaire de la phase à un instant donné et le nombre de cycles accumulés entre deux instants. Ce n’est pas une mesure absolue, car il reste une ambiguïté qui est le nombre entier de tours de phase nécessaire pour obtenir la distance satellite/récepteur. La mesure de phase est réalisée dans l’échelle de temps propre du récepteur et dépend de la qualité du générateur de fréquence. Un point fondamental de tout système de navigation par satellites est que les horloges de la constellation sont toutes synchronisées entre elles. Cette propriété permet de résoudre l’équation de navigation (PVT) où il y a trois inconnues de position et qu’une seule inconnue de temps. Cette inconnue sur le temps représente l’écart entre le temps du récepteur et le temps commun de tous les satellites, souvent appelé temps de la constellation de satellites (Temps GPS ou Temps Galileo par exemple).
Chapitre 6 Les effets des erreurs système sur les mesures GNSS Jusqu’à présent nous n’avons traité que des mesures GNSS exemptes d’erreurs. Il y a trois grandes classes d’erreurs qui affectent les mesures GNSS : les erreurs que l’on nomme erreurs « système » pour signifier qu’elles proviennent des systèmes de géolocalisation par satellites eux-mêmes, elles comprennent principalement les erreurs d’orbites et d’horloges des satellites ; les erreurs de propagation du signal à travers l’atmosphère (liées à la traversée de l’ionosphère et de la troposphère) ; enfin les erreurs locales de réception liées à l’environnement direct du récepteur (les interférences, le multi-trajet, mais également ce qui touche au brouillage et au leurrage). Ce chapitre est dédié aux effets des erreurs « système » sur les mesures GNSS. Ces effets sont différents selon que les mesures sont affectées d’une erreur d’orbite, c’est-à-dire d’une erreur dans la position du satellite transmise dans les messages de navigation, ou d’horloge, c’est-à-dire une erreur de synchronisation entre l’horloge du satellite et le temps système, elle aussi transmise dans les messages de navigation. Une erreur d’horloge satellite affecte tous les utilisateurs de la même façon, tandis qu’une erreur d’orbite se reporte différemment selon la position de ces derniers. La spécificité de la géolocalisation par satellites tient dans le fait que les erreurs système peuvent se compenser : une erreur d’horloge peut partiellement compenser une erreur d’orbite. Pour un utilisateur et un satellite donnés, il est équivalent, pour le calcul de la distance qui les sépare, de reculer le satellite de la distance d dans la direction de la ligne de visée et d’avancer le biais d’horloge de la durée d/c secondes. Cette compensation, quand elle existe, n’est toutefois que partielle car l’une des erreurs est scalaire (l’erreur d’horloge) et l’autre vectorielle (l’erreur d’orbite). Une autre erreur, plus subtile que les précédentes mais bien présente, correspond au temps passé par le signal à travers les équipements (électronique, câbles. . . ), depuis sa génération par l’oscillateur atomique de l’horloge bord, jusqu’à son émission au centre de phase du satellite. Ces erreurs dépendent de la fréquence utilisée et sont prises en compte dans les systèmes
98
Le temps dans la géolocalisation par satellites
Fig. 6.1 – Les trois points de référence d’une antenne de réception GNSS. de géolocalisation par satellites aux travers de corrections définies et transmises dans le message de navigation.
6.1
Les centres de phases
Comme le signal est émis de l’antenne GPS du satellite émetteur et reçu par l’antenne du récepteur, les positions mentionnées dans le chapitre précédent sont toutes les deux référencées aux centres de phase des antennes respectives. Le centre de phase est le point apparent sur l’antenne où a lieu l’émission ou la réception de l’onde électromagnétique. La position de ce point est donnée par rapport au point de référence antenne. La position point de référence antenne est donnée par rapport au marqueur d’antenne. Les coordonnées géodésiques de l’antenne de réception sont les coordonnées du marqueur d’antenne. Dans la figure 6.1, la position du centre de phase, référencée au marqueur d’antenne, est donnée par le vecteur a. Cette position dépend de la fréquence du signal, ce qui a rigoureusement une conséquence sur le calcul de la distance géométrique R et donc sur la modélisation de la pseudo-distance. Formellement, la modélisation s’écrit donc : P Ri = Ri + hrec − hsat , (6.1) où la distance Ri est calculée entre centres de phases émetteur et récepteur associés à la fréquence i. Il faut tout de même préciser que les différentes distances Ri calculées sont très proches les unes des autres. Le centre de mission du système GPS se charge de diffuser constamment aux utilisateurs les orbites et les biais d’horloges satellites. En général, les orbites des satellites décrivent l’évolution temporelle du centre de masse du satellite. Cependant, les utilisateurs du système GPS ignorent et souhaitent ignorer la position de l’antenne d’émission par rapport au centre de masse
Les effets des erreurs système sur les mesures GNSS
99
Fig. 6.2 – La localisation du centre de phase dépend de la fréquence. des satellites GPS. Pour pallier cela, le système GPS diffuse aux utilisateurs des orbites décrivant l’évolution temporelle du centre de phase de l’antenne d’émission des signaux de chaque satellite. Comme le système GPS diffuse sur les deux fréquences, les éphémérides GPS utilisent comme référence un nouveau centre de phase, appelé centre de phase géométrique qui s’écrit comme la combinaison des centres de phase selon les fréquences fi : f 2a2 − f12a1 aC = 2 2 , (6.2) f2 − f12 où a1 positionne le centre de phase du signal à la fréquence f1 et a2 positionne le centre de phase du signal à la fréquence f2 (voir illustration en figure 6.2). Pour calculer ces orbites, le segment sol du système GPS calcule précisément la position du centre de masse des satellites à partir de stations de référence au sol dont les coordonnées des points de références sont corrigées de la tectonique des plaques et des marées terrestres (voir chapitre 1). Puis la position du centre de phase est calculée après la correction du vecteur centre de masse au centre de phase. rec avec les mesures de pseudoL’utilisateur qui recherche sa position X distances doit donc résoudre trois inconnues de position, se rapportant à un repère pratique pour la géolocalisation, plus un paramètre d’horloge hrec qu’il est indispensable d’estimer. Dans la suite, nous négligerons les écarts des différents centres de phases et on utilisera pour toutes les fréquences la distance géométrique aux centres de phase de la combinaison géométrique des mesures entre émetteurs et récepteurs.
6.2
Effet des erreurs d’orbite et d’horloge sur la mesure de pseudo-distance
Le but de cette section est d’évaluer la structure de la distribution des erreurs d’orbites et d’horloges sur les mesures de pseudo-distances. Cette structure est vraiment spécifique aux mesures GNSS car les erreurs d’orbites
100
Le temps dans la géolocalisation par satellites
et d’horloges n’affectent pas les utilisateurs tous de la même façon. Les erreurs d’horloge satellite, qui représentent une quantité scalaire, se reportent intégralement chez tous les utilisateurs tandis que les erreurs d’orbites, qui représentent une quantité vectorielle, dépendent de la position relative de ces derniers par rapport au vecteur d’erreur. Cette situation, propre aux GNSS, va permettre qu’une erreur d’horloge puisse absorber une erreur d’orbite dans la direction radiale, c’est-à-dire une erreur dans la position du satellite située sur la direction centre Terre – satellite. Cette dernière propriété souligne l’intrication forte entre la détermination de l’orbite et la correction d’horloge. On évalue également la corrélation spatiale des erreurs d’orbite et d’horloge. La corrélation spatiale des erreurs est une mesure de la similitude entre des erreurs mesurées, à la même date, en des points différents. C’est une valeur comprise entre 0 et 1. Cette information est intéressante pour évaluer l’homogénéité des amplitudes d’erreurs distribuées sur des zones géographiques relativement étendues. Dans la suite des développements, on convient de noter par : sat : la position du satellite radiodiffusée dans le message de navigation ; X Xsat : la position réelle du satellite ; hsat : le biais d’horloge radiodiffusé dans le message de navigation ; hsat : le vrai biais d’horloge. L’erreur de positionnement du satellite est définie par : sat + e. sat = X X
(6.3)
L’erreur d’horloge est définie par : sat hsat = hsat + eh .
(6.4)
La formulation de la pseudo-distance que l’on recherche pour effectuer un calcul de positionnement est celle qui ne contient aucune erreur : sat − X rec || + hrec − hsat . P R = ||X
(6.5)
sat − X rec || représente la distance géométrique exacte entre le La norme ||X satellite au temps d’émission et le récepteur au temps de réception, les temps étant rapportés à une référence commune. sat ainsi que son biais d’horloge Cependant, la position vraie du satellite X sat vraie h nous sont en fait inconnus, nous avons à notre disposition unique sat et d’horloge hsat issues du message de ment les informations d’orbite X navigation qui contiennent nécessairement des erreurs, d’estimation et/ou de modélisation. L’utilisateur qui les utilise se base donc sur une formulation erronée : sat − X rec || + hrec − hsat . P R = ||X (6.6) rec || représente la distance géométrique biaisée de sat − X La norme ||X l’erreur de positionnement du satellite. Quels sont les effets de ces erreurs sur la formulation de la pseudo-distance ? Y a-t-il des cas où ces erreurs n’ont
Les effets des erreurs système sur les mesures GNSS
101
aucun impact sur le calcul de positionnement ? Si oui, comment les caractériser ? En général, les effets des erreurs d’orbites et d’horloges sur la pseudodistance introduisent un écart eP R entre les deux formulations de telle sorte que l’on puisse écrire : P R = P R + eP R . (6.7) Pour comprendre la structure des erreurs d’orbites et d’horloges dans la formulation de la pseudo-distance, on introduit la vraie valeur de position et l’horloge du satellite dans la formulation de la pseudo-distance erronée. On obtient : sat − X rec + e|| + hrec − hsat − esat . P R = ||X (6.8) h L’étape suivante consiste à extraire l’erreur vectorielle e de la norme et ceci se fait par un développement de Taylor du premier ordre. Dans les opérations de différentiation de la norme en un vecteur v non nul, on rappelle (voir section 4.1) que, pour tout vecteur h : ||v + h|| = ||v|| +
v|h + o (||h||) . ||v||
(6.9)
Cette équation revient à linéariser la variation de la norme d’un vecteur donné (ici v) pour de faibles variations de ce dernier. On vérifie immédiatement que la dérivée de la norme en v est bien linéaire et continue en h. L’interprétation géométrique de ce développement est illustrée par la figure 6.3 où la norme du vecteur h est le tiers de celle de v afin de bien appréhender la distance o (||h||). Dans les cas qui nous intéressent pour la navigation, ||v|| ∼ = 26, 5 × 106 m et ||h|| est de l’ordre de quelques centaines de mètres, ce qui rend l’approximation pratiquement exacte car o (||h||) se noie dans le bruit de mesure. Lorsque l’on applique cette linéarisation autour de la vraie position du satellite, c’est-à-dire pour de faibles valeurs d’erreurs ||e|| (quelques centaines de mètres environ), on obtient : sat − X rec || + u · e + hrec − hsat − esat . P R = ||X h
(6.10)
Ici le vecteur u désigne le vecteur unitaire récepteur-satellite : u =
rec sat − X X . sat − X rec X
(6.11)
On trouve au final : P R = P R + u · e − esat h ,
(6.12)
eP R = u · e − esat . h
(6.13)
et donc : On constate alors qu’une erreur d’horloge esat h se reporte intégralement sur la mesure de pseudo-distance et affecte tous les utilisateurs de la même façon,
102
Le temps dans la géolocalisation par satellites
Fig. 6.3 – Interprétation géométrique de la différentielle de la norme. La norme du
vecteur v + h est la somme de celle de v plus la projection signée du vecteur h sur l’axe porté par v, plus un reliquat o (||h||) qui tend vers zéro quand ||h|| tend vers zéro.
alors qu’une erreur e de positionnement du satellite se reporte suivant sa projection sur le vecteur unitaire récepteur satellite u, comme le suggère la figure 6.4. On convient maintenant de projeter l’erreur vectorielle d’orbite e, différence entre la position estimée du satellite et sa position réelle, selon la direction radiale – c’est-à-dire la direction entre le centre Terre et le satellite, et le plan normal à cette direction : e = er + en . (6.14) L’erreur radiale est colinéaire au vecteur unitaire porté par la direction radiale ur ; elle s’écrit donc er = er ur avec er soit positif soit négatif. La projection de ces erreurs sur une ligne de vue d’élévation El s’écrit : eP R = u · en − esat (6.15) h − er cos θ . L’angle θ se déduit de l’élévation de la ligne de vue par les relations trigonométriques classiques dans les triangles AQO (QO = RT cos El) et SQO de la
Les effets des erreurs système sur les mesures GNSS
103
Fig. 6.4 – Effet d’une erreur d’orbite sur la mesure de pseudo-distance. Elle affecte différemment les utilisateurs selon la projection de l’erreur sur l’axe à vue : elle est maximale sur la ligne de vue portée par u1 et nulle sur celle portée par u2 (la figure n’est pas à l’échelle) (a) et effet d’une erreur d’horloge sur la mesure de pseudodistance. Elle affecte indifféremment tous les utilisateurs de la même façon. Dans ce schéma l’erreur d’horloge est positive, ce qui correspond à une avance de l’horloge satellite par rapport au temps système (b). figure 6.5 : sin θ =
RT cos El, RS
(6.16)
où RT est le rayon de la Terre, RS la distance radiale centre Terre – satellite. La valeur du produit u · en est variable et évolue dans l’intervalle [− sin θ, sin θ], elle est nulle si la projection normale de l’erreur en est colinéaire au produit vectoriel ur ∧ u. Les valeurs maximales des erreurs de mesures sont obtenues sur le cône de visibilité du satellite avec pour sommet le centre de masse du satellite et pour base les lieux géographiques de la Terre en visibilité radioélectrique avec le satellite. Le demi-angle du cône est noté α, il correspond aux angles d’élévations El les plus faibles. L’erreur normale en est nulle dans la direction radiale et prend une valeur maximale sur les bords du cône de visibilité.
104
Le temps dans la géolocalisation par satellites
Fig. 6.5 – Projection du vecteur d’erreur d’orbite e sur la ligne de vue utilisateur satellite AS. Inversement, l’erreur radiale er prend une valeur maximale dans la direction radiale et se projette aux extrémités du cône (en particulier sur les directions portées par les vecteurs u1 et u2 de la figure 6.6) avec pour valeur er cos α. Cependant, le demi-angle d’ouverture du cône α varie entre 12◦ pour la constellation Galileo, où les satellites évoluent à 23 200 km d’altitude environ, et 13,5◦ pour la constellation GPS où les satellites évoluent à 20 200 km d’altitude environ. Cet angle étant de valeur faible, on peut considérer que cos α ∼ = 1, ce qui signifie que l’erreur d’orbite radiale affecte toutes les lignes de vues de la même façon. Avec cette approximation aux petits angles, les erreurs d’orbites et d’horloges sur les mesures se simplifient : eP R = u · en − esat (6.17) h − er . Dans tous les développements précédents, le calcul du vecteur u se basait sat du satellite. Dans la pratique, la connaissance de sur la position réelle X cette position n’est pas toujours automatique et nous ne disposons que de sat . Vu les faibles amplitudes d’erreurs d’orbites, il est la position estimée X alors équivalent de calculer le vecteur unité avec la position estimée comme l’attestent les développements suivants. Comme précédemment, l’erreur de mesure s’écrit : sat − X rec || − ||X sat − X rec || − esat . eP R = P R − P R = ||X h
(6.18)
Le développement limité se fait maintenant autour de la position estimée plutôt qu’autour de la position réelle : sat − X rec || = ||X sat − X rec − e|| = ||X sat − X rec || − u . e, ||X
(6.19)
Les effets des erreurs système sur les mesures GNSS
105
Fig. 6.6 – Décomposition des erreurs d’orbite dans les directions radiales et normales.
avec : u =
sat − X rec X . sat rec || ||X −X
(6.20)
On retrouve alors l’expression précédente : eP R = u · e − esat h .
6.2.1
Corrélation entre la direction radiale du satellite et l’horloge
Les développements précédents font apparaître un phénomène fondamental de la navigation par satellites : une erreur d’horloge esat peut compenser une h erreur d’orbite dans la direction radiale esat . Il y a donc une corrélation « un h pour un » entre la direction radiale du satellite et l’horloge. Cela se traduit dans la formulation de la pseudo-distance vraie de la façon : sat − X rec || + hrec − hsat P R = ||X sat + er − X rec || + hrec − hsat − esat , = ||X h
(6.21)
ur · er = esat h .
(6.22)
avec :
106
Le temps dans la géolocalisation par satellites
Fig. 6.7 – Corrélation entre erreur d’orbite radiale et horloge du satellite. Vu de la direction radiale il est équivalent de rapprocher le satellite de la Terre de la distance d et de retarder l’émission du signal de la durée d/c. La situation géométrique correspondante est représentée par la figure 6.7 dans laquelle ||er || = esat h . Dans ce cas, l’effet de ces erreurs sur les mesures est nul, eP R = 0, et P R = P R .
6.2.2
Majorant des erreurs d’orbites et d’horloge dans la pseudo-distance
Comme nous venons de le voir, les erreurs radiales d’orbites, c’est-à-dire les erreurs dans la direction centre Terre – satellite, se compensent avec l’horloge du satellite et les erreurs normales se projettent différemment selon la position de l’utilisateur. La norme du vecteur d’erreur dans la direction normale est en , cette quantité est toujours positive. Un majorant de l’erreur normale aux erreurs de mesures est en sin α, projection de l’erreur vectorielle sur le cône du satellite d’ouverture α (voir Figure 51). L’erreur radiale est normalement compensée par le biais d’horloge satellite h. Toute erreur dans la modélisation de ce biais d’horloge transmise à l’utilisateur se retrouve donc intégralement dans les erreurs de mesures. Lorsqu’on assemble les deux contributeurs des erreurs d’orbite et d’horloge, on obtient un majorant de l’erreur sur la mesure : sat |eP R | ≤ er cos α − esat en sin α = esat h + sign er cos α − eh h − er cos α +en sin α. (6.23)
Vu l’amplitude faible de l’angle α, on peut approcher cette expression par une formulation plus aisée à retenir : en sat max |eP R | ∼ + eh − er . (6.24) = 5 Si le biais d’horloge satellite compense l’erreur radiale, alors l’impact d’une erreur d’orbite dans les erreurs de mesures ne dépasse pas un cinquième de l’erreur normale.
Les effets des erreurs système sur les mesures GNSS
107
Fig. 6.8 – Corrélation spatiale d’une erreur d’orbite. Une erreur d’orbite se projette différemment selon la position de l’utilisateur. Elle peut introduire une erreur positive, négative ou nulle (b).
6.2.3
Corrélation spatiale des erreurs d’orbites
La position des satellites diffusée dans les messages de navigation peut contenir des erreurs. Ces erreurs peuvent provenir soit du segment de contrôle soit du segment spatial. Pour Galileo et pour les blocs GPS autres que GPS III, les éphémérides sont calculées au sol (par le segment de contrôle) et transmises aux satellites pour diffusion alors que pour le GPS III, les éphémérides sont calculées à bord (donc par le segment spatial). Il y a donc une erreur additionnelle du fait que l’on utilise les coordonnées des satellites à une position qu’ils n’occupent pas réellement. C’est donc une erreur à prendre en compte au moment où l’on effectue le calcul de positionnement. sat − X rec || + deph + hrec − hsat + εC . P R = ||X (6.25) L’erreur d’orbite est vectorielle, elle se projette donc différemment selon la position de l’utilisateur (voir la figure 6.8). L’erreur deph vue par un utilisateur sur sa mesure de pseudo-distance peut être approchée par la projection de sat − X sat sur le vecteur unité u de la ligne de vue l’erreur d’orbite e = X récepteur vers satellite : deph = u · e.
(6.26)
L’erreur deph peut être positive, négative ou nulle dans le cas particulier ou le vecteur d’erreur e est orthogonal à la ligne de vue u (figure 6.8). Pour évaluer la corrélation spatiale de l’erreur d’orbite, on va se centrer sur la position du satellite donnée par les éphémérides et considérer deux stations 1 et X 2 séparées d’une longueur de ligne de base d. L’objectif est de mesurer X sat − X sat vue par la station 1 dans la station 2. la proportion de l’erreur e = X
108
Le temps dans la géolocalisation par satellites
L’erreur dans la mesure de pseudo-distance vue par la station 1 est : sat − X 1 || − ||X sat − X 1 || = ||X sat − X 1 || − ||X sat − e − X 1 ||. (6.27) e1 = ||X Comme dans la section précédente, nous faisons l’hypothèse valide que l’amplitude de l’erreur d’orbite e = ||e|| est petite par rapport à la distance totale sat − X 1 ||. La linéarisation de l’équation précédente fournit l’approxima||X tion : sat − X 1 X e1 ∼ (6.28) · e = u1 · e. = sat 1 || ||X − X De la même façon, l’erreur dans la mesure de pseudo-distance vue par la station 2 s’écrit : sat − X 2 X e2 ∼ (6.29) · e = u2 · e. = sat 2 || ||X − X La corrélation spatiale est représentée par la différence de ces deux termes d’erreurs, soit : e − |e2 − e1 | χ= . (6.30) e L’amplitude maximale d’une erreur d’éphéméride dans les deux pseudomesures est donnée par : d×e |e2 − e1 | ≤ , (6.31) h où h est l’altitude des satellites GNSS. La configuration décrite dans la figure 6.8b montre une géométrie dans laquelle l’inégalité précédente est réalisée et pour laquelle l’erreur d’orbite est normale. La projection orthogonale de l’erreur d’orbite sur les lignes de vues est notée eP R . Elle contribue à e1 = +eP R dans la pseudo-mesure de la station 1 et e2 = −eP R à la station 2. Une application de trigonométrie permet d’établir, d’une part, que : θ θ eP R = e · sin ∼e , (6.32) 2 2 puis :
d θ θ tan = ∼ , 2 2h 2
d’où : eP R =
d×e . 2h
(6.33)
(6.34)
Un majorant de χ est donc fourni par : d . (6.35) h Ce majorant signifie que la corrélation spatiale de l’erreur d’orbite est proportionnelle à la longueur de la ligne de base. Par exemple, pour une ligne de base de longueur 1000 km et une altitude approchée à 20 000 km de l’orbite des satellites GPS, la corrélation spatiale est de 95 %, ce qui signifie que 95 % de l’erreur mesurée à la station 1 se retrouve à la station 2. χ≤1−
Les effets des erreurs système sur les mesures GNSS
6.2.4
109
Corrélation spatiale des erreurs d’horloge
On s’intéresse ici à l’évolution de l’erreur d’horloge satellite vue des stations 1 et 2. Si on modélise cette erreur par un biais b et une dérive linéaire fonction du temps d’amplitude a, l’erreur mesurée aux stations 1 et 2 sera : h1 = c (b + at1 ) , h2 = c (b + at2 )
(6.36)
avec t1 et t2 les temps d’émission correspondant à la date tr de réception commune aux stations 1 et 2. On a alors : h1 − h2
= ac (t1 − t2 ) = ac (t1 − tr + tr − t2 ) . = a (P R2 − P R1 )
(6.37)
Au premier ordre, il vient les approximations suivantes : P R2 − P R1
= = ∼ =
2 − X sat 1 − X sat || ||X X || − || sat || − ||X 2 − X 1 − X 1 − X sat || . 1 + X ||X 1 −X sat X −X sat || · X2 − X1 ||X
(6.38)
1
Un majorant de l’erreur d’horloge est fourni par : h1 − h2 ≤ ad.
(6.39)
Ce qui montre que la corrélation spatiale de l’erreur d’horloge est proportionnelle à la dérive interne a des horloges satellites, dérive qui est extrêmement faible. Dans le cas d’une dérive de 0, 1 ns/s et une ligne de base de longueur 1000 km, l’effet sur les pseudo-distances est du dixième de millimètre ce qui est complètement noyé dans le bruit des mesures.
6.3
Les biais instrumentaux – TPG
Une fois le signal GNSS généré à l’intérieur de la charge utile du satellite GPS, il lui faut un certain temps pour atteindre le centre de phase de l’antenne et être émis. En effet, ce dernier doit traverser le générateur de codes, le modulateur de fréquences, les amplificateurs, le triplexer, les câbles et le processus de formation de faisceaux à l’antenne. Ce temps passé par le signal à l’intérieur des équipements peut atteindre quelques nanosecondes (jusqu’à 15 ns soit 5 mètres). Un biais instrumental satellite correspond au délai écoulé depuis la génération du signal par l’oscillateur de l’horloge bord (étalon de fréquence) jusqu’à son émission au centre de phase de l’antenne. De la même façon, une fois le signal reçu au centre de phase du récepteur, il lui faut traverser les câbles et l’électronique de réception, ce qui ajoute un délai supplémentaire qui s’inscrit dans les mesures GNSS. Ces retards sont liés au délai de phase et au
110
Le temps dans la géolocalisation par satellites
délai de groupe qui affectent un signal lorsque celui-ci passe au travers d’un filtre. Quand un signal sinusoïdal de type : X0 (t) = sin (2πf0 t) ,
(6.40)
traverse un filtre, il est affecté par un déphasage θ0 associé à la fréquence f0 . Le signal mesuré en sortie du filtre devient : Y0 (t) = sin (2πf0 t + θ0 ) .
(6.41)
Le délai de phase, ou temps de propagation de phase (TPP), ou encore biais instrumental de la mesure de phase, est le biais de temps que l’on doit appliquer au signal d’entrée X0 pour correspondre au signal Y0 que l’on récupère en sortie du filtre : X0 (t − T P P ) = Y0 (t) . (6.42) Le signal Y0 que l’on récupère s’écrit maintenant : Y0 (t) = sin (2πf0 t − 2πf0 T P P ) .
(6.43)
Le délai de phase dépend directement de la valeur du déphasage. Il est défini par : θ TPP = − . (6.44) 2πf Pour un signal modulé, tel qu’un signal GNSS, la réponse d’un filtre introduit un nouveau délai. Pour modéliser un signal modulé, on écrit un tel signal d’entrée du filtre comme le produit d’une porteuse pure par l’enveloppe env (t) de la modulation : X0 (t) = sin (2πf0 t) env (t) . (6.45) L’enveloppe est la partie du signal X0 qui contient l’information que l’on a souhaité encoder. On appelle délai de groupe, ou temps de propagation de groupe (TPG) ou encore biais instrumental de la mesure de code, le biais de temps qui affecte l’enveloppe du signal lorsqu’elle traverse un filtre. Pour un signal modulé, les deux types de biais de temps doivent s’appliquer lors de la traversée d’un filtre : le délai de phase affecte la sinusoïde et le délai de groupe retarde l’enveloppe du signal. Le signal en sortie de filtre devient : Y0 (t) = sin (2πf0 (t − T P P )) env (t − T P G) .
(6.46)
Il est défini comme la variation de la phase θ du signal dans la chaîne de communication en fonction de la fréquence f : TPG = −
1 dθ . 2π df
(6.47)
Plus globalement, le TPG représente le temps que met un signal à se propager dans une chaîne de communication (incluant les câbles et les chaînes
Les effets des erreurs système sur les mesures GNSS
111
électroniques de traitement du signal). Voir l’article de Berry et al. (2013) pour les applications sur les systèmes GNSS (américain GPS et russe Glonass) et la variation des délais de code et de phase selon les fréquences utilisées et l’espacement des corrélateurs. La composante linéaire de la variation de la phase en fonction de la fréquence peut être attribuée à la longueur électrique du câble d’antenne et représente le temps moyen de propagation du signal. Les composantes d’ordres supérieurs sont interprétées comme étant des variations du temps de traversée du signal pour différentes fréquences et sont une source de distorsion du signal. Par définition, le biais instrumental satellite est le retard entre le signal émis par le satellite et mesuré au centre de phase de l’antenne et la sortie de la source de fréquence embarquée par ce satellite qui génère le signal. Le biais instrumental récepteur est le retard entre le signal reçu par le récepteur et mesuré au centre de phase de l’antenne et la fonction de corrélation qui génère la pseudo-distance. Ces biais sont propres à chaque équipement, donc à chaque satellite et chaque récepteur : ils dépendent de la fréquence fi puis de la modulation de code et de phase. Les biais instrumentaux présentent une sensibilité à la thermique et au vieillissement de l’équipement. Pour les satellites, ces biais consistent en un terme constant plus une fluctuation rapide à la période orbitale dont l’amplitude varie de façon saisonnière (période annuelle). On verra par la suite que le terme de biais est inclus dans les paramètres de correction d’horloge inclus dans le message de navigation. Il est donc pris en compte dans les calculs de synchronisation au temps système effectués par l’utilisateur. L’incertitude du biais instrumental satellite, c’est-à-dire la variation de ce délai, n’excède pas 3 nanosecondes 95 % du temps. Ces biais de temps sont notés δti pour le biais récepteur et δti pour le biais satellite, l’indice i indique la fréquence du signal fi . Contrairement aux biais d’horloge qui peuvent être soit positifs pour signifier un retard, soit négatifs pour signifier une avance, un biais instrumental est toujours positif (c’est toujours un retard). Par définition, l’instant d’émission du signal est l’instant d’apparition du signal au centre de phase de l’antenne satellite et l’instant de réception du signal est défini au centre de phase de l’antenne du récepteur. La pseudo-distance est définie comme étant la distance entre les centres de phase satellite et récepteurs affectée des biais d’horloges et des biais instrumentaux. La modélisation de la pseudo-distance s’écrit donc : P Ri = c τi − τ sat .
(6.48)
Ici τi est le temps propre de construction de la mesure de pseudo-distance du signal de fréquence fi au moment de la corrélation et τ sat le temps propre de génération de ce même signal par l’oscillateur interne du satellite. Ce dernier est contenu dans le message de navigation et lu par le récepteur.
112
Le temps dans la géolocalisation par satellites
Le temps τi contient le temps propre de réception du signal au centre de phase de l’antenne récepteur τrec plus le biais instrumental δti . Il est donc la somme de ces deux termes : τi = τrec + δti .
(6.49)
Le temps propre τrec est la somme du temps de réception GPS au centre d’antenne et du biais d’horloge : τrec = trec + Δtrec (trec ). Une petite subtilité est à noter ici car le biais d’horloge est ajusté au moment du calcul du positionnement, autrement dit à la date de création de la pseudo-distance. Ce calcul fournit donc le biais Δtrec (trec + δti ). On fait ici l’hypothèse valide que le biais d’horloge récepteur varie très peu sur la durée δti , qui est de l’ordre de quelques nanosecondes, ce qui revient à écrire : Δtrec (trec + δti ) = Δtrec (trec ) = Δtrec . Au final, on obtient : τi = trec + Δtrec + δti . (6.50) Le temps propre d’émission τ sat est la somme du temps de génération du signal en référence GPS tsat et du biais d’horloge : τ sat = tsat + Δtsat . Entre le temps GPS de génération du signal par l’oscillateur interne du satellite et son apparition au centre de phase satellite, il s’est passé le temps δti . Au final, le temps d’émission du signal au centre de phase de l’antenne du satellite s’écrit, en référence de temps système : ti = tsat + δti .
(6.51)
La distance géométrique est la distance entre les centres de phase des antennes satellites et récepteurs. Elle s’écrit : Ri = c trec − ti . (6.52) Notons pour le moment Bi = cδti et B i = cδti les biais instrumentaux exprimés en mètres. La modélisation de la pseudo-distance se voit linéairement affectée par ces biais : P Ri = c τi − τ sat = c trec + δti + Δtrec − tsat + Δtsat = c trec + δti + Δtrec − tsat + Δtsat + δti − δti (6.53) i sat i = c trec − t + c Δtrec − Δt + c δti + δt = Ri + hrec − hsat + Bi + B i Comme on peut le voir dans la formulation du haut, les biais instrumentaux sont en fait indiscernables d’un biais d’horloge, ce qui rend leurs observations difficiles avec les mesures GNSS. On définit alors la notion de biais d’horloge de code et de biais d’horloge de phase f1 ou f2 comme la somme indifférenciée du biais d’horloge et du biais instrumental associé : hi = hsat − B i = c Δtsat − δti = cΔti (6.54) hi = hrec + Bi = c (Δtrec + δti ) = cΔti
Les effets des erreurs système sur les mesures GNSS
113
Ainsi la modélisation de la pseudo-distance s’écrit : P Ri = Ri + hi − hi . Il faut avoir conscience que les biais hi et hi sont les biais d’horloges apparents qui ne traduisent pas seulement la désynchronisation physique des horloges récepteur et satellite par rapport à un temps de référence, mais comprennent également des termes supplémentaires que sont les biais instrumentaux. Les biais instrumentaux dépendent non seulement de la fréquence mais aussi de la modulation utilisée. Par exemple, chacune des mesures de code, C1 , C2 , P1 , P2 possède un biais dédié BC1 , BC2 , BP1 et BP2 , représentant les temps de propagation de groupe, et pour les mesures de phase représentant les délais de phase. C’est pourquoi nous convenons de noter respectivement par BP Ri et B P Ri les biais instrumentaux récepteur et émetteur, exprimés en mètres, affectant les mesures de code, et respectivement par BLi et B Li les biais instrumentaux récepteur et émetteur, exprimés en mètres affectant les mesures de phase. La modélisation des mesures de code et de phase est maintenant enrichie de la façon suivante : P Ri = Ri λi Li = Ri + λi W
+ εP Ri + εL i (6.55) Selon ce qui précède, on peut également formuler la modélisation des mesures en compactant les biais d’horloges avec les biais instrumentaux pour former les biais d’horloges apparents : P Ri = λi Li =
+hrec + hrec
Ri Ri + λi W
−hsat −hsat
+hP Ri +hLi
+BP Ri +BLi
−hP Ri −hLi
+B P Ri +B Li
−λi Ni
−λi Ni
+εP Ri +εLi
(6.56)
La différence entre les biais instrumentaux affectant la mesure de code et de phase est relativement faible. En général donc, les biais d’horloges de code et de phase sont assez faibles en tous cas pour être la plupart du temps confondus.
6.3.1
Les biais de code et de phase différentiels (DCB, DPB, IFB)
Les biais différentiels sont définis comme la différence de biais instrumentaux entre deux observables de code (DCB pour Differential Code Bias) ou de phase (DPB pour Differential Phase Bias), voir le livre de Shaer (1999) sur le sujet. On distingue les DCB satellites et récepteurs pour les mesures de code et de phase. Les DCB récepteurs de code et de phase s’écrivent : DCBP Ri −P Rj = δtP Ri − δtP Rj ,
(6.57)
DP BLi −Lj = δtLi − δtLj .
(6.58)
Les DCB satellites de code et de phase s’écrivent : DCB P Ri −P Rj = δtP Ri − δtP Rj ,
(6.59)
114
Le temps dans la géolocalisation par satellites DP B Li −Lj = δtLi − δtLj .
(6.60)
Exprimés en mètres, les DCB et DPB se calculent comme les différences d’horloges. Par exemple, pour les récepteurs, on a : c.DCBP Ri −P Rj = BP Ri − BP Rj = hP Ri − hP Rj ,
(6.61)
c.DP BLi −Lj = bLi − bLj = hLi − hLj .
(6.62)
L’intérêt pratique des DCB est de transférer par exemple une horloge de code f1 en horloge de code f2 . Appliqué aux mesures P1 et P2 , on a : hP2 = hP1 + c.DCBP2 −P1 .
(6.63)
Il y a autant de biais DCB qu’il y a de combinaisons possibles entre les observables. Cependant, certains auteurs préfèrent réserver exclusivement la notion de DCB entre mesures de code de même fréquence, par exemple pour la différence des biais entre P1 et C1 ou P2 et C2 . Lorsque des mesures de code de fréquences différentes sont combinées, ces auteurs préfèrent utiliser le vocable de biais inter-fréquences que l’on note par l’acronyme anglais IFB pour Inter Frequency Bias et souvent exprimé en mètres. Ainsi, on a une équivalence : IF B sat = c.DCB P2 − P1 = B P2 − B P1 ,
(6.64)
IF Brec = c.DCBP2 −P1 = BP2 − BP1 .
(6.65)
Dans cet ouvrage, nous choisissons d’utiliser le vocable DCB dans tous les cas. Tous comme les biais instrumentaux, les DCB contiennent une composante constante qui peut être positive ou négative plus une composante aléatoire. Les DCB satellites présentent des caractéristiques temporelles d’évolution très stable et diffèrent d’un satellite à l’autre. Côté dérive, il est intéressant de noter que la solution IGS propose pour ces biais des valeurs constantes par mois sans variabilité notoire d’un mois à l’autre. La valeur absolue des DCB moyens ne dépasse pas les 15,0 nanosecondes avec une variabilité autour de cette valeur moyenne de 3,0 nanosecondes à 95 %. Pour les mesures C1 , C2 , P1 , P2 , les ordres d’amplitude des différents DCB satellites sont les suivants : DCB P2 −P1
DCB DCB P1 −C1 DCB P2 −C2
Amplitude sur les satellites GPS De quelques ns à 12 ns (4 m environ) 14 Autour de 2 ns (60 cm environ) 15 Autour de 0,6 ns (20 cm environ) 16
Les biais DCB P1 −P2 satellites sont diffusés dans les fichiers IONEX délivrés par le service IGS. Les biais DCB P1 −C1 sont régulièrement estimés par le centre IGS en même temps que leur service de calcul d’horloge satellite. La stabilité des DCB récepteurs dépend en majeure partie de la variabilité de la thermique du récepteur. Ils sont donc affectés d’une fluctuation journalière à laquelle s’ajoutent des variations saisonnières de plus faible amplitude. 14. Voir l’article de Wilson et al. (1999). 15. Voir l’article de Collins et al. (2009). 16. Voir l’article de Leandro et al. (2007).
Les effets des erreurs système sur les mesures GNSS
115
Fig. 6.9 – Effet de la déformation du signal dans la fonction de corrélation du récepteur (figure extraite de l’article de Shloss et al. [2002]).
6.4
La déformation de la forme d’onde
En août 1993, un pilote de la société américaine Trimble de fabricant de récepteurs GPS testait les systèmes de GPS différentiel (DGPS) de ce fabricant. Le pilote a noté que les données GPS le positionnaient trop bas pendant son approche de la piste. Les responsables du système GPS au DoD, le « Department of Defence » américain, ont été contactés mais n’avaient pas vu le problème car l’erreur de positionnement apparaissait uniquement en appliquant le signal civil et non en appliquant le signal militaire. Une commutation sur l’amplificateur redondant du satellite concerné (SV-19) a fait disparaître le problème dont l’origine était une distorsion du signal civil. Au niveau du récepteur, l’effet de cette distorsion correspond à l’introduction d’oscillations à la fréquence fd , dont la décroissance est bornée par l’écart-type σ, et d’un biais Δ entre le signal rectangulaire codant l’information de code et sa reconstruction (illustration en figure 6.9, extrait de l’article de Shloss et al. [2002]). Dans la fonction de corrélation du récepteur, cela se traduit par un bruit et un décalage du pic de corrélation, ce qui introduit une erreur dans la mesure de code. L’amplitude du biais Δ est propre à la fonction de corrélation, donc du fabricant de récepteur qui la conçoit. Il n’y a pas de modélisation particulière pour cette erreur dans les mesures de pseudo-distances. Quand la distorsion apparaît, son effet est différent et spécifique à la technologie du récepteur. La seule contre-mesure possible est de disposer d’une fonction multicorrélateur dans le récepteur et d’analyser les résultats que produisent ces derniers par comparaison. De nouvelles anomalies similaires ont été constatées en 2009 et 2016. Cette erreur reste en bonne place dans les listes de défaillance « possibles » du GPS avec une probabilité d’apparition donnée par les responsables GPS de 10−4 par heure.
Chapitre 7 Les effets de propagation dans l’atmosphère sur les mesures GNSS Le signal émis par le satellite est une onde électromagnétique se propageant à la vitesse limite c dans le vide. Cependant, avant d’arriver au récepteur terrestre, elle traverse les différentes couches de l’atmosphère, ce qui va modifier sa vitesse de propagation. Les deux principaux milieux qui affectent cette vitesse de propagation sont la couche ionosphérique et la couche troposphérique. L’ionosphère est un milieu dispersif où la vitesse de propagation dépend de la fréquence du signal et de la quantité de plasma traversée. Donc avec deux fréquences il est possible d’évaluer cette erreur et d’en annuler les effets sur les mesures. L’ionosphère affecte les mesures de code et de phase d’une erreur qui se présente avec la même amplitude mais avec des signes opposés : on parle de retard sur la propagation de groupe (erreur ionosphérique introduite avec un signe « plus » sur la mesure de code) et d’avance sur la phase (erreur ionosphérique introduite avec un signe « moins » sur la mesure de phase) 17 . La troposphère est un milieu électriquement neutre qui affecte les fréquences GNSS (comprises entre 1 et 1,5 Ghz) de la même manière. Plutôt que de modifier la vitesse de propagation c dans les équations de mesure GNSS, on ajoute différents retards dans leur modélisation.
7.1
Les effets ionosphériques
Le retard ionosphérique se cumule lors de la traversée du signal dans l’ionosphère. L’ionosphère est un plasma qui est créé par l’effet d’ionisation provenant du flux solaire dans le spectre ultraviolet (UV) et des rayonnements X solaires sur les hautes couches de l’atmosphère (voir les textes de référence de Blelly et Lilensten [2000] et Blelly et Alcaydé [2007]). Ce plasma se 17. Ces effets sont détaillés dans l’ouvrage de Misra et Enge (2012).
118
Le temps dans la géolocalisation par satellites
déploie entre 80 et environ 600 km d’altitude et la densité de matière y est faible. L’ionosphère est un milieu dispersif pour les ondes électromagnétiques. Elle modifie l’indice de réfraction du milieu. Au premier ordre, l’effet e de l’ionosphère sur la mesure de pseudo-distance et de phase dépend du contenu électronique total (TEC pour Total Electron Content) traversé par le signal et de l’inverse du carré de la fréquence du signal : ef =
40, 3 · T EC . f2
(7.1)
Cet effet se traduit par un retard dans la mesure de code, une avance de phase de la porteuse et une réfraction des ondes. Pour la mesure Doppler, ce sont les variations de retards relatifs liés à la traversée du signal dans l’ionosphère qui provoquent ce décalage, car cela affecte la vitesse relative du signal le long de la ligne de propagation. Le décalage en fréquence est donc directement relié au gradient des retards le long de la ligne de vue. L’effet dissipatif de l’ionosphère induit un retard en fréquence : plus le gradient de densité en électrons libres est grand, plus la fréquence reçue est faible par rapport à la fréquence transmise. Le décalage Doppler ionosphérique a un signe opposé au décalage Doppler cinématique : e˙ f (7.2) Δfionosph`ere = − f. c Le décalage Doppler induit par l’ionosphère est donc attribuable à la variation du contenu électronique dans la couche ionosphérique : Δfionosph`ere = −
40, 3 dT EC . cf dt
(7.3)
En période d’activité ionosphérique calme, une valeur typique de ce décalage Doppler est de 0,085 Hz pour la fréquence f1 , donc ce n’est pas un problème pour les boucles de poursuite. Lors d’événements de scintillations, de rapides changements de variation de TEC peuvent produire des variations de décalage Doppler supérieures à 1 Hz par seconde. Ces variations soudaines et importantes peuvent même être supérieures à ce que les boucles de poursuite peuvent maintenir et conduire à des décrochages du signal. Si e désigne le délai ionosphérique (en mètre) qui affecte la fréquence f1 , alors le délai qui affecte la fréquence f2 est γ12 e où γ12 est le rapport des carrés des fréquences (à ne pas confondre avec le facteur de Lorentz qui utilise la même notation) : 2 2 f12 n1 77 ∼ (7.4) = γ12 = 2 = = 1, 64, f2 n2 60 pour le GPS. Les multiplicateurs de fréquence n1 et n2 sont définis au paragraphe 2.2. Par conséquent, avec deux fréquences, il est possible d’évaluer le retard ionosphérique sur chacune des fréquences. Tout système de navigation émet au moins sur deux fréquences différentes afin de pouvoir corriger les
Les effets de propagation dans l’atmosphère sur les mesures GNSS
119
effets ionosphériques qui se traduisent en un retard dans la mesure de code, une avance de phase de la porteuse et une réfraction des ondes. Ces effets varient suivant le jour de l’année et l’heure de la journée. Ils sont difficilement modélisables car la dynamique de l’ionosphère dépend de l’intensité du vent solaire ainsi que des différents couplages avec la magnétosphère et l’atmosphère neutre. De plus, à chaque transition jour-nuit, l’ionosphère rejoint deux états stables très différents : un régime éclairé où se maintient et s’équilibre la production des espèces chimiques et un régime « nuit » où l’ionosphère n’est plus excitée par le Soleil, donc tend vers une neutralité électronique. Ainsi, la transition jour-nuit est la cause principale de la dynamique de l’ionosphère. À cela, étant directement sensible au comportement du Soleil, l’ionosphère est également affectée par les orages géomagnétiques et les éruptions solaires. Les sursauts radio, intense émission dans le domaine des radiofréquences suite à l’accélération du vent solaire, provoquent une importante dégradation du rapport signal sur bruit (phénomène de « fading ») pouvant entraîner la perte du signal par le récepteur. L’élargissement de l’émission électromagnétique solaire dans la bande X provoque une forte augmentation soudaine de la densité volumique d’électrons dans les couches basses de l’ionosphère pouvant absorber le signal GPS. La turbulence du plasma ionosphérique produit ce que l’on appelle la scintillation ionosphérique qui se caractérise par des fluctuations rapides de l’indice de réfraction du milieu. La scintillation ionosphérique a un effet destructif sur le signal car affecte sa structure en introduisant des variabilités aléatoires sur l’amplitude et la phase du signal pouvant également entraîner des pertes de mesures.
7.2
Les effets troposphériques
Le retard troposphérique T est causé par le passage du signal à travers la troposphère qui constitue la couche la plus basse de l’atmosphère jusqu’à la tropopause (environ 11 km d’altitude). Ces effets résultent d’un changement de l’indice de réfraction dû à l’humidité de l’air et aux variations de pression et de température. Elle induit une courbure du signal et un ralentissement de la vitesse de propagation. Ces effets sont fortement corrélés avec la saison, l’heure locale et la latitude. La troposphère étant composée de gaz neutres, elle n’est pas dispersive pour les signaux électromagnétiques ce qui veut dire que le retard atmosphérique affecte les fréquences GNSS de la même façon. Les espèces principales de l’atmosphère proche, l’azote et l’oxygène, correspondent à la partie sèche de la troposphère. Ces effets contribuent pour 90 % au délai total et sont à dynamique lente, soit environ 1 % de variation en quelques heures, et sont donc assez bien modélisés. Les effets de troposphère sèche ont une amplitude approximativement de 2,37 m à la verticale locale et peuvent atteindre plusieurs dizaines de mètres à basse élévation (inférieure à 10◦ ). La partie humide de la troposphère, c’est-à-dire la vapeur d’eau, est responsable des 10 % du délai restant : elle a une variabilité plus grande, de 10
120
Le temps dans la géolocalisation par satellites
à 20 % sur quelques heures, et se modélise plus difficilement. Sa contribution à la verticale locale varie de 1 à 80 cm. On écrit donc le délai troposphérique comme la somme de ces deux contributions : T = T s + T h = fs (El) T sv + fh (El) T hv ,
(7.5)
où : T : est le retard troposphérique sur l’axe à vue, T s la contribution sèche et T h la contribution humide ; Tv : est le retard troposphérique à la verticale locale ; El : est l’élévation de la ligne de vue ; f : est la fonction de rabattement, fs pour la partie sèche et fh pour la partie humide. Un modèle possible pour la fonction de rabattement est donné par : f (El) =
1+ sin El +
a b 1+ 1+c a b sin El+ sin El+c
.
(7.6)
Les coefficients a, b et c sont empiriques et sont différents selon la partie hydrostatique (as , bs , cs ) et humide (ah , bh , ch ) de la troposphère. L’effet de la troposphère, milieu électriquement neutre, induit une compression dans le décalage Doppler et a le même signe que le Doppler cinématique : plus le gradient troposphérique est grand, plus la fréquence reçue est grande par rapport à la fréquence transmise. Δftroposph`ere =
7.2.1
T˙ f. c
(7.7)
Modélisation des effets atmosphériques dans les mesures GNSS
Ces effets affectent les mesures de code, phase et Doppler sur la fréquence f de la façon suivante : + εP R PR = R + ΔhP R + ef + T DR = R˙ + Δh˙ DR − e˙ f + T + εDR , λL = R + λW + ΔhL − ef + T − λN + εL
(7.8)
où : ef : représente le délai associé au ralentissement de l’onde dans l’ionosphère en fonction de la fréquence f ; T : représente le délai associé au ralentissement de l’onde dans la troposphère ; ε : représente le bruit résiduel inhérent à tout appareil de mesure (thermique, interférences. . . ).
Les effets de propagation dans l’atmosphère sur les mesures GNSS
121
Pour alléger les écritures, on a introduit dans la formulation précédente le signe Δ pour noter les différences d’horloges ΔhP R = hP R − hP R . On rappelle que les horloges ΔhP R contiennent les biais instrumentaux ΔhP R = Δh + ΣBP R , avec Δh = hrec − hsat et ΣBP R = BP R + B P R . Le signe Σ est utilisé pour noter la somme de biais entre récepteur et satellite. Les bruits εP R et εL sont supposés être des bruits blancs de variances 2 . Globalement, les valeurs de ces variances sont de l’ordre respectives σP2 R et σL du mètre pour le code et du centimètre pour la phase.
7.3
Effet de l’environnement sur la mesure de pseudo-distance
Les mesures GNSS sont affectées par une erreur de propagation au voisinage du récepteur. Ces erreurs sont soit le fait de brouillages volontaires ou involontaires, soit un événement de multi-trajets du signal causés par la présence au niveau de l’antenne de réception de signaux secondaires provenant de réflexions du signal sur l’environnement local. Ces signaux réfléchis ont parcouru un trajet plus long que le trajet direct et arrivent au récepteur avec un déphasage causant une interférence. À chaque réflexion du signal, la polarisation du signal RHCP s’inverse pour devenir LHCP (pour Left Hand Circular Polarization) puis à nouveau RHCP à la réflexion suivante et ainsi de suite. Si la ligne de visibilité directe entre le récepteur et le satellite est coupée, typiquement par des masquages, la mesure du temps d’arrivée est nécessairement erronée, et le récepteur n’a pas moyen en propre de déceler cette erreur. Si le récepteur reçoit les deux signaux, alors l’interférence génère une distorsion au niveau de la fonction de corrélation, ce qui induit une erreur sur la mesure. Ces multi-trajets n’affectent principalement que les mesures de code. P R = R + ΔhP R + ef + T + MP R + εP R .
7.4
(7.9)
Le filtrage du code par la phase
Les mesures GNSS disponibles pour le positionnement sont les mesures de code bruitées, possiblement affectées de multi-trajets et de mesures de phase précises mais ambiguës. Un positionnement précis tentera d’utiliser au mieux la mesure de phase, ce qui revient automatiquement à fournir une estimée de l’ambiguïté la plus fine possible. Une technique classique et très ancienne consiste à estimer l’ambiguïté de phase en faisant la moyenne sur un arc glissant de la différence entre la mesure de phase et la mesure de code, il s’agit du filtre de Hatch.
122
Le temps dans la géolocalisation par satellites
Une formulation possible pour le lissage est la suivante. L’ambiguïté est d’abord estimée par une moyenne faite sur les mesures, phases moins codes sur les échantillons disponibles : 1 1 (P Ri − λLi ) = (Ni + 2efi ) . n i=1 n i=1 n
Nmoy =
n
(7.10)
Puis cette ambiguïté est injectée dans la mesure de phase, supposée sans sauts de cycles. P Rk = λLk + Nmoy = λLk + P R − λLn . (7.11) La notation n est ici réservée pour désigner la moyenne sur n échantillons. Malheureusement, l’effet de l’ionosphère sur les signaux GNSS conduit invariablement au problème de l’accumulation du gradient ionosphérique. D’autre part, ce processus suppose que le multi-trajet sur la mesure de code soit très faible ou bien apparaisse comme un bruit blanc car un biais se reporterait sur l’estimation de l’ambiguïté. Ce gradient ionosphérique apparaît d’une itération i à l’autre i + 1 comme un développement au premier ordre du délai ionosphérique accumulé lors de la traversée du signal dans la couche ionosphérique : efi+1 = = efi +
def δt, dt
(7.12)
où δt est le temps écoulé entre deux itérations. Ce gradient se somme sur tout l’arc de telle sorte que : 2 def δt. ef ≈ 2ef1 + (n − 1) n i=1 dt n
(7.13)
Le premier terme de cette somme reflète le délai ionosphérique de la première mesure de l’arc, le second terme est ce que l’on nomme la divergence ionosphérique. La présence de dérive dans la composante ionosphérique des mesures GNSS introduit donc un biais dans la mesure de code lissée. Si τ = (n − 1) δt de note la longueur de la fenêtre de lissage, la valeur de ce biais est 2τ dtf . Une formulation équivalente est donnée par le processus itératif suivant : P R1 = P R1 . (7.14) P Rk+1 = n1 P Rk+1 + n−1 P Rk + (λLk+1 − λLk ) n Cette formulation est intéressante car elle fait intervenir l’incrément de la mesure de phase, ce qui correspond à la mesure Doppler lorsque les échantillons sont cadencés à la seconde. Le principe de la preuve de l’équivalence consiste à retrouver la première formulation faite avec le calcul de la moyenne à l’aide de la formule de récur rence. Supposons que la relation P Rk = λLk + P R − λLn soit vraie au rang
Les effets de propagation dans l’atmosphère sur les mesures GNSS
123
k et prouvons-la au rang k + 1. En partant de la formule de récurrence et en développant celle-ci, on obtient : 1 n − 1 P Rk+1 = λLk+1 + (P Rk+1 − λLk+1 ) + P Rk − λLk . n n
(7.15)
Appliquons l’hypothèse de récurrence sur un arc où le premier point a été enlevé (puisqu’on veut faire glisser l’arc), c’est-à-dire sur n - 1 points : 1 n−1 P Rk+1 = λLk+1 + (P Rk+1 − λLk+1 ) + P R − λLn−1 . n n
(7.16)
À cette étape on applique la formule classique de récurrence du calcul de moyenne : 1 n−1 an−1 , an = an + (7.17) n n avec an = P Rk+1 − λLk+1 et on retrouve la récurrence au pas suivant : P Rk+1 = λLk+1 + P R − Dn .
(7.18)
Chapitre 8 Les différentes combinaisons de mesures GNSS Ce chapitre est dédié à la présentation des combinaisons classiques des mesures de code et de phase sur deux fréquences, ainsi qu’aux avantages que l’on peut dégager dans chacune d’elles. Parmi les combinaisons les plus largement utilisées, on trouve la combinaison dite « ionosphérique » qui isole le retard ionosphérique, et la combinaison « géométrique » qui permet d’éliminer l’erreur de propagation ionosphérique. D’autres combinaisons se révèlent très utiles pour la détection de sauts de cycles. Par souci de clarté et sans perdre en généricité, nous présentons les combinaisons pour les mesures de codes cryptés P avec les fréquences f1 et f2 . D’autre part, les effets d’environnement locaux ne sont pas pris en compte.
8.1
Le modèle standard des mesures de code et de phase
La formulation retenue pour les mesures de codes et de phases est la suivante18 : P1 P2 λ1 L1 λ2 L2
= R1 = R2 = R1 + λ1 W = R2 + λ2 W
+ + + +
ΔhP1 ΔhP2 ΔhL1 ΔhL2
+e + γ12 e −e − γ12 e
− λ1 N1 − λ2 N2
+ + + +
εP1 εP2 . εL 1 εL 2
(8.1)
Dans cette formulation, la quantité R contient la distance de propagation géométrique entre les centres de phase f1 et f2 de l’émetteur et du récepteur plus les effets de propagation troposphérique. La quantité e note le retard ionosphérique pour la fréquence f1 , et γ12 est le facteur de conversion défini par la formule (7.4). Les notations λ1 et λ2 sont réservées pour les longueurs 18. Voir le guide de Kouba (2009).
126
Le temps dans la géolocalisation par satellites
d’onde des signaux électromagnétiques de fréquence respectives f1 et f2 . Les biais d’horloges apparents ΔhPi et ΔhLi contiennent les biais instrumentaux : ΔhPi = Δh + ΣBPi ,
(8.2)
ΔhLi = Δh + ΣBLi .
(8.3)
avec Δh = hrec − h la différence des horloges physiques récepteur et émetteur, ΣBPi = BPi + B Pi et ΣBLi = BLi + B Li respectivement la somme des biais instrumentaux de code et de phase. Les différentes mesures de codes et de phases sur les deux fréquences permettent de réaliser plusieurs combinaisons linéaires, de type α1 P1 + α2 P2 et β1 λ1 L1 + β2 λ2 L2 avec αi , βi ∈ Q et α1 + α2 , β1 + β2 ∈ N (souvent 0 ou 1), qui éliminent certains termes dans la modélisation. sat
8.2
Combinaison ionosphérique
La combinaison ionosphérique est définie par : PI = P2 − P1 ,
(8.4)
QI = λ1 L1 − λ2 L2 .
(8.5)
Elle élimine la composante géométrique, troposphère et horloge et laisse les termes dépendant de la fréquence : élongation ionosphérique, biais instrumentaux et écarts des centres de phase δij = u ·(ai −aj ) sur la ligne de vue (voir les sections 6.1 et 6.2). Ces derniers sont en général négligeables sur les satellites GPS bloc II mais peuvent atteindre 50 cm sur les satellites GPS bloc III. En utilisant la convention d’écriture ΣDCBP2 −P1 = DCBP2 −P1 + DCB P2 −P1 et ΣDP BL1 −L2 = DP BL1 −L2 + DP B L1 −L2 , le développement donne : PI = δ21 +c.ΣDCBP2 −P1 + (γ12 − 1) e +εPI QI = δ12 +c.ΣDP BL1 −L2 + (γ12 − 1) e−λ1 N1 + λ2 N2 + (λ1 − λ2 ) W +εLI . (8.6) De la même façon que pour le problème des horloges, les DCB interviennent toujours dans les combinaisons ionosphériques comme somme entre DCB émetteur et récepteur. Ils ne peuvent être estimés qu’à une constante commune près puisque, pour tout réel a, on a : ΣDCBP2 −P1 = (DCBP2 −P1 + a) − DCB P2 −P1 + a . (8.7) Cette constante, ou référence, est vue comme la référence par rapport à laquelle s’évaluent tous ces biais. Le choix de cette référence est laissé à l’appréciation de l’organisme qui les produit. Ainsi, l’IGS diffuse des observations de DCB centrés par convention autour de zéro.
Les différentes combinaisons de mesures GNSS
127
Les bruits de la mesure de code εPI et de phase εLI ont pour variance la somme des variances de code et de phase. σP2 I = σP2 1 + σP2 2 ,
(8.8)
2 2 2 = σL + σL . σL I 1 2
(8.9) √ Cela représente des bruits dont les amplitudes sont amplifiées d’un facteur 2.
8.3
Combinaison en longueur d’onde équivalente étroite (narrowlane)
La combinaison en longueur d’onde équivalente étroite (narrowlane pour son équivalent anglo-saxon) est définie par : f1 P1 + f2 P2 , f1 + f2
(8.10)
f1 λ1 L1 + f2 λ2 L2 . f1 + f2
(8.11)
Pn = Qn = Le développement donne : Pn
=
Qn
=
RPn
+ΔhPn
+ ff21 e
+ΔhQn
− ff21 e
+εPn
. +εQn (8.12) Les biais d’horloges contiennent les biais instrumentaux qui s’obtiennent en suivant : f1 ΣBP1 + f2 ΣBP2 ΔhPn = Δh + , (8.13) f1 + f2 f1 ΣBL1 + f2 ΣBL2 . (8.14) ΔhQn = Δh + f1 + f2 Cette combinaison fait apparaître une nouvelle longueur d’onde commune à la somme des ambiguïtés Nn = N1 + N2 et à la rotation de phase W : RQn +
λ2 λ1 λ2 +λ1 W
λc =
λ1 − λλ22+λ 1
(N1 + N2 )
λ2 λ1 c = ≈ 10, 7 cm. λ2 + λ1 f1 + f2
(8.15)
La fréquence du signal équivalent à cette combinaison est la somme des fréquences des signaux de base. Avec ces notations, la mesure de phase s’écrit : Qn = RQn + ΔhQn − λc Nn + λc dw −
f1 e + εL n . f2
(8.16)
Cette combinaison produit des observables avec une petite longueur d’onde. Les variances des bruits s’écrivent : σn2 =
f22 σ22 + f12 σ12 , (f2 + f1 )
(8.17)
128
Le temps dans la géolocalisation par satellites √ √ ce qui correspond à des bruits de niveau 1 + γ12 / 1 + γ12 inférieur à √ chacun des signaux de base, environ 1/ 2 ≈ 0, 7 fois le bruit individuel de chaque signal. L’avantage de cette combinaison est de fournir une mesure de code moins bruitée que les mesures de code d’origine.
8.4
Combinaison en longueur d’onde équivalente large (widelane)
La combinaison en longueur d’onde équivalente large (widelane pour son équivalent anglo-saxon) est définie par : f1 P1 − f2 P2 , f1 − f2
(8.18)
f1 λ1 L1 − f2 λ2 L2 . f1 − f2
(8.19)
Pw = Qw = Le développement donne : Pw
=
Qw
=
RPw
+ΔhPw
− ff12 e
+ΔhQw
+ ff12 e
+εPw
. (N1 − N2 ) +εQw (8.20) Les biais d’horloges contiennent les biais instrumentaux et s’obtiennent en suivant : f1 ΣBP1 − f2 ΣBP2 ΔhPw = Δh + , (8.21) f1 − f2 f1 ΣBL1 − f2 ΣBL2 ΔhQw = Δh + . (8.22) f1 − f2 La combinaison fait apparaître une nouvelle longueur d’onde commune à la différence des ambiguïtés Nw = N2 − N1 et à la rotation de phase W : RQw +
λ2 λ1 λ2 −λ1 W
λw =
λ1 − λλ22−λ 1
c λ2 λ1 = ≈ 86, 2 cm. f1 − f2 λ2 − λ1
(8.23)
La fréquence du signal équivalent à cette combinaison est la différence des fréquences des signaux L1 et L2. Avec ces notations, la mesure de phase s’écrit : Qw = RQw + λw W + ΔhQw − λw Nw +
f1 e + εQw . f2
(8.24)
Cette combinaison se caractérise par une grande longueur d’onde, ce qui est pratique pour identifier des sauts de cycles et fixer les ambiguïtés. Inversement, le niveau de bruit de ces nouveaux signaux est bien supérieur à celui de chacune des composantes du signal : f12 σ12 + f22 σ22 . (8.25) (f1 − f2 ) √ √ Le bruit de cette combinaison est environ 1 + γ12 / γ12 − 1 soit 5, 7 fois plus important que les mesures de base qui servent à la former. σn2 =
Les différentes combinaisons de mesures GNSS
8.5
129
Combinaison de Melbourne-Wübbena
La combinaison de Melbourne-Wübbena est définie par la différence entre la mesure de phase widelane et la mesure de code narrowlane : M W = Qw − Pn .
(8.26)
Cette combinaison tire parti du faible bruit du code en voie étroit et de la grande longueur d’onde de la phase widelane. Par ailleurs, la combinaison de code Pn et la combinaison de phase Qw présentent des délais ionosphériques identiques sur les deux mesures, ce qui permet d’éliminer ce budget d’erreur par différence. Le développement donne la formulation suivante : M W = BMW − λw Nw + λw W + εMW ,
(8.27)
où le biais BMW s’écrit : BMW = BLw − BPn + B Lw − B Pn .
(8.28)
En faisant l’hypothèse que les biais instrumentaux sont identiques pour les mesures de code et de phase, on arrive à l’expression : MW = −
2f1 f2 IF Brec + IF B sat − λw Nw + λw W + εMW . 2 2 f1 − f2
(8.29)
Cette combinaison est normalement constante sur un passage, donc ses variations sont dues à des sauts de phases. Comme ces sauts sont de l’ordre de 86 cm pour un saut de N1 ou N2 , il est facile de les détecter malgré le bruit de code.
8.6
Combinaison géométrique
La combinaison géométrique est définie par : Pc = Qc =
f12 P R1 − f22 P R2 γ12 P R1 − P R2 , = 2 2 f1 − f2 γ12 − 1
(8.30)
f12 λ1 L1 − f22 λ2 L2 γ12 λ1 L1 − λ2 L2 . = 2 2 f1 − f2 γ12 − 1
(8.31)
Son avantage est qu’elle élimine le plus gros effet de l’ionosphère, environ 99,9 %. Le développement donne : Pc Qc
= Rc γ12 λ1 −λ2 = Rc + γ12 −1 W
+ΔhPc +ΔhQc
1 −λ2 N2 − γ12 λ1γN 12 −1
+εPc . +εQc
(8.32)
130
Le temps dans la géolocalisation par satellites
Les biais d’horloges contiennent les biais instrumentaux qui s’obtiennent en suivant : γ12 ΣBP1 − ΣBP2 , ΔhPc = Δh + (8.33) γ12 − 1 ΔhQc = Δh +
γ12 ΣBL1 − ΣBL2 . γ12 − 1
(8.34)
On les dénomme couramment horloges géométrique ou plus couramment sous leur équivalent anglo-saxon horloges ionosphere-free. Un calcul littéral donne les relations suivantes pour les horloges de code : ΔhP1 = ΔhPc +
ΣBP1 − ΣBP2 , γ12 − 1
ΔhP2 = ΔhPc + γ12
ΣBP1 − ΣBP2 . γ12 − 1
(8.35)
(8.36)
Le calcul sur les horloges de phase est identique. Ces formulations font apparaître les différences de DCB station satellites au second membre. Elles permettent de transférer une horloge combinée en formulation géométrique en une horloge dans les fréquences f1 ou f2 . Le bruit de la mesure de code εPc et de phase εQc ont pour variance la combinaison des variances de code et de phase : σc2 =
2 2 σ1 σ22 + γ12
(1 − γ12 )2
.
(8.37)
Globalement, l’effet de cette combinaison est d’augmenter les bruits de mesures 2 )/ |1 − γ |, soit en gros des bruits trois fois plus impordu facteur (1 + γ12 12 tants. Le coefficient devant le délai de rotation de phase est la longueur d’onde en voie étroite λc : λ2 λ1 γ12 λ1 − λ2 = = λc . (8.38) γ12 − 1 λ2 + λ1 Pour extraire une ambiguïté entière à partir de la combinaison géométrique des ambiguïtés N1 et N2 , il faut réécrire la formulation sous la forme λk avec λ indépendant des ambiguïtés N1 et N2 et k plus petit entier qui soit une combinaison entière des ambiguïtés N1 et N2 . Pour cela, on introduit les notations f1 = 2n1 f0 et f2 = 2n2 f0 avec n1 = 77 et n2 = 60 et on explicite le facteur γ12 en fonction du carré du rapport des fréquences γ12 = f12 /f22 . On obtient rapidement l’égalité : γ12 λ1 N1 − λ2 N2 c = (n1 N1 − n2 N2 ) . γ12 − 1 2f0 (n21 − n22 )
(8.39)
La différence n1 N1 − n2 N2 est maintenant entière et, comme n1 et n2 sont premiers entre eux, la combinaison des ambiguïtés n’admet aucun diviseur
Les différentes combinaisons de mesures GNSS
131
commun. La longueur d’onde équivalente associée λIF est la longueur d’onde géométrique : c λIF = ≈ 6, 3 mm. (8.40) 2f0 (n21 − n22 ) Cette longueur d’onde prend une valeur très faible, ce qui rend difficile dans cette combinaison la détection de sauts de cycles. Les équations de mesures en horloges géométriques s’écrivent finalement : Pc Qc
= Rc = Rc + λc W
+ΔhPc +ΔhQc
+εPc . −λIF (n1 N1 − n2 N2 ) +εQc
(8.41)
Chapitre 9 La diffusion des biais d’horloge satellite dans le message de navigation Ce chapitre est dédié à la diffusion de la correction d’horloge des satellites de la constellation GNSS aux utilisateurs. Ces corrections correspondent aux différents écarts de synchronisation, des avances pour certaines et des retards pour d’autres, des horloges de la constellation par rapport à une référence commune. Cette information est indispensable pour la géolocalisation par satellites car le principe de base du système GNSS repose tout entier sur le fait que les émissions des signaux électromagnétiques par les satellites soient toutes synchrones entre elles. La correction d’horloge diffusée dans les messages de navigation est applicable pour un récepteur qui utilise les deux fréquences pour former la combinaison géométrique. Ce chapitre décrit également comment les biais instrumentaux sont pris en compte en se focalisant sur leurs utilisations du point de vue de l’utilisateur. Le choix des concepteurs des systèmes de géolocalisation par satellites a été d’introduire les effets des biais instrumentaux dans la correction d’horloge diffusée à l’intérieur du message de navigation, puis de transmettre en parallèle dans le même message une correction spécifique pour les récepteurs qui n’utilisent qu’une seule fréquence.
9.1
La diffusion des biais d’horloge dans le message de navigation
Le message de navigation offre aux utilisateurs une correction d’horloge GPS dédiée à la combinaison géométrique : Pc =
γ12 P1 − P2 , γ12 − 1
(9.1)
134
Le temps dans la géolocalisation par satellites
faite avec les mesures de code P1 et P2 , où γ12 est le carré des rapports des fréquences défini par la formule (7.4). Les formulations de chacune de ces mesures de code sont données ci-dessous : P1 P2 Pc
= R = R = R
+ hrec − hsat + hrec − hsat + hPc − hPc
+ BP1 + B P1 + BP2 + B P2
+e + γ12 e
+T +T +T
+ εP1 + εP2 + εc
(9.2)
où : R est la distance géométrique entre la position du centre de masse du satellite au temps GPS d’émission du signal au centre de phase et la position du point de référence du récepteur à la date de réception du signal ; hrec est le biais de temps entre le temps propre de l’horloge du récepteur τrec et le temps GPS trec ; hsat est le biais de temps entre le temps propre de l’horloge bord τ sat et le temps GPS tsat ; B Pi est le biais instrumental qui représente le temps passé par le signal dans les systèmes électroniques entre le moment de la génération du signal par l’horloge bord et son émission au centre de phase Li ; BPi est le biais instrumental qui représente le temps passé par le signal entre la réception au centre de phase Li de l’antenne et la fonction de corrélation qui génère la pseudo-distance. Il prend en compte les délais dans les systèmes électroniques et les câbles. Les biais de temps hPc et hPc sont respectivement les biais d’horloge récepteur et satellite associés à la combinaison géométrique qui prend en elle la composante de biais instrumentaux combinés : hPc = hrec +
γ12 BP1 − BP2 , γ12 − 1
(9.3)
hPc = hsat −
γ12 B P1 − B P2 . γ12 − 1
(9.4)
e est l’élongation ionosphérique du signal à la fréquence L1 ; T est l’élongation troposphérique ; hPc est l’horloge géométrique qui prend en elle la composante de biais instrumentaux combinés : γ12 B P1 − B P2 / (γ12 − 1) ; γ12 est le carré des rapports des fréquences défini par la formule (7.4). Les signaux L1P(Y) et L2P(Y) sont générés de façon simultanée par l’oscillateur bord. Ils se propagent ensuite à l’intérieur des équipements pour être émis à leurs centres de phase antenne respectifs à des dates affectées des biais instrumentaux. Si ces codes sont générés ensemble à la date τ sat en temps propre de l’horloge bord, alors ils sont émis respectivement aux dates : τ P1 = τ sat + δtP1 ,
(9.5)
τ P2 = τ sat + δtP2 .
(9.6)
La diffusion des biais d’horloge satellite dans le message de navigation
135
Ces signaux sont également affectés de délais supplémentaires, respectivement e et γ12 e, lorsqu’ils traversent l’ionosphère. Au final, ces signaux arrivent au récepteur à des instants différents. Cependant, un récepteur réalise toutes ces mesures relativement à la date τrec . Les boucles de code et de phase suivent chaque signal indépendamment et, à une date commune τrec donnée, déterminent des dates d’émission. Ces instants d’émission sont nécessairement tous différents suite aux effets de bruits de mesures mais surtout aux différents délais variables selon les fréquences qui affectent les mesures : les biais instrumentaux et le délai ionosphérique. Donc du point de vue du récepteur, les signaux provenant d’un même satellite et reçus à un instant de réception commun, ne seront jamais émis de façon synchrone. Ceci est la différence fondamentale entre le point de vue émetteur, où on parle de génération de signaux calés sur une horloge commune et qui arrivent au récepteur à des instants différents, et le point de vue récepteur où on parle de mesures de pseudo-distances prises à des instants communs pour des signaux émis à des instants différents. Rappelons que la relation entre le temps propre de l’horloge bord τ sat et le temps GPS tsat est donnée par : τ sat = tsat + Δtsat tsat .
(9.7)
Pour trouver la date d’émission du signal au centre de phase en temps GPS, il faut appliquer la correction des biais instrumentaux. On a ainsi, pour les signaux L1P(Y) et L2P(Y) : tP1 = τ sat − Δtsat + δtP1 ,
(9.8)
tP2 = τ sat − Δtsat + δtP2 ,
(9.9)
où : tP1 : est la date GPS d’émission du signal L1P(Y) dans la fréquence L1 au centre de phase L1 ; tP2 : est la date GPS d’émission du signal L2P(Y) dans la fréquence L2 au centre de phase L2. On définit ainsi de nouveaux biais de temps qui mêlent à la fois décalage d’horloge et délais instrumentaux : ΔtP1 = Δtsat − δtP1 ,
(9.10)
ΔtP2 = Δtsat − δtP2 .
(9.11)
Le système GPS est conçu pour des utilisateurs qui reçoivent et traitent les mesures P1 et P2 pour leur positionnement. Afin de s’abstraire du délai ionosphérique, les utilisateurs forment la combinaison géométrique Pc . Le système GPS diffuse donc une correction d’horloge ΔtPc relative à la combinaison géométrique, c’est-à-dire qui prend en compte la combinaison des différents biais
136
Le temps dans la géolocalisation par satellites
instrumentaux δtP1 et δtP2 . Si l’on forme la combinaison géométrique des différents temps d’émission, on obtient : tPc =
γ12 tP1 − tP2 γ12 δtP1 − δtP2 = τ sat − Δtsat + = τ sat − ΔtPc . γ12 − 1 γ12 − 1
(9.12)
Ici tPc est la date GPS d’émission de la combinaison géométrique au centre de phase de la combinaison géométrique des mesures. Attention, il ne s’agit pas ici d’un signal physique. Le nouveau biais : δtPc =
γ12 δtP1 − δtP2 , γ12 − 1
(9.13)
est le biais instrumental associé à la combinaison géométrique et de la même façon on construit un nouveau biais de temps associé : ΔtPc = Δtsat − δtPc .
(9.14)
Au final, on a les relations suivantes qui relient la date de génération des signaux GPS avec les différentes dates d’émission aux différents centres de phase : tP1 = τ sat − ΔtP1 , (9.15) tP2 = τ sat − ΔtP2 ,
(9.16)
tPc = τ sat − ΔtPc .
(9.17)
La correction Δt est contenue dans la sous-trame 1 et transmise par un modèle parabolique d’évolution : Pc
ΔtPc (t) = af 0 + af 1 (t − toc ) + af 2 (t − toc )2 + Δtsat , r
(9.18)
où t : est une date en seconde dans le système de temps GPS ; toc : est une date de référence en seconde ; af 0 , af 1 , af 2 : sont les coefficients du polynôme exprimés en seconde, s/s et s/s2 ; Δtsat : est un terme de correction relativiste en seconde. r Dans ce modèle d’évolution, c’est le paramètre af 0 qui prend en compte la P1 −B P2 combinaison géométrique B Pc = cδtPc = γ12 Bγ12 −1 des biais instrumentaux. sat Le terme Δtr est un terme de correction relativiste 19 qui s’exprime de façon équivalente par les deux formulations suivantes : · V √ 2X Δtsat = F e a sin Ek = − . r c2
(9.19)
19. Voir le paragraphe 19.3 pour la prédiction théorique détaillée de cet effet de l’excentricité des orbites GPS.
La diffusion des biais d’horloge satellite dans le message de navigation
137
√ Les paramètres d’orbites e (excentricité de l’orbite), a (racine carré du demigrand axe) et Ek (anomalie excentrique au temps tk = t − toe ) sont diffusés dans la sous-trame 2 et 3, la constante F est définie par : √ 2 GM F =− . (9.20) c2 et V sont respectivement les positions et vitesses instantanées Les vecteurs X du satellite, c’est-à-dire calculées à la date tPc . L’explication de ce terme de correction relativiste sera examinée en détail dans les chapitres consacrés à la relativité. Les corrections d’horloges des solutions fournies par le centre international IGS sont applicables pour des utilisateurs qui combinent les observables en formulation géométrique. Ces corrections sont en fait des horloges de phase dont le biais af 0 est défini par la moyenne des horloges de code. Le système Galileo diffuse des corrections d’horloges selon le même modèle d’évolution, et avec le même modèle de correction relativiste.
9.2
La diffusion des biais l1-l2 dans le message de navigation, TGD , BGD
La correction d’horloge satellite ΔtPc diffusée dans le message de navigation est applicable pour un utilisateur bi-fréquence, c’est-à-dire un utilisateur capable de traiter les mesures P 2 et P 1 puis de former la combinaison géométrique pour éliminer le délai ionosphérique. Pour les utilisateurs mono-fréquence L1 ou L2, le système GPS diffuse pour chaque satellite un moyen pour compenser le biais différentiel entre les signaux L1P(Y) et L2P(Y), et ainsi pouvoir transférer la correction d’horloge géométrique en une correction d’horloge P 1 ou P 2. Ces biais sont les TGD ou Time Group Delay qui sont diffusés dans la sous-trame 1 du message de navigation GPS (avec pour unité la seconde). Au niveau des temps d’émission des signaux satellite, les TGD sont définis de façon à s’ajouter aux temps d’émission du signal géométrique pour retrouver le temps d’émission du signal mono-fréquence : tP1 = tPc + TGD , t
P2
=t
Pc
+ γ12 TGD .
(9.21) (9.22)
Cette définition est naturelle car les TGD doivent disparaître lorsque l’on forme la combinaison géométrique avec les dates tP1 et tP2 . Avec ces équations, on arrive immédiatement à l’expression des TGD telle que donnée dans le document IS-GPS-200 : tP1 − tP2 TGD = . (9.23) 1 − γ12 D’un autre côté, on a :
tP1 = τ sat − ΔtPc + TGD = τ sat − ΔtPc − TGD ,
(9.24)
138 tP2 = τ sat − ΔtPc
Le temps dans la géolocalisation par satellites (9.25) + γ12 TGD = τ sat − ΔtPc − γ12 TGD .
Ce qui signifie que le biais d’horloge applicable à un utilisateur mono-fréquence se construit à partir des biais d’horloge donnés par le message de navigation desquels on soustrait les TGD : ΔtP1 = ΔtPc − TGD ,
(9.26)
ΔtP2 = ΔtPc − γ12 TGD .
(9.27)
On peut également écrire les TGD en fonctions des biais instrumentaux. En partant de la première équation précédente, on a : Δtsat − δtP1 = Δtsat − δtPc − TGD .
(9.28)
En arrangeant l’équation précédente, on obtient les formules de transfert pour les horloges P1 , P2 et géométrique Pc : δtP1 = δtPc + TGD ,
(9.29)
δtP2 = δtPc + γ12 TGD .
(9.30)
Pour convertir un biais instrumental obtenu en combinaison géométrique en un biais instrumental mono-fréquence, il faut ajouter les TGD . Les biais instrumentaux mono-fréquence permettent également de calculer le TGD : TGD =
δtP1 − δtP2 . 1 − γ12
(9.31)
Exprimées en mètre (en multipliant par la vitesse de la lumière), les formules de transfert précédentes donnent : B P1 = B Pc + cTGD ,
(9.32)
B P2 = B Pc + γ12 cTGD .
(9.33)
où, de façon équivalente, en rajoutant le décalage d’horloge Δt des deux côtés des équations, on obtient le transfert d’une horloge géométrique en horloge mono-fréquence : sat
hP1 = hPc + cTGD ,
(9.34)
hP2 = hPc + γ12 cTGD .
(9.35)
Pour le lecteur curieux de consulter l’ICD-GPS à ce sujet (IS-GPS-200), la table de correspondance entre la notation de cet ouvrage et celles du document IS-GPS-200 est proposée :
La diffusion des biais d’horloge satellite dans le message de navigation Notations utilisées sat
τ ΔtPc ΔtP1 ΔtP2 tP1 tP2 tPc
139
Notations IS-GPS-200 tSV ΔtSV (ΔtSV )L1P (Y ) (ΔtSV )L2P (Y ) t1 t2 t
Les TGD sont référencés à une valeur empirique absolue de biais instrumental satellite. Le lien entre TGD et DCB est donné par : DCB P1 −P2 = (1 − γ12 ) TGD + α,
(9.36)
avec α un facteur constant de recalage à une référence commune. Dans le cas où les DCB sont fournis par le centre IGS, la constante α fluctue en fonction de l’évolution de la constellation GPS et des nouveaux satellites contribuant par de nouveaux biais. On remarque enfin que l’équation précédente peut s’écrire, une fois ramenée à une référence commune, sous la forme : TGD + DCB P2 −P1 = γ12 TGD .
(9.37)
Toutes les informations concernant les biais de temps sont rassemblées dans la figure 9.1. Pour le système Galileo, le processus de diffusion des biais passe par la quantité Broadcast Group Delay (BGD) dont la définition est identique aux TGD : BGD ≡ TGD . (9.38) Les utilisateurs civils en particulier, qui traitent les signaux L1C/A, peuvent appliquer directement le TGD avec l’approximation que le DCB C1 −P1 est nul. Cela n’est pas rigoureusement le cas. Aussi, afin d’améliorer la précision du service de positionnement, le système GPS diffuse également des biais supplémentaires, les corrections inter-signaux (ISC pour l’acronyme anglosaxon Inter Signal Correction) qui permettent de transférer les horloges géométrique de code P en horloge C/A et C2 pour les mesures de code. Ces biais sont référencés en horloges P1 et définis dans le document d’interface IS-GPS-200 par : ISCL1C/A = tP1 − tL1C/A = DCB P1 −L1C/A , (9.39) ISCL2C = tP1 − tL2C = DCB P1 −L2C . Avec cette définition, on peut écrire trivialement : tL1C/A = tP1 − tP1 − tL1C/A , tL2C = tP1 − tP1 − tL2C ,
(9.40)
(9.41) (9.42)
140
Le temps dans la géolocalisation par satellites
Fig. 9.1 – Les différents biais de temps au niveau satellite sur les échelles de temps propre et de temps système. Le signal est construit à la date tsat et les codes P1 et P2 sont émis respectivement aux dates tP1 et tP2 aux centres de phase f1 et f2 de l’antenne. Le signal associé à la combinaison géométrique est émis à la date tPc en sortie d’antenne. Les TGD et DCB servent au transfert de temps d’émission entre ces signaux. Soit : tL1C/A = tP1 − ISCL1C/A , tL2C = tP1 − ISCL2C . tsat P1
(9.43) (9.44) sat
en fonction du temps τ , on En développant ces expressions selon obtient : tL1C/A = τ sat − ΔtPc − TGD + ISCL1C/A , (9.45) tL2C = τ sat − ΔtPc − TGD + ISCL2C . (9.46) Les biais d’horloges se définissent alors de la façon suivante : tL1C/A = ΔtPc − TGD + ISCL1C/A ,
(9.47)
tL2C = ΔtPc − TGD + ISCL2C .
(9.48)
En pratique, les biais inter-signaux ISC sont de faibles amplitudes, de l’ordre de quelques centimètres, il est courant de les négliger.
La diffusion des biais d’horloge satellite dans le message de navigation
9.3
141
Utilisation des signaux civils
On a vu que l’utilisateur bi-fréquence qui utilise les signaux L1P(Y) et L2P(Y) pouvait complètement corriger les biais instrumentaux ainsi que les délais ionosphériques par la combinaison géométrique des mesures. Une fois lissé le bruit de mesure et les éventuels multi-trajets avec la mesure de phase, la combinaison géométrique s’écrit : Pc = R + hPc − hPc + T. (9.49) Avec cette formulation, l’utilisateur corrige la composante horloge satellite hPc = cΔtPc avec les données du message de navigation puis détermine la position des satellites aux temps d’émission. Il peut alors résoudre sa position ainsi que son biais d’horloge hPc . En notant ρ = R + hPc pour condenser la notation, il vient : ρ + T = Pc + hPc . (9.50) Le second membre est entièrement calculable et permet, avec plusieurs satellites, de déterminer ρ et T . Les utilisateurs qui n’ont pas accès aux signaux cryptés L1P(Y) et L2P(Y) vont utiliser les signaux L1C/A et C2. Cependant, il leur faut corriger les biais instrumentaux qui leur sont propres et qui sont différents de ceux des signaux cryptés. En effet, les équations de mesures lissées s’écrivent : C/A = R C2 = R
+ hC 1 − hC 1 + hC 2 − h C 2
+e + γ12 e
+T , +T
(9.51)
où les biais de temps hC1 = cΔtC1 et hC2 = cΔtC2 sont spécifiques à chacune des deux mesures. On va donc introduire les corrections diffusées dans le message de navigation, biais d’horloge de la combinaison géométrique des mesures, TGD et ISB tels qu’assemblés précédemment : C/A C2
= R = R
+ hC1 − hPc + hC2 − hPc
+ cTGD + cTGD
− c.ISCL1C/A − c.ISCL2C
+e + γ12 e
+T . +T (9.52)
La combinaison géométrique s’écrit alors : ISCL2C − γ12 ISCL1C/A C2 − γ12 C/A = R+hCc −hPc +cTGD −c +T. (9.53) 1 − γ12 1 − γ12 On arrive alors facilement à extraire l’expression des paramètres ρ et T à résoudre : (C2 − γ12 C/A) + c ISCL2C − γ12 ISCL1C/A − cTGD + hPc . (9.54) ρ+T = 1 − γ12 L’utilisation des signaux L1C/A et C2 est donc plus délicate pour le calcul de positionnement que pour les signaux L1P(Y) et L2P(Y) car elle nécessite la prise en compte des TGD et ISB dans la combinaison géométrique de ces signaux.
142
9.4
Le temps dans la géolocalisation par satellites
Le calcul du délai ionosphérique
La formulation de la combinaison ionosphérique permet d’extraire le calcul du délai ionosphérique qui affecte le signal sur la fréquence L1 : e=
P2 − P1 − IF Brec − IF B sat . (γ12 − 1)
(9.55)
Ce calcul contient bien sûr le bruit de mesures de code et les effets du multitrajet. Il convient de traiter cette information de façon à filtrer ces erreurs. Il est tout à fait possible de calculer le retard ionosphérique avec les mesures de code C, soit les mesures C/A et C2 . Tout le mécanisme de construction est identique et l’on a : e=
C2 − C/A − cDCBC2 −C1 − cDCB C2 −C1 . (γ12 − 1)
(9.56)
Il faut toutefois préciser que la mesure C/A est moins précise que la mesure P1 contenant le code militaire.
Chapitre 10 Les références d’espaces Le problème de la navigation par GPS est de déterminer la position d’un récepteur dans le repère terrestre. L’intérêt pour l’utilisateur de résoudre sa position dans un repère lié à la Terre est d’ordre pratique : si l’utilisateur est immobile, ses coordonnées de positionnement doivent également rester inchangées. Pour des questions pratiques, il est impératif de diffuser à l’utilisateur des éphémérides des satellites en repère terrestre, c’est-à-dire dans un repère qui est directement accessible à un utilisateur terrestre. Par contre, le calcul de ces éphémérides, c’est-à-dire la résolution de l’équation m¨r = F , doit être menée dans un repère inertiel car si l’on voulait résoudre l’équation du mouvement dans le repère terrestre, il faudrait prendreen compte les termes d’entraînement et de Coriolis supplémentaires m¨r = F − ω ∧ ω ∧ r − 2ω ∧ r˙ où ω est la vitesse de rotation de la Terre, ce qui complique sérieusement la solution. Le problème de navigation pourrait également être complètement résolu en repère utilisateur. Cependant, il faut garder à l’esprit que, dans ce repère tournant, la lumière ne se déplace plus en général en ligne droite, sauf pour un observateur qui la mesure localement, c’est-à-dire à l’endroit où il se trouve. Ceci complique fortement la résolution du problème. Le temps de transmission sat vers un récepteur terd’un signal voyageant d’un satellite positionné à X sat restre positionné à Xrec n’est plus ||Xrec − X ||/c en repère terrestre alors que le calcul est valable en repère inertiel. Pour cette raison, le problème de navigation est grandement simplifié si l’on résout les équations de propagation en repère inertiel. Il faut donc définir le repère inertiel dans lequel on effectue les calculs de localisation puis faire, si nécessaire, les opérations de transformation de coordonnées pour retrouver une position en repère terrestre. On voit donc la nécessité de définir différents types de repères : un repère terrestre dans lequel seront rapportées les positions utilisateurs, et un repère inertiel dans lequel seront menés les calculs d’orbites et les équations de propagation. Il faut disposer des transformations les plus simples possibles pour passer d’un repère à un autre. La construction de ces repères, auxquels on réfère un positionnement, est une problématique très ancienne qui a fait l’objet de grands développements
144
Le temps dans la géolocalisation par satellites
au cours de l’histoire des sciences. Un exposé de ces travaux et de l’état de l’art sur ce sujet fondamental est proposé par le livre de Boucher et Capitaine (2017).
10.1
Changement de base et transformations de coordonnées
Il convient ici de poser le formalisme de transformation des coordonnées. Les transformations de changement de base et de coordonnées sont simples mais « dangereuses » d’utilisation. On rappelle ici les notions d’algèbre linéaire qui conduisent à ces formulations. On considère unespace vectoriel E de dimension n muni des bases B1 = e11 · · · e1n et B2 = e21 · · · e2n . Les vecteurs e2i s’écrivent comme combinaison linéaire des vecteurs e1i : e2j =
n
pij e1i .
(10.1)
i=1
La matrice de passage de la base B1 à la base B2 est la matrice P1→2 = (pij ) de l’application « identité » : Id
(E, B1 ) −→ (E, B2 ) ,
(10.2)
dont les colonnes sont les composantes des vecteurs e2i dans la base B1 . ⎛
e21
p11 P1→2 = ⎜ ⎝ ··· pn1
· · · e2n ⎞ · · · p1n ⎟ .. . ··· ⎠ · · · pnn
e11 .. . e1n
.
(10.3)
Considérons comme exemple le cas le plus simple de la dimension 2. La figure 10.1 illustre un mouvement de rotation directe (sens trigonométrique) d’angle θ de la base B1 à la base B2 . La matrice de changement de base de B1 à B2 est la matrice de rotation :
cos θ − sin θ . (10.4) P1→2 = R (θ) = sin θ cos θ Une matrice de rotation est une transformation orthogonale (les distances sont préservées) qui vérifie la relation : R−1 (θ) = R (−θ) = Rt (θ) .
(10.5)
Un point de confusion doit être levé sur la matrice de rotation. Les matrices de rotations décrivent les changements d’une base par rapport à une autre mais
Les références d’espaces
145
Fig. 10.1 – Mouvement de rotation appliqué au changement de bases. Ici on passe de la base B1 à la base B2 par la rotation d’angle θ.
Fig. 10.2 – Exprimé dans la même base, le mouvement de rotation est un endomorphisme.
représentent également l’endomorphisme qui transforme un vecteur de E en un autre dans la même base : R(θ)
(E, B1 ) −→ (E, B1 ) .
(10.6)
Si v1 est un vecteur de (E, B1 ), alors l’effet de la rotation d’angle θ sur v1 est le vecteur de (E, B1 ) défini par v2 = R (θ) v1 comme l’illustre la figure 10.2. Dans le cadre de l’exposé, nous utilisons les rotations comme matrice de changement de base et non pas en tant qu’endomorphisme. Intéressons-nous aux changements de coordonnées de vecteurs. Soit X un t vecteur de E de composantes X1 = x11 · · · x1n dans la base B1 et de t composantes X2 = x21 · · · x2n dans la base B2 . Exprimons le vecteur X dans les deux bases : ⎛ ⎞ n n n n n n ⎝ X= x1i e1i = x2j e2j = x2j pij e1i = pij x2j ⎠ e1i . (10.7) i=1
j=1
j=1
i=1
i=1
j=1
146
Le temps dans la géolocalisation par satellites
L’identification des termes x1i aux termes
n j=1
pij x2j revient à faire l’opération
matricielle suivante (a priori contre-intuitive) : X1 = P1→2 X2 .
(10.8)
Le point délicat – source de confusions – est la nature contravariante de l’opérateur de changement de base. Comme on le voit, une matrice de passage de la base B1 à la base B2 transforme un vecteur exprimé dans la base B2 vers le même vecteur exprimé dans la base B1 . Les coordonnées X2 se déduisent donc des coordonnées X1 par la transformation inverse : −1 X2 = P1→2 X1 .
(10.9)
Si l’on reprend l’exemple précédent, le changement de coordonnées s’écrit : X2 = R (−θ) X1 .
(10.10)
Ici le vecteur X ne tourne pas : on exprime simplement ses coordonnées dans deux systèmes de bases différentes, X1 représente ses coordonnées dans la base initiale B1 et X2 sont les nouvelles coordonnées exprimées dans la base B2 qui se déduit de B1 par la rotation directe d’angle θ. Considérons maintenant deux changements de bases successifs, la première fait passer de la base B1 à la base B2 , et la seconde fait passer de la base B2 à la base B3 , avec pour matrice de passage respectives les matrices P1→2 et P2→3 . Ces transformations sont illustrées par la composition suivante de l’identité : Id Id (E, B1 ) −→ (E, B2 ) −→ (E, B3 ) . (10.11) Nous cherchons la matrice de passage de la base B1 à la base B3 . On peut écrire : X1 = P1→2 X2 ,
(10.12)
X2 = P2→3 X3 .
(10.13)
X1 = P1→2 P2→3 X3 .
(10.14)
P1→3 = P1→2 P2→3 .
(10.15)
Donc : Par conséquent : La matrice de passage P1→3 de la base B1 à B3 s’écrit comme la multiplication à droite des deux matrices de passages successives P1→2 et P2→3 . Si l’on se restreint aux bases orthonormales, il est toujours possible de passer d’une base à une autre par le produit d’au plus n rotations élémentaires. Dans le cadre de la dimension trois qui nous intéresse ici, les matrices de rotations élémentaires sont définies de la façon suivante : R1 (α) est la rotation directe autour de l’axe e1 = x : ⎞ ⎛ 1 0 0 (10.16) R1 (α) = ⎝ 0 cos α − sin α ⎠ , 0 sin α cos α
Les références d’espaces R2 (α) est la rotation directe autour de l’axe e2 = y : ⎞ ⎛ cos α 0 sin α 0 1 0 ⎠, R2 (α) = ⎝ − sin α 0 cos α R3 (α) est la rotation directe autour de l’axe e3 = z : ⎞ ⎛ cos α − sin α 0 R3 (α) = ⎝ sin α cos α 0 ⎠ . 0 0 1
147
(10.17)
(10.18)
Le passage d’une base B1 orthonormée à la base B2 orthonormée peut être réalisé par la composition de ces trois rotations. Dans cette composition, chaque rotation est définie par rapport à la précédente. La première correspond à une rotation autour de l’axe e3 = z d’angle α3 , suivie d’une seconde autour de l’axe e2 = y d’angle α2 suivie d’une troisième autour de l’axe e1 = x d’angle α1 . Chacune de ces rotations peut elle-même être vue comme une matrice de passage d’un changement de base intermédiaire pour aller de B1 à B2 . La composition de ces rotations successives est obtenue selon la loi de composition de matrices de passage citée plus haut, c’est-à-dire une multiplication à droite des matrices de rotations : P1→2 = R3 (α3 ) R2 (α2 ) R1 (α1 ) .
(10.19)
Le changement de coordonnées s’écrit : X1 = R3 (α3 ) R2 (α2 ) R1 (α1 ) X2 ,
(10.20)
X2 = R1 (−α1 ) R2 (−α2 ) R3 (−α3 ) X1 .
(10.21)
soit : Remarquons que la plupart des auteurs ont fait le choix de travailler sur les matrices de changement de coordonnées et donc définissent les rotations élémentaires comme l’inverse des matrices que nous avons posées. Dans cet ouvrage, nous optons pour l’utilisation des matrices de changement de base, qui nous semble plus intuitive, et conforme aux définitions d’algèbre linéaire.
10.2
Mouvements de l’axe de rotation de la Terre
La Terre a un noyau visqueux et la croûte terrestre est le siège de déplacements qui génèrent des efforts de cisaillement et de friction entre les différentes plaques. L’axe de rotation de la Terre n’est pas fixe sur la croûte terrestre et il se déplace par rapport aux étoiles. La croûte terrestre subit de façon permanente des déformations sous l’effet de la géophysique interne (tectonique des plaques, activité volcanique. . . ) et
148
Le temps dans la géolocalisation par satellites
d’excitations externes comme les marées terrestres et la charge des océans, par exemple. Pour exprimer le déplacement d’un point sur la croûte terrestre, il est nécessaire de définir une croûte terrestre moyenne par rapport à laquelle on exprime les déformations de la croûte vraie. Par construction, la croûte moyenne est indéformable. Sur cette croûte moyenne, l’axe instantané de rotation de la Terre n’est pas fixe car il ne correspond pas exactement à l’axe principal d’inertie de la Terre. Quand la rotation s’effectue exactement sur l’axe principal d’inertie, elle continue invariablement autour de cet axe. Mais lorsque le mouvement déroge à cette configuration, alors le pôle de rotation décrit un cercle autour du pôle d’inertie avec une période qui est proportionnelle à la différence relative entre les moments d’inertie polaire et équatorial. Sur la Terre, les amplitudes de ces cercles sur la croûte terrestre évoluent à l’intérieur d’un carré d’une vingtaine de mètres de côté. Ce mouvement a deux composantes principales. La première est l’oscillation d’ouest en est de Chandler, à la période de 14 mois, qui s’interprète comme le mouvement circulaire de l’axe de rotation, auquel se rajoute l’effet de l’élasticité de la croûte terrestre et du déplacement des océans. Le second est une oscillation annuelle due au déplacement saisonnier de l’atmosphère. Enfin, se rajoutent de petits mouvements rapides qui dépendent de phénomènes géophysiques imprédictibles. Le plan de l’orbite terrestre autour du Soleil est nommé plan de l’écliptique, il est incliné par rapport au plan équatorial d’un angle qui vaut environ 23◦ 26’. La variabilité de l’orbite terrestre autour du Soleil implique la variabilité du plan de l’écliptique autour d’un plan moyen. L’intersection entre le plan équatorial et le plan de l’écliptique moyen définit un axe privilégié appelé ligne des nœuds céleste. Si on se place au niveau du centre Terre, le Soleil se déplace dans le plan de l’écliptique et traverse les nœuds une fois par an au moment des équinoxes. Le nœud céleste ascendant est le nœud céleste correspondant au passage apparent du Soleil de l’hémisphère sud vers l’hémisphère nord, il est également appelé point de l’équinoxe de printemps ou encore point vernal. Par rapport aux étoiles, l’axe de rotation décrit des mouvements qui paraissent périodiques. Si on admet actuellement que l’axe de rotation pointe vers l’étoile polaire, il n’en sera plus de même dans quelques centaines d’années. La composante principale de ce mouvement est appelée précession, il fait décrire à l’axe de rotation de la Terre un cône autour de l’axe de l’écliptique (axe orthogonal au plan de l’écliptique) en environ 26000 ans ; c’est un terme linéaire en fonction du temps. La seconde composante est une somme de termes périodiques, la nutation, qui se traduit par des mouvements oscillatoires de l’axe de rotation autour du cône de précession, avec des périodes comprises entre 9 jours et 18,6 ans et des excursions pouvant atteindre 9,21”. Les mouvements de précession et nutation sont illustrés en figure 10.3. Ces mouvements de précession et nutation résultent des effets de couples d’attraction exercés par les corps extérieurs sur le renflement équatorial de la Terre. Le mouvement de précession résulte de la partie constante de ce couple de forces et comprend comme principaux contributeurs la Lune et le Soleil.
Les références d’espaces
149
Fig. 10.3 – Mouvements de précession et de nutation de l’axe de rotationterrestre.
Le mouvement de nutation traduit la partie variable en fonction des angles entre le plan équatorial et la direction des corps perturbateurs. La période long terme de la nutation provient du fait que le plan de l’orbite de la Lune n’est pas contenu dans le plan de l’écliptique. Seule la technique VLBI donne accès à la mesure de la nutation. En réalité, l’axe de rotation instantané de la Terre est difficilement observable du fait, d’une part, que les mouvements sont complexes, imprédictibles pour leurs faibles amplitudes, et, d’autre part, que les observations ne sont pas instantanées. Le lecteur intéressé trouvera des explications détaillées de la théorie de précession et nutation dans l’ouvrage de Simon et al. (1997) du Bureau des longitudes.
10.2.1
La sphère céleste, pôles et origines
Dans ce qui suit, les systèmes d’axes sont définis sur une sphère de rayon unité et positionnés au centre de masse de la Terre O incluant les océans et l’atmosphère. Les astronomes appellent cette sphère unité la sphère céleste. Un point P0 sur cette sphère définit automatiquement un grand cercle construit −−→ comme le plan passant par O et orthogonal au vecteur n0 = OP0 . Inversement, un grand cercle et une orientation définissent de façon univoque un point. Le couple point et cercle est nommé pôle et équateur. Cette sphère est rapportée à un système d’axes centré en O : l’axe z coupe la sphère au pôle P0 , un point σ0 , dit « origine » fixe sur l’équateur, définit l’axe x et l’axe y complète le trièdre. Ainsi, la donnée du couple pôle et origine (P0 , σ0 ) définit complètement le système d’axe (x0 , y0 , z0 ). L’orientation directe du trièdre (x0 , y0 , z0 ) induit une orientation naturelle sur l’équateur ainsi qu’un hémisphère nord et un hémisphère sud. Toutes ces définitions sont illustrées en figure 10.4.
150
Le temps dans la géolocalisation par satellites
Fig. 10.4 – Système de coordonnées dans la sphère céleste. Un point sur la sphère est repéré par les angles E et d.
Un point sur cette sphère est représenté par deux angles, l’angle E compté à l’équateur entre les méridiens passant par σ0 et P , puis l’angle d entre P0 et −− → P . Le vecteur unitaire n = OP a pour composantes : ⎞ ⎞ ⎛ sin d cos E u n = ⎝ v ⎠ = ⎝ sin d sin E ⎠ . cos d w ⎛
(10.22)
t
Les coordonnées (u, v, w) sont les cosinus directeurs du point P . L’équateur associé au pôle P coupe l’équateur associé au pôle P0 en deux points appelés nœuds. Le nœud à travers duquel l’équateur P passe de l’hémisphère sud à −−→ l’hémisphère nord est appelé nœud ascendant N . Le vecteur ON est noté l. On passe du pôle P0 au pôle P par la composition des rotations R3 (E) et R2 (d).
10.2.2
Origine non tournante
On s’intéresse ici au déplacement sur la sphère céleste du point P au cours du temps t dont la position à la date initiale t0 est P0 . Considérons également une origine σ sur l’équateur de P qui coïncide avec σ0 à t0 .
Les références d’espaces
151
Fig. 10.5 – Origine non tournante sur la sphère céleste. Lorsque le pôle P se déplace sur la sphère, le mouvement de l’origine σ associée ne glisse jamais le long de l’équateur de P mais reste toujours perpendiculaire à ce dernier. La transformation de la base 1 de pôle P0 et d’origine σ0 en une base 2 de pôle P et d’origine σ peut être réalisée par la composition des rotations 3-2-3 : P1→2 = R3 (E + 90◦ ) R2 (d) R3 (−E − 90◦ − s) .
(10.23)
La première rotation R3 (E + 90◦ ) positionne le nœud N , la seconde R2 (d) oriente l’équateur et la troisième R3 (−E − 90◦ − s) place l’origine σ sur l’équateur de P avec la quantité angulaire s. Le vecteur de vitesse angulaire du système d’axes (x, y, z) défini par la matrice de passage P1→2 s’écrit : ˙ n0 + d˙l − E˙ + s˙ n. ω = E (10.24) L’origine σ est dite non tournante si sa vitesse de déplacement sur la sphère reste toujours orthogonale à l’équateur de P , autrement dit le système d’axes (x, y, z) n’a aucune composante de rotation autour du vecteur n. Il s’agit d’une définition basée sur une condition purement cinématique (voir représentation en figure 10.5) introduite par Guinot (1979), puis reprise et développée par Capitaine et al. (1986). La propriété d’origine non tournante est respectée si, à tout instant, la projection orthogonale du vecteur de vitesse angulaire sur l’axe du pôle P de
152
Le temps dans la géolocalisation par satellites
rotation est nulle ce qui revient à vérifier la condition différentielle suivante :
c’est-à-dire si :
ω · n = E˙ cos d − E˙ − s˙ = 0,
(10.25)
s˙ = E˙ (cos d − 1) .
(10.26)
L’intégration de l’équation dans le temps fournit la quantité s : s(t) = s(t0 ) +
t t0
˙ = s(t0 ) − (cos d − 1)Edt
t t0
t (n ∧ n˙ ) · n0 uv˙ − v u˙ dt = s(t0 ) − dt. 1 + n · n0 t0 1 + w
(10.27) Pour de petits mouvements du pôle P autour de P0 , le développement de Taylor arrêté au premier ordre donne : 1 t ∼ s (t) = s (t0 ) − (uv˙ − v u) ˙ dt. (10.28) 2 t0 Notre hypothèse de faire coïncider σ avec σ0 à l’instant t0 signifie que s (t0 ) = 0.
10.3
Référentiel terrestre et céleste
Dans la majorité des traitements de données spatiales, il est nécessaire de convertir des données exprimées dans un repère inertiel ou céleste ou encore fixe par rapport aux étoiles dans un repère lié à la Terre dans sa rotation que l’on peut rapporter à des lieux géométriques avec parfois l’emploi de moyens de cartographie. Dans le domaine de la navigation, par exemple, la position des satellites se calcule en référentiel céleste parce que l’on recherche la meilleure inertie possible alors que le besoin utilisateur est une position dans un référentiel terrestre. L’objectif de cette section est de poser les éléments qui permettent de construire un référentiel terrestre (ITRS pour International Terrestrial Reference System), un référentiel inertiel (GCRS pour Geocentric Celestial Reference System), et les transformations de conversion entre eux, c’est-à-dire la matrice de passage que l’on construit avec les paramètres d’orientations de la Terre (EOP pour Earth Orientation Parameters). Préalablement à toute discussion, il convient de préciser les termes de systèmes et de repères de référence selon les conventions définies par les standards IERS.
10.3.1
Notions de système et repères de référence
Un système de référence (dont le mot équivalent anglais est « system »), ou encore référentiel, procède de concepts et définitions théoriques où l’on définit un système d’axes, mais ne peut pas être matérialisé. Un repère (dont le mot équivalent anglais est « frame ») est une réalisation, ou encore matérialisation du référentiel. On construit un repère qui réalise les
Les références d’espaces
153
conditions exprimées par le système de référence en donnant une distribution de coordonnées, en position et vitesse, d’un ensemble de points de référence à un instant donné. Par exemple, les coordonnées d’un réseau de stations sol pour le repère ITRF (International Terrestrial Reference Frame), réalisation de l’ITRS, les positions célestes des sources extragalactiques pour le repère ICRF (pour International Celestial Reference Frame, réalisation de l’ICRS, International Celestial Reference System), ou les coordonnées du même objet à plusieurs dates, comme les éphémérides des planètes (DE405, DE421, INPOP08) et des satellites (constellation GPS), sont des exemples de repères de référence.
10.3.2
Référentiel terrestre
Le référentiel pratique pour l’utilisateur est un repère dans lequel ses coordonnées restent inchangées lorsqu’il est immobile. Un tel référentiel est génériquement appelé référentiel ECEF pour Earth Centred Earth Fixed. Ce type de référentiel, dont l’origine est placée au centre de masse de la Terre, est automatiquement fixé à la croûte terrestre. Le référentiel ITRS est défini de telle sorte que les coordonnées ITRF d’un point fixe sur la surface de la Terre ait de faibles variations dans le temps dues aux effets de tectonique des plaques, des marées océaniques et terrestres, et du rebond post-glaciaire. L’orientation de l’ITRS est arbitraire : conventionnellement l’IERS a défini le pôle IRP, pour l’acronyme anglo-saxon de IERS Reference Pole, modélisée par les latitudes de plusieurs dizaines de stations de références moyennées sur une période de temps (1900–1905). L’origine du référentiel terrestre ITRS est le centre de masse de la Terre dans laquelle son atmosphère est prise en compte. Sur la sphère céleste, l’axe zIT RS est porté par la droite passant par l’origine et le pôle IRP. Le plan équatorial ITRS est le plan de référence pour l’origine des latitudes. L’axe xIT RS est défini comme l’intersection du plan équatorial et d’un méridien de référence pour l’origine des longitudes, celui de Greenwich. L’axe yIT RS est défini dans le plan équatorial ITRS et complète le trièdre. À strictement parler, l’axe zIT RF n’est pas aligné sur l’axe instantané de rotation de la Terre. L’évolution dans le temps de l’orientation de l’ITRS doit garantir que la résultante des mouvements de translation et de rotation de chaque élément de surface de la croûte terrestre, étendue à la surface totale, soit nulle. L’ITRF est fourni par un ensemble de coordonnées de points de références au sol dont les évolutions temporelles sont données par rapport à un ensemble de positions et vitesses connues à une date de référence t0 : (t) = X 0 + V0 (t − t0 ) + X
i (t) . ΔX
(10.29)
i
Les corrections ΔXi dépendent des déformations temporelles de la croûte terrestre. Parmi elles, les marées terrestres sont une réponse aux effets gravitationnels de la Lune avec des effets journaliers compris entre 20 et 50 cm.
154
Le temps dans la géolocalisation par satellites
Viennent ensuite les effets de charge des marées océaniques et les effets des variations de la pression atmosphérique (quelques centimètres). Un autre exemple de réalisation de l’ITRS est le système WGS84 qui est le repère utilisé pour les éphémérides GNSS radiodiffusées pour le positionnement et qui convient pour des applications ne nécessitant pas plus de 10 cm de précision. Pour des applications de haute précision de type géodésie, seul l’ITRF doit être considéré.
10.3.3
Référentiel céleste
Le référentiel pratique pour le calcul de trajectoires de satellites est un référentiel géocentrique inertiel, c’est-à-dire un référentiel dans lequel, en l’absence de contraintes extérieures, un corps est soit immobile soit en mouvement rectiligne uniforme. Un tel référentiel est génériquement appelé référentiel ECI pour Earth Centred Inertial. Ses axes ont une orientation fixe par rapport aux étoiles. Par exemple, le référentiel GCRS pour Geocentric Celestial Reference System est un référentiel au centre de masse de la Terre défini dans le cadre de la relativité générale par la résolution 2000 de l’Union astronomique internationale (IAU). Dans la pratique, la réalisation d’un tel référentiel se base sur les coordonnées d’un ensemble de sources radio d’objets lointains, principalement les quasars.
10.3.4
Les transformations entre les référentiels céleste et terrestre
Les transformations qui sont décrites sont celles adoptées et recommandées par les conventions IERS en utilisant les notions introduites dans les résolutions 2000 et 2006 de l’IAU. Dans la sphère céleste, tout changement de référentiel se fait via une série de rotations. Comme nous l’avons dit, il suffit de trois rotations, de type 3-2-1 ou 3-2-3 pour passer d’un système d’axes à un autre, soit trois angles d’Euler en fonction du temps. Cependant, pour passer du référentiel céleste au référentiel terrestre, l’IAU a préféré définir un système d’axes intermédiaire rattaché à un pôle de rotation appelé pôle céleste intermédiaire (CIP pour son acronyme anglo-saxon Celestial Intermediate Pole). Par convention, la rotation diurne de la Terre s’effectue sur cet axe. Ce dernier se déplace à la fois dans les référentiels ITRF et GCRF. Le pôle CIP est défini de façon conventionnelle afin de séparer les composantes de son mouvement en mouvement lent dans le GCRF et rapide dans l’ITRF. Seuls les mouvements dont les périodes sont supérieures à deux jours sont associés au mouvement céleste du CIP, tout le reste du spectre est associé au mouvement terrestre. Ainsi, la transformation de référentiel terrestre en référentiel inertiel se fait par la donnée de cinq paramètres fonction du temps appelés Earth Orientation
Les références d’espaces
155
Fig. 10.6 – Les coordonnées du pôle céleste intermédiaire CIP sont (xP , yP ) dans le référentiel ITRS et (XP , YP ) dans le référentiel GCRS. Le mouvement de rotation de la Terre est pris en compte sur l’équateur du CIP bien que l’axe de rotation instantanée de la Terre ne passe pas par le CIP mais lui reste proche.
Parameters (OEP pour son acronyme anglo-saxon). Quatre sont associés aux coordonnées du CIP sur la sphère céleste vue du référentiel terrestre et céleste : – deux coordonnées (xP , yP ) spécifient la position du CIP dans l’ITRS et traduisent le mouvement du pôle de rotation sur la croûte terrestre autour du pôle IRP. La coordonnée yP est comptée positivement vers l’ouest ; – un angle compté sur l’équateur CIP qui traduit le mouvement diurne de la Terre ; – deux coordonnées (XP , YP ) spécifient la position du CIP dans le GCRF et traduisent le mouvement du pôle de rotation par rapport aux étoiles, principalement la précession et la nutation. La figure 10.6 illustre les relations entre les référentiels ITRS et GCRS dans les plans tangents à la sphère céleste aux axes zIT RS et zGCRS , ainsi que l’axe de rotation instantanée porté par le vecteur ω qui traduit le mouvement réel de rotation de la Terre. Dans le processus de transformation de référentiels, la rotation de la Terre est prise en compte autour du pôle CIP qui est une moyenne journalière du pôle de rotation instantanée. Dans la pratique, les conventions IERS modélisent les coordonnées (XP , YP ) du pôle CIP dans le GCRF comme la somme des coordonnées (Xmod , Ymod ) du pôle fournies par les modèles de précession nutation IAU2000/2006 et des corrections temporelles (dX, dY ) vues comme des écarts au modèle sur les deux composantes par rapport au mouvement du CIP observé
156
Le temps dans la géolocalisation par satellites
Fig. 10.7 – Mouvement du pôle dans le repère terrestre donné par l’IERS entre avril 2017 et février 2018. dans le GCRF. De même, les coordonnées du pôle CIP dans l’ITRS (xP , yP ) à la date souhaitée sont la somme de plusieurs termes : (xP , yP ) = (x, y)IERS + (Δx, Δy)mar´ees oc´eaniques + (Δx, Δy)libration . (10.30) Le premier terme est la composante moyenne interpolée à la date dans les données fournies par l’IERS. Son amplitude est inférieure à une seconde d’arc soit environ 30 m sur la croûte terrestre. Le second traduit l’effet des marées océaniques sur la position du pôle à la période et demi-période journalière avec une amplitude inférieure à une milliseconde d’arc (1 mas) soit 3 cm. Le dernier terme traduit les mouvements rapides non modélisables à période inférieure à deux jours (donc non imputable à des effets de nutation par convention), liés à la définition du CIP et dont l’amplitude est inférieure à 0,03 mas soit environ 1 mm. La figure 10.7 illustre le mouvement du pôle CIP dans le repère ITRF entre le mois d’avril 2017 et février 2018. Ce mouvement inclut les variations diurnes et semi-diurnes produites par les marées océaniques. Les cinq paramètres EOP (Earth Orientation Parameters) suggèrent de construire trois rotations pour transformer le référentiel GCRF vers le référentiel ITRF. La première, notée Q (t), correspond au basculement du pôle GCRS au pôle CIP, la seconde, notée R (t), représente la rotation de la Terre autour de l’axe CIP, enfin la troisième W (t) correspond au basculement du pôle CIP au pôle ITRS. Ces trois rotations sont associées à trois matrices de passage qui définissent implicitement deux référentiels intermédiaires nécessaires
Les références d’espaces
157
Fig. 10.8 – Rotation diurne de la Terre autour du pôle CIP. Passage du référentiel terrestre TIRF au référentiel céleste CIRF par la rotation d’angle ERA.
dans cette transformation. Le premier est le référentiel CIRS pour Celestial Intermediate Reference System dont la matrice de passage PGCRS→CIRS est la rotation Q (t). Le second est le référentiel TIRS pour Terrestrial Intermediate Reference System dont la matrice de passage PT IRS→IT RS est la rotation W (t) (la lettre W étant retenue par rapport au terme anglais wobble correspondant à la notion d’oscillation). La rotation diurne de la Terre définit la matrice de passage PCIRS→T IRS égale à la rotation R (t). Cette rotation s’effectue dans l’équateur CIP autour des axes communs zT IRS et zCIRS entre deux points origines sur l’équateur CIP, respectivement le point CIO pour Celestial Intermediate Origin sur l’axe xCIRS et le point TIO pour Terrestrial Intermediate Origin sur l’axe xT IRS . L’angle entre les points TIO et CIO, compté positivement dans le sens rétrograde, rend compte de la rotation de la Terre. Il est appelé ERA pour Earth Rotation Angle (voir la figure 10.8). Comme on souhaite que les origines du TIRS et du CIRS rendent parfaitement compte de la rotation sidérale de la Terre, il est nécessaire que les points TIO et CIO ne soient pas affectés des mouvements de rotation parasites d’origine cinématique exclusivement imputables au mouvement du pôle sur la
158
Le temps dans la géolocalisation par satellites
Fig. 10.9 – Angle ERA entre les origines non tournantes CIO et TIO placées sur l’équateur CIP.
sphère céleste à la fois par rapport à l’ITRS et au GCRF. Les origines doivent donc être non tournantes, le TIO par rapport à l’ITRS et le CIO par rapport au GCRF (voir la figure 10.9). Le temps UT1 est proportionnel à l’angle ERA de rotation terrestre autour de son axe instantané de rotation. La Terre ne tourne pas à vitesse constante, la ˙ e . Le jour est vitesse angulaire de la Terre varie autour de sa valeur moyenne Ω donc de durée variable. La variation de la longueur du jour (LOD pour Length of Day dans sa terminologie anglo-saxone) est définie comme la différence entre le nombre de secondes écoulées dans le jour mesuré par UT1 et 86 400. Elle dépend des mécanismes de couplage entre le noyau fluide de la Terre et sa surface solide, de forçage géophysique par les océans (effets de marées) et l’atmosphère (effet de friction et de pression) sur la croûte terrestre. Tous ces effets génèrent une dissipation de l’énergie de rotation de la Terre et entraînent une décroissance séculaire de la vitesse de rotation. L’augmentation de la LOD est en moyenne de 2 millisecondes par siècle. Il y a 2 milliards d’années, une journée durait 10 heures, il y a 400 millions d’années un an était composé de 400 jours de 22 heures. Cependant, la vitesse de rotation de la Terre connaît également des variations irrégulières qui peuvent produire des accélérations transitoires qui se traduisent par des ajouts de seconde intercalaire dans l’écart entre le TAI et l’UT1. Au final, la transformation du référentiel céleste au référentiel terrestre est donnée par le produit des matrices de passage : PGCRS→IT RS = PGCRS→CIRS PCIRS→T IRS P T IRS→IT RS = Q (t) R (t) W (t) . (10.31) Les différentes matrices de passage s’explicitent sur la sphère céleste de la façon suivante : 1. passage du GCRF au système de référence céleste intermédiaire CIRS : PGCRS→CIRS = R3 (E) R2 (d) R3 (−E − s) .
(10.32)
La rotation R3 (E) positionne le nœud N , la rotation R2 (d) oriente l’équateur CIP, la rotation R3 (−E − s) positionne le CIO.
Les références d’espaces
159
La matrice de passage du référentiel GCRF au CIRF peut se reformuler avec les cosinus directeurs du pôle CIP dans le GCRF : ⎛
PGCRS→CIRS
X2
p ⎜ 1 − 1+ZP ⎜ ⎜ XP YP = Q (XP , YP , s) = ⎜ ⎜ 1+ZP ⎝ XP
t s=− t0
XP YP 1+ZP
1−
⎞ −XP
Yp2 1+ZP
−YP
YP 1−
2 +Y 2 Xp p 1+ZP
XP Y˙P − YP X˙P dt, 1 + ZP
⎟ ⎟ ⎟ ⎟ R3 (−s) , ⎟ ⎠
(10.33)
(10.34)
2. passage du système de référence céleste intermédiaire CIRS au système de référence céleste intermédiaire TIRS : PCIRS→T IRS = R3 (−ERA) .
(10.35)
La rotation R3 (−ERA) place le TIO ; 3. passage système de référence céleste intermédiaire TIRS à l’ITRS : PT IRS→IT RS = R3 (F + s ) R2 (−g) R3 (−F ) .
(10.36)
La rotation R3 (F + s ) positionne le nœud N , la rotation R2 (−g) oriente l’équateur de l’ITRS et la rotation R3 (−F ) positionne l’origine équatoriale de l’ITRS. Du fait de la faible valeur des angles mis en jeu pour le mouvement du pôle CIP dans le référentiel ITRS, la dernière transformation peut se reformuler avec les cosinus directeurs du pôle CIP dans l’ITRS et le jeu de rotations 3-2-1 : PT IRS→IT RS = R3 (s ) R2 (−xP ) R1 (−yP ) , 1 t (xP y˙ p − yp x˙ p )dt. s = 2 t0
(10.37) (10.38)
La matrice de passage PGCRS→IT RS fournit la loi de transformation des coordonnées ITRS vers GCRF : GCRS = Q (t) R (t) W (t) X IT RS . X
(10.39)
Le schéma de la figure 10.10 illustre cet enchaînement de rotations. Ces différentes matrices de passages sont également décrites dans le livre de Chapront-Touzé et al. (1994). Un référentiel fixe par rapport aux étoiles et lié à la Terre est également nommé ECI pour Earth Centred Inertial. Il tombe librement avec la Terre dans le champ gravitationnel généré par les autres corps du système solaire.
160
Le temps dans la géolocalisation par satellites
Fig. 10.10 – Transformations standards du référentiel inertiel GCRF vers le référentiel terrestre ITRS.
Le référentiel GCRF n’est pas complètement inertiel du fait de son attachement au centre de masse de la Terre. En effet, la trajectoire de la Terre n’est ni uniforme en intensité ni en ligne droite en direction. Il faut donc prendre en compte une accélération complémentaire qui provient de l’action du Soleil sur la Terre pour écrire les équations du mouvement.
10.3.5
Les référentiels pour le calcul du positionnement par GNSS
Nous venons précédemment de définir deux classes de référentiel : le référentiel ITRS (réalisé par le repère WGS84 ou ITRF plus précis) non inertiel mais pratique pour l’utilisateur, et le référentiel inertiel GCRF dans lequel on exprime les équations du mouvement et de propagation. La conversion de la position des centres de phase des satellites, donnés en repère terrestre ECEF, en repère inertiel ECI nécessite de disposer à tout moment des cinq paramètres d’orientations de la Terre, ce qui suppose que l’utilisateur reçoive régulièrement les valeurs de ces paramètres. Le document ICD-GPS-705 dédié aux utilisateurs L1-L5 diffuse dans le message 32 les trois premiers paramètres d’orientation de la Terre, les mouvements du pôle de rotation (xP , yP ) et l’angle ERA de rotation de la Terre. On suppose donc que, durant la propagation du signal de la constellation au récepteur, l’axe instantané de la Terre reste fixe par rapport aux étoiles. On a alors la transformation : ECI = R (t) W (t) X ECEF . X
(10.40)
Les références d’espaces
161
Le document ICD-GPS-200 dédié aux utilisateurs L1-L2 ne diffuse aucun paramètre de mouvements du pôle de rotation. L’utilisateur fait donc l’emploi d’une formulation très simplifiée des transformations des coordonnées. Le passage d’un référentiel ECI en référentiel ECEF se fait par une simple rotation autour de l’axe du pôle conventionnel. La matrice de passage s’écrit : PECI→ECEF = R3 (θ) . (10.41) Ce qui donne pour expression du changement de référentiel : ECEF . ECI = R3 (θ) X X
(10.42)
Cette approximation est d’autant plus valide si l’on décide de fixer à un instant donné t0 le référentiel ECEF par rapport aux étoiles : à cette date le référentiel ECEF devient le référentiel ECI. En général, on choisit comme instant t0 soit la date d’événement de réception des signaux soit celle d’émission. L’angle θ ˙ e de rotation de la Terre : se calcule en fonction de la vitesse conventionnelle Ω θ = Ω˙ e . (t − t0 ) ,
(10.43)
˙ e = 7, 2921151467 × 10−5 rad.s−1 . avec pour valeur de la vitesse moyenne : Ω C’est cette dernière approche et formulation que nous adopterons dans la suite pour décrire le calcul de positionnement tel que le permettent les systèmes GNSS. ECI = X ˙ ECI et Le changement de référentiel appliqué aux vitesses V ˙ ECEF doit prendre en compte la vitesse de rotation de la Terre. VECEF = X Elle s’écrit : ECI = R3 (θ) V ECEF + ω ECEF , V ∧X (10.44) ou de façon équivalente : ECEF . VECI = R3 (θ) VECEF + ΩX
(10.45)
Le vecteur de rotation instantanée ω traduit la rotation autour de l’axe z qui est commun aux deux repères ECI et ECEF, son expression est : ⎛ ⎞ 0 (10.46) ω = Ω˙ e ⎝ 0 ⎠ . 1 La matrice Ω est la matrice de l’application ⎛ ˙e 0 −Ω ⎝ ˙ Ω= 0 Ωe 0 0
→ : linéaire X ω ∧ X ⎞ 0 0 ⎠. 0
(10.47)
Chapitre 11 Positionnement avec le système GPS Le calcul de positionnement est basé sur une trilatération à partir des mesures de distance entre un utilisateur (celui qui cherche à se repérer) et les satellites visibles. Le principe est le suivant. Une mesure de distance D1 réalisée avec un satellite X1 positionne le récepteur sur une sphère S1 de rayon D1 centrée sur X1 . De la même façon, une seconde mesure D2 réalisée avec un satellite X2 positionne le récepteur sur une sphère S2 de rayon D2 centrée sur X2 . Le récepteur est donc positionné à l’intersection transverse des sphères S1 et S2 c’est dire sur un cercle C. Une troisième mesure D3 réalise l’intersection transverse entre le cercle C et une nouvelle sphère S3 centrée sur X3 , soit deux points. En général, comme les distances mesurées sont relativement importantes, un des points est sur Terre (pour un utilisateur terrestre) ou proche de la Terre et l’autre vraiment éloigné ce qui permet de les discriminer (voir la figure 11.1). En réalité, on ne mesure pas directement des distances mais des temps de propagation de signaux émis au niveau satellite et reçus au niveau du récepteur. Les distances entre le satellite et le récepteur sont calculées en multipliant les temps de propagation par la vitesse de la lumière. Ces signaux ne peuvent pas être une simple porteuse sinusoïdale car il n’y a rien qui permette de marquer le début de l’émission, celle-ci étant périodique. On peut certes mesurer les variations de la phase (« carrier phase » pour son équivalent anglo-saxon) mais cela reste une mesure ambiguë. Un élément va donc être rajouté au signal, un code, qui va permettre de repérer le début de l’émission, correspondant à une phase de ce code (« code phase » pour son équivalent anglo-saxon). Le code est « pseudo-aléatoire » c’est-à-dire qu’il est parfaitement prédictible (on sait le générer) mais il ressemble à un signal aléatoire. Le temps de transmission est la différence entre la date de réception et celle de l’émission d’une marque dans le code. Or, pour définir une date il faut disposer d’horloges des deux côtés de la chaîne de transmission, une à l’émission, l’autre à la réception. Et pour construire une distance géométrique à partir de temps de transmission, il est essentiel que ces horloges soient synchronisées. Puisque le positionnement nécessite plusieurs mesures, il devient nécessaire que toutes les horloges
164
Le temps dans la géolocalisation par satellites
Fig. 11.1 – Principe de positionnement par GNSS. La position est déterminée comme l’intersection de sphères dont le rayon est obtenu à partir de temps de propagation de signaux de navigation. On parle également de trilatération. impliquées dans le calcul soient synchronisées entre elles, c’est-à-dire qu’elles marquent exactement la même heure. Et ce n’est pas tout : ces horloges doivent suivre une échelle de temps stable et continue, elles doivent donc théoriquement être parfaites. À supposer que celles des satellites le soient (ce sont des horloges atomiques, avec une redondance assurée par des horloges additionnelles embarquées sur chaque satellite), ce ne sera certainement pas le cas de l’horloge récepteur. Ces dernières présentent une exactitude typique de 10−5 , elles génèrent une erreur moyenne de désynchronisation de 86 400 × 10−5 = 0,864 secondes par jour, ce qui se traduit par des erreurs de distance de 0,864 × 3 × 108 = 2,592 × 108 mètres soit prêt de 260 000 km par jour ! Il est donc nécessaire de calculer le biais de temps de l’horloge récepteur comme inconnue supplémentaire dans le calcul du positionnement, ce qui implique de disposer d’une mesure de plus. Comme il faut trois coordonnées pour localiser une position dans l’espace, il faut donc au moins quatre satellites GNSS pour résoudre le système à quatre inconnues, trois de position plus une pour le biais de temps récepteur. Revenons aux horloges des satellites de navigation qui sont supposées être théoriquement parfaites et parfaitement synchronisées. Comme on le sait, la
Positionnement avec le système GPS
165
différence entre la théorie et la pratique est toujours plus importante en pratique qu’en théorie. . . et les horloges du système GNSS, bien que très précises, dérivent selon leurs marches propres. Il est alors fondamental que les biais de temps entre chacune des horloges satellites et la référence du temps système soient connus et diffusés à l’utilisateur. Sans cela le principe de positionnement par satellites serait impossible. On comprend que la navigation par satellite repose sur la maîtrise du temps. Un système de navigation doit donc obligatoirement transmettre à l’utilisateur des informations permettant de retrouver, à n’importe quel instant, à la fois la position des satellites GNSS dans l’espace et leur synchronisation dans le temps.
11.1
Le calcul du temps d’émission
Le calcul du temps d’émission est fondamental pour obtenir la position des satellites qui permettra de résoudre le positionnement du récepteur. Le temps propre d’émission τ sat est directement fourni par le récepteur lorsqu’il maintient ses boucles de corrélations. Il est également contenu dans les pseudomesures fournies par le récepteur : τPsat Ri = τrec − P Ri /c.
(11.1)
Cependant, cette date d’émission est : – en temps propre satellite ; – entachée de tous les délais accumulés, autrement dit les biais instrumentaux, les retards ionosphérique et troposphérique. On commence par dégager le délai ionosphérique par la combinaison géométrique : τPsat (11.2) Rc = τrec − P RC /c. L’équation (11.3) fournit une estimation du temps de transmission en temps propre satellite : τ sat = τPsat (11.3) Rc . On corrige alors ce temps propre de transmission τ sat par la combinaison des biais d’horloge et des biais instrumentaux en appliquant la correction Δtsat construite à partir des coefficients af 0 , af 1 , af 2 transmis dans le message de navigation (voir chapitre 9) : tsat = τ sat − Δtsat tsat . (11.4) Cette correction comprend également une correction relativiste Δtr liée à l’excentricité de la trajectoire des satellites 2
Δtsat (t) = af 0 + af 1 (t − toc ) + af 2 (t − toc ) + Δtr .
(11.5)
Cette équation est en réalité implicite car elle fait apparaître l’inconnue tsat dans les deux membres de l’équation. Une approximation valide consiste à utiliser le temps τ sat pour calculer le biais d’horloge satellite :
166 tsat
Le temps dans la géolocalisation par satellites (11.6) = τ sat − Δtsat τ sat .
Le calcul rigoureux de cet offset de temps met en jeu un calcul itératif en lançant la récurrence : sat t0 = τ sat . (11.7) sat tsat − Δtsat (tsat n+1 = τ n ) sat sat On stoppe dès que tsat n − tn−1 < ε et l’offset se calcule à la date tn . La date d’émission trouvée est celle du signal au centre de phase du satellite. Ce centre de phase correspond à la combinaison géométrique des mesures. Or, les éphémérides GNSS (GPS ou Galileo) diffusées dans le message de navigation sont celles du centre de phase des observables combinés en formulation géométrique, ce qui permet de retrouver ainsi la position du centre de phase satellite à la date d’émission. Une analyse de sensibilité permet de conclure que si on utilise directement la date τPsat Ri comme date d’émission corrigée du décalage d’horloge, on ne fait pratiquement pas d’erreur sur la position du satellite. En effet, supposons que les effets de l’environnement et des biais instrumentaux atteignent 30 mètres sur la pseudo-distance. Cela affecte la date d’émission d’environ 100 nanosecondes. La vitesse des satellites GNSS étant : GM V = ≈ 3, 9 km/s, (11.8) a avec : GM = 398600km3 .s− 2 : la constante d’attraction de la Terre ; a = 26578km : le demi-grand axe de l’orbite GPS par exemple. Le déplacement du satellite sur 100 nanosecondes est de 100 × 10−9 × 3, 9 × 10 ≈ 0, 4 mm, ce qui est sans impact sur son positionnement. Par contre, si on néglige la correction d’horloge Δtsat PC donnée dans le message de navigation, les erreurs peuvent être beaucoup plus grandes. Les horloges des satellites sont parfois décalées de plus de la milliseconde du temps système ce qui implique des erreurs de 10−3 × 3, 9 × 103 ≈ 4 mètres sur la position du satellite. 3
11.2
Le calcul de la position des satellites GPS et Galileo au temps d’émission
Le paragraphe précédent décrit comment peut être obtenu le temps d’émission du signal au centre de phase du satellite GPS. Il faut maintenant être capable de déterminer la position du satellite à cette date en repère terrestre. Les systèmes de navigation diffusent des paramètres d’éphémérides permettant de calculer la position du centre de phase de la combinaison géométrique, directement en repère terrestre, c’est-à-dire le repère pratique pour l’utilisateur.
Positionnement avec le système GPS
167
La détermination des orbites des satellites de navigation s’effectue en référentiel inertiel (voir chapitre 21). Si les satellites ne subissaient que la force d’attraction gravitationnelle centrale, l’orbite, appelée orbite képlérienne, serait une ellipse dont le centre de la Terre occupe un des foyers. Dans ce contexte particulier, le plan de l’orbite coupe le plan équatorial selon une droite appelée ligne des nœuds. Cette ligne coupe l’équateur en deux points appelés nœud ascendant et nœud descendant. Le nœud ascendant est défini comme le point à l’équateur traversé par le rayon vecteur du satellite lorsqu’il passe de l’hémisphère sud à l’hémisphère nord. Le nœud descendant est le point sur l’équateur diamétralement opposé au nœud ascendant. La ligne reliant le périgée, point le plus proche du centre de la Terre, et l’apogée, point de l’orbite qui en est le plus éloigné, est appelée ligne des apsides. Dans ce référentiel, la donnée d’une position et d’une vitesse à une date t d’un satellite équivaut à la donnée de six paramètres képlériens qui définissent de façon univoque l’orbite elliptique. Ce jeu de six paramètres fournit une interprétation géométrique directe, plus pratique à utiliser pour visualiser les orbites que la seule donnée d’une position et d’une vitesse. – deux paramètres (i, Ω) fixent le plan de l’orbite dans le référentiel inertiel, l’inclinaison et l’ascension droite du nœud ascendant : l’inclinaison i est l’angle entre le plan équatorial et le plan de l’orbite, l’ascension droite du nœud ascendant Ω est l’angle entre le point vernal et le nœud ascendant ; – deux paramètres (a, e) fixent la forme de l’ellipse dans le plan de l’orbite, l’excentricité e et le demi-grand axe a ; – un paramètre ω fixe la position de l’orbite dans le plan, l’argument du périgée qui est l’angle formé entre le nœud ascendant et le périgée de l’orbite ; – un dernier paramètre ν fixe la position du satellite sur son orbite, il s’agit de l’anomalie vraie définie par l’angle entre le périgée et le satellite. Le lecteur désireux d’approfondir ces notions pourra se reporter au livre de Capderou (2011) ou celui de Montenbruck et Gill (2005). Le référentiel approprié pour décrire le mouvement du satellite est le référentiel OPCS pour Orbital Plane Coordinate System. L’origine du OPCS est le centre de masse de la Terre, l’axe xOP CS est l’axe de la ligne des nœuds orienté dans la direction du nœud ascendant, l’axe zOP CS est orthogonal au plan de l’orbite, enfin l’axe yOP CS complète le trièdre. La figure 11.2 propose une illustration de ces paramètres et des référentiels ECI et OPCS. La matrice de passage de la base ECI à la base OPCS est donnée par les rotations successives suivantes : on effectue une rotation R3 (Ω) d’angle Ω autour de l’axe zECIF pour obtenir l’axe xOP CS puis on bascule le plan équatorial par une rotation R1 (i) autour de l’axe xOP CS d’angle i. PECIF →OP CS = R3 (Ω) R1 (i) .
(11.9)
168
Le temps dans la géolocalisation par satellites
Fig. 11.2 – Définition des 4 angles des paramètres képlériens : i et Ω fixent le plan de l’orbite, ω fixe la position de l’orbite dans le plan et ν fixe la position du satellite sur son orbite. Les deux paramètres de forme, l’excentricité e et le demi-grand axe a ne sont pas représentés dans la figure.
Dans le référentiel OPCS, la position du satellite est donnée par : ⎞ ⎛ r cos (ω + ν) sat = ⎝ r sin (ω + ν) ⎠ . X 0
(11.10)
En réalité, le satellite subit des accélérations perturbatrices, provenant de la déformation de Terre, de la présence de la Lune et du Soleil, de la pression de radiation solaire, qui produisent une trajectoire orbitale proche mais bien distincte d’une ellipse. À tout instant t, il est tout de même possible d’associer à la position et vitesse du satellite un jeu de paramètres képlériens qui sont ceux que suivraient le satellite s’il n’était plus soumis, à partir de la date t, qu’à la seule force de gravitation centrale (et aucune autre perturbation). Ces paramètres sont appelés paramètres képlériens osculateurs. Préalablement à la diffusion des éphémérides des satellites, il faut convertir les positions et vitesses calculées en référentiel ECI en positions et vitesses utilisateur, c’est-à-dire en référentiel ECEF. Dans un repère terrestre, l’orbite des satellites n’est plus une ellipse mais une courbe sinusoïdale enroulée.
Positionnement avec le système GPS
169
Fig. 11.3 – Conversion d’une éphéméride képlérienne GPS du repère inertiel (ellipse en jaune) vers le repère terrestre (cyan). Crédit : Julie Anton.
On peut également se faire une idée d’une telle trajectoire en repère terrestre en considérant la trace au sol des satellites de navigation. La trace au sol du mouvement d’un satellite est l’ensemble des points sur la surface de la Terre obtenus par projection centrale au cours du temps de la position du satellite sur la croûte terrestre. Si la Terre ne tournait pas, la trace au sol de l’orbite des satellites serait des grands cercles. Or, la trace au sol est une combinaison du mouvement du satellite et du mouvement de la Terre dans un repère inertiel. La trace au sol de satellite GNSS est une sinusoïde autour de l’équateur, projection de la courbe sinusoïdale enroulée (voir la figure 11.3). Pour Galileo, le cas est similaire mais avec la spécificité que la période orbitale est supérieure d’une heure environ par rapport à GPS du fait de leurs altitudes plus élevées, environ 3000 km (altitude de 23 222 km pour Galileo contre 20 200 km pour GPS). Il en découle une période de répétitivité plus longue : 10 jours (voir la figure 11.4). Une fois la conversion réalisée, on va ajuster par moindres carrés un modèle qui utilise le formalisme képlérien. La modélisation choisie pour les paramètres de bulletin doit satisfaire à plusieurs exigences. Elle doit être relativement simple à utiliser et légère à diffuser puis à stocker dans la mémoire des récepteurs, elle doit tenir compte de l’évolution du pôle vrai de rotation de la Terre (que l’utilisateur ne connaît pas), et enfin elle doit être la plus précise possible. Ce jeu est constitué de 16 paramètres au total soit 6 paramètres képlériens classiques, 3 paramètres d’évolutions linéaires et 6 termes de corrections sinusoïdales, plus une date à laquelle ces paramètres sont référencés. La liste de ces paramètres ainsi que l’algorithme de calcul sont ceux donnés par les documents d’interface GPS et Galileo (IS-GPS-200 et OS-SIS-ICD) :
170
Le temps dans la géolocalisation par satellites
Fig. 11.4 – Conversion d’une éphéméride képlérienne Galileo du repère inertiel (ellipse en jaune) vers le repère terrestre (cyan). Crédit : Julie Anton.
Paramètre M0 Δn e √ a λ0 i0 ω ˙ Ω di/dt Cuc , Cus Crc , Crs Cic , Cis toe
Description Anomalie moyenne à l’époque de référence toc Variation du mouvement moyen Excentricité Racine carré du demi-grand axe Longitude du nœud ascendant au début de la semaine GPS (samedi 24h00) Inclinaison à l’époque de référence toc Argument du périgée Dérivée première de l’ascension droite du nœud ascendant Dérivée première de l’inclinaison Amplitude des corrections harmonique cosinus et sinus de l’argument de latitude au périgée Amplitude des corrections harmonique cosinus et sinus de la distance radiale Amplitude des corrections harmonique cosinus et sinus de l’angle d’inclinaison Temps de référence de l’éphéméride
Un nouveau paramètre est introduit par les systèmes GNSS, il s’agit de la longitude λ du nœud ascendant, comptée à partir de l’axe xECEF alors que jusqu’à présent le nœud ascendant était repéré par l’ascension droite Ω, compté à partir de l’axe xECI . λ = Ω − θ.
(11.11)
Positionnement avec le système GPS
171
Fig. 11.5 – Longitude Ω du nœud ascendant NA de l’orbite des satellites GNSS. On appelle axe vernal l’axe passant par l’origine et le point vernal. L’angle θ = Ω˙ e . (t − toe ) entre l’axe vernal xECIF et l’axe xECEF dans le méridien de Greenwich est appelé le temps sidéral apparent. La figure 11.5 illustre la définition des angles θ, λ et Ω = θ + λ. Le calcul des 16 paramètres du modèle képlérien permet de modéliser l’orbite en repère terrestre avec une précision accrue autour du temps de référence toe . La figure 11.6 montre le bon accord entre le modèle képlérien (16 paramètres) et repère terrestre par rapport à l’orbite de référence. Les erreurs entre le modèle et la référence sont présentées en figure 11.7. Les étapes de calcul pour passer du modèle képlérien en coordonnées cartésiennes dans le repère terrestre sont les suivantes. Calcul de l’anomalie moyenne à la date d’émission tsat : GM (11.12) + Δn tsat − toe . M = M0 + 3 a Résolution de l’équation de Kepler (implicite) : M = E − e sin E.
(11.13)
Celle-ci se résout en utilisant par exemple une méthode itérative classique : Ek+1 = M − e sin Ek , (11.14) Eo = M
172
Le temps dans la géolocalisation par satellites
Fig. 11.6 – Modélisation de l’orbite en repère terrestre par un modèle képlérien de 16 paramètres (en rouge). Crédit : Julie Anton. avec un arrêt dès que |Ek+1 − Ek | < ε. Calcul de l’anomalie vraie : ν = 2 tan−1 Calcul de l’anomalie excentrique : E = cos−1
1+e E tan 1−e 2
e + cos ν 1 + e cos ν
.
(11.15)
.
(11.16)
Position sur orbite (comptée à partir de l’équateur) : φ = ω + ν.
(11.17)
Calcul des perturbations périodiques : δu = Cuc cos 2φ + Cus sin 2φ δr = Crc cos 2φ + Crs sin 2φ . δi = Cic cos 2φ + Cis sin 2φ
(11.18)
Application des corrections sur la position sur orbite, la distance radiale et l’inclinaison : u= φ + δu r = a (1 − e cos E) + δr . (11.19) di sat i = i0 + dt (t − toc ) + δi
Positionnement avec le système GPS
173
Fig. 11.7 – Amplitudes des erreurs sur les trois axes (delta X, delta Y et delta Z) entre le modèle képlérien radiodiffusé et l’orbite réelle pour le satellite Galileo E1, toe = 12h00. L’erreur 3D est représentée par delta norm. Crédit : Julie Anton.
Calcul des coordonnées du satellite dans le référentiel OPCS : ⎞ ⎞ ⎛ ⎛ r cos u xOP CS ⎝ yOP CS ⎠ = ⎝ r sin u ⎠ . 0 zOP CS
(11.20)
Il faut à présent ramener ces coordonnées en référentiel terrestre ECEF (de réalisation WGS84). Autrement dit, on cherche la matrice de passage PECEF →OP CS . Cette matrice est aisée à produire par composition : PECEF →OP CS = PECEF →ECIF PECIF →OP CS = R3 (−θ) R3 (Ω) R1 (i) . (11.21) Les coordonnées du centre de phase du satellite à la date d’émission tsat en référentiel ECEF sont données par l’expression : ECEF = R3 (Ω − θ) R1 (i) X OP CF . X
(11.22)
On voit ici apparaître la longitude λ = Ω−θ du nœud ascendant qui est l’angle qui est considéré par le modèle d’éphéméride GNSS plutôt que l’ascension droite du nœud ascendant. La longitude du nœud ascendant à la date tsat est calculée à partir de sa valeur prise au début de la semaine GPS par : ˙ − Ω˙ e tsat − Ωt ˙ oe . λ = λ0 + Ω
(11.23)
174
Le temps dans la géolocalisation par satellites
Tous développements faits, on obtient les coordonnées du satellite en repère ECEF par les compositions suivantes :
⎞ ⎞ ⎛ ⎛ r cos u cos λ − r sin u cos i sin λ r cos u sat tsat = R3 (λ) R1 (i) ⎝ r sin u ⎠ = ⎝ r cos u sin λ + r sin u cos i cos λ ⎠ . X r sin u sin i 0 (11.24)
Pour les systèmes GPS et Galileo, l a période de validité du modèle diffusé est de 4 heures lors du fonctionnement nominal du satellite. L’éphéméride est alors rafraîchie toutes les deux heures à partir de minuit en temps système (0h, 2h, 4h. . . ). Il existe d’autres modes de diffusion appelés modes de fonctionnement étendu parmi lesquels on trouve les modes de fonctionnement court terme et les modes de fonctionnement long terme. Les satellites GPS et Galileo peuvent diffuser en mode de fonctionnement étendu des éphémérides valides jusqu’à 26 heures avec des précisions dégradées. Pour le système GPS, le temps de référence de l’éphéméride est le toe qui se situe proche du milieu de l’arc de 4 h. Lorsqu’il y a des rafraîchissements asynchrones (pas situés sur une frontière des 2 h), les utilisateurs sont informés de ce rafraîchissement car le toe n’est plus exactement au milieu de l’arc. La plupart des utilisateurs exploitent la dernière éphéméride reçue, autrement dit la partie de l’arc couvrant [toe − 2h, toe ]. Le document d’interface GPS (ISGPS-200 version J) spécifie que les temps de références de l’éphéméride toe et horloge toc coïncident. Pour le système Galileo, le toe est placé en début d’arc de l’éphéméride et non pas proche du milieu comme pour le GPS. La durée de validité du modèle d’éphéméride est également de 4 heures lors du fonctionnement nominal. Cependant, contrairement au GPS qui rafraîchit le message toutes les deux heures, les satellites Galileo diffusent aux utilisateurs le message de navigation le plus récent reçu des stations d’émissions. Toutes les dix minutes, le centre de calcul de Galileo génère un message de navigation que les stations d’émissions envoient aux satellites à la meilleure opportunité possible. La gestion des points de contacts de communication entre les stations d’émission et les satellites Galileo garantissent que ces derniers sont en capacité de diffuser un nouveau message toutes les cent minutes environ. La figure 11.7 montre les écarts mesurés entre l’orbite de référence en repère terrestre et l’orbite recalculée avec les paramètres képlériens pour un satellite Galileo (E01). On constate que sur les 4 h demandées, l’écart est faible alors qu’il est important en dehors.
Positionnement avec le système GPS
11.3
175
Le calcul de la position et du temps du récepteur
La géolocalisation par GNSS nécessite au moins quatre équations de propagation car il faut résoudre à la fois la position du récepteur et la synchronisation de son horloge par rapport au temps système de la constellation. Ces équations de propagation font intervenir les temps de propagation du signal radioélectrique que l’on utilise pour extraire la distance géométrique entre le récepteur et le satellite émetteur. Ces distances géométriques permettent ensuite de déterminer la position du récepteur par la résolution d’au moins quatre équations de mesures. La formulation de ces équations de mesures est particulièrement simple lorsqu’elle est écrite en repère inertiel ECI. Il faut donc sélectionner un repère inertiel dans lequel l’utilisateur va faire son calcul de point à la date t du temps système (GPST ou GST) correspondant à cette solution. Cette sélection du repère inertiel ECI peut toujours être réalisée en figeant le référentiel ECEF à une date donnée, disons t , et dans lequel les calculs seront menés. La sélection de ce repère inertiel est complètement arbitraire mais dans la plupart des cas certains choix sont plus pratiques que d’autres. Enfin, une fois les coordonnées calculées dans le repère inertiel l’utilisateur doit pouvoir les ramener dans le référentiel ECEF à la date t du temps système où il effectue son positionnement. Pour ce faire, l’utilisateur doit prendre en compte la rotation du référentiel ECEF entre la date t où le repère inertiel ECI est défini et le référentiel ECEF cible à la date t (voir l’article (1999) d’Ashby et Weiss). Une solution de navigation peut être rattachée à deux dates GNSS privilégiées : soit une seule et unique date de réception, et dans ce cas il y a autant de dates d’événements d’émission qu’il y a de satellites pris en compte (disons n), soit une seule et unique date d’émission et dans ce cas il y a n dates d’événements de réception différents. Dans le premier cas, le calcul est fait sur un événement commun de réception, ce qui conduit à faire toutes les mesures au même instant puis à calculer les dates d’émissions différentes pour chaque satellite. Il est alors commode de figer le repère inertiel au référentiel ECEF à la date de réception commune en temps récepteur. Ce procédé de calcul est nommé « positionnement en événement récepteur ». Dans le second cas, le calcul est mené sur un événement commun d’émission du signal par les satellites de la constellation. Ce signal est supposé être émis exactement au même instant par tous les satellites. En particulier les codes PRN de tous les satellites sont émis simultanément à chaque seconde ronde GNSS et répétés de façon synchrone. En réalité, ce signal est émis en temps propre des horloges de chaque satellite qui deviennent synchrones une fois appliquées les corrections d’horloges envoyées dans le message de navigation de chaque satellite. Les satellites étant à des distances toutes différentes du récepteur, les temps de trajets différents vont conduire à un temps de réception différent pour chaque signal reçu. Dans ce calcul, il est alors commode de
176
Le temps dans la géolocalisation par satellites
figer le repère inertiel au référentiel ECEF de la date d’émission commune des satellites en temps GNSS. Ce procédé de calcul est nommé « positionnement en événement satellite ». La plupart des récepteurs implémentent la première méthode de calcul de positionnement soit le positionnement en événement récepteurs. Pour simplifier l’exposé, nous supposons que les temps de propagation du signal sont déjà corrigés des erreurs de propagation (ionosphère et troposphère). Par ailleurs, on choisit, dans la suite de l’exposé, de se placer dans le cadre spécifique d’une constellation : le système GPS. Le raisonnement est identique pour le système Galileo.
11.3.1
Positionnement en événement récepteur
À un temps propre de réception τrec donné, le récepteur détermine, en utilisant les codes PRN reçus, le temps propre d’émission satellite τ sat du signal. Le récepteur calcule ensuite le temps de transmission du signal ΔτR = τrec − τ sat qui inclut les biais d’horloges. rec du récepteur, à la date GPS Nous cherchons à déterminer la position X trec de réception, à partir de la position des satellites GPS à la date GPS tsat de l’émission du signal. Pour disposer d’un temps d’émission dans l’échelle du temps système GPS, on applique la correction d’horloge, incluant la correction relativiste de l’horloge, telle que prescrite dans le document d’interface IS-GPS-200 et décrite dans la section 11.1. À partir de cette date d’émission tsat , on calcule selon les prescriptions de l’IS-GPS-200 : sat en référentiel ECEF, définie á tsat ; 1. la position du satellite X 2. le biais d’horloge satellite hsat = cΔtsat . On fige alors le repère inertiel comme étant le référentiel ECEF proche du temps local de réception. Par exemple, on positionne t à la seconde ronde GPS la plus proche de la prise de mesure par le récepteur. On peut tout aussi bien poser t = τrec le temps local de génération des mesures de pseudodistance. Comme détaillé au chapitre 10, il faut donc effectuer la rotation d’angle θ qui correspond à la durée de propagation du signal pour passer du référentiel ECEF associé à la date tsat au référentiel ECI. Si on utilise la formule de changement de repère donnée au chapitre 10, on obtient l’expression suivante : ECI = R3 θsat X ECEF , X (11.25) avec :
θsat = Ω˙ e . tsat − t .
(11.26)
On peut alors écrire l’équation de mesure dans le repère commun ECI. Le temps de propagation géométrique ΔtR (temps de transmission du signal hors
Positionnement avec le système GPS biais de synchronisation) s’écrit : sat sat rec (trec ) . t −X cΔtR = c trec − tsat = R3 θsat X
177
(11.27)
Les inconnues de cette équation sont le temps de réception trec en temps GPS rec en référentiel ECI. Il faut donc au moins et la position du récepteur X t quatre satellites pour résoudre le système. Si on note par (xsat , y sat , z sat ) les sat (tsat ) et (xrec , yrec , zrec )t celles de X rec dans le coordonnées de R3 (θsat ) X repère ECI, on peut développer l’équation précédente pour n mesures : sat sat 2 2 2 c(trec − tsat (xsat 1 )= 1 − xrec ) + (y1 − yrec ) + (z1 − zrec ) sat sat 2 2 2 c(trec − tsat (xsat 2 )= 2 − xrec ) + (y2 − yrec ) + (z2 − zrec ) (11.28) .. . 2 sat 2 sat 2 (xsat c(trec − tsat n )= n − xrec ) + (yn − yrec ) + (zn − zrec ) Il est également possible d’écrire le problème, en utilisant la valeur des pseudodistances, où la distance mesurée par des temps de propagation est P R = cΔτR . L’équation de navigation devient alors : sat sat rec (trec ) + hrec − hsat . P R = R3 θsat X t −X (11.29) Les inconnues de cette équation sont maintenant le biais d’horloge de réception rec en référentiel ECI. hrec et les trois coordonnées de position du récepteur X Il faut toujours au moins quatre satellites pour résoudre le système. Le système de n mesures s’écrit : 2 2 2 P R1 = (xsat − xrec ) + (y1sat − yrec ) + (z1sat − zrec ) + hrec − hsat 1 1 2 2 2 sat sat sat P R2 = (x2 − xrec ) + (y2 − yrec ) + (z2 − zrec ) + hrec − hsat 2 .. . 2 2 2 sat sat sat P Rn = (xsat n − xrec ) + (yn − yrec ) + (zn − zrec ) + hrec − hn (11.30) C’est cette formulation que l’on va exploiter pour la résolution du positionnement. La correction d’horloge satellite hsat étant préalablement calculée, on corrige le temps de propagation du signal du biais d’horloge satellite. Par ailleurs, pour simplifier les notations, on note P R à la place de PR + hsat . La mesure est donc modélisée par : sat sat rec (trec ) + hrec , P R = R3 θsat X t −X (11.31) où les positions sont rapportées à un repère inertiel ECI. Une telle équation se nomme équation de mesure.
178
Le temps dans la géolocalisation par satellites
La solution qui est décrite ici procède par itération en linéarisant les équations de mesures autour d’une solution a priori. On commence par reconstruire un temps de propagation connaissant la (0) (0) rec position X du récepteur et l’horloge hrec a priori : sat (0) rec −X (11.32) P R(0) = R3 θsat X + h(0) rec . On effectue la différence entre les données mesurées et reconstruites : sat sat rec − R3 θsat X (0) +hrec −h(0) , P R−P R(0) = R3 θsat X −X −X rec rec (11.33) −→ sat sat (0) sat sat (0) X − Xrec + δX −R3 θ X − Xrec +hrec −h(0) δP R = R3 θ rec . (11.34) L’approche consiste à linéariser la distance géométrique autour de la position a priori du récepteur. En notant δh = hrec −h0rec , l’équation de mesure linéarisée s’écrit : (0) sat − X rec −→ R3 (θsat ) X · δX + δh. (11.35) δP R = − (0) sat sat R3 (θ ) X − Xrec Un changement de signe donne l’équation : (0) sat − X rec −→ R3 (θsat ) X .δX − δh. − δP R = (0) sat sat R3 (θ ) X − Xrec
(11.36)
où le vecteur normé : (0) sat − X rec R3 (θsat ) X , u = (0) sat − X rec R3 (θsat ) X
(11.37)
est le vecteur directeur unitaire, illustré en figure 11.8, entre la position a priori (0) rec sat . X du récepteur et la position du satellite R (−θsat ) X Au final, on a l’équation linéaire suivante, qui relie les incréments de position et d’horloge avec les écarts de mesures : − δP R = ux δx + uy δy + uz δz − δh.
(11.38)
En accumulant toutes les mesures à la date de traitement, on construit la formulation matricielle suivante : ⎡ ⎤ ⎡ ⎤ ⎡ δx ⎤ −δP R1 u1,x u1,y u1,z −1 ⎥ ⎢ ⎥ ⎢ .. .. .. .. .. ⎥ ⎢ ⎢ δy ⎥ (11.39) ⎣ ⎦=⎣ . . . . . ⎦ ⎣ δz ⎦ . −δP Rn un,x un,y un,z −1 δh Les inconnues à résoudre sont les trois composantes des écarts en position du récepteur, δx, δy, δz, et le biais d’horloge du récepteur δh. Le problème se réécrit sous forme condensée : Ap = b, (11.40)
Positionnement avec le système GPS
179
Fig. 11.8 – Vue communes des satellites de la constellation par un récepteur. où b est le vecteur des mesures et p le vecteur des paramètres à estimer. Bien souvent, le problème est surabondant, c’est-à-dire que l’on dispose de plus de mesures que d’inconnues. Dans ce cas, l’équation précédente est impossible à satisfaire et la solution cherchée sera celle qui minimise la quantité ||b − Ap||2 , autrement dit la solution qui optimise le critère des moindres carrés. La solution optimale pˆ qui minimise le critère des moindres carrés est donnée par : −1 t pˆ = At A A b. (11.41) Les détails de cette solution seront donnés au chapitre 21. On les trouve égale(1) rec ment dans l’ouvrage de Borre et Strang (2012). La nouvelle position X du récepteur est donnée par : (1) = X (0) + δX. X rec rec
(11.42)
(1)
Le nouveau biais d’horloge hrec est donné par : (0) h(1) rec = hrec + δh.
(11.43)
Les équations de mesures donnant le temps de propagation peuvent alors être linéarisées autour des nouvelles estimées des positions et des biais d’horloge (1) (1) rec X et hrec . Les itérations sont menées tant que les variations en position restent significatives. En général, l’algorithme converge en trois ou quatre ité rec en référentiel ECI et le biais rations maximum ; il fournit la position X d’horloge hrec = cΔtrec . La date de réception en temps GPS se calcule par application du biais : trec = τrec − Δtrec .
(11.44)
180
Le temps dans la géolocalisation par satellites
Une fois le système résolu, on replace les coordonnées de l’utilisateur, calculées en référentiel ECI, dans le référentiel ECEF au temps de réception en faisant une rotation d’angle Ω˙ e (trec − t ) : ˙ rec (trec ) (11.45) X ECEF = R3 −Ωe (trec − t ) Xrec (trec )ECI . Remarquons que dans le cas où t = τrec , l’angle de rotation est simplement Ω˙ e Δtrec . Résumé La navigation par GPS repose sur la mesure de temps d’arrivée de signaux provenant d’au moins quatre satellites GPS. Le récepteur utilise ces signaux pour déterminer les quatre inconnues que sont les trois coordonnées de position et le temps de réception. Lorsque le récepteur utilise ces mesures à une date commune de réception t , il applique les prescriptions algorithmiques suivantes : 1. mesure des différents temps propres d’émission τ sat des différents satellites ; 2. projection des temps propres en temps GPS tsat ; sat (tsat ) au temps d’émission tsat en 3. calcul de la position du satellite X repére terrestre ECEF ; 4. fixer le repére inertiel ECI pour écrire les équations de propagation. Le plus pratique est de prendre t = τrec ; 5. ramener les coordonnées ECEF des satellites impliqués en référentiel ECEF ; 6. résoudre le calcul du point en référentiel ECI, xrec , yrec , zrec et le biais de temps Δtrec ; 7. ramener les coordonnées inertielles ECI du récepteur en coordonnées terrestres ECEF, ce qui revient à faire une rotation d’angle proportionnel au biais d’horloge récepteur. Il est également possible d’évaluer précisément la vitesse du récepteur au travers de l’information contenue dans la mesure de Doppler (en Hertz) fournie par le récepteur : DHz = Δf = frec − f sat . (11.46) La conversion de cette mesure en mètre par seconde s’écrit : DR = c
DHz = λsat DHz . f sat
(11.47)
On part de l’équation classique qui formalise la mesure Doppler en Hertz : sat (tsat ) − V rec (trec ) · u V , (11.48) Δf = frec − f sat = −f sat c
Positionnement avec le système GPS
181
où : sat : est la vitesse du satellite à l’instant d’émission en référentiel ECI ; V rec : est la vitesse du récepteur à l’instant de réception à estimer en V référentiel ECI. Dans notre cas, la vitesse des satellites nous est accessible uniquement à partir des messages de navigation et donc sont référencées en repère terrestre. Comme le référentiel ECI a été défini en figeant le référentiel ECEF à la date de l’événement de réception trec , il faut préalablement convertir les vitesses données en référentiel ECEF en référentiel ECI en utilisant les expressions définies au chapitre 10 : sat sat sat ECI ECEF ECEF V = R3 V + ω ∧ X .
L’écart de fréquence peut s’écrire : rec (trec ) .u v sat (tsat ) − V . Δf = frec − f sat = −f sat c
(11.49)
(11.50)
Ces rotations laissent inchangées la norme de la vitesse mais en modifient l’angle, ce qui a un effet dans le calcul de la vitesse radiale. La fréquence transmise au niveau satellite fs est la fréquence du signal envoyé fL1 = 1575, 42 MHz affectée par un biais qui est transmis dans le message de navigation Δfs . fs = fL1 + Δfs , (11.51)
dΔtr Δfs = fL1 af 1 + 2af 2 (t − toc ) + . (11.52) dt Bien souvent pour le calcul, on suppose que ce biais est négligeable et on ne le prend pas en compte. Côté récepteur, la fréquence reçue est en réalité affectée d’un biais récepteur qui représente la dérive en fréquence de l’oscillateur récepteur : fr 1 + h˙ . (11.53) Tenant compte de ces biais, la mesure Doppler s’écrit : rec .u v sat − V ˙ − fr h. DHz = −f sat c
(11.54)
En développant l’expression précédente, on arrive à l’équation : c.
DHz ˙ rec .u − fr ch. + V sat .u = V f sat fs
(11.55)
En négligeant le rapport de fréquence ffrs ≈ 1, les développements aboutissent aux équations de mesures linéaires suivantes écrites en mètres par seconde : ˙ DR + V sat .u = ux vx + uy vy + uz vz − h.
(11.56)
182
Le temps dans la géolocalisation par satellites
Les n mesures accumulées permettent de construire le système matriciel suivant : ⎤ ⎡ ⎡ ⎤⎡ v ⎤ sat .u DR + V x u u u −1 1,x 1,y 1,z 1 ⎥ ⎢ ⎢ vy ⎥ ⎥ ⎢ .. ⎢ ⎥ .. . . . ⎥ .. .. .. ⎦ ⎢ (11.57) ⎥=⎣ . ⎢ ⎣ vz ⎦ . ⎣ . ⎦ un,x un,y un,z −1 sat .u DR + V h˙ n
Les inconnues à résoudre sont la dérive de l’horloge du récepteur et les trois composantes de la vitesse du récepteur. Les estimés de la dérive d’horloge et de la vitesse sont données directement ˆ˙ et V par h rec .
11.3.2
Positionnement en événement satellite
On considère maintenant un événement commun d’émission au niveau de la constellation GPS. Prenons comme événement commun l’émission du début d’un code C/A qui est répété toutes les millisecondes. Si toutes les horloges des satellites GPS étaient parfaites et synchrones, ces premiers bits de code PRN, différents par satellite mais faisant exactement la même longueur, 1023 bits, seraient émis à la même date. De plus, le système GPS est réglé de façon à caler l’émission de ces codes PRN à la seconde ronde GPS : au top de la seconde ronde GPS tous les satellites émettent ce premier bit de code. Dans ce cas, si nous fixons le référentiel ECI au référentiel ECEF à la date commune d’émission, il n’y a aucune transformation de coordonnées satellite à faire, donc aucune rotation. Ainsi, la date GPS t où le référentiel ECEF est gelé pour créer le référentiel ECI devient la date d’émission commune teme . De leurs côté, les horloges GPS dérivent chacune à leur manière. Elles ne deviennent synchrones qu’une fois les corrections d’horloges, transmises dans les messages de navigation, sont prises en compte. En effet, le temps propre τ sat d’un satellite GPS diffère du temps GPS tsat d’une quantité Δtsat : tsat = τ sat − Δtsat .
(11.58)
Par conséquent, chaque satellite va émettre le début de son code PRN dans son temps propre, ce qui correspond à émettre en retard ou en avance de la quantité Δtsat par rapport à la date d’émission teme en temps GPS (temps de la constellation GPS) : τ sat = teme + Δtsat . (11.59) Une fois les signaux émis par les satellites GPS, ils se propagent en direction du récepteur. Les différences de distances entre les satellites GPS et le récepteur se traduisent par des temps de transmissions différents. Les dates d’événements de réception seront donc différentes les unes des autres : aucun des signaux n’arrivent de façon synchrone. Ces différentes dates de réception vont s’étaler sur une plage de 20 millisecondes environ. Pendant ce laps de
Positionnement avec le système GPS
183
temps, le récepteur va bouger par rapport au référentiel ECI. Il faudra donc veiller à prendre en compte le déplacement du récepteur durant le temps de transmission, autrement dit réaliser des rotations pour ramener la position du récepteur à chaque date de réception du référentiel ECEF au référentiel ECI. Choisissons donc une date d’émission commune teme qui soit un multiple de la milliseconde, de façon à correspondre à la date d’envoi simultanée des débuts de codes PRN par tous les satellites. Considérons un satellite en particulier. Si l’horloge de ce satellite était parfaite et synchrone avec le temps GPS, le premier bit du code PRN serait envoyé exactement à la date t et reçu à la date τrec en temps propre récepteur mesuré par l’horloge locale. On ramène ce temps propre récepteur en temps GPS par la prise en compte d’un biais récepteur, inconnu pour l’instant : trec = τrec − Δtrec .
(11.60)
Comme l’horloge bord est imparfaite, l’émission réelle du premier bit du code PRN va être décalée de la durée Δtsat par rapport à la date teme . Ce biais prend en compte la dérive naturelle de l’horloge bord par rapport au temps système GPS, le biais instrumental, mais également les effets relativistes dus à l’excentricité des orbites. Cet écart de temps va donc également se retrouver à la réception de ce premier bit dans le signal GPS par rapport à la date de réception précédente τrec , mais affecté de l’effet Doppler qui est la conséquence du mouvement relatif du satellite et du récepteur durant le temps de transmission. L’offset de temps Δtsat au niveau du satellite et ce même offset Δtsat rec vu du récepteur sont reliées (section 4.1) par la relation : rec sat u.V u.V sat sat Δtrec 1 − = Δt , (11.61) 1− c c où : u : est le vecteur unitaire de la ligne de vue satellite vers récepteur en référentiel ECI ; sat : est le vecteur vitesse du satellite à la date d’émission en référentiel V ECI ; sat : est le vecteur vitesse du récepteur à la date de réception en référentiel V rec ECI. La résolution de cette équation nécessite de disposer de la vitesse du récepteur et du satellite à la date GPS d’émission teme . La position et la vitesse des satellites à la date teme se calculent selon les prescriptions du document d’interface IS-GPS-200. Au niveau récepteur, la date de réception en temps propre du premier bit du code PRN pour un satellite donné est τrec +Δtsat rec . Ramenée en temps GPS, cette date de réception, notée trec , s’écrit : trec = τrec + Δtsat rec − Δtrec .
(11.62)
184
Le temps dans la géolocalisation par satellites
Le temps de transmission ΔτR du signal, connu, s’écrit : eme . ΔτR = τrec + Δtsat rec − t
(11.63)
Le temps de propagation géométrique ΔtR est : ΔtR = trec − teme ,
(11.64)
il diffère du temps de transmission au biais Δtrec d’horloge récepteur près : ΔtR = ΔτR − Δtrec .
(11.65)
On obtient alors, en repère inertiel ECI l’équation de mesure suivante : rec (trec ) − X sat (teme ) ||. c (trec − teme ) = ||X
(11.66)
Ici, les inconnues sont le temps de réception trec en temps GPS et la position rec à cette date. du récepteur X Si on introduit le temps de propagation du signal, l’équation de mesure s’écrit : rec (trec ) − X sat (teme ) || + hrec . P R = cΔτR = ||X
(11.67)
Les inconnues sont maintenant le biais d’horloge hrec et la position du récep rec à la date de réception trec . teur X Comme les signaux de tous les satellites (au moins quatre) sont émis au même instant t , ils arrivent à des temps de réception tous différents. On a donc une position de récepteur et une date de réception différente pour chaque équation de mesure ce qui n’est pas résoluble puisque chaque nouvelle mesure apporte de nouvelles inconnues. On ramène donc le calcul de la position du récepteur à la date commune teme en linéarisant la position autour de cette date : rec (trec ) = X rec (teme + ΔtR ) = X rec (teme ) + V rec (teme ) ΔtR . X
(11.68)
On obtient alors l’équation de propagation suivante : rec (teme ) + V rec (teme ) ΔtR − X sat (teme ) ||. cΔtR = ||X
(11.69)
Si on écrit cette même équation avec le temps de transmission, on obtient : rec (teme ) + V rec (teme ) (ΔτR − Δtrec ) − X sat (teme ) || + cΔtrec . cΔτR = ||X (11.70) Les inconnues de cette équation sont maintenant la position du récepteur rec (teme ) à la date d’émission commune teme ainsi que le biais d’horloge X récepteur Δtrec à cette même date. Comme on l’a vu, la résolution du problème de navigation va faire intervenir plusieurs satellites, au moins quatre, ce qui va conduire à autant de dates d’événements de réception. Rigoureusement, cela devrait conduire à ajuster un
Positionnement avec le système GPS
185
biais d’horloge récepteur pour chaque événement de réception. Cela conduirait à trop d’inconnues à résoudre pour le nombre d’équations que le système peut produire. On fait alors l’approximation licite que ce biais récepteur est constant durant les 20 millisecondes de prise de mesures. Finalement, cela conduit à la résolution d’un seul et unique paramètre d’horloge récepteur Δtrec à la date sat (teme ), d’émission teme . Si on note par (xsat ,y sat ,z sat )t les coordonnées de X t eme eme rec (t rec (t ) et V ) respec(xrec , yrec , zrec ) et (x˙ rec , y˙ rec , z˙rec ) celles de X tivement dans le repère ECI, on peut développer l’équation précédente pour n mesures : cΔτR,1
cΔτR,2
=
2 (xrec + x˙ rec (ΔτR,1 ) − Δtrec ) − xsat ˙ rec (ΔτR,1 ) − Δtrec ) − y1sat )2 1 ) + (yrec + y
=
+(zrec + z˙ rec (ΔτR,1 ) − Δtrec ) − z1sat )2 + cΔtrec 2 (xrec + x˙ rec (ΔτR,2 ) − Δtrec ) − xsat ˙ rec (ΔτR,2 − Δtrec ) − y2sat )2 2 ) + (yrec + y +(zrec + z˙ rec (ΔτR,2 − Δtrec ) − z2sat )2 + cΔtrec
. . . cΔτR,n
=
2 sat )2 (xrec + x˙ rec (ΔτR,n − Δtrec ) − xsat ˙ rec (ΔτR,n − Δtrec ) − yn n ) + (yrec + y sat 2 +(zrec + z˙ rec (ΔτR,n − Δtrec ) − zn ) + cΔtrec
(11.71)
L’équation de navigation peut également se mettre sous une forme faisant apparaître un nouveau terme contributif au calcul de la distance géométrique connu sous le nom de délai Sagnac (voir les sections 14.6 et 20.3. Pour faire apparaître ce terme, on utilise la différentielle de la norme d’une fonction de la variable réelle. En écrivant cette norme par la composition de deux fonctions : t → F (t) → ||F (t) ||,
(11.72)
et en appliquant le théorème des fonctions composées, on a, pour tout réel h : d||F (t) || d 2F (t) |F (t) .h F (t) |F (t) .h .h = . F (t) |F (t).h = = dt dt ||F (t) || 2 F (t) |F (t) (11.73) En utilisant cette expression, on arrive rapidement à la formulation visée (avec approximation γ = 1) en différentiant l’équation de mesure autour du temps d’émission teme , la position des satellites étant supposées connues : sat (teme )|| ≈ ||X rec (teme ) − X sat (teme )|| rec (teme + ΔtR ) − X ||X sat (teme ) rec (teme ) − X X (11.74) + · V (teme )ΔtR rec (teme ) − X sat (teme )|| rec ||X On applique ensuite une seconde approximation sur la valeur du temps de propagation géométrique : rec (teme ) − X sat (teme ) ||, cΔtR ≈ ||X
(11.75)
186
Le temps dans la géolocalisation par satellites
pour arriver à : sat (teme ) || ≈ ||X rec (teme ) − X sat (teme ) || rec (teme + ΔtR ) − X ||X rec (teme ) − X sat (teme ) · Vrec (teme ) X . (11.76) + c Le second terme du membre de droite est en réalité le délai Sagnac (voir le 14.6), positif ou négatif, lié à la rotation de la Terre. Lorsqu’on introduit ces approximations dans l’équation de navigation, on arrive à : rec (teme ) − X sat (teme ) || + cΔtSagnac , cΔtR = ||X
(11.77)
soit de façon équivalente : rec (teme ) − X sat (teme ) || + hrec + cΔtSagnac . P R = ||X
(11.78)
Quelle que soit la formulation utilisée, l’avantage de cette approche est qu’il n’y a aucune rotation à appliquer au niveau des satellites. Par contre, il faut au préalable connaître la vitesse du récepteur en repère inertiel ECI avec une précision suffisante pour être injectée directement dans l’équation de mesure. Comme dans la section précédente, on linéarise l’équation de navigation autour (0) (0) rec de valeurs a priori de position X du récepteur et de biais Δtrec d’horloge : −→ rec δΔt. δP R = u · δX + 1 − u · V (11.79) Le symbole δ note ici les écarts entre la mesure et sa modélisation. δP R = P R − P R(0) , −→ (0) , rec − X δX = X rec
(11.80)
Δt(0) rec ,
(11.82)
(11.81)
δΔt = Δtrec − (0) rec sat rec Δτ (0) − Δt(0) X +V rec − X R u = . (0) sat || rec rec Δτ (0) − Δt(0) ||X +V rec − X R
(11.83)
sat Le vecteur u est le vecteur directeur unitaire entre la position X du satellite (0) (0) (0) rec + V rec Δτ − Δtrec du récepteur. à la date teme et la position a priori X R Au final, on a l’équation aux variations suivantes : x y z δP R = ux δx + uy δy + uz δz + (1 − ux Vrec + uy Vrec + uz Vrec ) δΔt.
(11.84)
En accumulant toutes les mesures à la date de traitement, on construit la formulation matricielle : ⎡
⎤
⎡
δP R1 u1,x ⎢ . ⎥ ⎢ . ⎣ .. ⎦ = ⎣ .. δP Rn un,x
u1,y . .. un,y
u1,z . .. un,z
⎡
⎤
⎤ δx y x −u z 1 − u1,x Vrec 1,y Vrec − u1,z Vrec δy ⎥ ⎥⎢ . ⎥ .. ⎦⎢ ⎣ δz ⎦ . y x z 1 − un,x Vrec − un,y Vrec − un,z Vrec δΔt (11.85)
Positionnement avec le système GPS
187
Les inconnues à résoudre sont les trois composantes des écarts en position du récepteur et un paramètre d’horloge récepteur. Le problème se réécrit sous forme condensée : Ap = b. (11.86) La solution optimale pˆ qui minimise le critère des moindres carrés est donnée par : −1 t pˆ = At A A b. (11.87) (1) rec du récepteur est donnée par : La nouvelle position X
(1) = X (0) + δX. X rec rec
(11.88)
(1)
Le nouveau biais d’horloge Δtrec est donné par : (0) Δt(1) rec = Δtrec + δΔt.
(11.89)
Les équations de mesures donnant le temps de propagation peuvent alors être linéarisées autour des nouvelles estimées des positions et des biais d’horloge (1) (1) rec X et Δtrec . Les itérations sont menées tant que les variations en positions restent significatives. En général, l’algorithme converge en trois ou quatre ité rec en référentiel ECI et le biais rations maximum ; il fournit la position X d’horloge. La résolution du problème de navigation fournit la position du récepteur à la date d’émission teme . Dans le cas où l’on souhaite avoir la position de l’utilisateur en référentiel ECEF aux différentes dates de réception, une rotation est nécessaire. Le biais d’horloge Δtrec étant connu, on connaît à présent le temps de réception trec en temps GPS et on applique la rotation : ˙ e (trec − teme ) X rec (teme ) rec (trec ) − Ω = R (11.90) X 3 ECEF ECI . Résumé La navigation par GPS repose sur la mesure de temps d’arrivée de signaux provenant d’au moins quatre satellites GPS. Le récepteur utilise ces signaux pour déterminer les quatre inconnues que sont les trois coordonnées de position et le temps de réception. Lorsque tous les signaux sont émis à une date commune teme , ils sont reçus à des dates différentes, selon le trajet qu’ils ont à parcourir, qui sont regroupées dans un intervalle de 100 ms. Le récepteur utilisateur applique alors les prescriptions algorithmiques suivantes : 1. mesure des différents temps propres de réception τrec du caractére de code émis à la date τ sat par les différentes satellites. Le choix d’un caractére particulier peut correspondre au début d’une séquence de code répétéé toutes les millisecondes ; 2. projection des temps propres τ sat en temps GPS teme ; sat (teme ) au temps d’émission teme en 3. calcul de la position du satellite X repére terrestre ECEF ;
188
Le temps dans la géolocalisation par satellites
Fig. 11.9 – En référentiel géodésique WGS84 un point est repéré par sa longitude λ, sa latitude géodésique Φ et la hauteur h.
4. fixer le repére inertiel ECI pour écrire les équations de propagation. Le plus pratique est de geler le référentiel ECEF à la date teme ; 5. calculer le décalage Doppler Δtsat rec pour trouver le temps de réception τrec + Δtsat de ce même caractère de code s’il était émis Ě la date teme ; rec 6. résoudre le calcul du point en référentiel ECI, xrec , yrec , zrec à la date teme et le biais de temps récepteur commun Δtrec ; 7. ramener les coordonnées inertielles ECI du récepteur en coordonnées terrestres ECEF, ce qui revient à faire une rotation d’angle proportionnel au temps de transmission pour récupérer la position du récepteur à la date de réception souhaitée.
11.4
Calculs dans le repère WGS84
Le système géodésique mondial 1984, acronyme du terme anglais World Geodetic System, est le système de référence des satellites GPS construit par le département américain de la défense (DoD). Le référentiel WGS84 est un ECEF basé sur une description de la Terre comme un ellipsoïde de révolution autour de son axe de rotation autour du pôle conventionnel IRP de l’ITRS, de paramètres a (demi-grand axe) et e (excentricité) bien définis. Il est réalisé en adoptant les coordonnées cartésiennes des 10 stations de surveillance GPS, dérivées par des mesures Doppler. La latitude Φ, la longitude λ et la hauteur h sont fournies en référence à cet ellipsoïde WGS84 (il en existe d’autres. . . ). Les coordonnées cartésiennes t (x, y, z) calculées par les algorithmes de positionnement décrits ci-dessus sont ensuite converties en coordonnées géodésiques (Φ, λ, h)t . Dans ce repère, illustré en figure 11.9, des différences apparaissent : la latitude géodésique est différente de la latitude géocentrique ; de même la hauteur géodésique n’est
Positionnement avec le système GPS
189
pas l’altitude par rapport au niveau moyen de la mer. Les transformations de coordonnées sont détaillées dans de nombreux ouvrages. La notion d’altitude est liée au champ de pesanteur de la Terre. On définit le poids d’un objet comme étant la force que la Terre exerce sur cet objet. Le poids est dirigé suivant une verticale qui est définie comme la direction donnée par un fil à plomb à un point fixé. Cependant, la Terre est animée d’un mouvement de rotation autour de l’axe des pôles, ce qui a pour conséquence d’emporter le fil à plomb dans cette rotation. C’est ce mouvement de rotation de la Terre qui fait la distinction entre le champ de gravitation G et le champ de pesanteur g. Lorsqu’on mène l’analyse dans un référentiel inertiel, l’extrémité du fil à −−→ plomb de masse m subit la force d’origine gravitationnelle mG = −m grad (V ), qui attire la masse vers le centre de la Terre, et crée une tension sur le fil T . Entraînée par la Terre dans sa rotation, la masse du fil à plomb est ani˙ e par consémée d’un mouvement circulaire uniforme de vitesse angulaire Ω quent son accélération est centripète, orthogonale à l’axe de rotation. Elle vaut 2 ˙ 2 r sin θu où l’angle θ est la colatitude (complémentaire de la a = vr u = Ω e latitude, c’est-à-dire la différence entre 90◦ et la latitude) du point en radian et u dirigée vers l’axe. Ces forces sont en équilibre et le principe fondamental de la dynamique appliqué au point matériel dans le repère géocentrique s’écrit ma = mG + T . Or, un observateur terrestre, qui n’est plus inertiel, voit le point matériel immobile et détermine le poids P de m par la mesure de la tension du fil et par la direction prise par le fil. Cet observateur écrit T + P = 0 soit T = −mg où g est le champ de pesanteur. La relation entre le champ de gravité et le champ de pesanteur est donnée par mg = mG − ma c’est-à-dire : ˙ 2 rsinθu. g = G − Ω e
(11.91)
˙ 2e rsinθu est la force centrifuge, dirigée vers l’extérieur de la cirLe terme −Ω conférence décrite par la masse du fil à plomb. Le champ de pesanteur est donc égal au champ de gravitation plus une force centrifuge. Par conséquent, la direction que donne le fil à plomb n’est pas tout à fait confondue avec celle du seul champ gravitationnel. Le champ de pesanteur est dirigé vers le centre de la Terre seulement aux pôles et à l’équateur. En tous les autres points, la direction du fil à plomb ne passe pas par le centre de la Terre. Il se trouve ˙ 2e rsinθu dérive elle-même d’un potentiel ce qui que l’accélération centrifuge −Ω permet d’exprimer, en coordonnées sphériques, le potentiel de pesanteur U en fonction du potentiel gravitationnel V : 2 1˙ U (r, θ, φ) = V (r, θ, φ) − Ωe rsinθ . (11.92) 2 2 ˙ e rsinθ Le terme −1/2 Ω est le potentiel centrifuge dans le référentiel tournant avec la Terre. Une équipotentielle de pesanteur est une surface où l’intensité de la force de pesanteur est la même partout. Les surfaces équipotentielles, ou surface de
190
Le temps dans la géolocalisation par satellites
niveau, s’enveloppent les unes les autres, mais la distance entre deux surfaces de niveau n’a pas de raison de rester constante. Si la Terre était homogène et rigide, les surfaces équipotentielles seraient des sphères centrées autour du centre de masse. Sous l’effet de la rotation, les surfaces équipotentielles sont des ellipsoïdes en première approximation. Il peut très bien se trouver qu’un cours d’eau puisse s’écouler dans la direction qui l’éloigne du centre de la Terre ! Prenons l’exemple du Mississipi sur son trajet qui par de Saint Paul jusqu’à son embouchure à la Nouvelle Orléans. La distance géocentrique à Saint Paul est de 6367 km tandis que celle de la Nouvelle Orléans est de 6373 km. Autrement dit, l’embouchure du Mississipi est plus éloignée du centre de la Terre que sa source de 6 km. Par ailleurs, la répartition des masses n’est pas uniforme, ce qui crée une déviation locale de la surface équipotentielle autour de l’excédent de masse. La signification physique d’une surface équipotentielle de pesanteur est qu’elle est, en chaque point, orthogonale à la direction indiquée par un fil à plomb. Le fil à plomb permet de proche en proche de définir la surface sur laquelle l’intensité du champ de pesanteur est identique : le géoïde. Le géoïde de pesanteur est défini comme la surface équipotentielle du champ de force de pesanteur. Autrement dit, tous les points du géoïde sont à la même altitude. Cette surface présente des « creux » et des « bosses » selon les irrégularités de répartition des masses de la Terre. Le géoïde est la surface de l’océan global au repos, sans l’effet des courants, des vagues, des marées, ni des différences de pressions atmosphériques. Il définit le niveau moyen de la mer (MSL pour l’acronyme anglo-saxon Mean Sea Level). Sur le géoïde, l’eau est en équilibre de pesanteur : elle n’a pas de raison de s’écouler dans un sens ou dans un autre. Le géoïde se prolonge sous les continents, définissant ainsi le niveau zéro des altitudes. Contrairement à l’ellipsoïde WGS 84, qui est utilisé pour définir la hauteur, le géoïde ne peut pas être défini mathématiquement ou utilisé dans les calculs parce que sa forme dépend de la distribution irrégulière des masses à l’intérieur de la Terre. Il y donc bien trois surfaces spécifiques et bien distinctes à considérer : la surface définie par l’ellipsoïde de référence, la surface du géoïde et celle du terrain qui est celle de la surface physique de la Terre (voir la figure 11.10). Une approximation pour convertir une hauteur géodésique en altitude est donnée par l’expression : h = a + N, (11.93) où : h : est la hauteur géodésique ; a : est l’altitude par rapport au géoïde ; N : est la hauteur du géoïde ; ε : est l’angle de la déflection à la verticale. On trouve donc l’altitude d’un lieu donné en soustrayant à la hauteur géodésique fournie par le calcul de point GPS la hauteur tabulée du géoïde.
Positionnement avec le système GPS
191
Fig. 11.10 – Pour un point à la surface de la Terre, différences entre l’altitude a, définie par rapport au géoïde, et la hauteur géodésique h, définie par rapport à l’ellipsoïde de référence.
11.5
Calcul des erreurs d’estimation t
Une solution de navigation consiste à calculer une correction p = (x1 , x2 , x3 , h) t à une position et date a priori X = (X1 , X2 , X3 , H) . La correction p est solution des équations de mesures linéarisées autour de X : b = Ap + ,
(11.94)
où : A : est une matrice m × 4, avec m le nombre de mesures ; : est le vecteur des erreurs de mesures. Ces erreurs sont supposées suivre une loi normale centrée ; b : est le vecteur des résidus. Dans les sections précédentes, la matrice A est définie comme la matrice des dérivées partielles des équations de mesures par rapport aux paramètres de positions et temps : ⎛ ⎞ u1 , l u1 , j u1 , k −1 ⎜ u2 , l u2 , j u2 , k −1 ⎟ ⎜ ⎟ A=⎜ . (11.95) .. .. .. .. ⎟ ⎝ . . . . ⎠ um , l um , j um , k −1 Ici les vecteurs i, j et k sont les vecteurs directeurs des axes du repère WGS84 et les m lignes correspondent aux m mesures. Il est cependant plus pratique de définir un repère lié à la position du récepteur. On travaille donc dans le
192
Le temps dans la géolocalisation par satellites
Fig. 11.11 – Repère géographique local Nord East Up. repère local est-nord-vertical (ENU pour East-North-Up), tel que représenté en figure 11.11. Dans ce repère, la matrice A s’écrit : ⎛ ⎞ cos el1 sin az1 cos el1 cos az1 sin el1 −1 ⎜ cos el2 sin az2 cos el2 cos az2 sin el2 −1 ⎟ ⎜ ⎟ A=⎜ (11.96) .. .. .. .. ⎟ . ⎝ . . . . ⎠ cos elm sin azm
cos elm cos azm
sin elm
−1
Les m lignes correspondent aux m mesures réalisées par le récepteur. La méthode des moindres carrés (décrite avec plus de détail au chapitre 21) fournit l’estimation : −1 t pˆ = At A A b. (11.97) L’erreur d’estimation e s’écrit : −1 t −1 t −1 t e = pˆ − p = At A A b − p = At A A (Ap + ) − p = At A A . (11.98) −1 Le facteur (At A) At projette une erreur de mesure en erreur de position. Cette erreur de position dépend de la géométrie de la constellation de navi−1 gation par le biais de la formulation (At A) et des erreurs ε contenues dans les mesures. Dans la plupart des cas, on considère que les erreurs de mesures sont de type bruit blanc, ce qui se traduit par une espérance nulle E [ ] = 0 et une covariance réduite à la matrice identité affectée d’un facteur de bruit de variance σ 2 soit cov ( ) = σ 2 I. L’espérance de l’erreur d’identification est nulle : −1 t E [e] = At A A E [ ] = 0.
(11.99)
Positionnement avec le système GPS La covariance de l’erreur d’identification est : t cov (e) = (e − E [e]) (e − E [e]) = E eet −1 t t −1 . A E A At A = At A t −1 t t −1 = AA A cov ( ) A A A −1 = σ 2 At A
193
(11.100)
Il s’agit d’une matrice carrée symétrique définie positive de dimension quatre qui s’écrit comme le produit de la variance des erreurs de mesure σ 2 par le −1 facteur C = (At A) qui ne dépend que de la géométrie de la constellation au-dessus du point considéré. La matrice C est donc la fonction de transfert entre la distribution des erreurs de mesure et la distribution des erreurs de positionnement, d’où le nom de dilution de la précision qu’on lui attribue habituellement ou DOP pour son acronyme anglais Dilution Of Precision. Comme la géométrie de la constellation se modifie sans cesse suite au mouvement des satellites sur leur orbite, le DOP varie dans le temps. On définit différentes composantes de DOP, dont le DOP horizontal, vertical et DOP de position (HDOP, VDOP et PDOP) à partir des éléments diagonaux de la matrice cov (e) : ⎛ 2 ⎞ qeast qEN qEU qET ⎜ qEN q 2 qET ⎟ north qN U ⎟, C=⎜ (11.101) 2 ⎝ qEU qN U qup qUT ⎠ qET qET qUT qT2 2 2 qeast + qnorth 2 . V DOP = qup 2 2 2 P DOP = qeast + qnorth + qup HDOP =
(11.102)
Le PDOP est une mesure du volume que forment les vecteurs directeurs des lignes de vues. Plus la géométrie des satellites est uniformément répartie dans l’espace et plus les valeurs de PDOP seront faibles, plus les lignes de vues seront concentrées entres elles et plus le PDOP sera élevé. Pour préciser ces aspects de variabilité du DOP, considérons deux cas modèles caractéristiques de géométrie limite de la constellation, présentés en figure 11.12, où le premier présente une configuration de satellites à basses élévations et uniformément distribués en azimut et le second une configuration de satellites positionnés à fortes élévations. Dans le premier cas (configuration A), la distribution des mesures permet une bonne observabilité de la dimension horizontale, ce qui doit aboutir à une faible erreur de positionnement horizontal. On doit donc s’attendre à des valeurs de HDOP faible. Par contre, n’ayant pas de mesure dans la direction
194
Le temps dans la géolocalisation par satellites
Fig. 11.12 – Cas modèles de configurations géométriques limites. verticale, la précision de localisation verticale est dégradée : de fortes amplitudes de positions dans la direction verticale n’affecteront pas les mesures de pseudo-distances. Cela se traduit par un VDOP élevé. Dans le second cas (configuration B), la situation ne permet pas un positionnement horizontal précis car toutes les mesures sont en positions presque verticales. Puisqu’une grande variation en position horizontale de l’utilisateur ne se reflètera pas par des variations importantes de pseudo-distance, le HDOP sera élevé. Concernant le VDOP, il serait prématuré d’affirmer qu’il atteindra des valeurs faibles car il y a ici un point de difficulté spécifique à la navigation par satellites : le mélange entre la direction radiale et l’horloge. En effet, lorsque l’on a beaucoup de mesures avec toutes les lignes de vues pratiquement positionnées à la verticale, on dispose d’une bonne observabilité du radial et de l’horloge en même temps, pas exclusivement du radial. Cet effet va se traduire dans la matrice C par une forte corrélation dans la direction « up » et la dimension temps « T », ainsi que par des variances associées importantes. On obtiendra donc dans ce cas un VDOP élevé contrairement à l’intuition. Pour faire chuter ce VDOP, il suffit d’une seule ligne de vue à basse élévation : sa seule présence va participer à séparer la partie radiale de l’horloge et va contribuer à un positionnement vertical précis. −1 À partir de l’expression cov (e) = σ−2 (At A) , les différents DOP permettent facilement de donner le RMS des erreurs de positionnement. Par exemple, les RMS des erreurs de positionnement dans les directions horizontales, verticales et 3D respectivement sont données par : eH = σ.HDOP,
(11.103)
eV = σ.V DOP,
(11.104)
e3D = σ.P DOP.
(11.105)
Les expressions précédentes fournissent une estimation simple de l’erreur RMS de positionnement. Elles s’écrivent comme le produit des erreurs des mesures (à 1 sigma) et du DOP. Parmi les contributeurs aux erreurs de mesure, il y
Positionnement avec le système GPS
195
a les différents bruits (thermique, interférence et multi-trajets) mais aussi les erreurs d’orbites et d’horloges des satellites une fois appliquées les informations du message de navigation. Les valeurs de HDOP n’excédant pas 1,5 dans 99 % du temps (HDOP = 1,5 @ 3σ), l’inégalité établie en section 6.2 : |eP R | ≤
en sat + eh − er , 5
(11.106)
permet de se faire aisément une idée de la précision des orbites et des horloges satellites à utiliser pour le positionnement si l’on souhaite une bonne (décimétrique) voire très bonne (centimétrique) précision.
11.6
L’ellipsoïde de confiance
La matrice de variance-covariance C de dimension 4 contient toute la structure des erreurs de positionnement et de temps que l’on matérialise souvent par un ellipsoïde de confiance défini canoniquement par l’ensemble : ! " X ∈ R4 |X t C −1 X = k 2 . (11.107) La matrice C définit la forme et l’orientation de l’ellipsoïde tandis que le coefficient de dilatation k définit son volume. Ce volume dépend de la probabilité (1 − α) pour laquelle l’ellipsoïde, centré sur la position estimée, contient la position vraie. Pour construire l’ellipsoïde de confiance dans le plan horizontal, on extrait de la matrice C la structure des erreurs de positionnement en erreurs horizontales eH , ce qui revient à considérer la sous-matrice extraite suivante :
2 deast dEN . (11.108) cov (eH ) = dEN d2north La formulation se déduit de la matrice de covariance C = cov (eH ) à laquelle on associe canoniquement une ellipse de confiance (à 1 sigma) définie par l’équation suivante dans le repère ENU : (xE , xN ) C −1 (xE , xN ) = 1, t
(11.109)
où (xE , xN ) sont les coordonnées du point dans le repère est nord (EN). En utilisant l’expression de l’inverse de C :
2 1 dnorth −dEN −1 C = 2 , (11.110) −dEN d2east deast d2north − d2EN le développement devient :
2 dnorth −dEN (xE , xN ) (xE , xN )t = d2east d2north − d2EN , −dEN d2east
(11.111)
196
Le temps dans la géolocalisation par satellites
Fig. 11.13 – Ellipse de confiance dans le plan horizontal. soit :
x2E x2 2xE xN dEN + 2N − 2 = constante. (11.112) 2 deast dnorth deast d2north L’équation de l’ellipse dans le repère formé par ses axes d’inertie (y1 , y2 ) s’écrit : −1
λ1 0 t (y1 , y2 ) = 1, (11.113) (y1 , y2 ) 0 λ2
où λ1 et λ2 sont les valeurs propres de la matrice de covariance cov (eH ) qui sont solutions de l’équation : 2 2 deast − λ dEN = deast − λ d2north − λ − d2EN = 0. det (C − λI) = dEN d2north − λ (11.114) La solution de cette équation fournit les valeurs propres :
1 2 d2east + d2north + (d2east − d2north ) + 4d2EN , (11.115) λ1 = 2
1 2 2 2 2 2 2 λ2 = deast + dnorth − (deast − dnorth ) + 4dEN . (11.116) 2 L’équation de l’ellipse suivant ses axes d’inertie s’écrit plus simplement : y12 y2 + 2 = 1. λ1 λ2 La situation géométrique est celle illustrée par la figure 11.13.
(11.117)
Chapitre 12 Positionnement en combinant les systèmes GPS et Galileo Les récepteurs de signaux de navigation sont capables d’acquérir et de poursuivre les signaux provenant de plusieurs constellations de satellites de navigation, dont le GPS et Galileo, par exemple. Le positionnement sera d’autant plus précis que les mesures seront abondantes, il est donc très intéressant de réaliser un calcul de point en mêlant plusieurs constellations. Dans le cas présent, on examine un positionnement obtenu avec la bi-constellation GPS et Galileo. Le traitement des signaux des deux constellations GPS et Galileo nécessite cependant quelques points d’attention particuliers. En effet, les modulations des signaux générés et émis par les deux constellations sont différentes, ce qui entraîne dans le récepteur des biais instrumentaux spécifiques au système GPS et au système Galileo. Cette différence est appelée ISB pour Inter System Bias, et si l’on veut un positionnement précis, il conviendra de prendre en compte cette caractéristique dans un traitement bi-constellation. Un autre point fondamental est que les références de temps système entre GPS et Galileo sont également différentes : le temps système GPS, le GPST pour GPS Time, n’est pas le même que le GST le Galileo System Time dans lesquels sont référencées les synchronisations des horloges GPS et Galileo, respectivement. Or, un calcul de positionnement avec les données de navigation par satellites doit impérativement se faire dans une référence de temps commune. Les ingénieurs européens ont donc défini le biais GGTO, le GPS/Galileo Time Offset qui est intégré dans le message de navigation Galileo.
12.1
Le GPS/Galileo Time Offset – GGTO
Le GPS/Galileo Time Offset est défini comme la différence entre les temps systèmes Galileo (le GST) et GPS (le GPST) : ΔtSystems = tGST − tGP ST .
(12.1)
198
Le temps dans la géolocalisation par satellites
Il permet de ramener l’échelle de temps GPS vers l’échelle de temps Galileo. Il est modélisé sous la forme d’un biais et d’une dérive et transmis dans le message de navigation Galileo : ΔtSystems = AOG + A1G · [T OW − tOG + 604 800 ((W N − W N0G ) mod 64)] , (12.2) où : T OW : est le Time Of Week GST dans la semaine GST ; W N : est le nombre de semaine GST ; AOG : est l’offset de temps système en seconde ; A1G : est la dérive de temps système en s/s ; tOG : est la date de référence du GGTO dans la semaine GST ; W N0G : est le nombre de semaine de référence du GGTO. Ainsi, une correction d’horloge satellite associée à la combinaison géométrique des mesures, GPS ou Galileo va pouvoir s’écrire en référence Galileo par application du GGTO : ΔtPc (t) |GAL = ΔtPc (t) |GP S + ΔtSystems .
(12.3)
La notation |∗ indique ici la référence de temps dans laquelle est rapportée la correction d’horloge. Par convention, on notera GGTO le biais système en mètre : GGT O = c.ΔtSystems .
12.2
(12.4)
Les biais inter systèmes – ISB
Par définition, les biais inter-systèmes (ISB pour son acronyme anglo-saxon Inter System Bias) sont des biais au niveau récepteur. Ils représentent l’écart entre le biais instrumental Galileo et le biais instrumental GPS qui interviennent dans la combinaison géométrique des mesures. Plus précisément, les combinaisons géométriques des mesures de code GPS et Galileo selon les fréquences L1/E1 et L5/E5 s’écrivent : Pc,GAL = Rc + hPc,GAL − hPc,GAL |GAL + εPc,GAL ,
(12.5)
Pc,GP S = Rc + hPc,GP S − hPc,GP S |GP S + εPc,GP S .
(12.6)
La composante Rc contient la distance géométrique et le délai troposphérique. Les biais d’horloges récepteurs qui interviennent dans cette combinaison s’écrivent en fonction du biais d’horloge et des biais instrumentaux combinés en formulation géométrique : hPc,GAL = hrec + BPc,GAL ,
(12.7)
hPc,GP S = hrec + BPc,GP S .
(12.8)
Positionnement en combinant les systèmes GPS et Galileo
199
Du fait de la structure interne des signaux Galileo qui est différente des signaux GPS, les biais instrumentaux combinés BPc,GAL et BPc,GP S ne sont pas égaux. Ces derniers s’écrivent comme combinaison géométrique des biais instrumentaux sur chacune des fréquences L1/E1 et L5/E5, avec γGAL = (fE1 /fE5a )2 et γGP S = (fL1 /fL5)2 : BPc,GAL =
γGAL BP1,GAL − BP5,GAL , γGAL −1
(12.9)
γGP S BP1,GP S − BP5,GP S . (12.10) γGP S −1 Par définition, la différence entre les deux biais BPc,GAL et BPc,GP S est le biais inter-système : (12.11) ISB = BPc,GAL − BPc,GP S . BPc,GP S =
En raison de ce biais, l’horloge de la station observée via les mesures GPS est légèrement différente de celle observée via les mesures Galileo, avec une différence presque constante entre elles : hPc,GAL − hPc,GP S = ISB.
(12.12)
Les mesures de code Galileo en combinaison géométrique se modélisent avec un biais d’horloge récepteur commun et un paramètre ISB : Pc,GAL = Rc + hPc,GP S + ISB − hPc,GAL |GAL + εPc,GAL .
(12.13)
Cette formulation ne permet cependant pas une observation directe du biais ISB avec pour seules données les mesures GNSS car, de la même façon qu’il y a une inobservabilité globale du problème horloge, il y a ici une indétermination entre le biais ISB et le biais d’horloge satellite Galileo. En effet, la même équation (12.13) peut s’écrire avec différents arrangements de termes. Par exemple, l’équation (12.14) intègre un incrément ΔISB dans l’horloge Galileo : Pc,GAL = Rc + hPc,GP S + (ISB + ΔISB) − hPc,GAL |GAL + ΔISB + εPc,GAL , (12.14) et de la même façon l’équation (12.15) intègre un incrément ΔhPc,GAL |GAL d’horloge Galileo dans les ISB : Pc,GAL = Rc + hPc,GP S + ISB + ΔhPc,GAL |GAL − hPc,GAL |GAL + ΔhPc,GAL |GAL + εPc,GAL . (12.15) Par conséquent, il est impossible de faire la distinction entre un décalage global de l’ISB récepteurs et un décalage, du même signe, dans toutes les horloges Galileo, car ces décalages s’annulent dans les observables Galileo et n’apparaissent pas dans les observables GPS. Il faut donc avoir une information a priori du biais ISB issue de campagnes de calibration. Dans le cas où l’on a à résoudre la détermination complète des orbites et horloges satellites sur la base d’un réseau dense de stations au sol dont la position est connue, il faut fixer un ISB pour une station de référence et les autres se déduisent par ajustement relativement à lui.
200
Le temps dans la géolocalisation par satellites
12.3
La résolution du positionnement avec les systèmes GPS et Galileo
La formulation générale des mesures de code en combinaison géométrique biconstellation, référencées dans le système de temps GPS, s’écrit de la façon suivante :
Pc,GAL Pc,GP S
= =
Rc Rc
+ hPc,GP S
+ ISB
+ hPc,GP S
− hPc,GAL |GP S −h
Pc,GP S
− GGT O
|GP S
+ εPc,GAL + εPc,GP S
(12.16) Avec les données ISB et GGTO, un récepteur peut résoudre sa position (trois inconnues) et son biais d’horloge par rapport au temps GPS (une inconnue). Ainsi, avec le même algorithme que dans le cas de la mono-constellation (un vecteur d’état avec quatre inconnues), un récepteur pourra effectuer son calcul de point. Cependant, cela nécessite de connaî au préalable le biais ISB car les observables Galileo contiennent à la fois l’ISB et le GGTO mêlés. Le système d’équations bi-constellation à résoudre avec les mesures en combinaison géométrique s’écrit : 2 GP S 2 2 S −x P R1,GP S = + y1 − yrec + z1GP S − zrec xGP rec 1
P R2,GP S
=
S + hGP S,rec − hGP 1 2 GP S 2 2 S −x + y2 − yrec + z2GP S − zrec xGP rec 2
+ hGP S,rec .. . P Rn,GP S
=
S − hGP 2
2 2 2 S −x GP S − y GP S − z (xGP rec ) + (yn rec ) + (zn rec ) n
P R1,GAL
S + hGP S,rec − hGP n 2 2 2 − xrec + y1GAL − yrec + z1GAL − zrec xGAL 1
P R2,GAL
+ hGP S,rec + ISB − hGAL − GGT O 1 2 2 2 − xrec + y2GAL − yrec + z2GAL − zrec xGAL 2 + hGP S,rec + ISB − hGAL − GGT O 2 .. .
P Rm,GAL
2 2 2 GAL − y GAL − z (xGAL − xrec ) + (ym rec ) + (zm rec ) m + hGP S,rec + ISB − hGAL − GGT O. m
(12.17)
Cette difficulté sur la méconnaissance ou l’imprécision de l’ISB peut être élégamment levée en résolvant non plus un biais d’horloge commun aux deux constellations mais un biais d’horloge par constellation ce qui porte le nombre
Positionnement en combinant les systèmes GPS et Galileo
201
d’inconnues à résoudre de quatre à cinq. 2 GP S 2 2 S −x P R1,GP S = + y1 − yrec + z1GP S − zrec xGP rec 1
P R2,GP S
S + hGP S,rec − hGP 1 GP S 2 2 2 x2 = − xrec + y2GP S − yrec + z2GP S − zrec
+ hGP S,rec
S − hGP 2
.. . P Rn,GP S
2 2 2 S −x GP S − y GP S − z = (xGP rec ) + (yn rec ) + (zn rec ) n
P R1,GAL
S + hGP S,rec − hGP n 2 2 2 xGAL = − xrec + y1GAL − yrec + z1GAL − zrec 1
P R2,GAL
+ hGAL,rec − hGAL 1 2 2 2 xGAL = − xrec + y2GAL − yrec + z2GAL − zrec 2 + hGAL,rec .. .
P Rm,GAL =
− hGAL 2
2 2 2 GAL − y GAL − z (xGAL − xrec ) + (ym rec ) + (zm rec ) m + hGAL,rec
− hGAL . m
(12.18)
Chacun des biais d’horloge absorbe à la fois le biais instrumental des signaux de la constellation associée et se référence dans le temps de cette même constellation. Le biais d’horloge hGP S,rec contient le décalage entre l’horloge du récepteur et le temps système GPS ainsi que le biais instrumental combiné des signaux GPS en formulation géométrique. Le biais d’horloge hGAL,rec contient le décalage entre l’horloge du récepteur et le temps système Galileo ainsi que le biais instrumental combiné des signaux Galileo en formulation géométrique. Il n’y a alors plus la nécessité d’utiliser ni les ISB, ni le GGTO.
Chapitre 13 La théorie de la relativité restreinte À partir de ce chapitre, nous exposons les concepts clés de la relativité (principalement concernant le temps) qui sont incontournables dans tout système de géolocalisation par satellites. Nous allons voir qu’il est possible et souhaitable de présenter cette nouvelle théorie de l’espace et du temps qu’est la relativité restreinte sans faire mention de la lumière, en introduisant la notion de « vitesse limite » ou de constante d’espace-temps. Nous préciserons toutefois en fin de chapitre pourquoi l’étude des propriétés de la lumière a joué un rôle déterminant dans la genèse de cette théorie.
13.1
Introduction : relativité galiléenne et relativité einsteinienne
Galilée (1564–1642) fut le premier à énoncer clairement, à l’aide d’exemples 20 nombreux et détaillés, dans un cadre mathématique, ce que nous nommons aujourd’hui le principe de relativité, autrement dit l’équivalence entre les référentiels inertiels. Cette équivalence implique que toutes les expériences physiques réalisées à l’intérieur d’une cabine animée d’un mouvement inertiel donneront les mêmes résultats quelle que soit la vitesse de la cabine par rapport au référentiel considéré. C’est ce que nous pouvons constater de nos jours aisément lorsque nous laissons tomber notre stylo depuis notre siège dans un avion de ligne en vitesse de croisière ou dans un TGV roulant en ligne droite à 300 km/h : tout se passe comme si nous étions au repos au sol. Dès lors, la question qui se pose est la suivante : comment passet-on des coordonnées d’un événement (repéré par trois coordonnées 20. On trouvera dans Galilée (1632), page 317, le célèbre passage où Galilée décrit des expériences diverses (mouches, papillons, seau d’eau percé. . . ) à l’intérieur de la cabine d’un bateau en mouvement uniforme.
204
Le temps dans la géolocalisation par satellites
d’espace et une de temps) dans un référentiel inertiel à celles de ce même événement dans un autre référentiel inertiel en mouvement par rapport au premier ? Les lois de transformation qui permettent de passer d’un référentiel à l’autre définissent la cinématique. Nous allons voir qu’il existe deux cinématiques a priori possibles et qui sont toutes deux compatibles avec le principe de relativité : la relativité galiléenne et la relativité einsteinienne, la différence essentielle entre les deux étant l’existence (pour la seconde) d’une vitesse limite de propagation de l’information.
13.2 13.2.1
La relativité galiléenne Les référentiels inertiels
Précisons ce que nous entendons par référentiel inertiel. Galilée donne l’exemple célèbre de mouvements divers observés à l’intérieur de la cabine d’un bateau. Ceux-ci sont strictement identiques, que le bateau se déplace de façon uniforme (sur une mer parfaitement calme) ou qu’il soit immobile à quai. Galilée conclut que, pour les observateurs qui suivent une ligne droite à vitesse constante (sur un plan), le mouvement est « comme rien ». Un référentiel inertiel est un référentiel dans lequel la loi d’inertie s’applique : un corps « laissé à lui-même » (donc qui n’est soumis à aucune influence extérieure) poursuit indéfiniment son mouvement en ligne droite à vitesse constante. Tout référentiel en mouvement de translation rectiligne et uniforme par rapport à un référentiel inertiel est lui-même inertiel. Il existe donc une infinité de référentiels inertiels.
13.2.2
Les transformations de Galilée
Les formules de passage d’un référentiel inertiel à un autre sont implicites dans la physique galiléo-newtonienne : on les nomme aujourd’hui « transformations de Galilée ». Donnons un exemple de transformation où l’on considère que le référentiel R est fixe et le référentiel R se déplace en un mouvement de translation uniforme de vitesse v par rapport à R suivant le sens positif de l’un ses axes, disons suivant l’axe x, comme illustré en figure 13.1. La position d’un objet dans R à un instant donné t est décrite par sa coordonnée x, tandis que dans R elle correspondrait à x : x = x + vt,
y = y,
z = z,
t = t .
(13.1)
Premier constat : on admet avec t’ = t l’existence d’un temps universel unique puisqu’il est possible de dater identiquement un événement quel que soit le référentiel inertiel considéré.
La théorie de la relativité restreinte
205
Fig. 13.1 – Le référentiel R glisse sur R selon l’axe x La cinématique basée sur le principe de relativité de Galilée stipule que les vitesses que mesurent deux observateurs positionnés dans deux systèmes de référence inertiels R et R s’additionnent de façon linéaire de sorte que la vitesse du corps par rapport au référentiel R est égale à la vitesse du corps par rapport au référentiel R plus la vitesse du référentiel R par rapport à R. Autrement dit, les transformations affectant les vitesses d’une particule matérielle en mouvement dans les deux référentiels distincts sont données par les formules : (13.2) ux = ux + v, uy = uy , uz = uz .
13.3
La relativité einsteinienne
Il existe d’autres formules compatibles avec le principe de relativité, nommées transformations de Lorentz, qui permettent de passer du référentiel R au référentiel R, en admettant que le référentiel R glisse avec la vitesse v le long de l’axe X : x + vt x= , 2 1 − vc2
y=y,
z=z,
t + vx2 t= c . 2 1 − vc2
(13.3)
On voit maintenant apparaître dans ces transformations, le facteur multiplicatif : 1 γ= , (13.4) 2 1 − vc2 toujours supérieur à 1 et nommé facteur de Lorentz. La constance structurelle c correspond à la vitesse maximale de propagation de l’information. Nous
206
Le temps dans la géolocalisation par satellites
pouvons la qualifier simplement de « vitesse limite » ou de « constante d’espace-temps ». Par ailleurs, les temps t’ et t ne sont plus identiques. Dans le cas limite où c −→ ∞, on retrouve exactement les transformations de Galilée. Soit ux = dx/dt la composante de la vitesse dans le système R et ux = dx /dt la composante de cette même particule dans le système R . Les transformations de vitesse d’une particule matérielle en mouvement dans les deux référentiels deviennent (loi de composition relativiste des vitesses) : 2 v2 1 − 1 − vc2 u u y z ux + v c2 ux = , uy = , uz = . (13.5) u v u v u v 1 + cx2 1 + cx2 1 + cx2 Dans le cas limite où c −→ ∞, on retrouve les équations de la mécanique classique qui stipule la loi d’additivité des vitesses. Dans le cas particulier où la particule se déplace parallèlement à l’axe des x, on a : uy = 0, uz = 0 et ux =
ux + v 1+
ux v c2
,
uy = 0, uz = 0.
(13.6)
On voit facilement en examinant cette formule que la somme de deux vitesses inférieures à la vitesse limite ne dépasse pas la vitesse limite et que, en remplaçant ux par c on alors ux = c. Autrement dit, la vitesse limite mesurée dans le référentiel R est exactement celle que l’on mesure dans le référentiel R : elle est invariante. Ainsi, il existe deux types de transformations qui conservent le caractère inertiel d’un référentiel : les transformations de Galilée et celles de Lorentz. La seule différence qui les sépare est que la dernière conserve une certaine vitesse constante et donc que cette vitesse apparaît comme une vitesse limite. Les transformations de Galilée et de Lorentz sont les deux seules qui conservent le caractère inertiel d’un référentiel (avec quelques hypothèses additionnelles que nous mentionnons plus loin), c’est-à-dire qu’un objet isolé y reste au repos ou se déplace à vitesse rectiligne constante. L’une ne contient pas de vitesse limite, et dans ce cas les vitesses s’additionnent, l’autre fait intervenir une vitesse limite et en conséquence, la composition des vitesses n’est plus une simple addition. Une autre propriété générale distingue les transformations de Lorentz des transformations de Galilée. Ces dernières sont douées de la propriété de commutativité, c’est-à-dire que le produit de deux transfor→ → v2 différentes ne dépend pas mations successives de Galilée de vitesse − v1 et − de l’ordre dans lequel elles sont effectuées. Au contraire, le produit de deux transformations successives de Lorentz dépend, en général, de leur ordre et → → v2 parallèles font exception. seules les transformations à vecteurs − v1 et −
13.3.1
La chronogéométrie de Minkowski
Les transformations de Galilée préservent la géométrie euclidienne, c’est-àdire un espace linéaire muni d’un produit scalaire euclidien (forme bilinéaire
La théorie de la relativité restreinte
207
symétrique définie positive) à partir duquel on peut mesurer des distances. En d’autres termes, la transformation de Galilée préserve les longueurs des objets définies par la distance euclidienne d’un espace à trois dimensions : dr2 = dx2 + dy 2 + dz 2 .
(13.7)
Les transformations de Lorentz font évoluer quatre variables, les trois composantes spatiales et la composante temporelle. L’espace naturel est donc un espace à quatre dimensions dont un point est appelé un événement. Minkowski cherche donc une métrique dans cet espace-temps, c’est-à-dire une forme bilinéaire, qui reste invariante par les transformations de Lorentz. La forme bilinéaire qu’il trouve est certes symétrique mais n’est plus définie positive. La métrique ds entre deux événements est donnée maintenant par l’expression : ds2 = dx2 + dy 2 + dz 2 − c2 dt2 . (13.8) Cette nouvelle métrique 21 définit une chronogéométrie (dont les transformations de Lorentz sont un sous-produit) qui va servir de base structurelle à la relativité restreinte et à ses stupéfiants résultats. La constante structurelle c apparaît dans la métrique en tant que facteur de conversion entre l’espace et le temps et correspond à la vitesse limite de propagation de l’information dans notre univers.
13.3.2
Temps propre et temps-coordonnée
La composante temporelle t de cette métrique est appelée temps-coordonnée. Ce n’est pas en général un temps mesurable au point considéré sauf lorsque l’observateur est au repos dans son référentiel, x = y = z = 0. Dans ce cas, il est appelé temps propre τ lié à l’observateur et ds2 = −c2 dτ 2 . 21. La notation différentielle utilisée ici a une définition mathématique rigoureuse. Si E est un espace vectoriel réel de dimension n avec pour base B = {e1 · · · en }, on appelle base duale B ∗ = {e∗1 · · · e∗n } l’ensemble des formes linéaires e∗i : E −→ R définies par e∗i (X) = xi pour tout vecteur X = x1 e1 + · · · + xn en de E. Les vecteurs de la base duale B ∗ associent à tout vecteur de E sa i`eme composante dans la base B, on note souvent les formes e∗i par dxi . Comme on est en dimension finie, l’espace E et son dual E ∗ = L (E, R) sont isomorphes, à tout vecteur X = x1 e1 + · · · + xn en , on associe la forme X ∗ = x1 e∗1 + · · · + xn e∗n . Pour toute forme quadratique réelle g : E −→ R, on définit la forme quadratique duale g ∗ : E ∗ −→ R par la relation g ∗ (X ∗ ) = g (X). Dans notre cas g ∗ est notée ds2 et g est définie par la matrice de Lobatchevski : ⎞ ⎛ 1 0 ⎟ ⎜ 1 ⎟, L=⎜ ⎠ ⎝ 1 0 −1 et les vecteurs sont ici les quadrivecteurs d’espace-temps X = (x, y, z, ct). Si on note X ∗ = t (dx, dy, dz, cdt), on a ds2 = g ∗ (X ∗ ) = X ∗ LX ∗ La norme d’un vecteur dans E pour la métrique g est définie par X = g (X, X). ∗ ∗ La norme d’une forme linéaire dans E pour la métrique g est définie par X ∗ = g ∗ (X ∗ , Y ∗ ) et notée ds. D’après notre construction ds (X ∗ ) = X.
208
Le temps dans la géolocalisation par satellites
Par temps propre, il faut entendre le temps cumulé mesuré par une horloge supposée parfaite, c’est-à-dire le nombre de cycles comptés par l’horloge parfaite depuis une origine donnée. La notion de temps propre est essentielle en relativité car elle correspond à l’élément de distance spatio-temporel invariant d’un référentiel inertiel à l’autre. En relativité, ni les longueurs ni les durées ne se conservent d’un référentiel inertiel à l’autre mais un mélange des deux. Ce mélange est justement ce que matérialise la métrique de Minkowski. De manière générale, le temps propre se calcule par intégration des intervalles ds. La durée ΔτAB que mesure une horloge entre deux événements A et B de sa ligne d’univers (c’est-à-dire sa trajectoire dans l’espace-temps) est le temps propre cumulé donné par l’intégrale : 1 B ΔτAB = ds . (13.9) c A La formule ci-dessus (qui restera valable en relativité générale) est l’une des plus importantes de toute la physique, bien qu’elle soit rarement présentée comme telle : elle traduit la dépendance du temps propre vis-à-vis de la ligne d’univers (qui est sa trajectoire dans l’espace-temps) et pas seulement des dates de début et de fin du voyage. Le temps propre enregistré par une horloge parfaite pour aller d’un point-événement à un autre de l’espace-temps est égal à la longueur de l’arc de la ligne d’univers reliant ces deux points divisée par la vitesse limite. Nous avons déjà défini le temps propre au paragraphe 1.1 (sans évoquer la relativité) : il s’agissait du temps indiqué par un oscillateur donné qui était inévitablement imparfait. Avec la relativité, le temps propre d’un oscillateur même supposé parfait dépend de sa ligne d’univers dans l’espace-temps. À partir de maintenant, tout le formalisme et le matériel mathématique sont mis en place pour que l’idée de relativité restreinte émerge. Le mot « restreinte » signifie simplement que la gravitation n’est pas prise en compte dans la métrique. Il ne signifie pas que la théorie ne serait pas applicable à certains types de mouvements ou nous interdirait d’étudier le point de vue d’observateurs quelconques. L’ouvrage de référence pour l’étude d’observateurs quelconques en relativité restreinte est celui de Gourgoulhon (2010).
13.3.3
La relativité sans la lumière
Nous avons volontairement présenté les deux cinématiques a priori possibles sans faire mention de la lumière et de ses propriétés. On peut en fait déduire 22 les deux transformations à partir de quelques hypothèses simples qui ne font pas intervenir la lumière : 22. Pour une démonstration détaillée, voir l’article de Jean-Marc Lévy-Leblond, One more derivation of the Lorentz transformation (Lévy-Leblond, 1976).
La théorie de la relativité restreinte
209
– le principe de relativité s’applique à toutes les lois physiques. En conséquence, les transformations de coordonnées doivent former mathématiquement un groupe : l’inverse d’une transformation est une transformation de même type et la composée de deux transformations (obtenue en enchaînant deux transformations successives) est aussi une transformation de même type ; – les transformations recherchées ne dépendent pas de l’orientation de l’axe des coordonnées considéré ; – les transformations recherchées ne dépendent pas du lieu ou de l’instant considéré ; – les transformations recherchées n’inversent pas le signe des intervalles de temps. Moyennant ces hypothèses (dont la plus forte est certainement le principe de relativité), on en déduit assez aisément que deux transformations sont possibles : celles de Galilée (sans aucune vitesse limite) et celles de Lorentz qui font apparaître une vitesse limite de propagation de l’information. Pour déterminer laquelle de ces deux transformations décrit le mieux notre univers physique, il n’est pas non plus nécessaire de faire intervenir la lumière. La cinématique einsteinienne implique l’abandon du temps universel unique : nous avons vu que la durée propre mesurée par une horloge entre deux pointsévénements dépend de la vitesse limite et de la ligne d’univers parcourue par cette horloge. En mesurant les décalages entre horloges parfaites (qui sont nuls selon la relativité galiléenne), on pourrait estimer la valeur de la vitesse limite. Cela montre que la relativité einsteinienne (tout comme la galiléenne) transcende la nature des interactions physiques et définit de façon générale les relations entre l’espace et le temps.
13.4
Quelques précisions sur la genèse de la relativité restreinte
Le fait que la cinématique d’Einstein-Minkowski ne dépende pas de la lumière pourra surprendre certains lecteurs qui auront été habitués à des présentations de la théorie où le rôle de la lumière semble au contraire incontournable. Même si les transformations de Lorentz peuvent être déduites sans aucune hypothèse sur la lumière, c’est historiquement par l’étude des propriétés de la lumière que l’on a compris qu’il fallait réviser les relations entre l’espace et le temps. Pourquoi ? Tout simplement parce que la lumière est une onde dotée d’une propriété étonnante : celle de se propager toujours à la vitesse limite dans le vide (localement et dans tous les référentiels inertiels). En conséquence, sa vitesse apparaît comme invariante (telle que mesurée) dans des situations où l’on s’attendrait à détecter des variations. Comme
210
Le temps dans la géolocalisation par satellites
la Terre se meut autour du Soleil avec une certaine vitesse, la loi galiléenne d’addition des vitesses implique que la vitesse de propagation de la lumière en provenance des étoiles et mesurée sur Terre devrait dépendre de la vitesse de la Terre (en direction et en intensité). Les tentatives infructueuses de détecter ces variations ont conduit Einstein à poser comme axiome l’invariance de la vitesse de la lumière dans tous les référentiels inertiels. Cette invariance est la conséquence de l’existence d’une vitesse limite. Le seul ajout au principe de relativité de l’existence de cette vitesse limite nous entraîne dans une vision complètement différente de la réalité, aussi riche que surprenante.
13.4.1
Les expériences pour détecter des variations dans la vitesse de propagation de la lumière
En 1810, François Arago aborde le problème selon l’hypothèse de la nature corpusculaire de la lumière. Il cherche à détecter des variations, même infimes, dans la vitesse de la lumière, Son idée ? Plutôt que de mesurer un écart de vitesse, Arago cherche à détecter un écart exprimé en angles de réfraction à travers des prismes car l’angle de réfraction au passage du prisme sera fonction de la vitesse incidente des particules de lumière. Grâce à la précision de son instrumentation, Arago s’attend à mesurer entre les étoiles vers lesquelles la Terre se dirige et celles dont elle s’éloigne, des écarts angulaires correspondant à 1/5000e de la vitesse d’émission puisque la vitesse de la Terre autour du Soleil est environ 1/10 000e de celle de la lumière. C’est le même effet que nous observons sur l’autoroute pour les voitures que nous croisons ou qui nous dépassent : leur vitesse telle que nous la mesurons dépend de la nôtre. Quels furent les résultats obtenus ? Aucun écart notable ne fut enregistré bien que la précision des mesures ne fût pas en cause ! Se fondant quant à eux sur la modélisation ondulatoire de la lumière (vue comme l’oscillation d’un champ électromagnétique), Albert Michelson et Edward Morley perfectionnent à partir des années 1880 une méthode fondée sur l’interférence de faisceaux lumineux, dont la direction de propagation est différente par rapport au mouvement de la Terre : par exemple, l’un se propage parallèlement et l’autre perpendiculairement. La figure d’interférence obtenue entre les deux rayons traduit la différence entre les vitesses de propagation dans les deux directions. Du fait du mouvement de la Terre autour du Soleil, on s’attendait à ce que la vitesse de propagation des faisceaux lumineux, issus de la même source, variât selon la direction du bras traversé, avec comme conséquence une différence dans les temps de trajet des faisceaux. Le résultat permit de déterminer que la vitesse de la lumière était identique, indépendamment de son sens de propagation par rapport à la Terre. Cette propriété de la lumière est un second moyen, en plus de la désynchronisation des horloges parfaites, de déterminer laquelle des cinématiques
La théorie de la relativité restreinte
211
(galiléenne ou einsteinienne) décrit le mieux notre univers physique et a permis également de façon très précise d’estimer la valeur de la vitesse limite qui coïncide de très près avec celle de la lumière. La valeur de la vitesse limite a été fixée en 1983 : 299 792 458 m/s. Cette définition permet de relier les unités d’espace et de temps via la constante d’espace-temps c. Le mètre est quant à lui défini comme la longueur du trajet parcouru dans le vide par la lumière pendant une durée de 1/299 792 458 de seconde, si l’on admet que la vitesse de propagation de la lumière dans le vide coïncide avec la vitesse limite.
13.4.2
Le problème théorique posé par les lois de l’électromagnétisme
Les physiciens ont compris dans la deuxième moitié du xixe siècle que le cadre adéquat pour décrire la lumière (visible ou non) était donné par les lois de l’électromagnétisme établies par James Maxwell, la lumière étant une oscillation du champ électromagnétique. Or, les équations de Maxwell ne sont pas invariantes par les transformations de Galilée. Avec le recul, ce n’est pas étonnant puisque ces équations sont censées décrire correctement le comportement d’une onde qui ne peut se comprendre sans l’existence d’une vitesse limite. Historiquement, les transformations dites de Lorentz ont été obtenues par Lorentz et Poincaré dans le but de rendre les équations de Maxwell compatibles avec le principe de relativité. Les deux physiciens n’ont en revanche pas compris, contrairement à Einstein puis à Minkowski, que la véritable solution 23 avait une portée beaucoup plus générale et consistait à changer le cadre fondamental de la cinématique qui régit notre univers.
23. Pour plus de détails, on pourra consulter l’article historique d’Einstein (1905) ainsi que l’analyse de la partie cinématique par Spagnou (2014).
Chapitre 14 Les nouveaux effets physiques sur le temps prédits par la relativité restreinte Le simple fait qu’il existe une vitesse limite a des conséquences physiques contre-intuitives, en particulier dans l’interprétation du temps qui est notre sujet principal. L’existence d’une vitesse limite va invalider la notion de temps absolu (l’idée qu’il est possible de dater chaque lieu de l’Univers de façon identique) et introduire la notion de multiplicité des temps propres. Ce chapitre détaille les principaux effets physiques qui en résultent : désynchronisation cinématique des horloges parfaites, effet Doppler relativiste et effet Sagnac.
14.1
Relativité de la simultanéité
Considérons deux repères inertiels, R et R , où R est en mouvement de translation uniforme par rapport à R suivant le sens positif de l’un de ses axes, disons suivant l’axe x, comme illustré en figure 14.1. Considérons un point A, fixe dans R et appartenant à l’axe x’. Envoyons du point A des signaux lumineux suivant les deux sens de ce même axe. Puisque dans tout système (donc dans R ) la vitesse de la lumière mesurée, c, est la même, les signaux issus de A parviendront simultanément jusqu’aux points B et C équidistants de A et situés dans le système R . Or, pour un observateur dans le système R les événements « arrivée du signal en B » et « arrivée du signal en C » ne seront pas simultanés. En effet, selon la relativité, la vitesse de propagation des signaux lumineux est encore égale à c dans R, mais le point B se déplace (par rapport au système R) dans le même sens que le signal de A vers B, tandis que le point C se déplace (par rapport au système R) dans le sens contraire au signal de A vers C. En conséquence, vu du référentiel R, le signal arrivera au point C avant que l’autre signal n’arrive au point B.
214
Le temps dans la géolocalisation par satellites
Fig. 14.1 – Perte de la notion de simultanéité globale. Il faut bien comprendre que cette conclusion n’est pas propre à la lumière : si l’on utilise des objets quelconques (deux ballons par exemple) que l’on expédie du point A à la même vitesse et au même instant dans R , ils parviendront simultanément dans R aux points B et C mais de façon décalée dans R, car selon la loi de composition relativiste des vitesses établie au paragraphe 13.3, les vitesses des projectiles ne sont plus de simples additions dans R et ne compensent donc plus exactement la distance plus courte ou plus longue à parcourir dans R (comme c’est le cas dans la cinématique galiléo-newtonienne). En relativité, deux événements peuvent être simultanés dans un référentiel mais décalés dans un autre, non pas à cause du caractère fini de la vitesse de propagation des signaux utilisés mais comme conséquence de l’existence d’une vitesse limite de propagation de l’information dans notre univers.
14.2
La désynchronisation cinématique des horloges parfaites
Ce second effet est le plus important de la relativité restreinte en ce qui concerne le temps. Il fut prédit par Einstein en 1905 et fut vérifié pour la première fois 66 ans plus tard par Joseph Hafele et Richard Keating. Il peut s’énoncer comme suit. Prenons deux horloges parfaites synchronisées côte à côte dans un référentiel inertiel et éloignons l’une d’elles pour lui faire parcourir une courbe fermée quelconque qui la ramène au point de départ. Alors nous allons constater un décalage à l’arrivée, et plus précisément un retard, entre l’horloge déplacée et celle restée sur place. Précisons que les horloges ont conservé un rythme
Les nouveaux effets physiques sur le temps prédits par la RR
215
strictement identique tout au long de l’expérience. Autrement dit, l’une ne s’est pas mise à « battre » plus lentement alors qu’elle était en mouvement. Comment comprendre ce phénomène qui est complètement inexplicable par la physique newtonienne ? La façon la plus simple d’expliquer le phénomène (c’est-à-dire avec le moins d’hypothèses artificielles possible) est de considérer que le temps cumulé enregistré par chacune des horloges ne concorde pas : le nombre de secondes compté diffère d’une horloge à l’autre. La désynchronisation est expliquée par le fait que les horloges parfaites enregistrent chacune fidèlement un temps cumulé (un nombre de cycles) différent. Il existe donc autant de temps « vrais » que d’horloges et d’observateurs, le temps cumulé de chaque observateur dépend de sa trajectoire pour aller d’un point A à un point B et pas seulement des dates de début et de fin. La relativité restreinte évalue la désynchronisation de la façon suivante. Sélectionnons un référentiel que l’on considère comme inertiel. Soit Δτ0 la durée enregistrée par l’horloge au repos au point « O » dans ce référentiel. La formulation qui traduit la désynchronisation cinématique des horloges parfaites est une conséquence de la chronogéométrie de Minkowski. Dans cette géométrie à quatre dimensions, l’élément de longueur est ds et est « invariant par rotation », c’est ce que veut dire « invariant par changement de référentiel ». Autrement dit, si (x, y, z, t) sont les coordonnées d’un événement dans le référentiel R et si (x , y , z , t ) sont les coordonnées du même événement dans le référentiel R , l’intervalle d’espace-temps est invariable et s’écrit : ds2 = dx2 + dy 2 + dz 2 − c2 dt2 = dx2 + dy 2 + dz 2 − c2 dt2 .
(14.1)
Dans le référentiel propre, celui où l’observateur est au repos, dx = dy = dz = 0, donc l’intervalle d’espace-temps ds de la métrique de Minkowski vaut : ds2 = −c2 dτ 2 ,
(14.2)
où τ est le temps propre de l’observateur. Dans le référentiel local inertiel, l’observateur se déplace à la vitesse de norme constante v durant dt, donc dx2 + dy 2 + dz 2 = dr2 = v 2 dt2 . L’intervalle d’espace-temps s’écrit : ds2 = v 2 dt2 − c2 dt2 . (14.3) Donc :
c2 dτ 2 = c2 dt2 − v 2 dt2 .
On en déduit que :
(14.4)
v 2 (t) dt. (14.5) c2 Donc, si deux horloges sont fixes au point O dans un référentiel inertiel et que l’une des deux horloges parcourt une courbe fermée quelconque à partir du point O, la durée propre Δτ qu’elle enregistre pour son trajet est donnée par : Δτ0 v 2 (t) Δτ = 1 − 2 dt , (14.6) c 0 dτ =
1−
où Δτ0 est la durée propre enregistrée par l’horloge restée au point O.
216
Le temps dans la géolocalisation par satellites
Remarquons que, pour une vitesse faible devant c et constante, l’expression ci-dessus devient : v2 Δτ = 1 − 2 Δτ0 . (14.7) 2c La chronogéométrie de Minkowski a été bâtie pour conserver l’invariance de la vitesse limite et c’est elle qui permet d’établir la multiplicité des temps propres. De ce fait, multiplicité des temps propres et existence d’une vitesse limite sont indissociables : ce sont les deux faces d’une même pièce. Le temps propre est le temps cumulé enregistré (depuis une origine donnée) par une horloge supposée parfaite. L’équation précédente montre que Δτ est toujours inférieur à Δτ0 : une fois les horloges réunies, l’horloge voyageuse retarde toujours par rapport à l’horloge au repos restée sur place. Autrement dit, l’horloge voyageuse a compté un nombre de cycles (des secondes par exemple) inférieur à celui compté par l’horloge au repos. Cet effet traduit la multiplicité des temps propres. Un point important à souligner est que la relativité restreinte permet d’étudier n’importe quelle courbe fermée et qu’elle fournit un nouveau cadre cinématique universel. Une horloge parcourant dans un repère inertiel une courbe fermée à la vitesse v quelconque retardera toujours à son retour au point de départ. Si le référentiel n’est pas inertiel, la formule est plus compliquée et le décalage pourra correspondre à une avance ou à un retard. Un dessin très simple présenté en figure 14.2 (qui permet de saisir clairement la situation) va nous permettre de résumer les aspects importants. On pourrait penser que seules les indications des horloges à l’endroit où elles coïncident spatialement (points A et B) ont un sens physique mais cela est inexact. Nous verrons que l’expérience de Carroll Alley a permis de comparer les temps propres à distance, donc pas uniquement aux points A et B. Intéressons-nous à la ligne droite dans la figure 14.2 (censée être parcourue à vitesse constante). Il est facile de voir que si l’on raisonne dans un référentiel inertiel, c’est la trajectoire joignant les deux points-événements A et B qui est la plus longue dans l’espace-temps décrit par la métrique de Minkowski, bien qu’elle soit la trajectoire la plus courte dans l’espace. Si l’on emprunte une trajectoire plus longue dans l’espace, il nous faut aller plus vite pour rallier B au même instant, donc nous mesurerons toujours une durée propre plus courte, compte tenu de la désynchronisation des horloges parfaites. Or, la ligne droite est aussi, selon la loi d’inertie, la trajectoire suivie par un corps sur lequel ne s’exerce aucune force. Nous en concluons qu’un corps qui n’est soumis à aucune influence extérieure (donc dont le mouvement est inertiel) suit pour aller de A à B la trajectoire qui maximise son temps propre. Certaines situations étonnantes sont possibles conformément à la figure 14.2 pour deux voyageurs munis d’horloges et empruntant chacun une trajectoire différente pour aller de A et B, les deux voyageurs partant de A au même instant vu de A.
Les nouveaux effets physiques sur le temps prédits par la RR
217
Fig. 14.2 – Désynchronisation des horloges parfaites. Les deux horloges identiques sont synchronisées au départ (point A) mais ne le sont plus à leur point de rencontre (point B) à l’issue de leurs trajectoires respectives, chacune ayant enregistré un temps propre (cumulé) différent.
L’un des deux voyageurs peut arriver en B avant l’autre bien que chacun d’eux ait mesuré une durée propre identique pour effectuer le trajet. L’un des voyageurs peut arriver en B après l’autre bien que son trajet lui ait pris moins de temps. Le fameux « paradoxe » des jumeaux (qu’il est plus approprié de qualifier de pseudo-paradoxe car il n’y a aucune contradiction logique) n’est qu’un cas particulier pour la figure 14.2. Simplifions-le à l’extrême : au départ nos jumeaux sont réunis quelque part dans l’espace loin de toute source de gravitation. Si l’un d’eux effectue un aller-retour, il sera plus jeune que son comparse à son retour au point de
218
Le temps dans la géolocalisation par satellites
rencontre et la différence sera très marquée si le voyage (très hypothétique) est réalisé à une vitesse proche de la vitesse limite. L’expérience de Hafele et Keating a permis de vérifier en 1971 cette prédiction avec des horloges de haute précision (pour des vitesses nettement plus faibles que celle imaginée pour le jumeau voyageur). On a pu également tester des effets similaires en accélérant des particules telles que les muons dans un anneau (jusqu’à une vitesse proche de la vitesse limite) et en mesurant leur durée de vie moyenne dans le laboratoire. La désynchronisation cinématique des horloges parfaites est l’effet roi de la relativité restreinte. Deux horloges parfaites au rythme identique et initialement synchronisées sont en général décalées à leur point de rencontre à l’issue de leurs voyages respectifs. Un effet révolutionnaire totalement incompréhensible en physique newtonienne.
14.3
La dilatation des temps
On trouve encore très souvent dans la littérature sous la plume de vulgarisateurs ou d’enseignants mais aussi dans des articles de spécialistes l’expression « dilatation des temps », « dilatation du temps » ou « dilatation des durées ». Cette appellation est hautement critiquable car elle est la source de nombreuses confusions. Elle désigne dans l’esprit des spécialistes tous les effets physiques dont la source première est la multiplicité des temps propres. Historiquement, elle correspond à un effet beaucoup plus restrictif : la dilatation des durées impropres. L’intervalle de temps entre deux événements se produisant au même endroit dans un référentiel inertiel donné est toujours inférieur à l’intervalle de temps (dit impropre) entre ces deux mêmes événements mesuré dans un autre référentiel inertiel en mouvement par rapport au premier. Le terme « dilatation » est contestable car il évoque une cause mystérieuse qui ralentirait l’écoulement du temps alors que les effets sont métriques (conséquence de la nouvelle géométrie à quatre dimensions d’Einstein-Minkowski). Il pointe aussi une asymétrie – pourquoi « dilatation » plutôt que « contraction » du temps ? – qui n’existe pas lorsqu’on englobe dans l’effet des résultats d’expérience très divers concernant des désynchronisations relativistes d’horloges. Le fait d’amalgamer sous la même terminologie un ensemble disparate d’effets physiques distincts conduit fréquemment à des incompréhensions préjudiciables. C’est pourquoi nous n’emploierons pas ces termes dans la suite de cet ouvrage.
Les nouveaux effets physiques sur le temps prédits par la RR
14.4
219
La contraction des longueurs
Bien qu’il ne s’agisse pas d’un effet temporel, nous le mentionnons ici, car il est indissociable de la cinématique relativiste. Considérons une règle rigide au repos dans le référentiel R. Dans ce référentiel, la règle est posée parallèlement à l’axe x, les coordonnées des extrémités de la règle dans le référentiel R sont x1 et x2 et sa longueur mesurée dans de référentiel est notée Δx = x2 − x1 . On cherche maintenant à mesurer la longueur de cette règle pour un observateur en mouvement de translation rectiligne et de vitesse uniforme, soit dans le référentiel R . Pour cela, on cherche les coordonnées des deux extrémités x1 et x2 à un même instant t . La longueur cherchée est notée Δx = x2 − x1 . Or, les transformations de Lorentz donnent immédiatement la valeur de cette longueur : Δx = γΔx .
(14.8)
On appelle « longueur propre » la longueur l0 d’une tige dans le référentiel où elle repose. La longueur l de cette même tige vue dans un autre référentiel inertiel en mouvement uniforme de vitesse v est donnée par la relation : l = l0
1−
v2 . c2
(14.9)
Autrement dit, la distance entre deux points A et B est la plus « longue » dans le référentiel où ce que l’on mesure est immobile, elle paraît plus courte dans tout autre repère en mouvement uniforme. Il est aussi équivalent de dire que la distance entre deux points A et B, fixes dans un référentiel en mouvement, apparaît plus courte dans celui considéré comme « au repos ».
14.5
L’effet Doppler relativiste
L’effet Doppler relativiste est un décalage de fréquence entre l’onde reçue et l’onde émise qui comprend un terme ne dépendant que du module de la vitesse : il peut donc s’observer même pour une source qui reste à égale distance du récepteur, on parle alors d’effet Doppler « transverse » et le terme relativiste s’ajoute à l’effet Doppler classique résultant de l’éloignement ou du rapprochement de la source. Considérons une source qui se déplace à la vitesse constante v (en module) par rapport à un observateur inertiel, en émettant un signal périodique de fréquence fe vers l’observateur. Les intervalles d’espace-temps au niveau du récepteur et de l’émetteur s’écrivent comme suit : ds2e = −c2 dτe2 : où τe est le temps propre mesuré par l’émetteur ; ds2r = −c2 dτr2 : où τr est le temps propre mesuré par le récepteur.
220
Le temps dans la géolocalisation par satellites
La métrique étant celle de Minkowski ces intervalles sont aussi donnés par : ds2e = dx2 − c2 dt2 = v 2 dt2 − c2 dt2 = v 2 − c2 dt2 , ds2r = −c2 dt2 , où t est le temps indiqué par le référentiel inertiel associé au récepteur et v la vitesse de l’émetteur par rapport au récepteur. Le rapport entre les durées propres pour l’émetteur et le récepteur est donc : Δτe v2 = 1− 2 . (14.10) Δτr c Ce rapport traduit la multiplicité des temps propres et il est important de l’interpréter correctement : pendant que s’écoule la durée propre Δτr pour le récepteur entre τr et τr + Δτr l’émetteur enregistre, tout au long des événements qu’il traverse lorsqu’il passe du point correspondant à τr au point correspondant à τr + Δτr , la durée propre Δτe . Si nous revenons à l’effet Doppler classique, l’intervalle de temps entre les impulsions reçues sera : vr
1 Δτr = Δτe , 1+ (14.11) 2 c 1− v c2
où vr est la vitesse radiale de l’émetteur par rapport, au récepteur comptée positivement pour une source qui s’éloigne. La différence par rapport à la formule de l’effet Doppler classique est le facteur de conversion γ d’une échelle de temps propre à l’autre. On obtient directement la formule générale pour l’effet Doppler relativiste : 2 1 − vc2 1 − vc fr = fe × = fe × (si v = vr ) . (14.12) vr 1+ c 1 + vc
√ 2 En utilisant les formules de développements limités 1 − x2 ≈ 1 − x2 et 1 1 − x + x2 , la formule devient, en négligeant les termes d’ordre 1+x ≈ supérieur à 2 : vr2 vr v2 + 2 − 2 . (14.13) fr = fe × 1 − c c 2c L’effet Doppler relativiste, tout comme l’effet Doppler classique, est universel : il ne se limite pas aux ondes électromagnétiques mais est applicable à tout processus physique périodique. Le terme du second ordre en v 2 /c2 est entièrement imputable à la discordance entre les temps propres au point de réception et au point d’émission, caractéristique essentielle de la chronogéométrie d’Einstein sans équivalent dans la physique newtonienne. En résumé, lorsque l’émetteur s’éloigne ou se rapproche du récepteur, la fréquence reçue est décalée d’une quantité newtonienne qui résulte de la vitesse radiale et d’une autre quantité purement relativiste qui résulte de la différence entre les temps propres.
Les nouveaux effets physiques sur le temps prédits par la RR
221
Fig. 14.3 – Changement de la fréquence reçue par effet Doppler transverse.
14.5.1
Effet Doppler transverse
L’effet Doppler transverse, pour une source en mouvement à vitesse modérée par rapport au récepteur mais à distance fixe, se traduit par un terme en v 2 /2c2 contrairement à l’effet classique qui est nul dans cette situation, car il n’y a ni éloignement ni rapprochement de la source. Du point de vue de l’interprétation physique, cet effet est une conséquence directe de la multiplicité des temps propres. L’intervalle de temps propre entre deux impulsions au niveau de l’émetteur diffère de l’intervalle de temps propre correspondant au niveau du récepteur. Pour clarifier l’effet Doppler transverse dans le cas des ondes lumineuses, il est important de distinguer trois variables : 1. la fréquence de la raie émise depuis l’étoile considérée (supposée ici fixe par rapport à la Terre) et qui serait mesuré au point d’émission ; 2. la fréquence de la même raie émise et mesurée sur Terre ; 3. la fréquence de la raie émise depuis l’étoile mesurée au point de réception (sur Terre). Les deux premières fréquences sont identiques car les fréquences propres sont inchangées. En revanche, la troisième valeur se différencie des deux premières à cause de la disparité des temps propres sur la Terre et sur l’étoile source. Cette effet apparaît clairement dans le cas d’un mouvement circulaire uniforme : supposons que l’horloge A parcoure indéfiniment la circonférence d’un cercle et que l’horloge B soit fixe au centre (dans un référentiel inertiel). Dans cette situation, illustrée en figure 14.3, le temps propre cumulé par l’horloge A est inférieur à celui cumulé par l’horloge B et l’effet n’est pas réciproque : pour s’en convaincre on peut transmettre d’une horloge à l’autre
222
Le temps dans la géolocalisation par satellites
le temps enregistré par chacune des deux. L’horloge B recevra un temps cumulé de A inférieur au sien tandis que l’horloge A recevra de B un temps cumulé supérieur : il n’y a aucune réciprocité dans cette configuration parce que le référentiel pour B est inertiel alors que celui pour A ne l’est pas.
14.5.2
Application en navigation
En pratique, l’effet est assez similaire à ce que l’on peut observer à distance entre les horloges à bord des satellites GPS et les horloges au sol. La différence entre durées propres n’est pas réciproque et c’est une situation très courante. L’effet Doppler transverse intervient dans le transfert de fréquence entre horloges distantes. Il est important de préciser que c’est la désynchronisation cinématique des horloges parfaites (autre effet distinct) qu’il faut prendre en compte pour la localisation par GPS et non l’effet Doppler.
14.6
L’effet Sagnac
C’est l’un des effets phares de la relativité restreinte et qui souffre de nombreuses incompréhensions que nous allons tenter de dissiper. Afin d’explorer le contexte historique, le lecteur pourra consulter l’analyse Bibnum par Spagnou (2013) des articles de Sagnac (décrivant son expérience de 1913). Georges Sagnac fut un adversaire résolu de la relativité jusqu’à la fin de sa vie, bien que l’effet détecté soit purement relativiste. L’effet Sagnac est le décalage dans les temps d’arrivée de deux signaux lumineux ou objets quelconques émis au même instant et parcourant en sens contraire à la même vitesse un circuit fermé en rotation (voir la figure 14.4). Il s’agit là d’un effet purement relativiste qui peut se déduire de nombreuses façons et qui peut donner l’impression erronée d’être un simple effet classique. Comme nous le verrons, il y a un effet Sagnac dans la prise de mesure d’un signal GPS car toutes les horloges terrestres sont entraînées par la rotation de la Terre, à des vitesses différentes en fonction de la latitude (de 465 m/s à l’équateur à 0 aux pôles). L’effet sur la mesure GPS peut atteindre la centaine de nanosecondes et doit donc être compensé dans certaines situations.
14.6.1
Déduction relativiste de l’effet Sagnac optique à partir du référentiel du laboratoire
Plaçons-nous dans le référentiel inertiel (celui du laboratoire) qui voit le disque tourner. L’élément clef du raisonnement est que la vitesse de propagation du signal lumineux est c dans les deux sens. La durée d’un tour pour le signal partant dans le sens de la rotation du disque est calculée en exprimant la distance parcourue de deux façons. La distance parcourue pendant la durée Δt+ (que nous cherchons) est cΔt+ mais cette distance est égale à la circonférence du disque augmentée du trajet
Les nouveaux effets physiques sur le temps prédits par la RR
223
Fig. 14.4 – L’expérience de Sagnac. Les deux faisceaux lumineux ou objets quelconques sont émis au même instant du point O attaché au circuit tournant et parcourent le circuit en sens inverse à la même vitesse pour revenir au point O.
supplémentaire correspondant à la rotation du disque durant Δt+ : cΔt+ = 2πR + RωΔt+ .
(14.14)
De façon similaire, on établit que la durée d’un tour pour le signal se propageant en sens contraire est donnée par : cΔt− = 2πR − RωΔt− .
(14.15)
L’écart Δt mesuré dans le référentiel inertiel à l’arrivée entre les deux signaux est donc donné par : 1 4πR2 ω 1 Δt = Δt+ − Δt− = 2πR − = (14.16) 2 2 . c − Rω c + Rω c2 1 − Rc2ω C’est une durée impropre (puisque le départ et l’arrivée n’ont pas lieu au même endroit). Ce que nous cherchons est une durée propre, la durée mesurée par un observateur en O, donc attaché au circuit en rotation. Le passage de l’une (impropre) à l’autre (propre) se fait en divisant par le facteur γ.
224
Le temps dans la géolocalisation par satellites
Le délai Sagnac mesuré par une horloge du référentiel tournant est donc donné par : 4πR2 ω ΔtSagnac = . (14.17) 2 2 c2 1 − Rc2ω
14.6.2
Déduction de l’effet Sagnac universel à partir du référentiel du laboratoire
Dans cette approche, on remplace la lumière par n’importe quel objet ou onde que l’on expédie en sens contraire et à la même vitesse v0 (supposée être mesurée localement) par rapport au disque tournant. Nous allons comparer les prédictions théoriques de la relativité restreinte et de la physique newtonienne dans cette situation. Approche newtonienne dans le référentiel tournant Puisque chaque projectile parcourt la circonférence du disque à la même vitesse, vu du disque tournant, la durée d’un tour est identique pour chacun d’eux. Par conséquent, ils reviendront au même instant à leur point de départ O. Approche newtonienne dans le référentiel inertiel du laboratoire Dans le référentiel inertiel qui voit le disque tourner les arrivées simultanées au point O s’explique par le fait que leur vitesse est la somme de la vitesse de propagation v0 et de la vitesse tangentielle du disque tournant. Si v+ note la vitesse du projectile partant dans le sens de rotation par rapport au référentiel local inertiel et v− celle du projectile partant en sens inverse, la loi d’addition des vitesses donne : v+ = v0 + Rω et v− = v0 − Rω. Ainsi, calculées ces vitesses compensent exactement l’allongement ou le raccourcissement du trajet dû à la rotation du disque. Pour la physique newtonienne, l’effet Sagnac n’existe pas : le délai est nul. Approche relativiste dans le référentiel inertiel du laboratoire On reprend ici le raisonnement déjà utilisé pour la lumière La distance parcourue par le projectile qui se déplace dans le sens de la rotation est un peu plus grande que lorsque le disque est immobile, puisque durant son trajet, le disque tourne d’une petite quantité et l’émetteur-récepteur (point O) aussi. v+ Δt+ = 2πR + RωΔt+ ,
(14.18)
v− Δt− = 2πR − RωΔt− .
(14.19)
On en déduit que : Δt+ − Δt− = 2πR
1 1 − v+ − Rω v− + Rω
.
(14.20)
Par rapport au raisonnement newtonien, les vitesses v+ et v− ne sont plus simplement la somme de la vitesse v0 (identique dans les deux sens) par rapport
Les nouveaux effets physiques sur le temps prédits par la RR
225
au disque et de la vitesse de rotation du disque, Nous devons appliquer la loi de composition relativiste des vitesses : v+ =
v0 + Rω , 1 + v0cRω 2
v− =
v0 − Rω . 1 − v0cRω 2
(14.21)
Tous calculs faits, on trouve que l’écart Δt mesuré dans le référentiel inertiel à l’arrivée entre les deux entités utilisées est donné par : Δt =
4πR2 ω . c2 − R 2 ω 2
(14.22)
La vitesse v0 a disparu et on retrouve le délai de Sagnac ΔtSagnac obtenu pour la lumière en multipliant Δt par le facteur inverse de Lorentz. Le délai Sagnac ne dépend donc pas de la vitesse v0 des projectiles par rapport au disque : il suffit qu’elle soit non nulle et identique dans les deux sens. Vu de l’extérieur du circuit en rotation le délai Sagnac est obtenu par la loi de composition relativiste des vitesses. La valeur c dans la formule apparaît clairement ici comme une constante structurelle qui fixe la vitesse limite de notre univers, puisque nous avons raisonné avec des projectiles quelconques. La relativité restreinte prédit l’universalité de l’effet Sagnac en ce sens qu’il ne dépend ni de la nature des objets utilisés pour faire le tour du disque ni de leur vitesse par rapport au disque.
14.6.3
Raisonnement physique à partir de la multiplicité des temps propres
Il est crucial de comprendre que le délai Sagnac est une conséquence de la désynchronisation cinématique des horloges parfaites. Synchronisons trois horloges parfaites au même endroit : celle attachée à l’émetteur-récepteur au point O, celle du voyageur qui partira dans le sens de la rotation et celle du voyageur qui se dirigera dans le sens contraire. Les deux voyageurs partent au même instant, le top est donné au point O. Dans le référentiel inertiel du laboratoire, l’horloge du voyageur partie dans le sens de la rotation va un peu plus vite que celle de l’émetteur-récepteur au point O et celle partie en sens contraire va un peu moins vite Selon la désynchronisation des horloges parfaites appliquée dans le référentiel inertiel, l’horloge partie dans le sens de la rotation indique un retard d+ à son arrivée par rapport à l’horloge au point O et l’horloge partie dans l’autre sens indique une avance d− . Lorsque l’horloge voyageuse a fait un tour complet dans le sens de la rotation elle a enregistré la durée propre Δτ+ et l’horloge en O (fixe mais tournant avec le disque) a enregistré la durée propre Δt+ Le retard de l’horloge voyageuse implique que Δt+ = Δτ+ + d+ .
226
Le temps dans la géolocalisation par satellites
De même lorsque l’horloge voyageuse a fait un tour complet dans le sens opposé à la rotation, elle a enregistré la durée propre Δτ− et l’horloge en O a enregistré la durée propre Δt− . L’avance de l’horloge voyageuse implique que Δt− = Δτ− − d− . Or, chacune des deux horloges voyageuses mesure localement la même vitesse par rapport au disque (c’est même l’hypothèse) et mesure également la même distance parcourue. La situation étant parfaitement symétrique, les deux durées propres Δτ+ et Δτ− enregistrées par les horloges voyageuses sont identiques. Par conséquent, le délai Sagnac est donné par : Δt+ − Δt− = d+ − d− .
(14.23)
La réalité des effets de désynchronisation (multiplicité des temps propres) suffit à expliquer l’effet Sagnac : le décalage dans les temps d’arrivée correspond à cette désynchronisation et on ne peut pas avoir l’un sans l’autre. Résumons. Il s’écoule plus de temps pour l’émetteur-récepteur que pour le voyageur parti dans le sens de la rotation. Il s’écoule moins de temps pour l’émetteur-récepteur que pour le voyageur parti dans le sens contraire. Chacun des voyageurs revient au point O après avoir mesuré la même durée pour son tour complet mais leurs horloges respectives sont désynchronisées puisque celui parti en sens contraire est arrivé plus tôt que son comparse. Vu de l’émetteur-récepteur fixé sur le circuit en rotation, le délai Sagnac provient de la multiplicité des temps propres : l’horloge voyageant dans le sens de la rotation retarde par rapport à celle de l’émetteur-récepteur tandis que celle partie en sens contraire avance. Prenons un exemple concret : on fait partir les deux horloges à midi pour l’observateur en O, la A dans le sens de la rotation, la B dans le sens contraire. Le voyage a duré le même temps pour toutes les deux, disons 1 heure. L’horloge B arrive en O à 13h à son aiguille (midi + une heure) mais elle arrive la première. Elle attend A disons 10 minutes. Lorsque A parvient en O, il est 13h également à son aiguille (midi + une heure). Mais à ce moment-là il est 13h10 à l’horloge B. Les deux horloges parfaites sont désynchronisées lorsqu’elles se retrouvent. La définition la plus appropriée de l’effet Sagnac nous semble être celle-ci : L’effet Sagnac est le décalage temporel dans l’arrivée de deux entités quelconques (ondes ou particules) émises depuis un même point d’un circuit fermé en rotation et dont les durées propres pour parcourir ce circuit à contresens sont identiques. L’avantage de la définition ci-dessus (où la lumière apparaît comme un cas limite), à partir de l’identité des temps propres dans les deux sens, est qu’elle ne fait pas référence à une vitesse, la mesure de celle-ci pour un trajet aller résultant nécessairement d’une convention de synchronisation puisqu’il faut mesurer deux temps avec deux horloges distantes. La définition traditionnelle de l’effet Sagnac, fondée sur des vitesses, donne l’illusion que l’effet Sagnac serait lié au procédé de synchronisation alors qu’il n’en est rien : le délai
Les nouveaux effets physiques sur le temps prédits par la RR
227
Fig. 14.5 – Synchronisation par transmission d’un signal. Sagnac ne fait pas intervenir la vitesse des objets par rapport au circuit et est en fait une variante du pseudo-paradoxe des jumeaux.
14.6.4
Déduction de l’effet Sagnac par le calcul différentiel et les transformations de Lorentz
On considère deux plans parallèles dans un référentiel mobile R en translation à la vitesse v par rapport à un référentiel R inertiel. Le propos est ici de faire un transfert de temps, d’une horloge positionnée en x vers une horloge positionnée en x + dx au moyen d’un signal électromagnétique voyageant dans R à la vitesse u de composantes u = (ux , uy ). Notons u = (ux , uy ) les composantes du signal exprimées dans le référentiel inertiel R. Le lecteur est invité à se rapporter à la figure 14.5 pour l’illustration du cas étudié. On cherche à transférer le temps de l’horloge en x à celle positionnée en x + dx , donc synchroniser une horloge par rapport à une horloge distante. Pour ce faire, on compare le temps de propagation du signal mesuré dans R avec le temps de propagation du signal mesuré dans le référentiel R. L’analyse est faite dans le référentiel inertiel R et le raisonnement utilisé est toujours le même : si le référentiel mobile parcourt la distance vdt dans l’intervalle de temps relatif dt alors la distance totale parcourue par le signal dans la direction x pendant la durée dt est ux dt qui est la somme de deux contributions. La première est la distance dx, qui est la longueur dx vue dans le référentiel fixe R. La seconde est la distance vdt à parcourir par le signal pour atteindre le plan x + dx . Soit : ux dt = dx + vdt. (14.24) Le temps dt nécessaire au trajet est donc : dt =
dx . ux − v
(14.25)
228
Le temps dans la géolocalisation par satellites
Or, la composante ux n’est pas la simple addition des vitesses ux et v mais le résultat de la transformation de Lorentz : ux =
ux + v 1+
ux v c2
(14.26)
.
u v
Ici on rappelle que le terme cx2 est entièrement imputable au postulat de la vitesse limite, autrement dit la constance de la vitesse de la lumière. La différence ux − v s’écrit alors : ux − v =
ux
·
1− 1+
v2 c2 ux v c2
.
(14.27)
Ce qui permet d’expliciter le temps de trajet mesuré dans le référentiel R : dx u v 1 dt = 1 + x2 · (14.28) 2 . ux c 1 − vc2
2 Par commodité, on utilise l’expression du facteur de Lorentz γ 2 = 1/ 1 − vc2 et on trouve : dx vdx dt = γ 2 + γ 2 2 , (14.29) ux c Soit finalement :
1 γdx vdx dt = + γ 2 . γ ux c
(14.30)
La durée γ1 dt correspond à la durée propre dans le référentiel mobile. La distance γdx = dx est la distance propre dans le référentiel mobile (contraction des longueurs). Ainsi, le premier terme du membre de gauche représente le temps nécessaire, dans le repère mobile, pour que le signal u voyage du plan x au plan x + dx dans la direction horizontale. Si l’observateur du référentiel R ignore son mouvement par rapport au référentiel inertiel R ce serait le temps nécessaire pour synchroniser l’horloge du plan x + dx à l’horloge distante située dans le plan x . Le second terme est un temps additionnel nécessaire pour réaliser le transfert de temps dans le référentiel inertiel R. C’est le délai Sagnac : dtSagnac = γ
vdx . c2
(14.31)
Ce délai est indépendant de la vitesse du signal. La vitesse du signal pourrait même être variable, le délai Sagnac n’en serait pas modifié. Le délai Sagnac est vu comme un facteur de désynchronisation des horloges quand on passe du référentiel R en mouvement au référentiel inertiel R. Autrement dit, si un événement est vu de façon simultanée dans le référentiel R , il ne le sera plus relativement à R.
Les nouveaux effets physiques sur le temps prédits par la RR
229
Pour retrouver les résultats précédents, on peut facilement intégrer cette équation différentielle le long d’un contour fermé de longueur L posé sur un disque tournant. Si le signal voyage dans le même sens que le disque, alors le temps propre accumulé par le signal pour faire le circuit complet est : dx 1 vL Δt+ = dt = + γ 2 = Δτ+ + d+ . (14.32) γ ux c Pour le signal voyageant en sens opposé le temps propre accumulé pour réaliser le circuit complet est : dx 1 vL Δt− = dt = − γ 2 = Δτ− − d− . (14.33) γ ux c La différence est :
2vL . (14.34) c2 En prenant L = 2πR et v = ωR, on retrouve exactement la formulation ΔtSagnac pour le disque tournant. Le fait que l’intégrale circulaire du second terme soit non nulle signifie qu’il est impossible de transférer le temps par un signal quelconque sur un disque tournant sans prendre en compte le délai Sagnac. Δt = d+ − d− = γ
14.6.5
Déduction relativiste de l’effet Sagnac dans le référentiel tournant
Le délai Sagnac permet de transférer le temps dans un référentiel tournant. Or, ce délai n’apparaît pas lorsque l’on transfère le temps en repère inertiel. Cette quantité doit donc être contenue dans la métrique de Minkowski lorsqu’on lui applique une transformation de changement de référentiel ECI en repère tournant ECEF. Dans un repère inertiel, la métrique de Minkowski en coordonnées cylindriques s’écrit : ds2 = dr2 + r2 dθ2 + dz 2 − c2 dt2 .
(14.35)
Faisons maintenant varier les axes en appliquant une rotation de vitesse angulaire ω. Cela revient à appliquer le changement de coordonnées : r = r ,
θ = θ + ωt ,
z = z ,
t = t .
(14.36)
Tous calculs faits, la métrique de Minkowski exprimée en repère tournant s’écrit : ω 2 r2 2 2 2 2 ds = (dl ) + 2ωr dθ dt − c 1 − 2 (dt )2 , (14.37) c 2 2 2 où on utilise la variable (dl ) = (dr ) + r2 dθ + (dz )2 pour l’élément de carré de la distance. Dans la suite, on utilise la notation classique : 1 ω 2 r2 =1− 2 . 2 γ c
(14.38)
230
Le temps dans la géolocalisation par satellites
La transformation associée à la variable temps-coordonnée t = t signifie simplement que, dans le repère tournant, la coordonnée temporelle est fixée par le temps-coordonnée du repère inertiel. On va utiliser à présent la convention de synchronisation d’Einstein, qui repose sur l’invariance de la vitesse de la lumière, pour synchroniser un réseau d’horloges fixes dans le repère tournant. Dans le cas d’un trajet lumineux, l’élément de longueur spatio-temporel est nul, ds2 = 0, ce qui ramène à une équation du second degré dans la composante temps. 2 cdt 2ωr2 dθ cdt − (dl )2 = 0. −γ (14.39) γ c γ On résout cette équation en négligeant dans le discriminant le paramètre 2 2 ωr : c cdt ωr2 dθ = dl + γ . γ c
(14.40)
La quantité r2 dθ /2 est l’élément d’aire dAz , dans le repère tournant, balayé par le vecteur partant de l’axe de rotation jusqu’au signal lumineux, et projeté sur un plan parallèle au plan équatorial. Au total, le temps mis par la lumière pour parcourir le chemin Γ est : dt dl 2ω = +γ 2 dAz . (14.41) c Γ Γ γ Γ c Un observateur sur Terre qui ignore le mouvement de rotation de la Terre utiliserait seulement la quantité ∫ dl /c pour synchroniser son réseau d’horloges. Par contre, un observateur au repos dans un référentiel inertiel dirait que cette synchronisation est dépendante du chemin parcouru par la lumière. Cette dépendance est prise en compte dans le terme Sagnac : 2ω Δtsagnac = γ 2 dA . (14.42) c Γ Z S’il ne tenait pas compte de ce terme correctif, un utilisateur terrestre qui utiliserait la lumière pour le transfert de temps ferait une erreur significative de synchronisation. Imaginons que l’on effectue un processus de synchronisation qui suit l’équateur dans la direction de l’est (sens de la rotation de la Terre). On rappelle que 2ω/c2 = 1,6227×10−21 s/m2 , le rayon de la Terre est pris égal à a = 6378,137 km, l’aire balayée en faisant un tour le long de l’équateur dans le sens positif est πa2 = 1,27802 × 10−14 m2 . Avec ces données numériques, le terme (avec l’approximation γ ≈ 1) correctif de Sagnac est : 2ω dAz = 207, 4 ns. (14.43) c2 e´quateur Cela signifie que si l’on veut synchroniser un réseau d’horloges localisées à l’équateur, la dernière horloge du réseau retarderait de 207, 4 ns par rapport à
Les nouveaux effets physiques sur le temps prédits par la RR
231
la première. En prenant un chemin vers l’ouest, la dernière horloge avancerait cette fois-ci de 207, 4 ns par rapport à la première. Dans un repère inertiel, il est également possible d’utiliser une horloge mobile pour disséminer le temps de telle sorte que le déplacement soit si lent que la désynchronisation cinématique, relativement à une horloge au repos, soit pratiquement nulle. Si le mouvement est très lent, on peut considérer que les accroissements dr2 + r2 dθ2 + dz 2 = v 2 dt2 sont proches de 0. Dans le référentiel inertiel, le temps propre est dτ 2 = − (ds/c)2 . Un observateur dans le repère tournant qui tenterait la même expérience trouvera que le temps propre cumulé de son horloge est affecté par la vitesse de rotation de la Terre. En factorisant par le temps-coordonnée du repère tournant, la métrique a pour expression 2 2 2 dt γdl 2 2 2ωr dθ − (ds/c) = 1−γ . (14.44) − γ c2 dt cdt 2
Pour une horloge se déplaçant, le dernier terme devient très petit (γdl /cdt ) 1 et peut être négligé. Le temps propre en référentiel inertiel est donc relié au temps-coordonnée du repère tournant par l’équation : 2
dτ =
dt γ
2 2 2 2ωr dθ 1−γ , c2 dt
(14.45)
soit, en faisant les approximations de développement limité à l’ordre un : dτ =
ωr2 dθ dt −γ γ c2
(14.46)
Si on intègre l’équation sur le chemin Γ suivi par l’horloge mobile, on a alors : 2ω dt = dτ + γ 2 dAz . (14.47) c Γ Γ γ Γ Ceci montre que la dépendance au chemin parcouru dans le repère tournant est incontournable, que l’on utilise la lumière ou une horloge mobile pour disséminer le temps, alors que ces mêmes méthodes permettent de synchroniser des horloges en repère inertiel. C’est une preuve du caractère universel de l’effet Sagnac. Que ce soit pour la lumière ou pour l’horloge mobile, ces équations s’interprètent comme le moyen de réaliser le temps-coordonnée t = t dans le repère tournant si, après avoir effectué un processus de synchronisation, la correction Sagnac est appliquée. En 1984, une expérimentation sur l’effet Sagnac a été menée en utilisant les vues communes des satellites GPS (codes PRN 3, 4, 6, 8) et six centres de calcul de temps de façon à former une connectivité complète autour de la Terre. L’amplitude de la correction Sagnac a été évaluée entre 240 et 350 ns.
232
Le temps dans la géolocalisation par satellites
Aujourd’hui, l’application pratique la plus importante de l’effet Sagnac est le gyromètre (capteur de vitesse angulaire autour d’un axe) : mesurer la différence entre les temps de trajets entre deux faisceaux lumineux permet d’estimer la vitesse de rotation du circuit fermé. Les gyrolasers (qui utilisent une source laser) équipent la plupart des avions de ligne commerciaux : ils complètent les accéléromètres dans la centrale inertielle qui se trouve à bord de l’avion. Il s’agit de gyromètres relativistes à distinguer des gyromètres newtoniens (qui équipent aujourd’hui nos smartphones et qui sont des micropendules de Foucault, c’est-à-dire des capteurs mesurant la force de Coriolis qui s’exerce sur une pièce mécanique en mouvement). Il faut retenir que la relativité du temps (plus précisément la désynchronisation cinématique des horloges parfaites) est au cœur du phénomène. Toute explication de l’effet Sagnac ne passant pas par la cinématique de la relativité restreinte est nécessairement erronée.
14.7
Rôle de la relativité restreinte dans les systèmes de navigation par satellites
Les mesures de navigation par satellites sont faites par transmission de signaux électromagnétiques modulés en phase entre un satellite émetteur et un récepteur. Chaque satellite encode par modulation la date d’émission du signal, en synchronisant le premier bit de code C/A sur la seconde ronde de son horloge interne, ainsi que les trois coordonnées spatiales. La vitesse de la lumière étant une vitesse limite, la vitesse de propagation de l’information est indépendante de la vitesse des satellites. Par conséquent, un observateur qui recevrait au même instant les signaux de quatre satellites déduirait sa position en résolvant le système des quatre équations Δsi = 0 où i ∈ {1, 2, 3, 4}, soit en résolvant dans un référentiel inertiel : ||r − rj || − c(t − tj ) = 0,
(14.48)
où la valeur de c est 299 792 458 m/s, t : est la date de réception simultanée des quatre signaux ; tj : est la date d’émission du signal envoyé par le satellite j à la position rj . Les quatre inconnues sont les trois composantes de la position de l’observateur r et la date t de réception simultanée de ces quatre signaux. Si l’observateur était muni d’une horloge atomique parfaitement synchronisée avec celles des satellites, elle fournirait t et seulement trois satellites seraient suffisants pour la localisation. L’équation de positionnement écrite en utilisant la métrique de Minkowski fait intervenir des temps-coordonnées t et tj . Cependant, pour résoudre son calcul de positionnement, l’observateur va utiliser en réalité non pas des tempscoordonnées mais des temps cumulés par des horloges physiques c’est-à-dire des temps propres. Ces horloges sont situées à des endroits géographiques
Les nouveaux effets physiques sur le temps prédits par la RR
233
différents et évoluent à des vitesses différentes. De la même façon, les mesures de pseudo-distances P R (pseudorange en anglais) que produit un récepteur font intervenir des temps propres : P Rj = c (τ − τj ) .
(14.49)
τ : est la date de réception simultanée des quatre signaux en temps enregistré par l’horloge récepteur ; τj : est la date d’émission du signal en temps enregistré par l’horloge du satellite émetteur j. Cette subtilité est complètement absente dans un raisonnement newtonien. Pourtant, Il convient de garder très clairement ces différences à l’esprit si l’on veut que le système GPS soit utilisable pour la précision souhaitée. On considère un repère inertiel global dont l’origine est le centre de la Terre mais qui ne tourne pas avec elle et qui accompagne la Terre dans son mouvement de chute libre autour du Soleil : le repère géocentrique inertiel global. Ici on note v la vitesse (en module) d’un satellite de navigation (GPS par exemple) et R · cos (Φ) · ω la vitesse d’une horloge au sol située à la latitude Φ avec R le rayon de la Terre et ω la vitesse de rotation de la Terre. Ces vitesses sont rapportées au repère géocentrique inertiel global. Notons : Δtsat : la durée enregistrée par l’horloge à bord du satellite de navigation ; Δtsol : la durée enregistrée par l’horloge à la surface de la Terre ; Δt0 : la durée qui serait enregistrée par une horloge dans le référentiel géocentrique. Par application de la formule (14.6), on a (en faisant l’approximation valide v c) : Δt0 v2 v2 Δtsat = 1 − 2 dt ≈ 1 − 2 Δt0 , (14.50) c 2c 0 Δt0 (R · cos (Φ) · ω)2 (R · cos (Φ) · ω)2 Δt0 . 1− dt ≈ 1 − Δtsol = c2 2c2 0 (14.51) En prenant le rapport de ces durées, on en déduit la désynchronisation cinématique entre les horloges au sol et les horloges embarquées : 2 v2 (R · cos (Φ) · ω) Δtsat ≈ 1 − 2 + Δtsol . (14.52) 2c 2c2 Les satellites GPS évoluent à une vitesse de 3,8 km/s. En formant un écart relatif (équivalent à un écart de fréquence satellite normée) entre l’horloge du satellite et celle d’un récepteur GPS situé à l’équateur, on obtient : 2
Δtsat − Δtsol v2 (Rω) =− 2 + = −8, 32 × 10−11 . Δtsol 2c 2c2
(14.53)
234
Le temps dans la géolocalisation par satellites
Ainsi, les horloges à bord des satellites se désynchronisent par rapport aux horloges au sol et cet effet s’applique à des horloges même parfaites (le dérèglement des horloges n’est pas en cause). Numériquement, l’horloge à bord du satellite retarde de 8, 32 × 10−11 × 86400 = 7, 2 microsecondes par jour par rapport à une horloge terrestre. Cette dérive entraîne une erreur sur les mesures de pseudo-distance de 8, 32 × 10−11 × 86 400 × c = 2, 1 kilomètres par jour. Pour obtenir une expression en formulation fréquentielle, il suffit de convertir les intervalles de temps au point d’émission et au point de réception en fréquences dans la formule précédente, la fréquence étant l’inverse de la période du signal considéré. Le signal est émis à intervalle régulier au niveau du satellite en direction du récepteur terrestre. 2
Δf fsol − fsat v2 (Rω) = =− 2 + < 0. f fsat 2c 2c2
(14.54)
L’effet pour le récepteur terrestre est un décalage de la fréquence reçue vers le rouge (redshift) par rapport à la fréquence émise. Nous n’avons décrit ici que les effets principaux (les calculs détaillés sont fournis au chapitre 19). Nous allons voir que les effets relativistes liés à la gravitation sont également à prendre en compte dans la géolocalisation par satellites.
Chapitre 15 La théorie de la gravitation de Newton La gravitation est, parmi les interactions physiques, celle qui a été remarquée et étudiée le plus tôt par les observateurs humains. Cela peut surprendre puisque nous savons aujourd’hui que c’est l’interaction de loin la plus faible parmi toutes les interactions connues. La raison tient au fait que nous habitons à la surface d’un corps sphérique dont la masse imposante (par rapport à la nôtre) produit des effets gravitationnels aisément perceptibles dans notre vie quotidienne, et ce dès notre apprentissage d’enfant. La première théorie physique permettant de prédire précisément le mouvement des corps dans un champ gravitationnel fut celle de Newton. En quoi consiste-t-elle ?
15.1
Les deux lois de la théorie newtonienne de la gravitation
La théorie de Newton s’appuie sur deux lois pour décrire le mouvement d’un corps dans un champ gravitationnel : – les masses s’attirent avec une force qui est inversement proportionnelle au carré de la distance qui les sépare ; – l’accélération d’un corps est de façon générale proportionnelle à la résultante des forces qui s’exercent sur lui et inversement proportionnelle à sa masse.
15.2
La loi fondamentale de la dynamique newtonienne
En 1687, Isaac Newton construit une dynamique qui prédit le mouvement en fonction des forces en présence. Newton lie, dans son principe fondamental de la dynamique, les forces qui s’appliquent au corps avec l’accélération a de ce
236
Le temps dans la géolocalisation par satellites
propre corps : mia =
F ,
(15.1)
où mi est la masse « inerte » du corps qui représente la résistance qu’il oppose à une variation de sa vitesse. Cette équation décrit correctement le mouvement du corps dans un repère inertiel. Elle est invariante par les transformations de coordonnées galiléennes. Cette formulation n’interdit cependant pas de décrire correctement le mouvement dans un autre repère (un repère tournant par exemple) mais il faut alors enrichir le membre de droite par des termes représentant la perte du caractère inertiel du référentiel.
15.3
La force de gravitation newtonienne
Newton a combiné ses propres travaux en calcul différentiel avec ceux de Kepler pour extraire la loi de la gravité et prédire complètement la trajectoire des orbites planétaires. Pour Newton, la force de gravité est produite par les corps matériels et s’exerce uniquement sur des corps matériels. Deux corps s’attirent de la même façon en fonction de leur masse et de l’inverse du carré de leur distance : F =G
M g mg , r2
(15.2)
où mg et Mg notent la masse « grave » des corps qui représente leur capacité à générer la force de gravité. G est la constante gravitationnelle.
15.4
Une hypothèse supplémentaire : l’universalité de la chute libre
A priori les masses mi et mg n’ont aucune raison d’être égales. Mais la loi universelle 24 de la chute des corps établie par Galilée (qui stipule que l’accélération est constante et identique pour tous les corps dans le vide) est traduite en physique newtonienne par le principe d’identité entre la masse inerte et la masse grave : mi = m g . (15.3) Plus précisément : le rapport mi /mg est indépendant de la composition du corps et peut être fixé à un par un choix convenable d’unités. La validité de ce postulat a fait l’objet d’une expérience spatiale, portée par le satellite Microscope lancé le 25 avril 2016 en orbite basse à 710 km d’altitude. Il s’agit d’évaluer l’égalité à 10−15 près en faisant léviter à l’intérieur du satellite deux masses cylindriques concentriques constituées de matériaux différents, du titane d’un côté, un alliage de platine et de rhodium de l’autre. Elles sont 24. Pour connaître la démarche originale de Galilée (qui utilise des moyens très variés afin de corroborer ses hypothèses), on pourra se plonger avec délectation dans son traité de physique (Galilée, 1638).
La théorie de la gravitation de Newton
237
minutieusement contrôlées afin de rester immobiles par rapport au satellite dans un double accéléromètre électrostatique différentiel. Si l’universalité de la chute libre est vérifiée, les deux masses subiront la même accélération de contrôle. Si des accélérations différentes doivent être appliquées, cela mettra en évidence une violation de ce principe. Les premiers résultats obtenus n’ont mis en évidence aucun écart significatif. Les expériences ingénieuses de Galilée à l’aide de boules roulant sur des plans inclinés ont montré dès le début des années 1600 qu’au sens newtonien, l’inertie d’une boule quelconque compense exactement la force de gravité exercée sur sa masse de sorte que toutes les boules, petites ou grosses, quelle que soit leur composition, sont accélérées identiquement (abstraction faite de la résistance du milieu traversé). Ainsi, en l’absence de force de frottement due à la résistance de l’air (on sait qu’un marteau tombera dans l’air plus vite qu’une plume), tous les corps, indépendamment de leur composition, obéissent à une même loi. C’est la loi universelle de la chute des corps dans le vide. Galilée remarque également que la distance parcourue par le corps en chute libre évolue en proportion du carré du temps écoulé depuis le début de la chute. Ainsi, dans la cinématique de Galilée, le temps intervient littéralement dans les équations du mouvement.
15.5
Les lois de Kepler conséquences de la théorie de Newton
Avec son principe fondamental, Newton formalise en une équation la loi de Galilée sur la chute des corps, et celles de Kepler sur la forme des orbites planétaires. Tout corps sphérique et homogène de masse M génère le champ de gravitation G défini par : GM G = − 3 r. r
(15.4)
Du fait du principe d’équivalence faible (l’autre nom donné à l’universalité de la chute libre), un corps de masse m plongé dans ce champ subit l’accélération cette équation ne fait plus apparaître la masse des corps ma = mG soit a = G, en chute libre. Elle est soluble analytiquement en utilisant le calcul différentiel développé par Newton : d2r (15.5) a = 2 . dt Dans cette approche, le temps est une variable mathématique qui est absolue, c’est-à-dire identique en tout point de l’univers, comme l’a exprimé Newton : Le temps absolu, vrai et mathématique, en lui-même et de sa propre nature, coule uniformément sans relation à rien d’extérieur. L’espace absolu, par nature sans relation à rien d’extérieur, demeure toujours le même et immobile.
238
Le temps dans la géolocalisation par satellites
La théorie de Newton permet de calculer avec une bonne précision aussi bien les trajectoires des boulets de canon que celles des planètes. L’un de ses plus grands succès fut la prédiction en 1846 de l’existence d’une nouvelle planète (Neptune) dans le système solaire à partir des perturbations constatées dans la trajectoire de la planète Uranus.
Chapitre 16 La théorie de la gravitation d’Einstein Nous détaillons dans ce chapitre les traits essentiels de la théorie d’Einstein (qui est une théorie métrique de la gravitation) en insistant sur certaines idées fausses persistantes qui brouillent sa compréhension.
16.1
Analyse critique de la théorie newtonienne de la gravitation
Malgré ses nombreux succès, la théorie de Newton souffre de certaines incohérences conceptuelles sérieuses : – la théorie newtonienne considère la gravitation comme une interaction se propageant avec une vitesse infinie et entre donc en conflit avec la relativité restreinte. Si l’on admet que l’interaction gravitationnelle doit satisfaire le principe de relativité dans l’espace-temps de Minkowski, on doit s’attendre à l’existence d’ondes gravitationnelles se propageant à la vitesse limite (qui est aussi celle de la lumière) ; – un autre défaut lié au précédent est que la force de gravitation fait intervenir une distance qui en relativité restreinte dépend du référentiel considéré (à cause de la contraction des longueurs) : vue de la planète Mercure, la force exercée par le Soleil n’a pas la même intensité que vue du Soleil (même si la différence est très faible). D’une façon générale, la loi de Poisson n’est pas invariante par les transformations de Lorentz ; – l’équation de Poisson relie le potentiel gravitationnel à la densité de masse inerte. Or, la relativité restreinte montre que toutes les formes d’énergie contribuent à la masse inerte d’un système matériel. Une théorie cohérente devrait donc considérer toutes les distributions d’énergie comme des sources du champ gravitationnel ; – il est a priori peu cohérent d’admettre qu’une distribution d’énergie puisse créer un champ gravitationnel sans subir l’action du champ créé par une autre distribution d’énergie. On devrait donc s’attendre à ce que
240
Le temps dans la géolocalisation par satellites
la trajectoire des rayons lumineux soit incurvée par la masse du Soleil, contrairement à ce que prédit la théorie de Newton lorsque la lumière est considérée comme une onde transportant de l’énergie mais pas de matière ; – la théorie de Newton ne fournit pas d’explication pour l’égalité entre masse inerte et masse gravitationnelle. Celle-ci est traitée comme une coïncidence qu’il faut admettre comme une hypothèse arbitraire. En plus de ces défauts théoriques, une anomalie constatée dans la trajectoire de la planète Mercure (avance du périhélie résiduelle connue depuis la fin des années 1860) ne trouvait pas d’explication convaincante dans le cadre newtonien (même en tenant compte des perturbations causées par les autres planètes).
16.2
Le principe d’équivalence locale entre accélération et gravitation
Einstein généralise dès 1907 la loi universelle de la chute des corps établie par Galilée (que l’on appellera aussi « principe d’équivalence faible ») en un principe d’équivalence valable localement : – toutes les expériences de physique réalisées à l’intérieur d’un petit référentiel inertiel soumis à un champ de gravitation arbitraire donneront des résultats identiques à ceux obtenus dans un référentiel uniformément accéléré. Cette équivalence peut aussi s’exprimer de la façon suivante : – il est possible d’effacer localement et pour un intervalle de temps limité n’importe quel champ de gravitation en empruntant un petit référentiel en chute libre. Le petit référentiel en chute libre est aussi nommé « référentiel inertiel local ».
16.3
Un nouvel effet prédit grâce au principe d’équivalence locale entre accélération et gravitation
Nous allons montrer qu’en combinant le principe d’équivalence d’Einstein avec la relativité restreinte, il est possible de prédire un nouvel effet physique. Ce fut également la démarche25 d’Einstein dès 1907. Imaginons un ascenseur très loin dans l’espace de telle sorte qu’il soit soustrait à toute influence extérieure. Nous pouvons le considérer comme inertiel car dans ce référentiel, tout corps libre sera soit au repos, soit suivra un mouvement rectiligne à vitesse constante. 25. Pour plus de détails sur le raisonnement utilisé par Einstein en 1907, on pourra consulter l’article historique d’Einstein (1907) commenté par Spagnou (2015).
La théorie de la gravitation d’Einstein
241
Fig. 16.1 – Réseau d’horloges parfaites et synchronisées, équidistantes dans l’ascenseur au repos.
Accrochons du plancher jusqu’au plafond des horloges supposées parfaites au rythme identique et idéalement synchronisées Ces horloges sont donc espacées verticalement d’une distance fixe (figure 16.1). Dans l’ascenseur « immobile », ces horloges parfaites resteront synchronisées conformément à la relativité restreinte. À présent, supposons que l’ascenseur subisse une accélération constante selon l’axe où sont disposées les horloges. Comment vont se comporter les horloges ? Vont-elles se désynchroniser ou au contraire continuer à indiquer la même heure ? Nous serions tentés de conclure que les horloges ne se décaleront pas puisqu’elles se déplaceront à la même vitesse à tout instant dans le référentiel inertiel global qui voit l’ascenseur accélérer. Mais ce raisonnement est incorrect : la condition de rigidité implique que toute horloge à l’intérieur de l’ascenseur mesure une distance fixe par rapport à une autre horloge de l’ascenseur. Le temps d’aller-retour pour un signal électromagnétique entre les deux horloges reste constant à l’intérieur du référentiel accéléré. Une autre façon d’énoncer la condition de rigidité (dite de Born) est de dire qu’il existe pour toute horloge à l’intérieur de l’ascenseur un référentiel inertiel local (qui change d’un instant à l’autre) par rapport auquel les horloges gardent une distance fixe les unes par rapport aux autres. Cette condition de rigidité est cruciale en relativité et nous allons voir pourquoi. La figure 16.2 représente l’ascenseur « à un instant donné », du point de vue de l’horloge au plancher. Il suffit d’imaginer que l’horloge au plancher reçoit régulièrement de chacune des horloges placées au-dessus d’elle la valeur de son temps propre via des signaux radio.
242
Le temps dans la géolocalisation par satellites
Fig. 16.2 – Désynchronisation des horloges parfaites dans l’ascenseur accéléré. Vu du référentiel inertiel global, la distance entre deux horloges à l’intérieur de l’ascenseur diminue constamment puisque l’ascenseur accélère : c’est la contraction des longueurs prédite par la relativité restreinte. D’après ce principe, la longueur d’une tige apparaît contractée lorsque l’on mesure le passage des deux extrémités au même instant dans le référentiel inertiel « immobile ». La condition de rigidité (distances fixes dans l’ascenseur) impose donc que les distances entre les horloges varient dans le référentiel inertiel global. Les longueurs apparaissent de plus en plus contractées puisque l’ascenseur accélère. L’accélération est constante en un point donné de l’ascenseur mais varie d’un point à l’autre de sorte que les distances rapetissent du bas vers le haut (si l’ascenseur se déplace vers le haut) mais de façon différenciée en différents points de l’ascenseur. Puisque les horloges se rapprochent les unes des autres, elles n’ont pas la même vitesse par rapport au référentiel inertiel global. En conséquence, leurs temps propres sont différents et les horloges se décalent progressivement : c’est la désynchronisation cinématique des horloges parfaites prédite par la relativité restreinte. La relativité restreinte prédit donc que les horloges parfaites à l’intérieur de l’ascenseur qui subit une accélération constante, et qui sont en permanence à une distance fixe les unes des autres vont se décaler : les temps propres enregistrés par ces horloges (le nombre de cycles comptés) seront différents d’une horloge à l’autre. Rappelons que les horloges ne se dérèglent pas, ce temps cumulé correspond donc au temps réellement écoulé pour chaque horloge.
La théorie de la gravitation d’Einstein
243
La situation ci-dessus décrite doit être distinguée d’une autre : supposons que deux horloges sont immobiles dans un référentiel inertiel global mais séparées d’une certaine distance selon un axe. Que se passe-t-il si les horloges se mettent à accélérer séparément mais exactement de la même façon le long de cet axe ? Ici nous n’imposons plus le critère de rigidité. Les horloges gardent la même vitesse par rapport au référentiel inertiel global (au repos) : elles ne se décaleront pas. En revanche, la distance séparant les deux horloges telle que mesurée par chacune des horloges ne sera pas constante. Voilà donc ce que sont les prédictions de la relativité restreinte à l’intérieur de l’ascenseur uniformément accéléré. Selon le principe d’équivalence d’Einstein, nous sommes autorisés à considérer que la situation physique à l’intérieur de l’ascenseur accéléré est équivalente à celle d’un ascenseur « au repos » plongé dans un champ gravitationnel homogène. En admettant que le résultat reste valable pour des champs quelconques, nous en concluons que des horloges au rythme identique placées à des altitudes différentes dans un champ gravitationnel (par exemple celui de la Terre) vont se décaler : on peut parler de désynchronisation gravitationnelle des horloges parfaites. Or, la métrique de Minkowski ne peut prédire un tel effet car elle n’incorpore pas la gravitation (ses coefficients sont des constantes). Si le principe d’équivalence est valide, cela suggère fortement de généraliser la métrique de Minkowski de façon à ce qu’elle intègre la gravitation (donc la masse-énergie) dans ses coefficients. Cela revient à rechercher une théorie métrique de la gravitation.
16.4
Le principe des géodésiques
Nous avons vu qu’il existe en relativité restreinte un principe des géodésiques (trajectoires de longueur extrêmale dans l’espace-temps, la longueur étant donnée par la métrique d’espace-temps) qui peut s’énoncer ainsi : – les corps qui ne sont soumis à aucune force suivent la trajectoire dans l’espace-temps qui maximise leur temps propre. Il s’agit bien de géodésiques dans l’espace-temps puisque le temps propre correspond toujours à une longueur dans l’espace-temps (celle qui est obtenue en intégrant la forme différentielle ds). Supposons que nous disposions d’une métrique généralisant celle de Minkowski. Ses coefficients (devant les quatre dimensions) intégreront l’existence d’un champ gravitationnel non homogène, donc dépendront de la distance à l’astre central et de la masse de cet astre. Une telle métrique décrira en général un espace-temps que nous qualifierons de courbe (sa courbure n’est pas limitée à l’espace mais concerne aussi le temps). Certains auteurs critiquent avec raison le terme de courbure (car il induit l’idée fausse selon laquelle il ne serait pas possible de penser la courbure sans une dimension extérieure) mais les termes de substitution sont également critiquables (par exemple
244
Le temps dans la géolocalisation par satellites
lorsqu’on parle de déformation spatio-temporelle). Toutefois, moyennant certaines précautions, nous pensons que cette terminologie peut être conservée. Ce qui caractérise un espace-temps courbe, c’est que la métrique décrivant cette courbure ne peut pas être effacée globalement : il n’existe pas de référentiel inertiel global dans lequel la métrique se ramènerait à celle de Minkowski qui décrit un espace-temps plat. Si le principe d’équivalence est valide, nous pouvons décrire les trajectoires de corps en chute libre dans un champ gravitationnel en empruntant successivement des référentiels inertiels locaux dans lesquels la relativité restreinte s’applique. Nous « effaçons » ainsi localement la gravitation et dans de tels référentiels inertiels locaux, le mouvement s’effectuera en ligne droite et à vitesse constante. Le principe des géodésiques de la relativité restreinte doit donc pouvoir se généraliser ainsi : – les corps qui ne sont soumis qu’à la seule gravitation (donc qui sont en chute libre) suivent les géodésiques de l’espace-temps courbe qui maximisent leur temps propre. Si nous disposons d’une métrique, nous savons déterminer les distances (intervalles d’espace-temps) entre deux points de l’espace-temps. Donc à partir du principe des géodésiques, cela nous permet de prédire les trajectoires suivies par les corps. La notion de force de gravitation a totalement disparu.
16.5
Une première théorie métrique de la gravitation fondée uniquement sur la courbure temporelle
Peut-on avoir une idée de la métrique décrivant la courbure de l’espace-temps engendrée par une masse sphérique comme la Terre ou le Soleil ? Faisons l’hypothèse que la métrique a la forme suivante : 2V ds2 = − 1 + 2 c2 dt2 + dx2 + dy 2 + dz 2 . (16.1) c où V désigne le potentiel gravitationnel de la masse sphérique correspondant au Soleil (le raisonnement pouvant s’appliquer à un ensemble de masses quelconques). Il s’agit bien d’une généralisation de la métrique de Minkowski puisque, avec V = 0, on retrouve la métrique de Minkowski. Cette métrique décrit un espace-temps « courbé » temporellement mais plat spatialement puisque les coefficients devant les composantes spatiales valent 1 (la distance physique reste euclidienne). En remarquant que ds2 = −c2 dτ 2 et que dx2 + dy 2 + dz 2 = v 2 dt2 , on en déduit l’expression pour le temps propre : 2V v2 dτ = 1 + 2 − 2 dt. (16.2) c c
La théorie de la gravitation d’Einstein
245 2
Pour les champs faibles ( cV2 1) et les vitesses faibles ( vc2 1), l’expression se ramène à : V v2 dτ = 1 + 2 − 2 dt. (16.3) c 2c D’après le principe des géodésiques, un corps massif en chute libre suivra la trajectoire qui maximise son temps propre, donc qui maximise le long de sa ligne d’univers la quantité : V v2 1 + 2 − 2 dt. (16.4) c 2c Si l’on multiplie la quantité ci-dessus par la valeur −mc2 (où m est la masse du corps en chute libre), cela revient à minimiser la quantité : 1 2 mv − mV dt. (16.5) 2 La trajectoire suivie est donc celle qui, au sens newtonien, minimise l’énergie cinétique et maximise l’énergie potentielle, énergies qui se révèlent ci-dessus presque par enchantement ! On reconnaît le principe de moindre action de la physique newtonienne. Il est bien connu (nous l’admettrons ici) que ce principe conduit à la loi fondamentale de la dynamique newtonienne qui, pour V = − GM r , s’écrit : GM d2r = 3 r. dt2 r
(16.6)
La conclusion est révolutionnaire : nous avons montré qu’à l’aide d’une métrique qui décrit un espace-temps plat spatialement mais « courbé » temporellement, on peut rendre compte correctement des trajectoires elliptiques prédites par la théorie newtonienne sans faire usage de la notion de force, sans faire d’hypothèse gratuite sur l’égalité entre masse inerte et masse pesante (les masses des corps en mouvement ne jouent aucun rôle) et uniquement avec la courbure temporelle (c’est-à-dire la variation de point en point du temps propre dans le champ gravitationnel). Il est intéressant de noter que le mathématicien Riemann et quelques autres tentèrent dans la deuxième moitié du xixe siècle d’interpréter la gravitation dans le cadre d’une géométrie non euclidienne mais, comme ils raisonnaient exclusivement avec une courbure spatiale (la notion d’espace-temps leur était étrangère), leurs tentatives échouèrent. Existe-t-il une raison de privilégier la théorie métrique ci-dessus par rapport à la théorie newtonienne ? Outre la simplicité conceptuelle très séduisante (beaucoup moins d’hypothèses arbitraires), il y a une raison encore plus forte. Notre théorie métrique prédit un nouvel effet physique, la désynchronisation gravitationnelle des horloges parfaites (les horloges à des altitudes différentes se décalent) qui a été vérifiée avec précision. Nous détaillons la prédiction rigoureuse au chapitre 17.
246
Le temps dans la géolocalisation par satellites
La théorie métrique ainsi obtenue constitue déjà un premier pas très prometteur. Il nous manque néanmoins une véritable théorie (plus générale) qui nous permettrait de déterminer les coefficients de la métrique (donc la courbure de l’espace-temps) pour une distribution de masse-énergie quelconque.
16.6
Les équations générales du champ gravitationnel
Einstein, aidé de son ami mathématicien Marcel Grossmann, utilise les développements de la géométrie riemannienne pour formuler en 1915 la façon exacte dont la masse et l’énergie courbent l’espace-temps. Sous sa forme compacte, l’équation principale de la relativité générale (équation d’Einstein) s’écrit : Gαβ =
8πG Tαβ , c4
(16.7)
où G est la constante de gravitation universelle et c la vitesse limite. Le membre de gauche est le tenseur d’Einstein qui correspond à la métrique de l’espace-temps. Le membre de droite contient le tenseur énergie-impulsion Tαβ qui décrit la quantité de matière et d’énergie présente dans l’Univers. Par conséquent, la formule décrit précisément la façon dont la matière et l’énergie produisent une courbure de l’espace-temps. Dans le cas où la matière est une grande masse centrale M , l’équation établit comment l’espace-temps se courbe autour d’elle. Cette courbure est responsable du changement de trajectoire des objets dans l’espace à mesure qu’ils s’approchent de la masse. Ces objets ne sont plus attirés par une force gravitationnelle mais évoluent librement dans un espace-temps courbe en suivant des trajectoires dans l’espace-temps de longueur extrêmale (au sens de la métrique) appelées géodésiques. Selon le système de coordonnées choisi, la courbure et le contenu masseénergie tels que mesurés peuvent varier mais la relation donnée (via des tenseurs) par l’équation d’Einstein entre le contenu masse-énergie et la courbure est invariante. Autrement dit, tous les observateurs tomberont d’accord sur la réponse à la question : de combien l’espace-temps est-il courbé en fonction du contenu masse-énergie ? L’aspect important est qu’en relativité générale, le cadre (donc la métrique qui décrit l’espace-temps) par rapport auquel on rapporte l’ensemble des phénomènes physiques n’est pas donné a priori et c’est la relation entre les événements qui est essentielle. Notons que l’équation d’Einstein est souvent présentée avec un terme supplémentaire où apparaît la constante cosmologique : nous avons ici négligé ce terme car il n’intervient pas à l’échelle locale d’une galaxie.
La théorie de la gravitation d’Einstein
16.7
247
Les deux lois de la théorie de la gravitation d’Einstein
La théorie d’Einstein s’appuie sur deux lois pour décrire le mouvement d’un corps dans un champ gravitationnel : – la géométrie de l’espace-temps (encapsulée dans les coefficients de la métrique) est déterminée par la distribution de masse-énergie selon l’équation d’Einstein. Elle peut ne pas être statique si cette distribution varie (par exemple pour une masse sphérique en rotation). – le principe des géodésiques : les corps qui ne sont soumis qu’à la seule gravitation (donc qui sont en chute libre) suivent les géodésiques de l’espacetemps courbe qui maximisent leur temps propre. Notons que la lumière quant à elle suit des géodésiques de longueur nulle au sens de la métrique.
16.8
La métrique de Schwarzschild
Karl Schwarzschild découvre en 1916 la première solution exacte de l’équation d’Einstein autour d’une masse sphérique M non chargée et qui ne tourne pas. En coordonnées sphériques, cette métrique s’écrit sous la forme : 2V dr2 ds2 = − 1 + 2 c2 dt2 + (16.8) + r2 dθ2 + sin2 θdϕ2 . 2V c 1 + c2 La coordonnée θ est la colatitude (angle complémentaire de la latitude) du point en radian. La coordonnée ϕ est la longitude du point en radian. Le paramètre t est le temps mesuré avec une horloge « au repos à l’infini » : c’est le temps-coordonnée qui correspond à une zone soustraite à l’influence du champ gravitationnel. Dans cette expression, V désigne le potentiel du champ gravitationnel pour un ensemble de masses quelconque. Pour une masse homogène sphérique parfaite, l’expression de V est : V =−
GM . r
(16.9)
On remarque que les coefficients sont indépendants du temps t, donc la métrique est statique : la courbure de l’espace-temps ne fluctue pas. RS = 2GM c2 est appelé rayon de Schwarzschild. Pour tous les développements, nous ne traiterons que les zones de l’espace à l’extérieur du rayon, donc pour r > RS . Notons que pour la Terre, le rayon de Schwarzschild vaut environ 9 millimètres. Pour la masse de la Terre, qui est homogène et aplatie aux pôles, le potentiel gravitationnel est : GM GQP2 (cosθ) RT 2 GM V =− + 1 − J2 P2 (cosθ) , (16.10) =− r r3 r r
248
Le temps dans la géolocalisation par satellites
où : Q : est le quadripôle issu de l’aplatissement de la Terre représenté par le terme J2 : Q = J2 M RT2 ; P2 : est le polynôme de Legendre d’ordre deux : P2 (x) = 12 3x2 − 1 . La métrique de Schwarzschild se ramène à la métrique de Minkowski dans deux cas : – la masse sphérique est négligeable ou absente (M ≈ 0) ; – le point considéré se trouve à grande distance de la masse sphérique (r 1). Ce qui rend particulière cette métrique est le résultat mathématique suivant. Théorème (Birkhoff, 1923) : toute solution à symétrie sphérique de l’équation d’Einstein dans le vide est statique et asymptotiquement plate à l’extérieur du corps central. En conséquence, la métrique de Schwarzschild est l’unique solution de l’équation d’Einstein correspondant à ces hypothèses.
16.8.1
Une solution du vide de l’équation d’Einstein
La métrique de Schwarzschild est une solution du vide car elle est obtenue en supposant que le tenseur énergie-impulsion Tαβ est nul, autrement dit en admettant que l’espace extérieur à la masse sphérique est constitué entièrement de vide. Dans l’hypothèse où la masse sphérique se trouverait concentrée en un point unique (qui serait une singularité puisque r = 0), la métrique de Schwarzschild reste toujours la bonne solution de l’équation d’Einstein et décrit correctement la courbure de l’espace-temps vide de matière, sauf au niveau de la singularité. On sait aujourd’hui que ce cas limite correspond à des régions de l’espacetemps vides de matière (dotées d’un horizon des événements qui déconnecte causalement leur intérieur de l’univers extérieur) que l’on rencontre dans le monde physique, puisqu’il s’agit des fameux trous noirs. Examinons cette métrique selon la coordonnée radiale puis la coordonnée temporelle.
16.8.2
La coordonnée radiale
La variable r est la coordonnée radiale du point considéré. Elle est définie comme la circonférence, divisée par 2π, de la sphère centrée sur la masse sphérique et passant par le point considéré. Dans un espace plat, elle est identique à la distance entre le centre de la sphère et le point considéré. Dans un espace courbe, il n’y a aucune raison que les deux distances coïncident. Pour une radiale partant du centre de la masse sphérique, l’élément de distance se réduit, pour les champs faibles à : ds =
GM 1 + 2 dr. rc
(16.11)
La théorie de la gravitation d’Einstein
249
La longueur mesurée entre deux points sur la radiale de coordonnées r1 et r2 dans l’espace-temps courbé par la masse sphérique est donnée par : GM r2 . (16.12) Δs = (r2 − r1 ) + 2 ln c r1 On voit que la courbure engendre une augmentation de la distance correspondant au second terme où apparaît un logarithme. Précisons que la coordonnée r n’est pas mesurable directement puisque toute mesure de longueur est contrainte d’épouser la courbure. Seule la longueur Δs possède une signification physique.
16.8.3
Le temps-coordonnée
Le temps t correspond au temps qui serait mesuré par une horloge au repos à l’infini ou au point considéré en l’absence de gravitation. Ce temps n’est pas mesurable au point considéré puisque la valeur obtenue en ce point correspond justement à l’intervalle d’espace-temps. Pour une horloge au repos à un point de coordonnée radiale r, l’intervalle d’espace-temps se réduit à : 2GM 2 ds = − 1 − c2 dt2 . (16.13) rc2 D’après le principe d’équivalence, l’intervalle ds correspond aussi à celui du référentiel local inertiel attaché à un observateur : ds2 = −c2 dτ 2 ,
(16.14)
où dτ est l’intervalle de temps propre de l’observateur au point considéré. Donc le rapport entre la durée propre enregistrée au point r, où la courbure est non négligeable (donc près de la masse sphérique), et la durée propre enregistrée par une horloge à l’infini, est donné par : Δτ 2GM = 1− , (16.15) Δt rc2 Ce rapport peut être mesuré en échangeant par exemple des signaux radio entre les deux points distants.
16.8.4
Courbure temporelle et courbure spatiale
La courbure spatiale dans la métrique de Schwarzschild joue un rôle marginal pour les trajectoires des planètes dans le système solaire. Nous allons le démontrer de façon très simple. L’élément de métrique a pour expression : 2V dr 2 ds2 = − 1 + 2 c2 dt2 + + r2 (dθ2 + sin2 θdϕ2 ) (16.16) c 1 + 2V 2 c
250
Le temps dans la géolocalisation par satellites
Posons : v 2 = vr2 + vθ2 + vϕ2 =
dr2 + r2 dt2
dθ2 dϕ2 + sin2 θ 2 2 dt dt
.
(16.17)
où v est le module de la vitesse-coordonnée. En remarquant que ds2 = −c2 dτ 2 , on en déduit l’expression pour le temps propre :
dτ =
2V 1+ 2 c
−
vr2 + vθ2 + vϕ2 1 + 2V c2
1 c2
1/2 dt.
(16.18)
Pour les champs faibles ( cV2 1), on peut négliger le terme 2V c2 au dénominateur (qui correspond à la courbure spatiale) et en tenant compte que les 2 vitesses sont faibles ( vc2 1), l’expression du temps propre se ramène à : V v2 dτ = 1 + 2 − 2 dt. c 2c
(16.19)
Nous retrouvons le raisonnement utilisé au paragraphe 16.5 : la maximisation du temps propre ci-dessus revient à minimiser l’énergie cinétique et maximiser l’énergie potentielle de la physique newtonienne, donc les trajectoires prédites sont identiques aux trajectoires newtoniennes. On en déduit que pour une masse sphérique en rotation comme le Soleil, les trajectoires elliptiques des planètes en orbite s’expliquent principalement par la courbure temporelle. La courbure spatiale intervient à la marge car elle n’est responsable que d’effets additionnels très faibles comme l’avance résiduelle du périhélie des planètes intérieures (tout spécialement Mercure). Les mouvements ordinaires des corps sous l’effet de la gravitation (tous ceux que nous observons autour de nous) sont essentiellement une conséquence de la courbure temporelle, une conclusion magnifiquement contre-intuitive mais puissamment étayée par les résultats expérimentaux.
16.9
La métrique de Kerr
La métrique qui constitue la référence pour l’étude des champs forts à proximité d’astres compacts ou de trous noirs est la métrique de Kerr. Elle nous donne la courbure de l’espace-temps engendrée par une masse sphérique en rotation qui entraîne l’espace-temps dans son mouvement de rotation, d’où des effets supplémentaires. En conséquence, la métrique de Kerr n’est pas statique. Pour la géolocalisation par satellites actuelle, ces effets additionnels sont négligeables, donc la métrique de référence sera celle de Schwarzschild.
La théorie de la gravitation d’Einstein
251
Fig. 16.3 – La toile en caoutchouc pour montrer comment la relativité générale explique les orbites des planètes du système solaire. Une bonne analogie ? Crédit : NASA.
16.10
La toile en caoutchouc : une analogie presque entièrement fausse
De nombreux enseignants et physiciens exhibent fièrement l’analogie dite de « la toile en caoutchouc » pour illustrer la façon dont la relativité générale expliquerait le mouvement des planètes dans le système solaire. L’expérience montrée aux élèves consiste à poser une boule lourde au centre de la toile (voir la figure 16.3) puis à placer en périphérie des billes plus petites (représentant les planètes) qu’on lance sur la toile. On constate que les billes se mettent à tourner (en fait à spiraler vers le trou creusé par la grosse boule du fait des forces de frottement) car elles se déplacent sur une toile courbée par la masse centrale. Le tour est joué : on a réussi à montrer comment la relativité générale explique les orbites des planètes du système solaire. En fait cette analogie est presque entièrement fausse. Voici une première liste de raisons (sans doute celles qui sont le plus fréquemment évoquées) : – l’analogie est opérante uniquement en présence de gravité : la grosse boule ne déforme la toile qu’en présence de gravité alors que la déformation est censée s’y substituer ! Elle échoue donc totalement à montrer comment en relativité générale on parvient à expliquer les mouvements entièrement grâce à la courbure de l’espace-temps (sans influence extérieure). Elle fait croire que la courbure n’est pas intrinsèque et ne peut se concevoir sans un espace extérieur à la toile ni un champ extérieur à la toile : la relativité générale permet justement de la penser sans recours
252
Le temps dans la géolocalisation par satellites
à des dimensions supplémentaires ni à un champ de gravitation externe responsable de la déformation. Préciser que l’hyperespace dans lequel la toile est plongée est fictif est ici crucial. Notons que la notion de courbure évoque déjà chez la plupart des personnes une surface courbée dans un espace plus vaste : la toile déformée ne fait que renforcer cette image ; – elle fait croire que la courbure est engendrée uniquement par la matière (donc fait l’impasse sur la non-linéarité des équations d’Einstein qui est extrême par exemple pour un trou noir où la courbure engendre la courbure !). Cela est acceptable quand même si on se limite au système solaire ; – elle fait croire que les planètes et le Soleil (comme les billes et la boule posées sur la toile) sont extérieurs à la trame de l’espace-temps alors qu’elles en font partie intégrante. Les défauts pourtant beaucoup plus graves de cette analogie sont plus rarement cités : – l’analogie de la toile ne montre pas du tout pourquoi (en l’absence de force, donc en supposant la toile en état d’impesanteur) les petites billes se mettent en mouvement vers le corps central si on les pose en périphérie de la toile : pour le comprendre il faut raisonner à quatre dimensions et la multiplicité des temps propres joue un rôle crucial ; – elle fait croire que les planètes tournent autour du Soleil (ne vont pas simplement en ligne droite) à cause de la courbure spatiale alors que c’est à cause de la courbure temporelle, c’est-à-dire la dépendance du temps propre vis-à-vis de la localisation dans le champ gravitationnel ; – elle ne permet pas de comprendre qu’en relativité générale les mouvements des petites billes sont des géodésiques à quatre dimensions qui maximisent leur temps propre dans un espace-temps courbe. C’est certainement l’aspect le plus important et il est totalement ignoré avec la toile ; – elle ne permet pas de comprendre pourquoi les trajectoires suivies par la lumière sur cette toile (qui est censée se substituer complètement au champ gravitationnel) ne sont pas les mêmes que celles suivies par les corps massifs ; – elle fait croire que les effets de marée prédits par la physique newtonienne s’expliquent en relativité générale par la courbure spatiale alors que c’est la courbure temporelle qui les explique. Il y a néanmoins des effets additionnels (similaires à des effets de marée) qui sont liés à la courbure spatiale mais ils sont très faibles pour les mouvements des corps massifs dans le système solaire. Cette analogie cristallise de nombreuses idées reçues si l’on ne prend pas soin d’indiquer pourquoi elle ne s’applique que de façon très restrictive. Elle peut être utile à contresens, c’est-à-dire si l’on prend le temps de préciser pourquoi elle est presque entièrement fausse. L’essentiel à faire comprendre est que la relativité générale ramène la gravitation à de la chronogéométrie dynamique et que le temps joue un rôle essentiel.
La théorie de la gravitation d’Einstein
253
L’idée fausse principale propagée par cette analogie est de croire que si les planètes ne suivent pas des lignes droites mais tournent autour du Soleil, c’est à cause de la courbure spatiale. Comme nous l’avons montré aux paragraphes 16.5 et 16.8, la cause principale est la courbure temporelle. Les effets dus à la courbure spatiale sont assez proches de ce qui est montré par la toile mais la courbure spatiale n’est responsable que d’effets très faibles dans le système solaire pour les corps massifs (comme l’avance du périhélie pour les planètes intérieures). En fait, tous les mouvements des corps dus à la gravitation qui nous sont perceptibles dans notre vie de tous les jours ont pour origine la courbure temporelle. Il y a toutefois pour la lumière (qui quant à elle suit des géodésiques de longueur nulle dans l’espace-temps) des effets dans le système solaire où la courbure spatiale joue un rôle important : citons la déviation dans le plan équatorial des rayons lumineux provenant d’étoiles distantes lorsqu’ils rasent le Soleil et le retard dans la propagation d’un signal rasant le Soleil (effet Shapiro décrit au paragraphe 17.3). Au final, critiquer cette analogie de la toile en caoutchouc ne signifie pas que l’on ne peut pas faire comprendre la relativité générale si l’on ne détaille pas les équations. Par contre cela veut dire que chercher à tout prix à visualiser les situations est vain en relativité générale et peut conduire à des conclusions trompeuses. Einstein a écrit : « Quiconque a réellement compris cette théorie [la relativité générale] ne peut échapper à sa magie ». Or, la toile déformée ne permet pas du tout de saisir la profonde originalité de la théorie et du concept même d’espace-temps où la révolution véritable réside dans le temps physique. Elle nous prive d’une bonne partie de ce qui fait « la magie » de la relativité générale.
16.10.1
La chute de mon stylo d’Aristote à Einstein
Laisser tomber son stylo (ou tout autre objet) est une expérience étonnamment riche. Pour s’en convaincre, il suffit de se remémorer quelques étapes cruciales dans la compréhension du fait observé : – pour Aristote, chaque corps tend à retourner à son lieu naturel de repos. Mon stylo, si je le lâche, suit la trajectoire la plus simple à destination de son lieu naturel de repos qui est le centre de la Terre. Aristote ne propose pas de théorie capable de prédire précisément le mouvement des corps ; – pour Galilée, il n’y a pas de repos absolu et un corps libre qui se déplace sur un plan poursuivra indéfiniment son mouvement en ligne droite à vitesse constante sur ce plan. Les corps libres dans l’espace suivent un mouvement circulaire uniforme qui est donc également un mouvement inertiel pour Galilée. Mon stylo tombe vers le sol car il suit le type de trajectoire qui correspond à son mouvement inertiel ;
254
Le temps dans la géolocalisation par satellites
– pour Newton, premier physicien à établir une théorie cohérente permettant de prédire précisément les trajectoires des corps, mon stylo tombe vers le sol car il est attiré par la force de gravitation exercée à distance par la Terre, l’accélération étant proportionnelle à la force de gravitation ; – pour Einstein, aucune force n’entre en jeu : le stylo tombe vers le sol car il suit la trajectoire dans l’espace-temps (courbé par la masse de la Terre) qui maximise son temps propre. La « courbure temporelle » explique entièrement la chute de mon stylo qui est un mouvement inertiel dans un espace-temps courbe. Ce sont les observations et les expériences qui ont permis de départager les différentes alternatives.
Chapitre 17 Les nouveaux effets physiques sur le temps prédits par la relativité générale Ce chapitre expose les principaux effets physiques sur le temps résultant de la courbure de l’espace-temps : désynchronisation gravitationnelle des horloges parfaites, effet Einstein et effet Shapiro. Les idées fausses fréquentes sont explicitées et expliquées.
17.1
La désynchronisation gravitationnelle des horloges parfaites
Dans l’exemple de l’ascenseur uniformément accéléré, la relativité restreinte prédit que le nombre de secondes (ou de nanosecondes) enregistré par chacune des horloges situées du sol au plafond diffère d’une horloge à l’autre. Si l’on applique le principe d’équivalence d’Einstein, la situation physique décrite dans l’ascenseur est équivalente à celle d’un ascenseur immobile dans un champ de gravitation homogène. Cela signifie que l’effet chronogéométrique de multiplicité des temps propres prédit par la relativité restreinte doit également être observé entre deux horloges distantes soumises à un champ de gravitation homogène. Cela permet de déduire (si l’on admet que le résultat se généralise à des champs non homogènes comme le champ terrestre) qu’une horloge localisée plus profondément dans un champ de gravitation retardera par rapport à une horloge située plus haut : les temps propres diffèrent selon la localisation des horloges dans le champ gravitationnel. L’effet de désynchronisation gravitationnelle des horloges parfaites se dérive rigoureusement dans le cadre de la relativité générale à partir de la métrique de Schwarzschild qui décrit la déformation spatio-temporelle créée par une masse sphérique sans rotation.
256
Le temps dans la géolocalisation par satellites
Imaginons deux horloges immobiles parfaites au rythme identique situées l’une à la distance r1 , l’autre à la distance r2 du centre de la masse sphérique (celle de la Terre par exemple). Par application directe du principe d’équivalence, les intervalles d’espace-temps pour les deux lieux considérés sont : ds21 = −c2 dτ12 : où τ1 est le temps propre mesuré par l’horloge statique 1 ; ds22 = −c2 dτ22 : où τ2 est le temps propre mesuré par l’horloge statique 2. La métrique étant celle de Schwarzschild et les horloges étant statiques, ces intervalles sont aussi donnés par : 2GM 2 ds1 = − 1 − (17.1) c2 dt, r1 c2 2GM c2 dt, ds22 = − 1 − r2 c2
(17.2)
où t est le temps-coordonnée c’est-à-dire le temps qui serait indiqué par une horloge placée à « l’infini » ou en tout cas soustraite à l’influence du champ gravitationnel. L’intervalle dt est la durée par exemple d’un cycle pour chacune des horloges, autrement dit sa période. Cette durée est la même pour les deux horloges quel que soit le lieu puisqu’elles sont identiques et que le tempscoordonnée ne dépend pas du champ gravitationnel. Les deux horloges sont initialement synchronisées par un procédé quelconque et nous notons Δτ1 et Δτ2 les durées propres enregistrées par les deux horloges. Alors le rapport entre les durées propres est : 1− Δτ2 = Δτ1 1−
2GM r2 c 2 2GM r1 c 2
.
(17.3)
Pour mesurer ce rapport en pratique, on peut soit réunir les deux horloges en les transportant lentement pour négliger les effets relativistes purement cinématiques et comparer leurs indications directement, soit transmettre d’une horloge distante à l’autre un message radio contenant le temps d’émission qui correspond au temps propre cumulé depuis la synchronisation (il faut dans ce cas tenir compte du temps de propagation du signal). Si r1 correspond à une horloge située à l’altitude h, petite devant le rayon terrestre, et r2 à une horloge à la surface de la Terre, le rapport des durées se ramène à : Δτ2 GM GM GM ∼ 1 GM Δφ = 1− − 1 + 1 + = 1 + 2 , (17.4) = Δτ1 r2 c2 r1 c2 c2 r1 r2 c soit :
Δφ Δτ2 = 1 + 2 Δτ1 , c
(17.5)
Les nouveaux effets physiques sur le temps prédits par la RG
257
où Δφ est la variation du potentiel gravitationnel (entre les deux points). 1 1 ∼ GM GM GM − − = GM (17.6) Δφ = = − 2 h, r1 r2 r2 + h r2 r2 qui s’exprime également par Δφ = −gh où g = GM désigne l’accélération 2 rT gravitationnelle à la surface de la Terre. Si le temps propre cumulé pour l’horloge à l’altitude h est 1 seconde, le temps cumulé pour l’horloge à la surface de la Terre sera, au point de comparaison, inférieur de la quantité : gh −13 seconde par kilomètre d’altitude. c2 × 1s ≈ 1, 1 × 10 Une horloge parfaite et immobile au sol retarde par rapport à une horloge parfaite et immobile en altitude. Par exemple, une horloge que l’on placerait au sommet de l’Everest avancerait au bout d’une semaine de 544 nanosecondes par rapport à une horloge au niveau de la mer. Et il ne s’agit pas d’un artefact de mesure ni du procédé de synchronisation utilisé pour les horloges. Comme on l’a déjà indiqué précédemment, si l’on réunit les deux horloges ou que l’on réalise à distance un transfert de temps à l’aide d’un signal électromagnétique (on tient compte alors du temps de propagation), on constatera bel et bien l’écart entre les temps indiqués. Cet effet est un nouveau cas de multiplicité des temps propres spécifique à la gravitation qui n’a aucun équivalent en physique newtonienne où le temps est universel et unique.
17.1.1
Vérifications expérimentales
La désynchronisation cinématique et gravitationnelle des horloges parfaites a été vérifiée pour la première fois par Hafele et Keating en 1971 avec une précision d’environ 10 %. L’expérience de Carroll Alley (1975–1976) a permis de vérifier la désynchronisation gravitationnelle à 1 % près en améliorant celle de Hafele et Keating sur plusieurs aspects. La description de ces expériences cruciales est fournie au chapitre 18. De nombreuses autres expériences ont été réalisées par la suite, confirmant toutes les prédictions relativistes, de sorte que la réalité de cette désynchronisation ne fait plus de doute.
17.2
L’effet Einstein (décalage spectral gravitationnel)
Le raisonnement permettant de déduire la formule théorique de l’effet Einstein est très simple et similaire à celui déjà explicité pour la désynchronisation gravitationnelle des horloges parfaites, en partant de la métrique de Schwarzschild. Il suffit de convertir les intervalles de temps au point d’émission et au point
258
Le temps dans la géolocalisation par satellites
de réception en fréquences dans la formule (17.3) qui donne le rapport entre les durées propres enregistrées par les deux horloges distantes l’une de l’autre, la fréquence étant l’inverse de la période du signal considéré. Le signal est émis à intervalles réguliers depuis un point situé à la distance r2 du centre de la masse sphérique en direction d’un point à la distance r1 . Si le champ de gravitation ne varie pas dans le temps (autrement dit la courbure de l’espace-temps ne fluctue pas), alors le temps de propagation de chaque impulsion du signal est identique d’une impulsion donnée à la suivante. Cela signifie que la propagation du signal n’aura pas d’impact sur la fréquence du signal reçu à l’arrivée. Le décalage de fréquence est entièrement dû à la différence des temps propres entre le point de réception et le point d’émission. Ceci nous conduit à la formule exacte pour l’effet Einstein qui donne le décalage relatif entre la fréquence reçue et la fréquence émise : 1− fr − fe = fe 1−
2GM r2 c 2 2GM r1 c 2
−1 .
(17.7)
Une valeur commode est celle qui donne le décalage relatif de fréquence par kilomètre d’altitude pour la Terre : 1, 1 × 10−13 . On parle de décalage spectral gravitationnel quand on convertit les fréquences en longueurs d’onde. L’effet Einstein et la désynchronisation gravitationnelle des horloges parfaites s’obtiennent de façon identique en relativité générale car l’origine est la même. Il n’en reste pas moins que ce sont des effets physiques distincts : nous ne mesurons pas la même chose (des fréquences dans un cas et des temps cumulés dans l’autre) et les conditions de l’expérience sont différentes (la réception d’un signal périodique en provenance d’une source distante dans un cas, la comparaison de deux temps propres cumulés dans l’autre). Pour éviter les confusions, il convient de distinguer trois variables dans cet effet : 1. la fréquence du signal émis depuis le satellite mesurée au point d’émission ; 2. la fréquence du même signal émis depuis la Terre mesurée sur Terre ; 3. la fréquence du signal émis depuis le satellite mesurée au point de réception (sur Terre). Les deux premières fréquences sont identiques car il s’agit du même phénomène local observé, contrairement à la troisième fréquence qui correspond à un signal émis depuis un lieu différent et reçu sur Terre. L’origine de l’effet Einstein n’est pas dans les fréquences mais dans les temps propres cumulés aux points distants.
Les nouveaux effets physiques sur le temps prédits par la RG
17.2.1
259
L’universalité de l’effet Einstein
Puisque l’explication de l’effet tient entièrement dans la disparité entre les temps propres au point d’émission et au point de réception, l’effet est observable pour n’importe quel processus physique périodique. La lumière ne joue aucun rôle en tant que telle. Tout objet envoyé à intervalles réguliers depuis un point donné sera reçu avec une fréquence différente de celle du lieu d’où il est expédié si les deux lieux correspondent à des potentiels gravitationnels différents. On peut par exemple imaginer un lance-balles. L’effet Einstein est universel en ce sens qu’il ne dépend pas de l’entité utilisée : il peut s’agir aussi bien d’une onde électromagnétique que d’un corps massif. Il faut bien comprendre que le décalage de fréquence n’est pas lié à la propagation du signal entre les deux points : le temps de propagation pour chaque impulsion ou objet expédié est le même (si le champ est statique), donc n’a aucun impact sur la fréquence reçue. Certes l’onde électromagnétique ou l’objet expédié se meuvent dans un espace-temps courbe mais le temps de trajet est identique d’une impulsion à l’autre (nous supposons que la courbure ne fluctue pas). Le simple fait que les temps propres diffèrent entre le point de départ et le point d’arrivée suffit à rendre compte de l’effet.
17.2.2
Une erreur fréquente à éviter
L’effet Einstein souffre de nombreuses idées fausses quant à son interprétation. Nous allons nous focaliser sur une confusion qui est encore très présente dans les ouvrages de vulgarisation et même dans certains cours et qui a perturbé la compréhension de l’effet lors de la mise au point du système GPS. L’erreur de raisonnement consiste à attribuer au photon une masse gravitationnelle non nulle : il a une énergie cinétique, donc une masse inerte du fait de l’équivalence masse-énergie, donc une masse gravitationnelle selon le principe d’équivalence. Puisqu’il a une masse gravitationnelle, un photon venant du Soleil est attiré par la force de gravitation du Soleil, donc il perd de l’énergie pour arriver jusqu’à nous car il doit lutter pour s’extraire du champ de gravitation du Soleil. Or, son énergie est proportionnelle à sa fréquence, donc sa fréquence diminue. Ce raisonnement newtonien (qui consiste en fait à revenir à la théorie corpusculaire de Newton pour la lumière puisqu’on suit la trajectoire d’un petit projectile entre deux points) est totalement erroné bien qu’il continue à être abondamment utilisé. La notion de force ou d’attraction n’a plus cours en relativité générale. La lumière se propage le long de géodésiques de longueur nulle dans l’espace-temps courbe. La fréquence d’absorption d’un photon au point de réception est décalée par rapport à la fréquence d’émission d’un photon au point d’émission parce que les temps propres diffèrent entre les deux points (les horloges se désynchronisent). Si l’explication à base de perte ou de gain d’énergie du photon était valide, on devrait observer un effet double pour le décalage de fréquence puisque les deux explications sont indépendantes. Or,
260
Le temps dans la géolocalisation par satellites
la désynchronisation gravitationnelle des horloges a été amplement vérifiée et elle suffit à rendre compte de l’effet. Donc l’explication newtonienne doit être rejetée. Ce qu’il faut retenir est que toute déduction de l’effet Einstein qui ne fait pas appel à la métrique d’espace-temps est nécessairement erronée. Les démonstrations utilisant des bilans d’énergie ne sont valables qu’à condition d’expliciter le lien entre l’énergie mesurée et la métrique d’espace-temps. Le physicien Carroll Alley (auteur de la fameuse expérience que nous décrivons au chapitre suivant) relate 26 une difficulté rencontrée lors de la mise au point du système GPS (fin des années 1970) qui était liée à l’erreur d’interprétation de l’effet Einstein que nous venons de mentionner : Une erreur fréquente dans la prise en compte du temps relativiste fut également commise par l’un des industriels de l’US Air Force en charge du GPS. Il s’agit de l’idée selon laquelle l’onde électromagnétique changerait de fréquence (autrement dit l’énergie d’un photon varierait) puisqu’elle se propage entre deux points correspondant à des potentiels gravitationnels distincts. Si les ajustements d’horloges sont réalisés comme décrit précédemment de sorte que toutes les horloges sont calées sur le même temps-coordonnée, alors il n’y a pas d’effet sur la fréquence de l’onde telle que mesurée à l’aide de ce temps-coordonnée. Cependant, l’industriel en question avait inclus dans les algorithmes du calculateur une compensation supplémentaire, au total la correction des effets relativistes était donc double. Une expérience réelle testant l’équipement GPS en orbite fut nécessaire pour convaincre certains ingénieurs et physiciens de leur erreur.
17.2.3
Vérifications expérimentales
La première vérification de l’effet Einstein remonte à 1960 par Pound et Rebka qui atteignirent une précision de 10 % pour une altitude d’à peine 22,50 mètres. Jusqu’en 2018, la meilleure précision obtenue datait de 1976 avec l’expérience de Vessot et Levine : elle a consisté à mesurer l’effet Einstein avec une précision de l’ordre de 10−4 à l’aide d’une fusée transportée jusqu’à une altitude de 10 000 km. En 2010, l’équipe de J. Chou est parvenue à mesurer l’effet entre deux horloges atomiques optiques séparées seulement d’une hauteur de 30 cm, ce qui correspond à une décalage relatif de fréquence inférieur à 10−16 . L’année 2018 a été fastueuse pour l’observation de l’effet Einstein avec deux confirmations dans des conditions très différentes. L’effet Einstein a été mesuré 27 pour la première fois pour la lumière en provenance d’une étoile en orbite autour du trou noir supermassif qui est au 26. Alley (1983), « Proper time experiments in gravitational fields with atomic clocks, aircraft, and laser light pulses ». 27. Abuter et al. (GRAVITY Collaboration) (2018).
Les nouveaux effets physiques sur le temps prédits par la RG
261
centre de notre galaxie (dont la masse vaut 4 millions de fois celle du Soleil). Au point du plus proche passage, la vitesse de l’étoile était 3 % de celle de la vitesse limite (donc de celle de la lumière) et la distance de l’étoile au trou noir était 4 fois la distance entre le Soleil et Neptune. Les astrophysiciens espèrent dans les prochaines années pouvoir étudier d’autres étoiles en orbite plus serrée autour du trou noir, ce qui permettrait des tests plus sévères de la relativité générale. Bien sûr, les erreurs fréquentes indiquées ci-dessus sur l’interprétation de l’effet Einstein n’ont pas manqué de refaire surface lors de la présentation de ce résultat dans les médias. Toujours en 2018, des physiciens ont mesuré l’effet Einstein à partir de deux satellites Galileo qui avaient été placés en 2014 sur une mauvaise orbite. Du fait des orbites très elliptiques (avec des écarts en altitude de milliers de kilomètres) et grâce à la qualité des horloges embarquées, il a été possible pour les chercheurs, en analysant plus de 1000 jours de données des deux satellites, de mesurer l’effet Einstein avec une précision inégalée 28 , de l’ordre de 10−5 , donc environ 5 fois meilleure que celle qu’avaient obtenue Vessot et Levine il y a plus de 40 ans. Une expérience prévue en 2020 embarquera l’horloge PHARAO à bord de la station spatiale internationale. Grâce aux performances exceptionnelles de cette horloge à atomes de césium refroidis par laser, développée au SYRTE (Systèmes de référence temps-espace), l’effet Einstein devrait être vérifié à 2×10−6 près par comparaison avec des horloges à atomes froids au sol (fontaine atomique).
17.3
L’effet Shapiro
Dans son assertion générale, l’effet Shapiro prédit que le trajet d’un signal électromagnétique entre deux points de l’espace prend un peu plus de temps si ce signal frôle un corps massif, à cause de la courbure de l’espace-temps (voir la figure 17.1). Avec la métrique de Schwarzschild, courbure temporelle et courbure spatiale apportent des contributions identiques pour le retard de propagation de l’onde électromagnétique. Il est important de comprendre que cet effet, prédit par Irwin Shapiro en 1964, n’est pas une conséquence de la déflexion de la lumière autour du corps massif (dans le plan équatorial), autre effet qui fut vérifié en 1919 par Arthur Eddington lors d’une éclipse totale du Soleil. La déflexion dans le plan est ici négligeable. Pour trouver le retard Shapiro, on utilise la métrique de Schwarzschild en exprimant le temps-coordonnée dt en fonction de l’élément radial dr et en intégrant en deux parties, de r1 à r0 puis de r0 à r2 . En faisant l’hypothèse 28. Voir l’article récent de Delva et al. (2018) sur les résultats obtenus par cette expérience originale.
262
Le temps dans la géolocalisation par satellites
Fig. 17.1 – Schéma de principe de l’effet Shapiro pour un système à trois points. de champs faibles et r0 petit devant r1 et r2 on trouve, tous calculs faits 29 , le retard : 4r1 r2 4GM ln +1 . ΔtShapiro = (17.8) c2 r02 Dans le cas d’un aller-retour d’un signal radar sur la surface de la planète Vénus au moment où celle-ci est en conjonction avec la Terre, le retard est de 0,24 ms, ce qui est facilement mesurable avec les moyens actuels.
17.3.1
Deux erreurs fréquentes
On présente souvent l’effet en indiquant que la propagation de la lumière est ralentie sous l’effet de la gravitation (la lumière perdrait de l’énergie pour parvenir jusqu’à nous). Rien n’est plus faux : la lumière se propage le long de géodésiques de longueur nulle (au sens de la métrique) dans un espace-temps courbe. Certes la vitesse-coordonnée (mesurée à partir du temps-coordonnée) varie mais celle qui est mesurée localement avec le temps propre du lieu est toujours égale à c, quel que soit le champ gravitationnel considéré. L’autre erreur consiste à prétendre que le retard Shapiro est dû au trajet plus long à parcourir du fait de la déflexion de la lumière dans le plan équatorial. Cette déflexion est négligeable pour le retard de propagation. En revanche, la courbure spatiale (qui ne se traduit pas nécessairement par une déflexion dans le plan équatorial) allonge le trajet de la lumière par rapport à un espace-temps plat. Enfin, la courbure temporelle apporte une contribution au retard du même ordre que celle de la courbure spatiale.
17.3.2
Vérifications expérimentales
La meilleure précision pour la vérification de cet effet a été obtenue en 2002 grâce à la sonde spatiale Cassini qui était en route vers la planète Saturne et qui se trouvait à ce moment-là de l’autre côté du Soleil par rapport à la Terre. 29. On trouvera une démonstration détaillée du retard Shapiro dans les notes de cours de Gourgoulhon (2013) disponibles en ligne.
Les nouveaux effets physiques sur le temps prédits par la RG
263
L’effet Shapiro a été confirmé à 2 × 10−5 près en exploitant des signaux radio allers-retours entre la Terre et la sonde. Pour mesurer le retard dans la propagation de la lumière par rapport à un espace-temps plat, il est nécessaire de déterminer les positions respectives de la Terre et de la sonde (ou de la planète) en conjonction par une connaissance fine de leurs trajectoires respectives. On compare ensuite le temps de propagation théorique en ligne droite entre la Terre et la sonde (ou planète) avec le temps mesuré lors de la conjonction. Le retard Shapiro dans la propagation de la lumière lorsqu’elle rase un corps massif est dû à la courbure de l’espace-temps. La lumière se propage le long de géodésiques de longueur nulle au sens de la métrique et sa vitesse de propagation est toujours localement égale à c. Courbure temporelle et courbure spatiale contribuent au retard de façon comparable. On trouvera au paragraphe 19.4 une déduction détaillée de l’effet Shapiro pour les signaux reçus des satellites dédiés à la géolocalisation.
Chapitre 18 Les expériences sur la désynchronisation des horloges parfaites Deux expériences historiques ont permis pour la première fois de vérifier les effets de désynchronisation des horloges parfaites prédits par la relativité (les mêmes que ceux qui interviennent dans la géolocalisation par satellites.) Nous allons les décrire et préciser pourquoi on peut les qualifier de cruciales pour l’histoire de la physique.
18.1
L’expérience de Hafele et Keating
L’expérience de Hafele et Keating fut la première en 1971 à vérifier la désynchronisation des horloges parfaites. L’idée originale de Hafele et Keating consista à embarquer des horloges atomiques à bord d’avions de ligne commerciaux pour deux tours du monde (avec escales) à peu près au niveau de l’équateur, l’un vers l’est, l’autre vers l’ouest. Les horloges sont synchronisées au départ en un même lieu puis certaines sont embarquées pour un voyage circumterrestre qui les ramène à leur point de départ où leurs temps respectifs sont à nouveau comparés avec ceux des horloges restées sur place.
18.1.1
L’hypothèse de l’horloge
L’un des objectifs affichés de l’expérience était de valider l’hypothèse de l’horloge (que quelques physiciens ou philosophes récalcitrants rejetaient) : n’importe quelle horloge (qu’il s’agisse d’une clepsydre, d’un sablier, d’une horloge à pendule 30 ou d’une horloge atomique) enregistre le temps propre cumulé (c’est-à-dire le nombre de cycles comptés depuis une origine donnée) tel que prédit par la relativité. Nos horloges au rythme identique et supposées parfaites 30. Bien sûr, pour une horloge à pendule, les effets des accélérations seraient à prendre en compte avant de comparer les mesures aux prédictions relativistes.
266
Le temps dans la géolocalisation par satellites
Fig. 18.1 – Schéma de principe de l’expérience de Joseph Hafele et Richard Keating. devraient donc se décaler du fait de la multiplicité des temps propres comme le montre la figure 18.1. Les trajectoires sont tracées dans le plan (x, y).
18.1.2
De combien nos horloges sont-elles censées se décaler ?
Nous avons vu au paragraphe 16.8 (métrique de Schwarzschild) que le temps propre cumulé enregistré par une horloge embarquée parcourant une courbe fermée sera donné dans le cas de champs et de vitesses faibles par : Δt V [r (t)] u2 (t) Δτ = 1+ dt. (18.1) − c2 2c2 0 Ici Δt est l’intervalle de temps-coordonnée entre les deux mêmes points. V est le potentiel gravitationnel correspondant à un ensemble de masses a priori quelconque. Nous supposons que le point de départ et d’arrivée est situé à l’équateur. Pour les horloges à la surface de la Terre, la vitesse u vaut Rω (où ω est la vitesse angulaire de la Terre et R son rayon) tandis que le potentiel V vaut
Les expériences sur la désynchronisation des horloges parfaites
267
−GM/R (où G est la constante gravitationnelle, M la masse de la Terre). La durée enregistrée par l’horloge au sol est donc : R2 ω 2 GM Δτ0 = 1 − 2 − (18.2) Δt0 . c R 2c2 Pour l’horloge embarquée (altitude h et vitesse par rapport au sol v), la vitesse u vaut Rω +v tandis que le potentiel V vaut −GM/ (R + h). Le lecteur pourra se rendre compte que, à l’approximation considérée, l’addition classique des vitesses suffit. La durée enregistrée par l’horloge embarquée est donc : (Rω + v)2 GM − Δt. (18.3) Δτ = 1 − 2 c (R + h) 2c2 Les intervalles de temps-coordonnée Δt0 et Δt sont égaux pour l’horloge embarquée et l’horloge au sol puisqu’elles partent du même point et arrivent au même point. Δτ peut alors être approximé par : Le rapport Δτ 0 Δτ ∼ v2 gh vRω cos Φ − , (18.4) =1+ 2 − Δτ0 c c2 2c2 où g est l’accélération de la gravité à l’équateur, la vitesse v étant comptée positivement pour le voyage vers l’est, négativement pour le voyage vers l’ouest. Le cosinus est un terme qui prend en compte la latitude pour le trajet de l’horloge embarquée (qui n’est pas strictement limité à l’équateur). On a Φ = 0 à l’équateur.
18.1.3
La dépendance selon la direction et la faisabilité de l’expérience
Outre l’hypothèse de l’horloge, cette expérience exploite une asymétrie intéressante dans l’effet physique : la désynchronisation des horloges (voir la formule ci-dessus) comporte un terme qui est positif ou négatif selon que le voyage s’effectue vers l’ouest ou vers l’est, ce qui conduit pour des horloges embarquées à bord d’avions de ligne à un retard pour les horloges voyageant vers l’est (c’est-à-dire dans le sens de rotation de la Terre) ou une avance pour celles voyageant vers l’ouest. Il s’agit donc d’un excellent test pour vérifier l’exactitude des prédictions relativistes. Hafele et Keating sont semble-t-il les premiers à se rendre compte que la précision des horloges atomiques en ce tout début des années 1970 rendait possible cette expérience en tirant parti de la valeur assez élevée de la vitesse d’un point à la surface de la Terre qui tourne sur elle-même à environ 1700 km/h.
18.1.4
Le compteur d’intervalles de temps
Une question importante (qui est pourtant rarement abordée) concerne le procédé utilisé pour comparer les temps indiqués par deux horloges atomiques.
268
Le temps dans la géolocalisation par satellites
Fig. 18.2 – Principe du compteur d’intervalles de temps. Intuitivement nous imaginons qu’il suffit de lire les temps de nos deux horloges réunies (comme nous comparons habituellement deux montres) mais cela ne peut fonctionner ainsi car les différences de temps ici sont infimes (quelques dizaines de nanosecondes). Dans ces conditions, comment faire ? Le principe d’un compteur d’intervalles de temps (dispositif électronique) est très simple : entre deux impulsions reçues, il s’agit de compter le nombre de cycles grâce à une horloge, comme indiqué sur la figure 18.2. Pour estimer le décalage entre les temps indiqués par deux horloges, il suffit de générer (par exemple au rythme de 10 par seconde) des pulses datés par l’horloge 1 (temps t1 ) et des pulses datés par l’horloge 2 (temps t2 ). Le compteur d’intervalles a deux entrées : l’une pour les pulses de l’horloge 1, l’autre pour les pulses de l’horloge 2. Il mesure avec une grande précision (erreur inférieure à la nanoseconde) le temps écoulé Δt entre le premier pulse reçu de l’horloge 1 et le premier pulse reçu de l’horloge 2. Le décalage entre les deux horloges est égal à t2 − t1 − Δt. Pour des horloges idéalement synchronisées, la valeur ainsi calculée vaudrait zéro. Le décalage est mesuré au début de l’expérience entre les horloges qui vont être embarquées et les horloges de référence au sol pour s’assurer de leur synchronisation (ou noter l’écart initial éventuel). On compare à nouveau les horloges à la fin du voyage selon le même procédé.
18.1.5
Pourquoi quatre horloges atomiques embarquées ?
Hafele et Keating embarquèrent quatre horloges atomiques pour leurs voyages autour du monde (sur des avions commerciaux successifs compte tenu des escales). « Monsieur Clock » occupait deux sièges, donc leur budget pour leurs deux tours du monde correspondait à un total de quatre sièges.
Les expériences sur la désynchronisation des horloges parfaites
269
Mais pourquoi quatre horloges ? L’un des problèmes principaux était de repérer les éventuels dérèglements des horloges embarquées dus à leurs imperfections physiques afin d’isoler les écarts purement relativistes. Les horloges atomiques subissent de temps en temps des sauts de fréquence aléatoires : elles se mettent à marcher un peu moins vite ou un peu plus vite. Hafele et Keating ont relié entre elles les horloges embarquées afin de pouvoir repérer les sauts de fréquence individuels durant les vols. Avec deux horloges, on peut détecter un saut mais il est impossible de savoir laquelle des deux horloges s’est déréglée. Il faut au minimum disposer de trois horloges pour y parvenir. La quatrième horloge n’est que du bonus : bien pratique en cas d’une panne sur l’une des horloges et une mesure supplémentaire pour les résultats. En plus, le prix du billet d’avion pour trois ou quatre horloges était le même, puisque deux sièges étaient nécessaires. Le choix de quatre horloges embarquées était donc parfaitement justifié.
18.1.6
Un dérèglement commun aux quatre horloges ?
Un autre dérèglement possible était envisageable : on ne pouvait écarter le scénario selon lequel les quatre horloges embarquées se dérégleraient de la même façon comme conséquence d’une cause commune, par exemple une perturbation subie par l’avion durant son voyage. Comment distinguer un tel dérèglement d’un écart relativiste ? Il n’était pas possible d’équiper les avions de ligne commerciaux de façon à comparer à distance durant le vol les horloges embarquées avec les horloges au sol, Hafele et Keating ne pouvaient donc exclure que certains écarts à l’arrivée correspondent à des dérèglements globaux d’horloges et non à un effet relativiste. Nous verrons que l’expérience de Carroll Alley a permis de trancher la question. Hafele et Keating devaient se résigner à s’appuyer sur des arguments de vraisemblance tirés d’expériences menées en laboratoire sur des horloges atomiques. La probabilité que les quatre horloges embarquées subissent en vol un dérèglement identique (qui plus est coïncidant avec la prédiction relativiste !) était jugée très faible même si le contrôle de l’environnement était limité. Notons que les perturbations subies en vol par les différents avions empruntés furent rares durant les deux tours du monde.
18.1.7
Comparaison entre les valeurs théoriques et les valeurs mesurées
Le tableau ci-dessous donne les valeurs prédites et les valeurs mesurées.
270
Le temps dans la géolocalisation par satellites Effet relativiste Désynchronisation gravitationnelle Désynchronisation cinématique du second ordre Désynchronisation cinématique du premier ordre (associée à l’effet Sagnac) Écart total théorique Écart total mesuré
Est +144 ns −51 ns
Ouest +179 ns −47 ns
−133 ns
+143 ns
−40 ± 23 ns −59 ± 10 ns
+275 ± 21 ns +273 ± 7 ns
Les écarts mesurés (moyenne et écart-type) par rapport aux horloges au sol ont été obtenus à partir des valeurs enregistrées pour chacune des quatre horloges embarquées après avoir tenu compte des sauts individuels de fréquence. Pour les horloges ayant voyagé vers l’est, les écarts mesurés (en nanosecondes) furent -57, -74, -55, -51. Pour celles ayant voyagé vers l’ouest, les écarts mesurés furent 277, 284, 266, 266. Les écarts théoriques (qui se décomposent en trois termes) ont été obtenus en sommant sur une centaine d’intervalles correspondant à une vitesse et une altitude fixées. Pour le vol vers l’est, 125 intervalles furent définis au total tandis que pour le vol vers l’ouest, il y eut 108 intervalles. Pour chaque intervalle, la formule donnant Δτ en fonction de Δτ0 fut appliquée et le résultat final pour l’écart prédit s’obtint par simple sommation sur les différents intervalles. Les écarts-types correspondent aux incertitudes sur les paramètres des différents vols (altitude et vitesse). La désynchronisation gravitationnelle se traduit par une avance pour les horloges embarquées (quel que soit le sens du voyage). La désynchronisation cinématique se décompose en deux termes : l’un se traduit par un retard (quel que soit le sens du voyage car la vitesse intervient au carré), l’autre par une avance ou un retard selon le sens du voyage. Au final, les horloges ayant voyagé vers l’est retardent par rapport aux horloges au sol, tandis que celles ayant voyagé vers l’ouest avancent. La désynchronisation des horloges fut vérifiée avec une précision de l’ordre de 10 %.
18.1.8
En quoi l’expérience de Hafele et Keating se démarque-t-elle des précédentes ?
Par rapport aux expériences qui l’ont précédée, celle de Hafele et Keating est la première à comparer directement des temps propres cumulés. L’effet Doppler transverse avait été déjà vérifié (en 1938 par Ives et Stilwell) mais cela consistait à comparer la fréquence du signal reçu avec celle du signal émis depuis un point distant comme pour l’effet Doppler classique. La mesure du flux de muons cosmiques en fonction de l’altitude était aussi un résultat important obtenu en 1941 mais le temps propre cumulé par le muon en vol n’avait pu être enregistré et comparé aux horloges au sol, pour des raisons pratiques
Les expériences sur la désynchronisation des horloges parfaites
271
évidentes (impossibilité d’attacher une horloge au muon). L’effet Einstein quant à lui avait été vérifié dès 1960 mais, comme nous l’avons vu, son interprétation était contestée par une minorité de physiciens, qui refusaient d’y voir une conséquence de la multiplicité des temps propres. Là encore, l’expérience consistait à comparer la fréquence du signal reçu avec celle du signal émis comme pour l’effet Doppler classique. Autre expérience à distinguer : on sait accélérer dans un anneau des muons (particules quantiques) à des vitesses proches de la vitesse limite et on peut ainsi mesurer l’augmentation de leur durée de vie moyenne dans le laboratoire pour un mouvement circulaire conformément aux prédictions relativistes. Toutefois, l’effet de désynchronisation n’est mesuré qu’indirectement puisqu’il n’est pas possible d’attacher une horloge au muon. Hafele et Keating furent donc vraiment les premiers à comparer les temps propres cumulés avec des horloges macroscopiques et à vérifier les décalages relativistes une fois les horloges réunies.
18.1.9
Le pseudo-paradoxe des jumeaux
Ces résultats sont la première preuve expérimentale directe du pseudoparadoxe des jumeaux. Le jumeau voyageur retrouve son frère en étant plus ou moins âgé que lui selon le cas. Il n’y a là aucune contradiction logique : c’est une conséquence « naturelle » de la chronogéométrie einsteinienne. Certains auteurs ont prétendu que les résultats obtenus par Hafele et Keating ne s’appliqueraient pas à des êtres vivants et conscients comme les humains sur lesquels l’expérience n’a pas été réalisée. On peut aisément contrer cet argument en remarquant que les temps propres cumulés pour chaque jumeau pourraient être enregistrés en comptant le nombre de battements de cœur de chacun d’eux. Il n’existe par ailleurs aucune raison valable de douter du résultat, même si l’expérience n’a pas été menée sur des humains (la faisabilité technologique n’étant pas à notre portée pour des écarts de temps spectaculaires).
18.1.10
Pourquoi l’expérience de Hafele et Keating peut être qualifiée de cruciale
Cette expérience peut vraiment être qualifiée de cruciale pour de nombreux aspects : – elle valide l’hypothèse de l’horloge selon laquelle n’importe quelle horloge mesure le temps propre cumulé, tel que prédit par la relativité ; – elle confirme les prédictions relativistes pour la désynchronisation cinématique et gravitationnelle des horloges parfaites ; – elle prouve l’origine purement relativiste de l’effet Sagnac (ainsi que son universalité) en mettant en évidence l’asymétrie dans la désynchronisation cinématique qui dépend du sens est ou ouest du voyage autour du monde ;
272
Le temps dans la géolocalisation par satellites
– elle prouve l’origine purement relativiste de l’effet Einstein (ainsi que son universalité) : la désynchronisation gravitationnelle est vérifiée et nous avons vu que la différence entre les temps propres aux points d’émission et de réception suffit à expliquer le décalage des fréquences ; – elle constitue la première preuve expérimentale directe que le fameux pseudo-paradoxe des jumeaux est une réalité même si les désynchronisations mises en évidence échappent à notre perception immédiate du fait de la faiblesse de leur amplitude ; – elle scelle l’abandon du temps universel unique de la physique newtonienne en confirmant au-delà du doute raisonnable la réalité de la multiplicité des temps propres. Pour aller plus loin, on pourra consulter les deux articles historiques de Hafele et Keating (1972) commentés par Spagnou (2018).
18.2
L’expérience de Carroll Alley
L’expérience de Hafele et Keating souffrait de quelques défauts que l’expérience de Carroll Alley réalisée en 1975–1976 a permis de pallier : – il y avait des incertitudes importantes sur l’altitude et la vitesse des différents vols effectués ; – les horloges embarquées n’étaient pas isolées de leur environnement dans l’avion (champ magnétique, accélérations, température...) ; – durant le vol, les temps propres des horloges embarquées n’étaient pas comparés à ceux des horloges au sol. Carroll Alley avait travaillé sur les missions Apollo : c’était un expert en ce qui concerne les réflecteurs lasers qui ont été posés sur la Lune et qui ont permis de mesurer très précisément la distance Terre-Lune. Par rapport à l’expérience de Hafele et Keating, celle de Carroll Alley était diligentée par le ministère de la Défense américaine. Son but premier était de vérifier au plus près la désynchronisation gravitationnelle des horloges parfaites. Certains responsables importants du développement du système de géolocalisation par GPS (alors en gestation) doutaient fortement de la réalité de cet effet et ne comprenaient pas correctement comment la relativité générale l’expliquait. S’il était avéré, cet effet devrait être pris en compte dans la conception détaillée du GPS, d’où l’intérêt porté par les militaires américains à cette expérience. Carroll Alley va atteindre le but fixé d’abord en minimisant les deux autres termes de la désynchronisation (d’origine purement cinématique). Il dispose d’un avion spécialement dédié à l’expérience. Il peut donc choisir librement la trajectoire suivie par l’avion. La principale limitation pour l’expérience de Hafele et Keating était la nécessité d’emprunter des avions de ligne commerciaux, ce qui restreignait drastiquement le contrôle des paramètres de l’expérience. Afin d’annuler (quasiment) la désynchronisation cinématique associée à l’effet Sagnac (où la vitesse de l’avion intervient au premier ordre), Alley opte
Les expériences sur la désynchronisation des horloges parfaites
273
pour une trajectoire en forme d’hippodrome : de cette façon, l’avion parcourt le même trajet vers l’est (ce qui se traduit par un retard pour les horloges embarquées) et vers l’ouest (ce qui se traduit par une avance), le trajet complet annulant l’effet. Afin de minimiser la désynchronisation cinématique du second ordre, la vitesse de l’avion n’excèdera pas 450 km/h : l’effet sera ainsi 10 fois plus faible que la désynchronisation gravitationnelle. Par ailleurs, Carroll Alley apporte des améliorations significatives par rapport à Hafele et Keating qui répondent à certaines critiques légitimes : – la trajectoire de l’avion est suivie précisément en temps réel par des radars au sol, ce qui permet d’affiner sensiblement les prédictions théoriques en réduisant les incertitudes ; – les horloges embarquées sont isolées de leur environnement en étant confinées dans une boîte. Cela permet de contrôler notamment la température, les accélérations subies (qui sont amorties) et le champ magnétique ; – la grande nouveauté (sur laquelle nous allons revenir) réside dans la mesure du décalage de temps propre entre les horloges embarquées et les horloges au sol durant le vol, en plus de la comparaison en début et fin de voyage.
18.2.1
Le transfert de temps par lien laser (T2L2)
Fort de son expérience sur les missions Apollo (en particulier sur les réflecteurs lasers), Carroll Alley va réaliser le premier transfert de temps par lien laser entre des horloges au sol et des horloges embarquées. Cette technique lui permet de combler un trou par rapport à l’expérience de Hafele et Keating et de s’assurer que les écarts observés à l’arrivée ne proviennent pas d’un dérèglement durant le vol qui serait commun à toutes les horloges embarquées. La technique consiste à envoyer des pulses lasers à intervalles réguliers (d’une durée extrêmement courte) depuis le sol vers un réflecteur laser fixé sur le cockpit de l’avion utilisé (il y avait en fait un réflecteur laser disposé de chaque côté de l’avion). On note t1 le temps propre pour l’horloge au sol correspondant à l’émission d’un pulse laser. Le pulse est reçu sur le réflecteur à l’instant t2 qui est le temps propre pour les horloges embarquées. Le pulse est réfléchi vers le sol où il est reçu à l’instant t3 . On suppose (convention d’Einstein-Poincaré) que la vitesse du signal est identique dans les deux sens lors de l’aller-retour (égale à celle de la lumière dans le vide). Pour comparer les temps propres cumulés des horloges au sol avec ceux des horloges embarquées, il suffit donc de remarquer que le pulse laser atteint le réflecteur sur l’avion au temps propre (pour l’horloge au sol) égal à : t1 +
t1 + t3 t3 − t1 = . 2 2
(18.5)
274
Le temps dans la géolocalisation par satellites
Fig. 18.3 – Schéma de principe pour l’expérience de Carroll Alley. Les temps propres des horloges embarquées étaient comparés avec ceux des horloges au sol au début et à la fin du voyage mais aussi (nouveauté) à distance durant le vol.
Le décalage entre les deux horloges est donné par : t2 −
t 1 + t3 . 2
(18.6)
On peut ainsi suivre durant la totalité du vol (donc à distance) les différences de temps propre entre les horloges au sol et les horloges embarquées (voir la figure 18.3).
18.2.2
De combien nos horloges sont-elles censées se décaler ?
La prédiction relativiste est identique à celle pour l’expérience de Hafele et Keating à l’exception du terme correspondant à la désynchronisation cinématique du premier ordre (associée à l’effet Sagnac) qui a été annulé intentionnellement comme indiqué précédemment.
Les expériences sur la désynchronisation des horloges parfaites
275
Fig. 18.4 – Différence entre les temps propres des horloges embarquées et des horloges au sol (figure tirée de l’article de Carroll Alley [1983]).
Le rapport entre les durées propres mesurées par les horloges embarquées Δτ et les horloges au sol Δτ0 sera donc : v2 Δτ ∼ gh =1+ 2 − 2 . Δτ0 c 2c
18.2.3
(18.7)
Comparaison entre les valeurs théoriques et les valeurs mesurées
La figure 18.4 résume les résultats obtenus. Au départ, les horloges au sol sont synchronisées avec les horloges qui vont être embarquées. La comparaison est réalisée à l’aide d’un compteur d’intervalles de temps. Ensuite, la comparaison est effectuée durant le vol (d’une durée de 15 heures environ) au moyen d’un transfert de temps par lien laser, comme indiqué précédemment. Les horloges embarquées se désynchronisent progressivement, conformément à la prédiction relativiste. À l’arrivée, la désynchronisation cesse mais, bien sûr, les horloges embarquées sont décalées par rapport aux horloges au sol : elles ont accumulé au total plus de temps propre que les horloges au sol, d’une quantité qui est très proche de la valeur théorique (une avance de 47 nanosecondes). La désynchronisation gravitationnelle (environ 52 nanosecondes d’avance pour les horloges embarquées) fut vérifiée avec une précision de l’ordre de 1,5 %. La désynchronisation cinématique (environ 5 nanosecondes de retard) était volontairement minimisée et fut vérifiée à 15 %.
276
Le temps dans la géolocalisation par satellites
18.2.4
Une expérience cruciale ?
La première expérience à vérifier la désynchronisation des horloges parfaites est celle de Hafele et Keating qui a permis de mettre en évidence les trois composantes (deux cinématiques, une gravitationnelle). On peut considérer que l’expérience d’Alley forme un tout avec celle de Hafele et Keating car elle répond à la plupart des critiques dont celle de Hafele et Keating a fait l’objet : horloges embarquées non isolées, caractéristiques cinématiques des trajectoires des avions mal connues, pas de comparaison à distance des temps propres. Ces deux expériences permettent de mettre un terme aux polémiques sur la réalité de la multiplicité des temps propres et rendent intenables les interprétations alternatives soutenues par une minorité de physiciens.
18.2.5
Des incompréhensions chroniques
Dans son excellent article (Alley, 1983) (dont nous conseillons fortement la lecture et que nous avons déjà mentionné), Carroll Alley fait part des difficultés de compréhension encore très présentes en ce qui concerne les prédictions relativistes sur le temps. Il cite le physicien français Léon Brillouin (1970) qui vivait à l’époque aux États-Unis et qui livrait ainsi sa propre interprétation de l’effet Einstein : Toutes les horloges au repos dans notre référentiel inertiel garderont la même fréquence avec ou sans potentiel gravitationnel. Le redshift gravitationnel est uniquement dû au mouvement des photons. La première phrase est correcte (la fréquence propre est inchangée) mais la seconde, qui semble découler de la première dans l’esprit de Brillouin, est erronée. Brillouin commet ici l’erreur fréquente (qui n’a pas du tout disparu en 2020) consistant à croire que l’effet Einstein s’explique par une variation d’énergie du photon durant son parcours du point d’émission au point de réception. Carroll Alley ajoute, très lucide : Nous ne devrions pas être surpris par un tel manque de compréhension de certains concepts fondamentaux de la relativité générale puisque le sujet n’est presque jamais enseigné aux ingénieurs et rarement même aux physiciens. Notons aussi que la confusion autour de ces concepts n’est pas limitée aux ingénieurs et aux autres responsables en charge du fonctionnement d’horloges ultra-stables, mais est largement répandue, même chez d’éminents physiciens.
Les expériences sur la désynchronisation des horloges parfaites
18.3
277
Expériences ultérieures
Les expériences sur la désynchronisation des horloges parfaites ne se sont pas arrêtées avec celle de Carroll Alley. Des expériences japonaises et italiennes eurent lieu vers la fin des années 1970 et avaient pour but de vérifier la désynchronisation gravitationnelle pour des horloges ayant séjourné en altitude. Des expériences britanniques furent également conduites respectivement en 1996 puis 2010 en empruntant des avions de ligne commerciaux comme le firent Hafele et Keating. Tous les tests réalisés ont confirmé de manière convaincante les prédictions relativistes de sorte qu’il n’y a plus le moindre doute sur la réalité de ces effets physiques.
Chapitre 19 Effets relativistes sur le temps pour la géolocalisation par satellites Ce chapitre détaille les effets relativistes sur le temps qui sont à prendre en compte dans un système de géolocalisation par satellites, qu’ils soient d’origine gravitationnelle ou purement cinématique. Nous procédons en deux temps : d’abord un exposé simplifié, ensuite une démonstration rigoureuse et exhaustive de toutes les contributions.
19.1
Première approche (principales contributions)
Comme on le sait, le principe de la localisation par satellites repose sur l’estimation de la durée de transmission entre un signal électromagnétique émis par le satellite et reçu par un récepteur. Cette durée est la différence entre le temps de réception du message et le temps d’émission de l’onde au niveau du satellite. Ce temps d’émission est fourni dans le message de navigation envoyé par le satellite. Or, ce temps d’émission est celui indiqué par l’horloge atomique à bord du satellite située à une altitude de 20 200 km environ. Selon la relativité, le temps d’émission que le récepteur GPS récupère dans le message de navigation est décalé par rapport aux horloges terrestres. En effet, si l’on compare le temps propre Δτeme mesuré au niveau du satellite, situé à une distance radiale reme , avec le temps propre Δτrec mesuré au niveau récepteur situé à une distance radiale rrec on a, conformément au paragraphe 17.1, la relation : Δτrec =
1− 1−
2GM c2 rrec 2GM c2 reme
1/2 Δτeme .
(19.1)
280
Le temps dans la géolocalisation par satellites
Les deux temps propres cumulés ci-dessus sont supposés partager une origine commune (synchronisation des horloges en un même lieu ou à distance par transfert de temps). Entre les horloges des satellites et les horloges au sol, la relation peut s’écrire : GM GM Δtsat ≈ 1 + 2 Δtsol . − 2 (19.2) c rsol c rsat Le décalage relatif de temps propre est : GM GM Δtsat − Δtsol = 2 − 2 = 5, 3 × 10−10 , Δtsol c rsol c rsat
(19.3)
ce qui correspond à une avance des horloges GPS de 5, 3 × 10−10 × 86 400 = 45, 7 × 10−6 seconde par jour par rapport à une horloge terrestre. Cette dérive entraîne une erreur sur les mesures de pseudo-distance de 5, 3×10−10 ×86 400× c = 13, 7 km par jour. Comme pour les effets de la relativité restreinte, le décalage en fréquence est : Δf fsol − fsat GM GM = = 2 − 2 > 0. (19.4) f fsat c rsol c rsat L’effet est un décalage de la fréquence reçue vers le bleu (blueshift) par rapport à la fréquence émise. Au final, en prenant en compte la désynchronisation gravitationnelle et la désynchronisation cinématique, l’avance de l’horloge GPS embarquée par rapport à l’horloge au sol est égale à :
GM c2
1 rsol
−
1 rsat
+
2 2 − Vsat Vsol 2 2c
× Δtsol .
(19.5)
Tous calculs faits, il apparaît que l’on a au total une avance des horloges en vol de 38,4 microsecondes par jour, ce qui entraînerait une dérive sur les mesures de pseudo-distance de 11,5 km par jour ! La figure 19.1 représente les désynchronisations cinématique et gravitationnelle (au bout d’une journée) d’horloges à bord de satellites en orbite terrestre en fonction de leur altitude. On constate qu’à une altitude d’environ 3000 km, les deux effets relativistes (qui jouent en sens contraire) se compensent exactement : la désynchronisation est donc nulle. L’altitude des satellites GNSS est d’environ 20 000 km. Voilà pour une première approche qui permet de comprendre quels sont les principaux effets relativistes à prendre en compte. Nous allons à présent démontrer rigoureusement les valeurs prédites pour la désynchronisation des horloges à bord des satellites GPS.
Effets relativistes sur le temps pour la géolocalisation par satellites
281
Fig. 19.1 – Désynchronisation cinématique et gravitationnelle des horloges à bord de satellites en orbites terrestres.
19.2
Synchronisation des horloges GPS avec les horloges terrestres
Le système GPS ne peut fonctionner si les horloges des satellites ne sont pas synchronisées entre elles. Or, certaines vont avancer et d’autres retarder. Un système d’horloges est synchronisé si toutes les horloges marquent exactement la même heure (ce qui est illusoire) ou bien si on connaît très exactement les avances ou les retards de chacune d’entre elles par rapport à une référence commune. Pour cela, il faut construire une référence de temps commune aux horloges GPS à partir de laquelle on pourra définir les avances ou les retards de chaque horloge. Une fois que ces avances et ces retards sont bien définis, le système d’horloges est considéré comme synchronisé. Il existe de nombreuses méthodes pour construire une référence à partir d’un système d’horloges. Si on construit une référence GPS à la seule lecture des temps cumulés par les horloges GPS, cette référence sera intrinsèquement liée à la situation cinématique et gravitationnelle de ces horloges. D’un autre côté, si l’on dispose d’un réseau de bonnes stations terrestres bien réparties sur le globe, on peut également construire une référence terrestre qui sera liée au géoïde terrestre. Or, on sait que les horloges GPS enregistrent des temps cumulés différents de ceux des horloges terrestres. Si l’on ne tient pas compte de ces effets relativistes, la référence GPS va immanquablement diverger par rapport à une référence terrestre. Ce qui nous intéresse est de construire une référence de temps GPS qui suive une référence de temps terrestre.
282
Le temps dans la géolocalisation par satellites
La première chose à faire sera de construire une référence de temps terrestre, le TAI (temps atomique international) en sera une réalisation. La seconde sera de raccorder la marche des horloges GPS avec les horloges terrestres. Ce raccord peut être réalisé à partir de vues communes des horloges GPS faites avec un réseau de stations terrestres. Ce n’est qu’une des méthodes possibles car il y a quelques années on parlait beaucoup du TWSTFT (Two Way Satellite Time and Frequency Transfer). Chaque ligne de vue va relier une horloge GPS à une horloge au sol : elle contient donc une information sur le décalage – par rapport à une référence commune – de chacune de ces deux horloges. Pour réaliser cette synchronisation des horloges GPS avec le temps terrestre, on part de la chronogéométrie définie par la métrique ds de Schwarzschild faisant intervenir à la fois la cinématique des horloges et le potentiel gravitationnel. Cette métrique peut se mettre sous la forme suivante en faisant le change 2 ment de variable r → r 1 + R4rS , où RS est le rayon de Schwarzschild, puis en la généralisant avec le potentiel V (qui désigne le potentiel gravitationnel newtonien au voisinage de la Terre) : 2V 2V 2 ds2 = − 1 + 2 c2 dt2 + 1 − 2 dr + r2 dθ2 + r2 sin2 θdϕ2 . (19.6) c c La convention de signe sur V est choisie de manière à ce que le champ gravi−−→ tationnel newtonien soit donné par G = −grad (V ). Cette métrique met en jeu des variables d’espace et de temps qui sont le résultat du choix d’un référentiel inertiel, ici le GCRF, référentiel géocentrique. Dans ce système de coordonnées, la variable temps est un temps-coordonnée qui n’est pas le temps physique des horloges terrestres ni le temps physique des horloges GPS. La stratégie sera tout d’abord de définir un temps terrestre en fonction du temps-coordonnée géocentrique, puis un lien entre le temps GPS et le tempscoordonnée géocentrique. On aura ainsi le lien entre le temps propre terrestre et le temps propre des horloges GPS.
19.2.1
Temps terrestre et temps atomique international
Plaçons un observateur, muni d’une horloge supposée parfaite, fixe à la surface du géoïde terrestre. L’équation du mouvement de cet observateur est : r = r0 ,
θ = θ0 ,
ϕ = ϕ0 + ωt.
(19.7)
dϕ = ωdt,
(19.8)
Soit : dr = 0,
dθ = 0, −5
−1
avec ω = 2π/23h56 min = 7, 29 × 10 rad.s Le temps-coordonnée t est le temps enregistré par une horloge parfaite au repos dans le référentiel inertiel et placée à l’infini (donc soustraite à tout champ gravitationnel).
Effets relativistes sur le temps pour la géolocalisation par satellites
283
Le temps propre τTT de cet observateur est appelé le temps terrestre et s’obtient par :
2V 2V 1 2 dτT T = 1 + 2 dt − 2 1 − 2 r02 sin2 θ0 ω 2 dt2 . (19.9) c c c Si l’on néglige les termes en 1/c4 du développement limité, cette expression devient : 1 1 2 (ωr dτT T ∼ V − dt. (19.10) 1 + sinθ ) = 0 0 c2 2 On reconnaît dans la parenthèse le potentiel qui définit le géoïde terrestre U0 (r0 , θ0 , ϕ0 ) = V (r0 , θ0 , ϕ0 )− 12 (ωr0 sinθ0 )2 . On peut écrire le temps terrestre en fonction du temps-coordonnée très simplement : U0 dτT T = 1 + 2 dt . (19.11) c Puisque U0 est une constante, l’équation précédente s’intègre immédiatement : U0 (19.12) τT T = 1 + 2 t + τT T 0 . c Cette dernière expression montre que le temps terrestre s’obtient à partir du temps-coordonnée par la multiplication d’un facteur constant, indépendamment de la position sur le globe. Une estimation de la valeur de U0 /c2 s’obtient rapidement en prenant θ0 = π/2 et r0 = RT le rayon équatorial de la Terre : U0 −GM GM J2 ω 2 RT2 = − − c2 RT c2 2RT c2 2c2 −10 = −6, 953 × 10 − 3, 764 × 10−13 − 1, 203 × 10−12 = −6, 969 × 10−10
(19.13)
Le deuxième terme prend en compte l’aplatissement de la Terre. Le signe négatif dans la formule ci-dessus signifie qu’une horloge parfaite et fixe sur le géoïde terrestre enregistre des temps cumulés moins importants qu’une horloge au repos soustraite à tout champ gravitationnel ou placée à l’infini. La contribution du potentiel centripète est 500 fois plus petite que la contribution du potentiel central et celle du quadripôle 2000 fois plus petite. Le temps terrestre τT T étant un temps propre enregistré par des horloges fixes sur la Terre, il est mesurable. Le temps TAI est une réalisation de ce temps terrestre qui combine les données de plusieurs centaines d’horloges atomiques réparties à la surface du globe. Le temps TAI est un temps restitué qui n’est pas corrigé a posteriori, il serait exactement la même chose que le temps terrestre si les horloges atomiques utilisées étaient parfaites. Il existe d’autres réalisations de temps terrestre (effectuées par le BIPM) qui tiennent compte des erreurs découvertes dans les données des horloges atomiques après leur utilisation pour le TAI.
284
19.2.2
Le temps dans la géolocalisation par satellites
Désynchronisation des horloges terrestres par rapport au temps-coordonnée selon leur altitude
L’objet de ce paragraphe est de calculer le facteur de correction à appliquer au temps-coordonnée pour déterminer le temps propre d’une horloge située à une altitude a par rapport au géoïde. Selon l’équation (17.6), le temps propre d’une horloge H située à l’altitude a, par rapport à une horloge positionnée à la surface du géoïde terrestre, et qui elle, suit le temps terrestre, est donné par :
ga dτH = 1 + 2 dτT T . (19.14) c En combinant avec l’équation (19.11), le temps propre d’une horloge terrestre située à une altitude a, par rapport au géoïde, en fonction du tempscoordonnée, est donné par :
U0 ga dτH = 1 + 2 (19.15) 1 + 2 dt . c c En conservant uniquement les termes en 1/c2 , on obtient l’expression approchée : U0 + ga dτH = 1 + dt. (19.16) c2
19.2.3
Temps-coordonnée géocentrique et temps propre d’un satellite GPS
L’équation du mouvement d’un satellite GPS par rapport aux coordonnées du référentiel inertiel géocentrique GCRF (ct, r, θ, ϕ) est donnée par : r = rGP S (t) ,
θ = θGP S (t) ,
ϕ = ϕGP S (t) .
(19.17)
On suppose que ces positions (éphémérides du satellite) nous sont fournies avec suffisamment de précision. Notons au passage que ces éphémérides sont exprimées en temps-coordonnée. Comme on s’intéresse à la variable temps-coordonnée, on fait apparaître cette dernière dans la métrique ds : 2V dr2 + r2 dθ2 + r2 sin2 θdφ2 2V ds2 = − 1 + 2 + 1 − 2 (cdt)2 . c c c2 dt2 (19.18) Comme précédemment, le rapport de l’élément de longueur sur l’élément temps-coordonnée est la vitesse du satellite dans le repère GCRF : v2 =
dr2 + r2 dθ2 + r2 sin2 θdϕ2 . dt2
(19.19)
Effets relativistes sur le temps pour la géolocalisation par satellites
285
L’horloge à bord du satellite fournit le temps propre τGP S qui est tel que :
2V 2V v 2 dτGP S = −ds/c = 1+ 2 − 1− 2 dt. (19.20) c c c2 Seuls les termes en 1/c2 sont conservés dans ce développement sans perdre en précision : 2V v2 V v2 (19.21) dτGP S = 1 + 2 − 2 dt = 1 + 2 − 2 dt. c c c 2c On peut alors exprimer l’incrément de temps-coordonnée GCRF en fonction de l’incrément de temps propre GPS. Ainsi, le temps-coordonnée géocentrique ti au niveau du satellite no i est déduit de la lecture τ GP S,i de l’horloge atomique embarquée par : ti =
0
τGP S,i
1−
V v2 dτGP S . + c2 2c2
(19.22)
Cette formule combine les deux effets déjà mentionnés : la désynchronisation gravitationnelle (terme en V /c2 ) et cinématique (terme en v 2 /2c2 ) des horloges parfaites.
19.2.4
Temps terrestre et temps propre GPS
La coordonnée temporelle utilisée par le système GPS n’est pas le tempscoordonnée géocentrique t employé ci-dessus mais une réalisation du temps terrestre établie à partir d’un ensemble d’horloges atomiques terrestre et d’horloges atomiques embarquées dans les satellites GPS. Le temps système GPS est une horloge composite – on parle de temps « papier »– obtenue comme une moyenne « bien faite » de l’ensemble des mesures de temps fournies par toutes les horloges que l’on considère. Le temps GPS a été synchronisé sur le temps universel coordonné à 0h00, temps UTCUSNO , dans la nuit du 5 au 6 janvier 1980. Le temps UTCUSNO est établi à partir d’un ensemble d’horloges atomiques gérées par l’U.S. Naval Observatory (USNO). Depuis, le temps système GPS est maintenu par construction proche de cette référence de temps terrestre, à moins d’une microseconde, modulo 1 seconde. À la date de la synchronisation à UTCUSNO , ce dernier était en retard de 19 secondes sur le TAI. Comme le temps GPS est une échelle de temps continue, il n’est pas perturbé par les sauts de secondes, contrairement à l’UTC. Il y a donc un écart constant entre le temps système GPS et le temps TAI : le temps TAI avance toujours de 19 secondes par rapport au temps système GPS. En revanche, l’écart entre le temps GPS et l’UTC est variable : depuis le 31 décembre 2016, le temps GPS est en avance de 18 secondes sur l’UTC.
286
Le temps dans la géolocalisation par satellites
L’établissement du temps système GPS nécessite de disposer de mesures d’un réseau d’horloges positionné sur le géoïde terrestre. Or, le réseau d’horloges utilisé est à la fois terrestre – les horloges des stations de réceptions, et spatial – les horloges embarquées à bord de chaque satellite de la constellation. Pour les horloges du réseau terrestre, le temps propre est donné par la formule (19.16). Pour les horloges du réseau spatial, il faut appliquer la fonction de transfert qui ramène le temps propre τ sat,i cumulé par l’horloge atomique à bord du satellite no i au temps terrestre associé τT T,i au niveau du géoïde terrestre. Cette fonction est donnée par la relation : τT T,i =
τ sat,i V U0 v2 1 − 2 + 2 dτ sat . 1+ 2 c c 2c 0
(19.23)
En négligeant les termes en 1/c2 on arrive à l’équation : τT T,i =
0
τ sat,i
1−
(V − U0 ) v2 dτ sat . + c2 2c2
(19.24)
Cette dernière expression relie le temps terrestre au temps propre cumulé par une horloge atomique embarquée par un satellite GPS. Le terme U0 correspond à la correction nécessaire pour pouvoir utiliser comme référence des horloges au repos situées à la même altitude sur la surface de la Terre. Ce terme contient également la contribution du quadripôle à la surface terrestre qui contribue au potentiel terrestre de la quantité −3, 76 × 10−13 , effet qui doit être pris en compte pour la synchronisation des horloges GPS avec les horloges terrestres. Le potentiel V est le potentiel gravitationnel terrestre appliqué à la position des satellites GPS. La valeur du quadripôle du potentiel terrestre décroît très rapidement en fonction de l’altitude si bien que cette contribution peut être négligée à l’altitude GPS, sa valeur étant de l’ordre de 10−14 . Par conséquent, le potentiel V peut être réduit dans le calcul à la seule contribution du monopôle V = −GM/r. Selon ce potentiel, les orbites des satellites sont képlériennes d’excentricité e et de demi-grand axe a. En mécanique newtonienne, le champ gravitationnel est conservatif et donc son énergie totale est conservée. L’énergie totale de la trajectoire orbitale s’écrit : v2 GM −GM − = . (19.25) 2 r 2a Avec cette expression du carré de la vitesse, on obtient l’expression donnant le temps terrestre en fonction du temps propre cumulé par les horloges GPS : τT T,i =
τ sat,i 0
1+
3GM U0 2GM + 2 − 2ac2 c c2
1 1 − a r
dτ sat .
(19.26)
Effets relativistes sur le temps pour la géolocalisation par satellites
287
On sépare de cette formule la partie constante de la partie variable : τ sat,i 2GM 1 1 3GM U0 sat,i − dτ sat . τT T,i = 1 + + 2 τ − 2ac2 c c2 a r 0 (19.27) Le premier terme représente le rapport entre le temps cumulé par une horloge GPS, évoluant sur une orbite parfaitement circulaire, et le temps terrestre. En effet, dans le cas d’une orbite circulaire r = a, on a la relation : 3GM U0 sat,i τT T,i = 1 + τ + . (19.28) 2ac2 c2
On remarque que les temps propres sont différents, ce qui est complètement inexplicable dans la conception newtonienne du temps. La valeur des termes de correction constants est : 3GM U0 + 2 = +2, 5046 × 10−10 − 6, 9693 × 10−10 = −4, 4647 × 10−10. (19.29) 2ac2 c Le signe négatif indique que les horloges GPS en orbite circulaire enregistrent un temps cumulé plus important que les horloges terrestres. En effet, si l’on ramène l’horloge embarquée no i sur le géoïde terrestre, on pourra constater qu’elle avance par rapport à une horloge terrestre. Le second terme est variable et est entièrement imputable à l’excentricité de l’orbite réellement parcourue par l’horloge GPS embarquée. Il apparaît comme un terme correctif au terme constant.
19.3 19.3.1
Compensation des effets relativistes dans les systèmes de navigation Biais en fréquence des horloges à bord
Conformément au document d’interface IS-GPS-200, les satellites GPS maintiennent, grâce à leurs horloges, une base de fréquence qui apparaît pour un observateur situé sur terre, cadencée à f0 = 10, 23MHz. Pour compenser l’effet de la relativité, à la fois restreinte et générale, la fréquence de l’horloge à bord des satellites fGP S est fixée à la valeur de : 1 1 3GM U0 = 1+ + . (19.30) f0 2ac2 c2 fGP S Soit : fGP S = 1 − 4, 4647 × 10−10 × f0 = 10, 2299999954326MHz.
(19.31)
De la sorte, les horloges embarquées dans les satellites GPS apparaissent battre à la fréquence fondamentale f0 pour un observateur placé sur le géoïde terrestre. Autrement dit, on force les horloges GPS à battre à un rythme différent
288
Le temps dans la géolocalisation par satellites
(plus lentement) que les horloges au sol de façon à percevoir sur Terre le temps qu’elles indiquent en vol identique à celui qu’elles indiqueraient au sol. La fréquence des horloges embarquées est donc diminuée de : Δf fGP S − f0 = = −4, 4647 × 10−10 . f0 f0
(19.32)
Ce réglage particulier de la fréquence de l’horloge couvre l’effet de dérive principal de 11,5 km par jour dans les mesures.
19.3.2
L’effet de l’excentricité des orbites GPS
Si les orbites des satellites GPS étaient parfaitement circulaires, le temps propre des horloges embarquées serait invariable une fois les effets de relativité générale pris en compte. Cependant, ces orbites ne sont pas circulaires mais elliptiques. La correction relativiste liée à l’excentricité est donnée par : Δtr = −
0
τ sat,i
2GM c2
1 1 − a r
dτ sat .
(19.33)
Ce terme s’intègre exactement en utilisant : – l’expression de la distance radiale en fonction de l’anomalie excentrique : r = a (1 − e.cosE) , – l’expression de la dérivée de l’anomalie excentrique : GM/a3 dE = . dt 1 − e.cosE On a alors : 2GM e. cos E 2GM 1 1 − dt = dt c2 a r ac2 1 − e. cos E √ 2 GM a = (e. cos E) dE c2 √ 2 GM a e. sin E + const. = c2
(19.34)
(19.35)
(19.36)
La constante d’intégration est injectée dans la correction des horloges GPS incluse dans les messages de navigation. Le terme de correction relativiste s’écrit donc : √ Δtr = F.e. a.sinE , (19.37) √ GM c2
= −4, 442807633 × 10−10 √ sec mètre Pour un satellite d’excentricité e = 0, 01 (l’excentricité d’un satellite GPS peut aller jusqu’à 0,03), l’écart en temps maximal est de l’ordre de 23 ns soit
avec F = − 2
Effets relativistes sur le temps pour la géolocalisation par satellites
289
pratiquement 7 mètres sur la mesure de pseudo-distance. Cette correction est nécessaire car les effets gravitationnel et cinématique sur les horloges varient selon l’excentricité. Le positionnement donné par les récepteurs GPS prend en compte cet effet, qui est calculable puisque le récepteur dispose des paramètres de l’orbite de tous les satellites. La correction peut également s’exprimer sous une forme alternative : ·V 2X Δtr = − , (19.38) 2 c où les vecteurs positions et vitesses sont ceux du satellite à l’instant de transmission. Ici il n’est pas nécessaire de préciser le repère d’expression des vecteurs vitesse et position car le produit scalaire est invariant par changement de repère (transformation orthogonale). Cette formule, de loin la plus couramment implémentée, se déduit de la précédente par utilisation des formulaires des orbites képlériennes. √ · V . On écrit alors Pour le voir, il suffit de montrer que GM a.e.sinE = X que le produit scalaire X · V = r.v.sinγ où γ est la pente de la vitesse. On utilise ensuite les formules képlériennes suivantes :
r = a (1 − e.cosE) ,
v=
GM
2 1 − , r a
e.sinE sinγ = √ . 1 − e2 .cos2 E (19.39)
On commence par former le produit rv : √ rv = GM a
√ 2r 1 − 2 = GM a (1 + e.cosE) (1 − e.cosE). a a
(19.40)
Puis on multiplie par le sinus de la pente : r.v.sinγ =
√ e.sinE GM a 1 − e2 .cos2 E √ . 1 − e2 .cos2 E
(19.41)
Le résultat est immédiat. Le terme de correction relativiste est bien nul lorsque l’orbite est circulaire (excentricité nulle ou orthogonalité des vecteurs positions X et vitesses V ). Les satellites GPS ou Galileo pourraient effectuer la correction eux-mêmes avant d’envoyer le message de navigation. Ils ne le font pas, au contraire des satellites du système russe, le GLONASS. Les corrections d’horloges diffusées par l’IGS sont exprimées en temps propre de chaque satellite. Il faut donc appliquer ce terme périodique relativiste dans les mesures pour pouvoir les utiliser. Précisons au passage que, pour les éphémérides calculées par l’IGS dans les fichiers de référence au format SP3, les positions des satellites sont données en repère terrestre WGS84 et exprimées au centre de masse du satellite et non au centre de phase, contrairement aux éphémérides GPS radiodiffusées qui sont exprimées au centre de phase.
290
19.3.3
Le temps dans la géolocalisation par satellites
Raccordement des temps systèmes GPS et Galileo au temps UTC
Lorsqu’un utilisateur calcule sa solution de navigation (voir chapitre 11), il estime automatiquement un biais d’horloge entre son temps propre et le temps système de la constellation. Le calcul de ce biais lui permet de synchroniser sa base locale de temps au temps système de la constellation utilisée. Les systèmes de navigation ainsi que les systèmes d’augmentation (SBAS, chapitre 22) diffusent aux utilisateurs des paramètres permettant de transférer le temps système de la constellation vers le temps UTC, offrant ainsi un service de datation dont l’exactitude est inférieure à 30 nanosecondes à 95% pour le système GPS 1 , inférieure à 30 nanosecondes à 95 % pour le système Galileo 2 , et inférieure à 20 nanosecondes à 99 % une fois appliqués les paramètres des systèmes SBAS. Ce service permet à l’utilisateur de synchroniser très précisément son horloge au temps UTC et donc de dater ses événements dans l’échelle de temps légale internationale. Dès leur génération, les temps systèmes GPS et Galileo sont maintenus, modulo une seconde, à moins d’une microseconde de l’échelle de temps UTC. L’écart entre les deux échelles a deux origines distinctes. D’une part, les temps systèmes GPS et Galileo sont des échelles de temps continues, ils diffèrent du temps UTC d’un nombre entier de secondes intercalaires (voir chapitre 1.7). D’autre part, il existe une dérive inhérente mais limitée entre les deux échelles de temps. Le transfert de temps est donné par l’écart ΔtUT C défini par la relation : ΔtUT C = tGP S − tUT C .
(19.42)
Le changement de seconde intercalaire (ajout ou retrait d’une seconde intercalaire) introduit une subtilité, spécifiée par les documents d’interfaces (IS-GPS-200 et OS-SIS-ICD), dans le calcul de cet écart. L’utilisateur doit savoir à quel moment utiliser telles ou telles valeurs de secondes intercalaires. Cet écart permet de ramener l’échelle de temps GPS ou Galileo vers l’échelle de temps UTC. Il est modélisé sous la forme d’un biais A0 , d’une dérive A1 , plus le nombre entier de secondes intercalaires ΔtLS courantes. Rentre également en compte la future valeur planifiée du saut de seconde ΔtLSF à laquelle on associe le numéro de semaine WNLSF (composé des 8 bits de poids faible du numéro de semaine complet WN) et le numéro de jour DN (pour Day Number) dans cette semaine à la fin duquel la seconde intercalaire prend effet. Toutes ces informations sont transmises dans le message de navigation GPS : ΔtUT C = ΔtLS + A0 + A1 . [tGN SS − tot + 60 4800 (W N − W Nt )] , (19.43) où : tGN SS : est la date en échelle de temps GPS ou Galileo ; ΔtLS : est le nombre de secondes intercalaires (Leap Seconde) courantes ; 1. Précision affichée dans le document GPS SPS PS 2020. 2. Précision spécifiée dans le document Galileo Service Definition (Q4 2019), précision mesurée inférieure à 15 nanosecondes à 95 % dans le document Galileo IS Open Service QPR.
Effets relativistes sur le temps pour la géolocalisation par satellites
291
A0 : est le biais de temps en seconde ; A1 : est la dérive de temps en s/s ; tot : est le temps de référence pour le calcul de l’écart GPS-UTC ; W N : est le numéro de semaine courante ; W Nt : est le numéro de semaine de référence de l’UTC. Les principaux contributeurs aux erreurs de transfert de temps vers l’UTC sont les erreurs qui affectent la distance géométrique, c’est-à-dire les erreurs de position du satellite ainsi que les erreurs de biais de temps Δtsat permettant de transférer le temps propre de l’horloge du satellite vers le temps système de la constellation de navigation, les retards de propagation et enfin les biais instrumentaux récepteurs. Le calcul du transfert de temps ΔtUT C fourni par un système d’augmentation SBAS s’effectue selon la même formulation où l’on utilise maintenant le temps système SBAS tSBAS en lieu et place du temps système de la constellation de navigation tGN SS . Pour ramener la datation des événements dans l’échelle de temps UTC (la date trec|U T C ), l’utilisateur appliquera au temps propre τrec les différents biais de temps : trec|U T C = τrec − Δtrec − ΔtUT C , (19.44) où : τrec : est la datation de l’événement dans le temps propre du récepteur ; Δtrec : est le biais de temps à appliquer pour ramener le temps propre utilisateur vers le temps GNSS ; ΔtUT C : est le biais de temps à appliquer pour ramener le temps GPS vers le temps UTC ; trec|U T C : est la datation de l’événement dans l’échelle de temps UTC.
19.4
Effet Shapiro pour les signaux de navigation
Il s’agit ici de déterminer, dans le cadre de la relativité générale, la durée du trajet d’un signal radio provenant d’un satellite de navigation vers un utilisateur à la surface de la Terre (situation illustrée en figure 19.2). Nous allons montrer que l’effet Shapiro est négligeable pour l’implémentation actuelle des systèmes de navigation. La propagation du signal radio se fait le long d’une géodésique qui vérifie ds = 0, c’est-à-dire : 2V 2V 1 + 2 c2 dt2 = 1 − 2 dl2 , (19.45) c c où dl2 = dr2 + r2 dθ2 + r2 sin2 θdϕ2 est l’élément de longueur le long de la trajectoire du signal. En examinant cette métrique, le retard calculé résulte principalement de deux facteurs : celui devant la variable temporelle dt2 qui correspond à la
292
Le temps dans la géolocalisation par satellites
Fig. 19.2 – Propagation du signal radio du satellite de navigation no i vers un observateur au sol.
courbure temporelle, et celui devant la variable spatiale dl2 qui correspond à la courbure spatiale. Dans le cas d’une trajectoire purement radiale (où dθ = 0 et dϕ = 0), les deux facteurs sont responsables chacun d’eux de la moitié de la valeur du retard relativiste. En se limitant aux termes en 1/c2 , la métrique se ramène à : 2V (19.46) cdt = 1 − 2 dl. c Comme précédemment, le potentiel V appliqué au satellite de navigation peut être réduit à la seule contribution du monopôle V = −GM/r. L’équation précédente s’intègre alors en : 1 2GM r + ri + l t − ti = ||r − ri || + , (19.47) ln c c3 r + ri − l où (ti , ri ) sont les coordonnées GCRF du satellite no i et (t, r) sont les coordonnées GCRF de l’observateur au sol. Les temps t et ti sont toujours des temps-coordonnées. Le terme en logarithme dans l’équation de propagation ci-dessus traduit l’effet Shapiro : 2GM r + ri + l ΔtShapiro = ln . (19.48) c3 r + ri − l Une partie du retard Shapiro est uniquement la conséquence de la « courbure temporelle » : le simple fait de se déplacer dans un espace « plat spatialement » en traversant une région où règne un champ gravitationnel se traduit par un retard par rapport à un trajet qui s’effectuerait en l’absence de toute influence gravitationnelle. Appliqué à la navigation par satellites, le temps cumulé par un observateur terrestre sera plus grand que le temps cumulé pour les horloges locales croisées par le signal électromagnétique, si celles-ci sont positionnées
Effets relativistes sur le temps pour la géolocalisation par satellites
293
dans les lieux de potentiels gravitationnels supérieurs. Par conséquent, la différence entre les temps propres du récepteur terrestre et ceux des lieux traversés depuis le satellite se traduit à l’arrivée par une durée plus longue. Une autre partie du retard Shapiro est la conséquence de la déformation spatiale de l’espace traversé. Ce retard n’est pas dû au ralentissement de la lumière au passage d’une masse sphérique proche : la vitesse de la lumière localement (c’est-à-dire mesurée par un observateur à l’endroit où elle passe) est toujours égale à c mais elle se propage dans un espace-temps courbe impliquant un allongement du trajet. Notons que ces deux parties du retard Shapiro vont en réalité de pair : on ne peut pas avoir l’un sans l’autre dans la métrique de Schwarzschild. L’intensité du retard Shapiro est de l’ordre de quelques picosecondes : 2GM ∼ (19.49) = 3 × 10−11 s, c3 ce qui se traduit par un retard sur la mesure de pseudo-distance de l’ordre du millimètre. L’erreur commise en position est donc inférieure au centimètre.
19.4.1
Équation de propagation en temps terrestre
L’équation de propagation du signal radio de navigation de la section précédente faisait intervenir des temps-coordonnées. Or, ce n’est pas ce que mesure une horloge d’un récepteur au sol : cette dernière enregistre des temps propres. On peut facilement ramener l’équation de propagation exprimée en temps ter restre par la multiplication du facteur 1 + Uc20 . En négligeant les termes d’ordres supérieurs à 1/c4 , on obtient : U0 1 2GM r + ri + ||r − ri || ||r − ri || + . (19.50) ln τ − τi = 1 + 2 c c c3 r + ri − ||r − ri || Si on évalue le terme ||r − ri || U0 /c2 , on trouve sur la distance totale parcourue : |U0 | |U0 | ||r − ri || ∼ (19.51) = 3RT 2 ∼ = 1 cm. c2 c Cette contribution est donc assez faible pour être négligée, ce qui revient à écrire, en négligeant l’effet Shapiro : 1 τ − τi ∼ (19.52) = ||r − ri || c C’est cette dernière équation qui est utilisée dans l’implantation actuelle des systèmes de navigation.
19.5
Le rôle de la relativité dans le GPS : une légende urbaine ?
Compte tenu des rumeurs (infondées) persistantes qui continuent à circuler en 2020, nous pensons indispensable de faire ici une mise au point.
294
Le temps dans la géolocalisation par satellites
Certaines personnes contestent avec vigueur que le temps façon relativiste soit incontournable dans un système de géolocalisation comme le GPS. L’une des publications trop méconnues (pourtant remarquable) qui traite de ce thème est celle déjà mentionnée due à Alley (1983) intitulée « Proper time experiments in gravitational fields with atomic clocks, aircraft, and laser light pulses ». Alley y indique sans ambiguïté (page 421) à propos des systèmes tels que le GPS : Il est essentiel pour le fonctionnement correct de certains de ces systèmes que l’influence du potentiel gravitationnel et du mouvement sur le temps propre soit comprise en détail et qu’elle soit incluse dans leur conception et leur usage opérationnel. Rappelons que Carroll Alley est l’auteur de l’une des expériences les plus importantes parmi celles ayant vérifié les prédictions relativistes sur les différences de temps propres cumulés entre des horloges au sol et des horloges embarquées dans un avion. Voici ce qu’indique le document d’interface officiel (ICD) du GPS de 2018, accessible en ligne. IS-GPS-200 Revision J, 25 April 2018 3.3.1.1 Frequency Plan The carrier frequencies for the L1 and L2 signals shall be coherently derived from a common frequency source within the SV. The nominal frequency of this source – as it appears to an observer on the ground – is 10.23 MHz. The SV carrier frequency and clock rates – as they would appear to an observer located in the SV – are offset to compensate for relativistic effects. The clock rates are offset by Δf /f = −4.4647E-10, equivalent to a change in the P-code chipping rate of 10.23 MHz offset by a Δf = −4.5674E3 Hz. This is equal to 10.2299999954326 MHz. The nominal carrier frequencies (f0 ) shall be 1575.42 MHz, and 1227.6 MHz for L1 and L2, respectively. Donc dans les spécifications actuelles du GPS, la méthode recommandée pour compenser la désynchronisation relativiste des horloges embarquées à bord des satellites (par rapport aux horloges au sol) consiste à ralentir légèrement leur fréquence (en utilisant la prédiction théorique relativiste) avant leur lancement de sorte que, une fois en orbite, elles comptent le même nombre de tics que les horloges identiques au sol. Cette méthode a été abondamment utilisée depuis les débuts du GPS. En plus de la compensation du décalage relatif constant de fréquence (qui conduirait au bout d’une journée à une erreur en position de l’ordre de la dizaine de kilomètres si on l’ignorait), le récepteur GPS doit prendre en compte un effet relativiste beaucoup plus faible correspondant à l’excentricité (car les satellites suivent des trajectoires légèrement elliptiques donc non parfaitement circulaires).
Effets relativistes sur le temps pour la géolocalisation par satellites
295
Le document d’interface IS-GPS-200 du GPS précise l’algorithme utilisé : 20.3.3.3.3.1 User Algorithm for SV Clock Correction The user shall correct the time received from the SV (Satellite Vehicle) with the equation (in seconds) T = tsv - Δtsv , where : t = GPS system time (seconds), tsv = effective SV PRN code phase time at message transmission time (seconds), Δtsv = SV PRN code phase time offset (seconds). The SV PRN code phase offset is given by : tsv = af0 + af1(t - toc ) + af2(t - toc ) 2 + Δtr , where : af0, af1 and af2 are the polynomial coefficients given in subframe 1, toc is the clock data reference time in seconds (reference paragraph 20.3.4.5), and Δtr is the relativistic correction term (seconds). Le polynôme ci-dessus donne l’estimation des écarts d’horloge pour chaque satellite (la régression polynomiale est réalisée par les stations au sol et le résultat est transmis régulièrement aux satellites). Les trois premiers termes correspondent à des dérives d’horloges qui n’ont rien de relativiste car liées à leurs imperfections inévitables. Le dernier terme est le petit effet relativiste (qui correspond à une valeur en position de l’ordre de la dizaine de mètres, donc non négligeable même pour les applications de navigation automobile). Cela dit, Neil Ashby, l’un des auteurs les plus prolifiques sur ce sujet, précise dans son article « Relativity in the Global Positioning System » (Ashby, 2003) : Il est devenu d’usage courant de ne pas appliquer ces offsets aux horloges à rubidium parce qu’elles sont sujettes à des sauts de fréquence durant le lancement. À la place, une fois ces horloges en orbite, leurs fréquences sont mesurées et les corrections de fréquence requises sont incorporées dans le polynôme donnant les écarts d’horloge qui accompagne le message de navigation. Autrement dit, il est possible de ne pas utiliser la recommandation officielle spécifiée mais d’inclure le biais en fréquence relativiste dans le polynôme cidessus via le coefficient af1. Seul le terme relativiste lié à l’excentricité est alors à prendre en compte. C’est une méthode alternative qui consiste à estimer depuis le sol tous les écarts d’horloge significatifs (y compris le « gros » effet relativiste constant). Pour le système Galileo, c’est en fait la méthode spécifiée. C’est ce constat qui a conduit certains auteurs (notamment sur le Web) à prétendre qu’on peut très bien se passer de la relativité du temps dans la géolocalisation GPS et que le rôle indispensable de la relativité dans le GPS pour la navigation automobile serait une légende urbaine. Une telle affirmation est vraiment contre-productive (et on peut même être perplexe quant à ses motivations exactes) car s’il y a bien un système où la
296
Le temps dans la géolocalisation par satellites
relativité du temps est incontournable, c’est la géolocalisation par satellites (GPS ou autre). Les désynchronisations relativistes sont « énormes » par rapport aux objectifs sur la position estimée (quelques mètres pour la navigation automobile). Il est vrai que l’on peut estimer le gros de l’effet relativiste sans se soucier de l’origine de l’écart mais on ne pourrait pas prétendre maîtriser le fonctionnement d’un tel système sans comprendre finement les sources exactes de tous les écarts d’horloge significatifs. Par exemple, lors des phases de tests avant la mise en opération d’un nouveau satellite GPS, ignorer la relativité serait inacceptable car cela signifierait que l’on déclarerait apte au service un satellite pour lequel des écarts « énormes » de temps seraient constatés pour les horloges à bord (par rapport aux horloges au sol) sans avoir la moindre idée de ce qui se passe. Tout ingénieur sérieux jugerait un tel système tout bonnement inutilisable. Il y a également de nombreuses situations où la capacité de prédire suffisamment à l’avance ce que sera l’effet relativiste est cruciale. En conclusion, la relativité du temps n’est pas une légende urbaine mais au contraire une réalité qu’on ne peut pas se payer le luxe d’ignorer pour faire fonctionner le GPS ou Galileo. Le fait d’utiliser une régression polynomiale pour estimer le biais relativiste ne change rien à l’affaire. Pour finir, une petite histoire pour illustrer l’importance des effets relativistes (et leur difficile acceptation !) dès les débuts du GPS racontée par Neil Ashby dans son article ibid. (qu’on trouve aussi chez Carroll Alley) : Il y a une histoire intéressante au sujet de ce décalage de fréquence. Au moment du lancement du satellite NTS-2 (le 23 juin 1977), qui embarquait la première horloge atomique à césium, il était généralement admis que les horloges en orbite nécessitaient une correction relativiste, mais son amplitude et son signe restaient débattus. En réalité, certains doutaient même de la réalité de ces effets relativistes et du besoin de les prendre en compte ! Un synthétiseur de fréquence fut monté dans le dispositif de l’horloge du satellite afin qu’après le lancement, si le rythme de l’horloge sur son orbite finale s’avérait être celui prédit par la relativité générale, on puisse activer le synthétiseur pour régler le rythme de l’horloge sur la valeur requise. Après que l’horloge à césium à bord de NTS-2 fut activée, elle fonctionna durant environ 20 jours afin qu’on pût mesurer son rythme avant de démarrer le synthétiseur. Le décalage relatif de fréquence par rapport aux horloges au sol était +4,425 × 10−10 , alors que la relativité générale prédisait +4,465 × 10−10 . La différence était largement dans la marge d’erreur de l’horloge embarquée. Ceci correspondait à une vérification à 1 % près des effets combinés de l’effet Doppler du second ordre et du redshift gravitationnel pour une horloge orbitant à 4,2 rayons terrestres.
Chapitre 20 Transfert de temps et transfert de fréquence Les techniques de transfert de temps et de fréquence sont un moyen pédagogique puissant pour faciliter la compréhension des effets physiques relativistes. Dans ce chapitre, nous décrivons le procédé général pour réaliser le transfert de temps et de fréquence en donnant quelques exemples simples qui pourront être généralisés aisément à des cas plus complexes. L’exposé détaillé des diverses techniques de transfert de temps et de fréquence sort du cadre de cet ouvrage. En revanche, nous tenons à donner les principes généraux et les concepts essentiels.
20.1
Transfert de fréquence
Le transfert de fréquence consiste à comparer les fréquences propres de deux horloges distantes afin, éventuellement, de les accorder (on utilise aussi le verbe « syntoniser »). Il existe deux méthodes principales : la méthode à une voie (qui utilise la transmission d’un signal d’un point à un autre) et celle à deux voies (qui utilise un signal aller-retour).
20.1.1
La méthode à une voie
Supposons qu’une onde électromagnétique soit transmise depuis un point distant (par exemple depuis un satellite jusqu’à la surface de la Terre) et que la fréquence soit mesurée au point de réception (situation de la figure 20.1). Si nous souhaitons savoir quelle était la fréquence de l’onde au point d’émission, comment devons-nous procéder ? A Le transfert de fréquence consiste à déterminer le rapport ffB de la fréquence de l’onde émise mesurée par l’horloge A à la fréquence de l’onde reçue mesurée par l’horloge B.
298
Le temps dans la géolocalisation par satellites
Fig. 20.1 – Deux horloges A et B mesurant leur temps propre le long de leur ligne d’univers. Un signal de phase S est émis par A au temps propre τA , puis un autre signal de phase S + dS est émis par A au temps propre τA + dτ A . Les deux signaux sont reçus par B respectivement aux temps propres τB et τB + dτ B . Le temps t dans le référentiel est le temps-coordonnée.
Par définition de la phase (S = ωτ = fA =
2πτ T ),
on déduit :
1 dS , 2π dτA
(20.1)
et
1 dS . 2π dτB On obtient la formule générale pour le transfert de fréquence : fB =
fA dτB dτB dtB dtA = = . fB dτA dtB dtA dτA
(20.2)
(20.3)
Les premier et troisième termes sont liés à la métrique d’espace-temps : on compare le temps-coordonnée avec le temps propre aux points de réception et d’émission. Le deuxième terme est lié à la propagation du signal entre le point d’émission et le point de réception (exprimée en temps-coordonnée). Examinons quelques exemples simples. Si on se limite à l’ordre en 1/c (ce qui signifie que l’on néglige les termes d’ordre supérieur), les premier et troisième termes de la formule générale ci-dessus sont égaux à 1 puisqu’on ignore les effets relativistes. Reste uniquement le deuxième terme qui se réduit à l’effet Doppler classique et s’explique par l’éloignement ou le rapprochement de l’émetteur par rapport au récepteur.
Transfert de temps et transfert de fréquence
299
Au premier ordre en 1/c, on néglige les effets de la propagation dans un espace-temps courbe (effet Shapiro). On peut donc écrire : t B − tA =
− → − r→ B (tB ) − rA (tA ) . c
(20.4)
En dérivant par rapport à tA , on obtient l’expression générale pour l’effet Doppler classique : −−→ − → 1 − uABc·vA fA dtB = = (20.5) −−→ − →, fB dtA 1 − uABc·vB où − u−→ est le vecteur unitaire pour la direction AB : AB
− → − r→ B − rA − → u− AB = − − → , r→ B − rA
(20.6)
et vA , vB les vitesses respectives des horloges A et B. Dans le cas particulier où vB = 0 et où l’émetteur se rapproche du récepteur de manière purement radiale, le rapport des fréquences devient : fA vA . =1− fB c
(20.7)
Si on se limite à l’ordre en 1/c2 , il faut tenir compte de trois effets physiques prépondérants : – l’effet Doppler classique qui s’explique par l’éloignement ou le rapprochement de l’émetteur ; – l’effet Doppler transverse (relativiste) qui s’explique par la désynchronisation cinématique des horloges parfaites (due aux vitesses respectives de l’émetteur et du récepteur) ; – l’effet Einstein (relativiste) qui s’explique par la désynchronisation gravitationnelle des horloges parfaites (due à la différence de potentiel gravitationnel entre le lieu du récepteur et celui de l’émetteur). Le deuxième terme de la formule générale a été déjà déterminé précédemment. Il est inchangé car les quantités suivantes à prendre en compte sont en 1/c3 . Seul l’effet Doppler classique est à prendre en compte. Nous devons par contre détailler le calcul pour les deux autres termes pour tenir compte de la métrique d’espace-temps (celle de Schwarzschild sera ici la référence) : dτB 1 v2 r→ = 1 − 2 B + U (− ) , (20.8) B dtB c 2 et
2 dτA 1 vA − → + U (rA ) , =1− 2 dtA c 2
(20.9)
où U représente le potentiel gravitationnel terrestre au point considéré (si nous considérons que l’expérience a lieu dans l’environnement de la Terre). Nous négligeons ici l’influence des autres corps du système solaire.
300
Le temps dans la géolocalisation par satellites
On voit apparaître dans les expressions qui précèdent l’effet Doppler du second ordre ainsi que l’effet Einstein (via le potentiel gravitationnel U ). A Le rapport ffB vaut donc : 1− fA = fB 1−
1 c2 1 c2
2 vB 2 2 vA 2
+ U (− r→ B) 1− × 1− + U (− r→ A)
− →− → u− AB ·vA c − →− → u− AB ·vB c
.
(20.10)
Comme exemple simple, prenons le cas d’un disque en rotation sur lequel on place en périphérie une horloge A et au centre une horloge B. Les effets liés à la gravitation sont nuls, de même que l’effet Doppler classique (A et B étant à distance fixe). A Le rapport ffB vaut donc : v2 fA 1 2 ≈ 1 + A2 . = v fB 2c 1 − c12 2A
(20.11)
En valeur absolue, le décalage relatif en fréquence entre les deux points A et v2 B vaut 2cA2 . Une mesure récente (2018) du décalage spectral gravitationnel (effet Einstein) a consisté à analyser le spectre électromagnétique d’une étoile en orbite autour du trou noir supermassif de notre galaxie. Il s’agit en fait d’un magnifique exemple de transfert de fréquence : les différents effets relativistes intervenant dans la formule ci-dessus ont été mesurés et les résultats sont détaillés dans l’article d’Abuter et al. (GRAVITY Collaboration) (2018). Si on se limite à l’ordre en 1/c3 , les premier et troisième termes de la formule générale sont inchangés car les quantités suivantes à prendre en compte sont en 1/c4 . En revanche, pour le deuxième terme, il faut tenir compte de l’effet Shapiro qui est en 1/c3 . On a donc : t B − tA =
− → − r→ B (tB ) − rA (tA ) + ΔtShapiro , c
(20.12)
où ΔtShapiro est le retard Shapiro. Il suffit de dériver par rapport à tA l’expression ci-dessus et d’en déduire B ce que vaut dt dtA . Les lecteurs désireux de connaître les détails des calculs pourront avantageusement consulter l’article de Blanchet et al. (2001). Notons que la précision des meilleures horloges actuelles (exactitude et stabilité proches de 10−18 ) permet de mesurer les effets jusqu’à l’ordre 1/c3 et qu’en conséquence, ces calculs détaillés ont un intérêt pratique. La géodésie chronométrique est une technique promise à un bel avenir : elle consistera à se servir d’horloges de haute précision à la surface de la Terre
Transfert de temps et transfert de fréquence
301
qui, grâce au transfert de fréquence, permettront de détecter l’effet Einstein et d’estimer les fluctuations d’altitude terrestre de l’ordre du centimètre. Voir l’article de Delva et Lodewyck (2013) pour plus de détails.
20.1.2
La méthode à deux voies
Nous ne détaillons pas ici cette méthode. Voir l’article de Blanchet et al. (2001) pour plus de détails.
20.2
Transfert de temps
Le transfert de temps consiste à comparer les temps propres de deux horloges distantes afin, éventuellement, de les synchroniser. Comme pour le transfert de fréquence, il existe deux méthodes principales : la méthode à une voie (qui utilise la transmission d’un signal d’un point à un autre) et celle à deux voies (qui utilise un signal aller-retour).
20.2.1
La méthode à une voie
Supposons qu’une onde électromagnétique soit transmise depuis un point distant dans l’espace (par exemple depuis un satellite) et reçue en un autre point, de la façon décrite par la figure 20.1. Nous raisonnons en temps-coordonnée : le signal est émis de A à l’instant tA et reçu en B à l’instant tB . Si nous souhaitons savoir à distance de combien les horloges sont décalées, il nous faut estimer le temps de propagation du signal TAB entre le point d’émission et le point de réception. La désynchronisation entre les deux horloges sera égale à : Δt = (tA + TAB ) − tB .
(20.13)
Nous avons déjà vu pour le transfert de fréquence que : TAB =
− → − r→ B (tB ) − rA (tA ) + ΔtShapiro . c
(20.14)
En pratique, on connaît la position du récepteur B à l’instant tA plutôt qu’à l’instant tB . Dans ce cas, il est nécessaire de prendre en compte la rotation de la Terre sur elle-même durant la propagation du signal, autrement dit il faut alors inclure l’effet Sagnac dans les calculs (qui peut correspondre à une avance ou un retard selon la configuration). La formule générale pour le temps de propagation du signal est donc : TAB =
− → − r→ B (tA ) − rA (tA ) + ΔtSagnac + ΔtShapiro , c
(20.15)
302
Le temps dans la géolocalisation par satellites
où ΔtSagnac est la correction Sagnac à appliquer. On qualifie souvent de « retard Römer » le premier terme dans le temps de propagation ci-dessus, en hommage à l’astronome danois qui, en 1676, montra le caractère fini de la vitesse de propagation de la lumière, en raisonnant dans un cadre newtonien. Examinons quelques exemples simples. Si on se limite à l’ordre en 1/c2 , seul l’effet Sagnac est à prendre en compte en plus du retard Römer : TAB =
− → − → − → [− r→ − r→ B (tA ) − rA (tA ) B (tA ) − rA (tA )] .vB (tA ) + . 2 c c
(20.16)
Attention : on pourrait penser être autorisé, au premier ordre en 1/c, à ignorer l’effet Sagnac mais son amplitude n’est pas négligeable compte tenu des quantités au numérateur. Si on se limite à l’ordre en 1/c3 , il faut prendre en compte l’effet Shapiro ainsi que des développements supplémentaires pour l’effet Sagnac. Les lecteurs désireux de connaître les détails des calculs pourront avantageusement consulter l’article de Blanchet et al. (2001). Nous avons décrit comment tenir compte du temps de propagation, ce qui permet de réaliser un transfert de temps-coordonnée. Afin de synchroniser les horloges, il est nécessaire de réaliser un transfert de temps propre. En conséquence, il faut tenir compte de la désynchronisation relativiste puisque les temps propres diffèrent en général d’un lieu à un autre. Un exemple de déduction complète est donné dans l’article de Xie (2016) dans le cas intéressant de communications entre satellites.
20.2.2
La méthode à deux voies
On peut imaginer différentes configurations à deux voies. Nous décrivons l’une des plus courantes qui met en jeu une station au sol et un satellite. Nous raisonnons à nouveau en temps-coordonnée. Un signal est émis de la station au sol à l’instant tA et reçu par le satellite à l’instant tB . Un second signal est émis par le satellite à l’instant tB et reçu par la station au sol à l’instant tA . On note TAB le temps mis par le signal pour aller de A vers B et TB A le temps mis par le signal pour aller de B vers A. Les quantités TAB et TB A sont celles que nous avons calculées pour la méthode à une voie. L’intervalle de temps Δt correspondant à la désynchronisation entre l’horloge de la station et l’horloge du satellite (toutes deux supposées parfaites) est donné par : Δt = (tA + TAB ) − tB . (20.17) On peut aussi exprimer ce même intervalle pour le signal voyageant dans l’autre sens : Δt = tA − (tB + TB A ) . (20.18)
Transfert de temps et transfert de fréquence
303
En combinant les deux équations, on en déduit : Δt =
(tA + tA ) − (tB + tB ) + (TAB − TB A ) . 2
(20.19)
Dans le cas de la technique T2L2 (transfert de temps par lien laser) utilisée notamment pour l’expérience de Carroll Alley, le signal est réfléchi instantanément, donc tB − tB = 0. Dans cette même expérience d’Alley, on était autorisé à considérer que la propagation était parfaitement symétrique, donc que TAB − TB A = 0. On retrouve alors la formule obtenue au paragraphe 18.2. Dans le cas général, il n’est pas correct de supposer qu’il y a symétrie, ce qui veut dire que la quantité (TAB − TB A ) n’est pas négligeable. Si on se limite à l’ordre en 1/c2 , il faut calculer la différence entre les corrections Sagnac dans les deux sens de parcours. Si on se limite à l’ordre en 1/c3 , il faut calculer la différence entre les corrections Sagnac dans les deux sens de parcours, mais aussi la différence entre les retards Shapiro pour chacun des parcours. Comme pour la méthode à une voie, nous avons décrit comment réaliser un transfert de temps-coordonnée. Afin de synchroniser les horloges, il est nécessaire de réaliser un transfert de temps propre, donc il faut tenir compte de la désynchronisation relativiste entre les deux points A et B. Dans la géolocalisation par satellites, le transfert de temps joue un rôle essentiel que nous allons détailler.
20.3 20.3.1
Le transfert de temps avec les signaux GPS Repères inertiels et repère terrestre
On rappelle que dans le cas du système GPS, deux référentiels sont couramment utilisés. D’une part, les utilisateurs effectuent leur positionnement dans un référentiel lié à la rotation de la Terre, c’est-à-dire en référentiel ECEF dont la réalisation opérationnelle est le WGS-84. Les éphémérides GPS, c’est-à-dire la position du centre de phase des satellites au cours du temps, sont exprimées dans le repère WGS-84. Il s’agit d’un repère tournant autour d’un axe de rotation qui diffère légèrement de celui de la Terre. D’autre part, il est nécessaire de disposer de repères inertiels ECI dans lequel la propagation des signaux se fait en ligne droite à la vitesse de la lumière dans le vide. L’origine de ces repères inertiels coïncide avec le centre de masse de la Terre et l’axe z est toujours lié à l’axe de rotation de la Terre à une date donnée. Un référentiel inertiel tombe librement avec la Terre dans le champ gravitationnel généré par les autres corps du système solaire. Les calculs de temps de propagation seront toujours menés en repère ECI. Pour construire un repère ECI, on le superposera au système de coordonnées
304
Le temps dans la géolocalisation par satellites
ECEF à une date donnée t0 . On passe d’un référentiel ECI au référentiel ECEF par une rotation dont l’angle dépend de la date où l’on fait la transformation. Dans le système GPS, les horloges de la constellation de navigation sont synchronisées dans le repère inertiel ECI par rapport aux horloges à la surface du géoïde terrestre.
20.3.2
L’effet Sagnac dans les systèmes GNSS
Comme nous l’avons vu au paragraphe 14.6, la correction Sagnac est un effet relativiste qui ne dépend que de la cinématique, en aucun cas des effets de gravitation, donc la relativité restreinte suffit pour le décrire entièrement. L’effet Sagnac doit être pris en compte à chaque fois que l’on cherche à synchroniser des horloges distantes sur un disque ou sur une sphère en rotation. Un observateur sur la Terre se rapportant au repère ECEF doit appliquer la correction Sagnac afin de synchroniser son horloge à la référence de temps GPS. Dans le cas de la mesure GPS, l’élément de longueur dx est parallèle à la vitesse relative v et donc vdx = v · dr où dr est le vecteur incrément de chemin dans le sens de la propagation du signal. La correction Sagnac prend alors la forme v · dr dtSagnac = γ 2 . (20.20) c =X rec − X sat entre le satellite et le Intégré sur le chemin en ligne droite R récepteur (en référentiel ECI), le délai Sagnac s’écrit donc : ΔtSagnac = γ
v · R , 2 c
(20.21)
où tous les vecteurs sont exprimés en repère inertiel ECI. En réalité, dans le cas précis des applications en navigation, les vitesses des satellites sont très faibles par rapport à la vitesse de la lumière : le facteur de Lorentz γ est proche de 1 (≈ 1 + 1, 3 × 10−5 ). Ce facteur est la plupart du temps négligé dans les standards. Les horloges à la surface du géoïde terrestre restent synchronisées entre elles. C’est une propriété du géoïde qui est une surface équipotentielle. De même, des horloges en périphérie d’un disque tournant restent synchronisées entre elles également. Ce géoïde est en gros un ellipsoïde aplati représentant la surface de notre planète au niveau moyen des mers. Sur ce géoïde de référence, toutes les horloges atomiques battent au même rythme les unes par rapport aux autres. Il est alors possible de définir une échelle de temps qui soit donnée par des horloges idéales fixées au géoïde. Cette échelle, réalisée physiquement par un réseau mondial d’horloges atomiques, est appelée temps UTC (temps universel coordonné). En revanche, si l’on veut transférer le temps d’une horloge à l’autre (donc synchroniser une horloge par rapport à une horloge distante), il faut prendre
Transfert de temps et transfert de fréquence
305
en compte l’effet Sagnac. Le transfert de temps doit tenir compte du temps de trajet du signal, d’où le caractère incontournable de l’effet Sagnac. L’effet de désynchronisation est fonction du sens du mouvement et du type de trajectoire. Pour un récepteur fixe sur le géoïde, l’effet maximal est de 137 ns soit 41 m dans la mesure, ce qui n’est pas négligeable pour une précision verticale inférieure à quelques mètres.
20.3.3
Le transfert de temps avec les signaux GPS
Dans les applications de navigation, la correction Sagnac rend compte du mouvement du récepteur durant le temps de transmission du signal. Dans cette section, on cherche à relier le temps de réception d’un signal GPS avec son temps d’émission, tous deux référencés en temps GPS. On suppose ici les horloges parfaites. L’exercice consiste à synchroniser une horloge récepteur fixe sur la Terre et en mouvement avec celle-ci, par rapport à une horloge de la constellation GPS. On fixe donc une date de transmission tsat du signal par le satellite émetteur. On rappelle que les positions des satellites sont données en référentiel sat (tsat ) ECEF. À cette date d’émission tsat , la position du satellite est X dans le référentiel ECEF associé à la date tsat . Le signal arrive au récepteur à la date trec en temps GPS. À cette date rec (trec ) en référentiel ECEF de réception trec , la position du récepteur est X associé à la date trec . Bien entendu si le récepteur est fixe sur Terre, ses coor rec restent fixes dans le référentiel ECEF alors qu’elles évoluent données X constamment en repère inertiel. Le temps de propagation géométrique ΔtR du signal du satellite vers le récepteur est la différence entre le temps à l’émission et celui de la réception exprimée en échelle de temps commune, ici le temps GPS : ΔtR = trec − tsat .
(20.22)
À ce moment, il n’est pas encore possible d’écrire l’équation de propagation rec (trec ) ne sont pas exprimées dans le même sat (tsat ) et X car les positions X référentiel ECEF. On va donc au préalable fixer un repère inertiel ECI que l’on superpose à l’ECEF à la date de transmission tsat , et faire l’analyse dans ce repère. À cette date d’émission tsat , la position du récepteur est mainte rec (tsat ) dans le référentiel ECEF associé à la date tsat . La vitesse du nant X rec exprimée en récepteur, due au mouvement de rotation de la Terre, est V référentiel ECI. On applique alors le raisonnement déjà utilisé : durant l’intervalle de temps rec ΔtR dans le référentiel ECI. En ΔtR , le récepteur s’est déplacé du vecteur V effet, le référentiel ECEF a légèrement tourné par rapport au repère inertiel ECI, entraînant le récepteur avec lui : rec (trec ) = R3 (θ) · X rec tsat . X (20.23) Où R3 est la rotation selon l’axe z définie par la formule (10.18).
306
Le temps dans la géolocalisation par satellites
Comme le temps de transmission varie entre 70 et 90 ms, les angles de rotation θ sont petits, on peut donc approximer cette équation, en repère inertiel ECI, par un développement de Taylor à l’ordre un : rec (trec ) = X rec tsat + Vrec ΔtR . rec tsat + ΔtR = X X (20.24) Il est important de préciser le repère dans lequel les opérations de dérivées sont faites car en référentiel ECEF la position d’un récepteur fixe sur la Terre ne bouge pas au cours du temps. Dans le repère inertiel ECI, la lumière se déplace en ligne droite à la vitesse constante c, par conséquent la distance totale parcourue par la lumière dans l’intervalle de temps ΔtR est : rec ΔtR − X rec tsat + V sat tsat ||. cΔtR = ||X (20.25) Cette équation modélise la mesure entre le satellite GPS et le récepteur, c’està-dire le temps de propagation du signal. L’inconnue dans cette équation est bien sûr le temps de propagation ΔtR . C’est une équation implicite qui peut être résolue en référentiel ECI de façon itérative en initialisant le calcul avec : (0)
ΔtR =
1 sat sat sat ||Xrec t −X t ||. c
(20.26)
Les itérations successives se font avec : (n+1)
cΔtR
+V rec Δt(n) ||, = ||R R
(20.27)
sat (tsat ) pour simplifier la notation. Le = X rec (tsat ) − X où l’on a posé R processus converge très rapidement, on s’arrête dès que l’écart entre deux itérations est suffisamment faible. Dans cette méthode de résolution, le délai Sagnac passe complètement inaperçu car il est automatiquement pris en compte d’une itération à l’autre. On peut toutefois extraire cet effet de l’équation de propagation par une résolution directe faisant intervenir les approximations classiques des développements limités. On commence en élevant au carré. +V rec ΔtR ||2 . c2 Δt2R = ||R Le développement de cette expression donne : 2 2 2 rec · RΔt R. c − Vrec ΔtR = R2 + 2V
(20.28)
(20.29)
2 2 2 En remarquant que c2 − Vrec ΔtR = c ΔtγR on arrive à : ΔtR = c γ
rec · RΔt R=R R 2 + 2V
1+
rec · R 2V Vrec · R ΔtR . ΔtR ∼ =R+ 2 R R (20.30)
Transfert de temps et transfert de fréquence
307
Fig. 20.2 – Le délai Sagnac dans le transfert de temps. Ce délai peut être positif ou négatif selon la variation de la distance relative.
On résout maintenant l’équation en tR :
rec · R rec · R R ΔtR R V V ∼ = 1−γ 1+γ , = γ c cR c cR
(20.31)
soit finalement : rec · R ΔtR R V = +γ . 2 γ c c
(20.32)
Le temps propre cumulé par l’horloge du récepteur pendant le trajet du signal contient la correction Sagnac qui rend compte du mouvement du récepteur tandis que le signal se propage du satellite émetteur vers le récepteur. Cette correction peut être positive ou négative (illustration en figure 20.2). rec · R > 0, alors le récepteur s’éloigne de l’émetteur à l’instant de Si V transmission : le délai Sagnac est le temps supplémentaire à ajouter pour que le signal rattrape le récepteur en mouvement de rotation. < 0, alors le récepteur se rapproche de l’émetteur à l’instant de Si Vrec · R transmission : le délai Sagnac est le temps supplémentaire à retrancher car le récepteur va à la rencontre du signal dans son mouvement de rotation. Comme la vitesse du récepteur due à la rotation de la Terre est de l’ordre de 463 m/s à l’équateur et nulle aux pôles, l’approximation γ ≈ 1 est complètement valide. On a ainsi : ΔtR =
R + ΔtSagnac , c
(20.33)
308
Le temps dans la géolocalisation par satellites
avec : ΔtSagnac =
rec · R V . 2 c
(20.34)
La formulation du temps de propagation peut également être obtenue à partir de l’équation implicite suivante déjà obtenue dans les développements précédents (γ ≈ 1) : rec · R V cΔtR = R + ΔtR , (20.35) R à laquelle on injecte dans le membre de droite une estimation approchée du temps de propagation par : R ΔtR ∼ = ΔtR0 = . c
(20.36)
Cela revient alors exactement à faire la résolution de l’équation implicite en une et une seule itération puis à stopper le calcul. L’équation du délai de propagation permet également de synchroniser l’horloge récepteur, fixe dans le référentiel ECEF, au temps GPS matérialisé par la date tsat . Autrement dit, on transfère le temps de l’horloge satellite tsat , référencée en temps GPS, au niveau récepteur terrestre. Ce transfert prend en compte le temps de transmission du signal et l’effet Sagnac : trec = tsat +
R + ΔtSagnac . c
(20.37)
Il est important de préciser qu’il faut disposer d’un référentiel ECI pour poser l’équation de mesure car dans un référentiel ECEF la lumière ne parcourt pas une ligne droite. Le délai Sagnac rend compte de cette déviation. Le délai Sagnac a également une interprétation géométrique élégante. On écrit pour cela la vitesse du récepteur comme le produit vectoriel du vecteur de vitesse angulaire de la Terre, porté par l’axe des pôles, avec la position du récepteur, supposée connue. rec = ω ∧ X rec tsat . V (20.38) En utilisant la relation vectorielle (u ∧ x) · y = u · (x ∧ y ), la correction Sagnac (approximation γ ≈ 1) se réécrit de la forme : rec (tsat ) · R ω∧X rec (tsat ) ∧ R X ΔtSagnac = = ω · . (20.39) 2 2 c c En menant le développement du calcul jusqu’au bout, on arrive à la formulation : sat (tsat ) ∧ X rec (tsat ) X z ΔtSagnac = Ω˙ e , (20.40) c2
Transfert de temps et transfert de fréquence
309
Fig. 20.3 – Le délai Sagnac est proportionnel à l’aire équatoriale balayée entre le rayon vecteur satellite et le rayon vecteur récepteur.
où la notation ()z correspond à la composante z du vecteur considéré. rec (tsat ) représente l’aire du triangle sat (tsat ) ∧ X La quantité Az = 12 X z inscrit dans le plan équatorial issu de la projection sur ce plan équatorial du triangle formé par les vecteurs position satellite et position récepteur au temps d’émission tsat . L’illustration de cette aire est fournie en figure 20.3. La correction Sagnac s’écrit maintenant :
ΔtSagnac =
˙e 2Ω Az . c
(20.41)
˙ e /c2 a la valeur : La quantité 2Ω ˙e 2Ω = 1, 6227 × 10−21 s/m2 = 1, 6227 × 10−6 ns/km2 . c2
(20.42)
La correction Sagnac est donc 2ω/c2 fois l’aire balayée par le signal entre le satellite émetteur et le récepteur à l’instant d’émission, projetée sur le plan terrestre équatorial. Son amplitude varie entre 0 et 150 ns environ ce qui correspond à un effet maximal de 45 m sur la mesure de pseudo-distance. La situation géométrique où le délai Sagnac est nul est celle où le signal voyage le long d’un méridien.
310
20.3.4
Le temps dans la géolocalisation par satellites
Intégration implicite de l’effet Sagnac dans le positionnement en événement récepteur
Dans la section précédente, l’équation du temps de propagation est écrite dans un référentiel ECI figé au référentiel ECEF à l’instant de transmission tsat . Dans la plupart des cas, cependant, les récepteurs utilisent des algorithmes de positionnement où tous les calculs sont réalisés à l’instant commun de réception des mesures, selon les prescriptions décrites dans la section 11.3.1. Dans cette approche, la date de réception trec du signal du satellite émet rec (trec ) dans le référentiel teur est fixée, et la position du récepteur est X ECEF associé à cette date. Figeons également le référentiel inertiel d’analyse ECI au référentiel ECEF à la date trec . sat (tsat ) à la date d’émission tsat en temps GPS, La position du satellite X est naturellement exprimée dans le référentiel ECEF associé à la date tsat . Or ce référentiel ECEF n’est pas superposé au référentiel ECI à cette date mais est différent d’une rotation autour de l’axe des pôles, dont l’angle correspond à la durée de propagation du signal ΔtR = trec − tsat . Il faut donc effectuer la rotation d’angle θ = Ω˙ e ΔtR pour passer du référentiel ECEF associé à la date tsat au référentiel d’analyse ECI. Selon la formule (10.10), le changement de coordonnées s’écrit : ECI = R3 (−θ) · X ECEF , X (20.43) où R3 est la matrice de rotation autour de l’axe des pôles. Voir également la formule (11.27). On peut alors écrire l’équation de mesure dans le repère commun ECI. La distance totale parcourue par la lumière dans l’intervalle ΔtR est : sat (tsat ) . cΔtR = X (20.44) rec (trec ) − R3 (−θ)X Il s’agit également d’une équation implicite sur le temps de propagation ΔtR qui peut être résolue de façon itérative en posant 1 sat sat (tsat ) . ΔtR0 = X )−X (20.45) rec (t c Dans ce cas, le délai Sagnac est automatiquement « pris en compte » par le jeu des rotations qui consistent à modifier la position du satellite, exprimée dans le référentiel ECEF associé aux dates d’émission tsat pour le ramener en référentiel ECI (en résolvant l’équation du temps de propagation de façon itérative). Ce raisonnement est d’apparence non relativiste car il revient à corriger le sat exprimées dans délai Sagnac en transformant les coordonnées du satellite X sat le référentiel ECEF à la date d’émission du signal en coordonnées R3 (−θ) X exprimées dans le référentiel ECEF à la date de réception du signal. Dans le référentiel inertiel géocentrique, l’explication fournie pour l’onde lumineuse avec une cinématique galiléenne coïncide avec celle de la relativité car la vitesse du signal est c quelle que soit la distance parcourue. Cette distance varie à cause de la rotation de la Terre.
Transfert de temps et transfert de fréquence
311
Vu de la Terre (en référentiel ECEF), on s’attendrait avec la cinématique galiléenne à ce que la vitesse du signal en provenance du satellite duquel la Terre se rapproche soit égale à c plus celle de la rotation de la Terre et que la vitesse du signal en provenance du satellite duquel la Terre s’éloigne soit égale à c moins celle de la rotation de la Terre. Or ce n’est pas le cas : la vitesse ne varie pas. La relativité l’explique : la vitesse est c dans le référentiel inertiel car c’est la valeur obtenue par la loi de composition relativiste des vitesses dans le cas particulier de la lumière. La vitesse mesurée est c dans tout référentiel inertiel mais aussi c localement (avec le temps propre du lieu) quel que soit l’observateur, accéléré ou non. L’application des rotations, pour le calcul des coordonnées des satellites GNSS dans le positionnement en événement récepteur, occulte un effet physique purement relativiste dont il ne faut pas oublier l’existence : l’effet Sagnac.
Chapitre 21 Principes généraux de la restitution d’orbite GPS par moindres carrés Après avoir défini une échelle de temps stable et synchronisé toutes les horloges des satellites sur la base de cette référence de temps commune, il faut maintenant calculer la position des satellites et diffuser aux utilisateurs un modèle (défini en section 11.2) qui permette de calculer les coordonnées des satellites à tout instant dans la référence de temps. Cette dernière opération est du ressort de l’orbitographie qui fait l’objet de ce chapitre.
21.1
Introduction au principe de la détermination d’orbite par moindres carrés
L’orbitographie consiste à déterminer le mouvement d’un corps céleste. Initialement développée pour comprendre et prédire le mouvement des planètes dès le XIVe siècle, elle est maintenant massivement utilisée pour le calcul des orbites des satellites. L’orbitographie est une discipline qui appelle de nombreux domaines variés de la physique, des travaux de Kepler jusqu’à ceux d’Einstein, en passant par les développements en mathématiques, science de la Terre et de son environnement spatial proche, systèmes de référence d’espace et de temps, etc. Cette complexité poussa Isaac Newton au commentaire selon quoi « l’orbitographie est l’un des problèmes les plus difficiles de l’astronomie mathématique ». Les techniques actuelles de géodésie spatiale basées sur l’orbitographie de satellites terrestres permettent de déterminer les coordonnées des points de la surface de la Terre avec une précision inférieure au centimètre. Le traitement des mesures permet de calculer quotidiennement les paramètres de rotation de la Terre ainsi que les coordonnées stations avec une très bonne précision en combinant les données de plusieurs satellites.
314
Le temps dans la géolocalisation par satellites
Ces résultats sont déduits d’une restitution d’orbite réalisée à partir d’un lot suffisant de mesures couvrant une période finie. La restitution d’orbite consiste à ajuster les paramètres de la trajectoire qui passe au mieux à travers ces mesures au sens des moindres carrés. Il s’agit de reconstruire la trajectoire du satellite la plus réaliste possible sur une plage de temps où l’on dispose de mesures, et ceci en tenant compte d’un certain nombre de postes d’erreurs. Cette trajectoire s’obtient à partir d’un bulletin d’orbite du satellite composé de six paramètres, trois paramètres de positions et trois de vitesse. Si toutes les forces qui agissent sur le satellite sont précisément connues alors l’ensemble de la trajectoire est complètement déterminée en propageant le bulletin initial avec les équations du principe fondamental de la dynamique. Ce dernier relie l’accélération du satellite aux forces qu’il subit au cours du temps sous la forme d’un système dynamique qui fixe la trajectoire une fois posée la condition initiale. On voit donc l’intérêt à modéliser au mieux l’environnement dynamique du satellite, c’est-à-dire recenser toutes les forces qui s’appliquent sur le satellite et les calculer le plus précisément possible. Toute erreur dans le modèle dynamique engendrera des erreurs de précision sur l’orbite que l’on cherche à calculer. Rappelons qu’un système dynamique est la donnée d’une condition initiale et d’une loi d’évolution, le plus souvent sous la forme d’une équation différentielle comme les équations de Newton par exemple. Pour commencer, on se donne un bulletin initial « proche » de la vraie orbite. Puis on propage la trajectoire du satellite avec le modèle dynamique à partir de ce bulletin sur l’arc de mesures. Une fois la position du satellite connue à chaque date, notamment à chaque date de mesures, il faut être capable de reconstruire ces mesures synthétiquement de façon à pouvoir collecter les écarts éventuels (en général ils sont bien présents) avec les mesures réelles que fournissent les instruments de mesures. Il est donc nécessaire de disposer de bons modèles des mesures que l’on traite. Fatalement, toute erreur de modélisation dans les mesures se reportera sur la précision de l’orbite calculée, comme précédemment pour les erreurs de modélisation de la dynamique qui servent à propager l’orbite. On forme ensuite la différence entre les mesures réelles et les mesures synthétiques. Ces écarts de mesures collectés, appelés résidus de mesures, vont nous servir à inférer la correction nécessaire à appliquer au bulletin d’orbite de façon à rapprocher l’orbite propagée de l’orbite réelle, donc de diminuer l’amplitude des résidus. C’est ici que la technique des moindres carrés s’applique. Si les résidus de mesures peuvent s’écrire comme une fonction linéaire de la variation du bulletin, alors la méthode des moindres carrés permet d’estimer une variation de bulletin optimale dans le sens où elle permet de minimiser le carré des résidus de mesures. Pour se ramener aux hypothèses de la méthode des moindres carrés, il faut se placer dans le cadre linéaire. Or, les équations de mesures sont rarement linéaires, en particulier celles qui modélisent les mesures GNSS de code et de phase. Il faut donc procéder à une linéarisation de ces équations autour d’un bulletin qui soit relativement proche (de l’ordre de quelques centaines de mètres) de la vraie position-vitesse du satellite. Cette linéarisation s’effectue à chaque date des
Principes généraux de la restitution d’orbite GPS par moindres carrés
315
Fig. 21.1 – Itérations successives dans un calcul d’orbite par moindres carrés. mesures, ce qui permet d’accéder à une information relative à l’écart entre l’orbite réelle et l’orbite propagée à chacune de ces dates. Répétons que cette information s’exprime comme une correction à appliquer sur l’orbite propagée pour la rapprocher de l’orbite réelle à chaque date de mesure, au sens où l’on veut réduire l’écart entre la mesure réelle et la mesure théorique. Comme l’on s’intéresse au bulletin initial et non au bulletin à chaque date, il faut trouver le moyen de « translater » cette correction d’orbite, extraite à chaque date, vers une correction du bulletin initial. En gros, il faut connaître le comportement des orbites du système dynamique dans un voisinage de l’orbite propagée à partir du bulletin initial. Plus particulièrement, il nous faut décrire de quelle façon un écart au bulletin initial se propage au cours du temps. Cette question trouve sa réponse en résolvant les équations variationnelles du mouvement donné par le système dynamique. Ces équations fournissent la loi d’évolution temporelle d’une variation du bulletin initial : si l’on perturbe la position initiale d’une petite quantité, autrement dit on choisit un bulletin proche du bulletin initial, de combien l’orbite propagée à partir de ce nouveau bulletin s’écarte de l’orbite initiale ? Une fois ces questions résolues, chaque mesure va apporter une information sur la correction à appliquer sur le bulletin initial. Quand on assemble toutes les mesures entre elles, on collecte de facto un ensemble de corrections applicables au bulletin initial. La méthode des moindres carrés fournit une correction « d’ensemble » du bulletin initial en traitant d’un coup toutes les mesures de l’arc. Cette opération filtre l’information disponible et en restitue une correction « moyenne » du bulletin initial. Lorsque l’on applique cette correction au bulletin initial, on obtient un nouveau bulletin et donc une nouvelle orbite qui réduit l’amplitude des résidus de mesures par rapport à l’ancienne. Maintenant que l’on dispose d’un nouveau bulletin initial, nous pouvons réitérer le processus que l’on vient de décrire pour, de proche en proche, converger vers l’orbite réelle. Le processus s’arrête lorsque l’écart entre deux corrections successives est faible, ce qui signifie que les mesures n’apportent plus d’informations à part le bruit qu’elles contiennent. La figure 21.1 illustre ces différentes itérations, lesquelles sont imputables à la non-linéarité des équations que l’on traite.
316
Le temps dans la géolocalisation par satellites
Il arrive cependant que l’on n’ait qu’une connaissance approximative des paramètres qui interviennent dans les forces agissant sur le satellite. C’est le cas des modèles de pression de radiation solaire du satellite qui nécessitent de connaître précisément les coefficients de réflexivité de diffusion, de réflexivité spéculaire et d’absorption des rayons incidents. Les forces de frottement atmosphérique, prépondérantes à des altitudes inférieures à 1500 km, sont aussi un exemple où les coefficients aérodynamiques du satellite (traînée principalement et portance) sont mal connus sans parler des modèles d’atmosphère qui sont imparfaits. Si cette imprécision est de nature à introduire des erreurs notables dans la trajectoire, alors il est recommandé de les introduire comme paramètres à ajuster en plus des paramètres de bulletin. Dans la suite, on appelle vecteur d’état l’ensemble des paramètres que l’on cherche à estimer par moindres carrés. Il faut également s’assurer que l’on dispose bien de l’information nécessaire dans les mesures pour arriver à estimer correctement les paramètres que l’on cherche à identifier. On dit qu’un paramètre est observable si l’on arrive à l’identifier avec une précision convenable au moyen de l’estimation statistique par moindres carrés. L’information relative à cette erreur d’identification est contenue dans la matrice de covariance associée à l’estimation du paramètre. Si les mesures que l’on traite ne contiennent pas ou peu d’informations sur ce paramètre, alors son introduction dans le vecteur d’état peut déstabiliser le filtre de restitution. Il faut donc être certain que l’ajout d’un paramètre supplémentaire dans le vecteur d’état va améliorer la précision d’estimation des paramètres orbitaux, et donc de la trajectoire restituée. En effet, le prix à payer pour l’ajout d’une inconnue supplémentaire dans le vecteur d’état, à quantité d’information constante, va contribuer à diminuer l’observabilité globale du système ce qui se reflètera mécaniquement par une inflation de la matrice de covariance. La mesure Mth (t) représente la mesure théorique que l’on calcule en connaissant la position a priori du satellite x(t), sa vitesse x(t) ˙ au temps t, ainsi que d’autres paramètres propres à la modélisation de la mesure (comme les coordonnées des stations, par exemple). Au cours du temps, l’ensemble des positions-vitesses calculés forme la trajectoire du satellite dans un espace à six dimensions. La mesure simulée dépend de la position et de la vitesse du satellite mais également de paramètres supplémentaires qui peuvent être, soient liés à la dynamique des satellites λ (comme les coefficients de traînée atmosphérique ou de pression de radiation solaire), soient liés aux mesures elles-mêmes μ (comme l’allongement troposphérique, certains biais récepteurs et satellites). Bien sûr un autre poste d’erreur lié à la qualité de la modélisation se rajoute à celui lié aux paramètres dynamiques. Ils traduisent une incertitude sur la connaissance plus ou moins bonne des effets de propagation ou de la modalité de la construction de la mesure elle-même par le récepteur. L’ensemble des paramètres que l’on cherche à estimer, position, vitesse du satellite et paramètres de modélisation, forment ce que l’on appelle le vecteur d’état : Y = (x, x, ˙ λ, μ)t .
Principes généraux de la restitution d’orbite GPS par moindres carrés
317
La mesure théorique est une fonction qui dépend du vecteur d’état, Mth (t, Y ). Pour les systèmes GNSS, la fonction de mesure a deux dimensions, l’une pour la mesure de code et l’autre pour la mesure de phase. La mesure Mr´eel (t, Yr ) représente la mesure réelle à un instant t et dépend des paramètres réels Yr du vecteur d’état, comme de la position réelle du satellite par exemple. Inévitablement, les récepteurs GNSS introduisent des bruits dans les mesures qu’ils génèrent. On suppose que ces bruits sont identiquement et indépendamment distribués (ce qui est fréquent), c’est-à-dire que les mesures ne sont pas corrélées entre elles. Autrement dit, le bruit de mesure peut être considéré comme une variable aléatoire de moyenne nulle et de variance constante (elle suit une loi normale, également appelée une distribution gaussienne). Les résidus de mesures : Mr´eel (t, Yr ) − Mth (t, Y ) ,
(21.1)
représentent l’erreur que l’on fait entre la mesure réelle et la mesure que l’on attend, c’est-à-dire la mesure que l’on sait prédire connaissant au mieux tous les paramètres de modélisation λ et μ qui nous sont accessibles. Ils contiennent les informations qui permettent de recaler à la fois la position x (t) et vitesse x˙ (t) du satellite ainsi que les paramètres de modélisation (λ, μ). Cependant, ils contiennent également le bruit de la mesure réelle et les erreurs de modélisation.
21.2
Le principe des moindres carrés
Le principe des moindres carrés consiste à déterminer les paramètres de bulletin et de modélisation qui reproduisent le mieux les mesures expérimentales. Disposant des m mesures M réel , les paramètres optimaux au sens des moindres carrés sont ceux qui minimisent le carré des résidus de mesures. Notons Ω l’ensemble des solutions admissibles du problème. L’ensemble Ω est un ouvert de R6 × RNλ × RNμ , Nλ est le nombre de paramètres de modélisation dynamiques et Nμ est le nombre de paramètres de modélisation de mesures. Le problème des moindres carrés est un problème de contrôle optimal qui demande de trouver le vecteur Yˆ tel que : ⎧ ⎪ ⎪ ⎪ ⎨
Yˆ ∈ Ω ⎛ ⎞ ⎛ ⎞2 Mr´eel (t1 , xr ) Mth (t1 , x) , ⎜ ⎟ ⎟ ⎜ . . ˆ ⎪ . . Y ∈ arg min − ⎝ ⎠ ⎠ ⎝ Y ∈Ω ⎪ . . ⎪ ⎩ Mr´eel (tm , xr ) Mth (tm , x) Γ
(21.2)
où Γ est une matrice de pondération, symétrique définie positive qui définit la norme : ||u||2Γ = ut Γ u. (21.3)
318
Le temps dans la géolocalisation par satellites
La matrice de pondération est construite de sorte à favoriser certaines mesures par rapport à d’autres selon la confiance qu’on leur accorde et qui dépend, entre autres, des conditions dans lesquelles elles ont été obtenues, comme les mesures de phase qui sont 100 fois plus précises que les mesures de code. Comme introduit précédemment, la détermination d’orbite par les moindres carrés nécessite le déroulement de différents processus et calculs bien spécifiques. À partir d’un bulletin initial et d’un ensemble de paramètres dynamiques déterminés, la trajectoire est propagée en résolvant en même temps les équations de la dynamique (issues du principe fondamental) et les équations variationnelles. Ces équations couplées forment un système d’équations différentielles du premier ordre. Le résultat de ce calcul est, d’une part, la trajectoire propagée permettant de disposer à tout instant d’une position et vitesse et, d’autre part, une matrice dépendant du temps qui fait la transition entre une variation de la position et vitesse initiale et la variation de la position et vitesse à l’instant considéré. Cette dernière matrice porte le nom de matrice de transition. Une fois la trajectoire connue, il faut reproduire les mesures réelles à chacune de leurs dates d’acquisition. Ces mesures théoriques dépendent de la position du satellite, éventuellement de sa vitesse comme la mesure Doppler, ainsi que d’autres paramètres de modélisation. Puis, on linéarise les équations de mesures autour du vecteur d’état courant correspondant à la date courante du traitement. La matrice de transition fera le lien entre la variation du vecteur d’état courant et la variation du vecteur d’état initial. Au final, le processus débouche sur un ensemble d’équations linéaires dont la variable est la variation du vecteur d’état initial. L’ensemble de toutes les mesures apporte une surabondance d’équations par rapport aux variables du vecteur d’état. La dernière étape consiste à extraire la solution optimale des équations de mesures au sens des moindres carrés. Cette résolution fournie une estimation de la variation du vecteur d’état initial en tant que variable aléatoire, apportant ainsi une covariance d’ajustement. Le processus se réitère en corrigeant le vecteur d’état initial de la variation estimée jusqu’à arriver à une convergence. Ces différentes étapes de calculs sont l’objet de la description suivante.
21.2.1
Dynamique des satellites
Il faut connaître au préalable la trajectoire x(t) propagée à partir d’une condition initiale et avec les équations du mouvement construites sur la base d’un modèle dynamique (connaissances des forces de perturbations, du potentiel, etc.). La loi d’évolution de la position du satellite est donnée par le principe fondamental de la dynamique, écrite en référentiel inertiel : m¨ x (t) = f (x, x, ˙ t, λ) .
(21.4)
Principes généraux de la restitution d’orbite GPS par moindres carrés
319
Dans cette équation différentielle (du second ordre), la fonction f représente l’ensemble des forces qui s’exercent sur le satellite. Les différentes forces avec leur ordre de grandeur sont mentionnées plus loin dans le cadre des satellites de navigation. L’équation d’évolution de la trajectoire peut s’écrire comme une équation différentielle d’ordre un, plus aisée à manipuler. Par ailleurs, pour des raisons de facilité d’écriture, il est pratique d’incorporer les paramètres dynamiques dans les variables à propager. Ainsi, le principe fondamental de la dynamique peut s’écrire de la façon suivante : ⎛ ⎞ ⎛ ⎞ x x˙ d ⎝ x˙ ⎠ = ⎝ f (x, x, ˙ t, λ) /m ⎠ . (21.5) dt λ 0 Cette équation globale exprime que les paramètres dynamiques restent constants au cours du temps. Par contre, la position-vitesse du satellite en dépend bien. Une écriture encore plus synthétique est obtenue en utilisant la variable t d’état X = (x, x, ˙ λ) pour nous ramener à la formulation du problème de Cauchy. L’équation d’évolution du modèle se ramène à un système dynamique qui s’écrit :
dX dt (t) = F (X, t) . (21.6) X (t0 ) = X0 Dans notre cas, les hypothèses de régularité de la fonction F (conditions de Lipschitz vérifiée) garantissent l’existence et l’unicité de la solution au problème de Cauchy, ce qui permet de connaître la valeur de X(t) à chaque instant t. La résolution de ce système d’équations différentielles fournit une courbe γ à valeurs dans l’espace des états (Rd ) et définie sur un intervalle de temps I⊂R: I → Rd , (21.7) t → γ (X0 , t0 , t) telle que X (t) = γ (X0 , t0 , t) et : dγ (X0 , t0 , t) = F (γ (X0 , t0 , t) , t) , dt
(21.8)
avec comme condition initiale à t = t0 γ (X0 , t0 , t0 ) = X0 .
(21.9)
La trajectoire γ permet de connaître à tout instant la position propagée du satellite. Comme on le voit, cette trajectoire dépend complètement de la condition initiale X0 , c’est-à-dire de la position et vitesse initiale et du choix des paramètres λ utilisés dans la modélisation de la dynamique. Un point important dans l’étude des systèmes dynamiques est de connaître la sensibilité de cette position par rapport aux conditions initiales. Cela revient
320
Le temps dans la géolocalisation par satellites
Fig. 21.2 – Propagation d’une erreur initiale par la matrice de transition. à connaître la façon dont l’orbite change lorsque les conditions initiales ou les paramètres dynamiques changent. On s’intéresse donc aux comportements du système autour de la trajectoire de référence X (t) = γ (X0 , t0 , t), c’est-à-dire que l’on regarde comment le système dynamique se déploie lorsque l’on modifie légèrement la condition initiale ou les paramètres dynamiques. Cela revient à étudier l’évolution des écarts δX entre la trajectoire de référence et celle où la condition initiale est perturbée. Cet écart s’écrit : δX (t) = γ (X0 + δX0 , t0 , t) − γ (X0 , t0 , t) .
(21.10)
Au premier ordre (développement de Taylor), cet écart évolue en fonction des dérivées partielles de la trajectoire par rapport aux conditions initiales de l’état du système : δX (t) = φ (t, t0 ) δX0 , (21.11) avec : φ (t0 , t) =
∂γ (X0 , t0 , t) . ∂X0
(21.12)
La matrice φ (t0 , t) est appelée matrice de transition, c’est une matrice carrée Rd × Rd . Elle permet d’évaluer à t l’effet d’une perturbation du bulletin initial sur la trajectoire de référence, comme l’illustre la figure 21.2. Pour la calculer à tout instant t, on différencie l’équation fondamentale de la dynamique pour obtenir les équations « aux variations ». La différentiation du premier membre de l’équation donne, en appliquant le théorème de Schwarz sur la commutation des opérateurs dérivés, la dérivée temporelle de la matrice de transition. ∂ dγ d ∂γ dφ (X0 , t0 , t) = (t0 , t) . (X0 , t0 , t) = ∂X0 dt dt ∂X0 dt
(21.13)
La différentiation du second membre de l’équation utilise le théorème de dérivation des fonctions composées et donne le produit de la jacobienne DX F de
Principes généraux de la restitution d’orbite GPS par moindres carrés
321
la fonctionnelle F avec la matrice de transition φ. ∂γ ∂F (γ (X0 , t0 , t) , t) = DX F (γ (X0 , t0 , t))× (X0 , t0 , t) = DX F (γ (X0 , t0 , t)) × φ (t0 , t) . ∂X0 ∂X0
(21.14) Dans cette équation, il est utile de préciser un peu plus la structure des différentielles. La différentielle de la fonctionnelle F s’écrit : ⎞ ⎛ 0 1 0 ⎜ 1 ∂f 1 ∂f 1 ∂f ⎟ . (21.15) DX F = ⎝ m ∂x m ∂ x˙ m ∂λ ⎠ 0
0
0
La matrice de transition s’écrit de la façon suivante : ⎛ ⎞ ⎛ ⎜ φ=⎜ ⎝ La matrice
∂x ∂x0
∂x ∂x0 ∂x ∂ x˙ 0 ∂x ∂λ
∂ x˙ ∂x0
∂ x˙ ∂x0 ∂ x˙ ∂ x˙ 0 ∂ x˙ ∂λ
∂λ ∂x0 ∂λ ∂ x˙ 0 ∂λ ∂λ
⎟ ⎜ ⎟=⎜ ⎠ ⎝
∂x ∂x0 ∂x ∂ x˙ 0 ∂x ∂λ
∂ x˙ ∂x0 ∂ x˙ ∂ x˙ 0 ∂ x˙ ∂λ
0
⎞
⎟ 0 ⎟ ⎠. 1
(21.16)
est présente du moment que les positions du bulletin
∂x initial sont libérées. À l’initialisation, la matrice ∂x est la matrice identité et 0 ∂ x˙ la matrice ∂x0 est nulle. ∂ x˙ La matrice ∂∂x est présente du moment que les vitesses du bullex˙ 0 ∂ x˙ 0 tin initial sont libérées. À l’initialisation, la matrice ∂∂x x˙ 0 est nulle et la matrice ∂ x˙ est la matrice identité. ∂ x˙ 0 ∂x ∂ x˙ est présente dans le cas où des paramètres de force La matrice ∂λ ∂λ sont libérés. On a donc le système différentiel linéaire suivant qui pilote l’évolution de la matrice de transition dans le temps en fonction de la valeur de X0 :
dφ dt (t0 , t) = DX F (γ (X0 , t0 , t)) × φ (t0 , t) . (21.17) φ (t0 , t0 ) = Id
Remarquons que ce système différentiel permet de résoudre le système linéarisé du problème général le long de la trajectoire de référence X (t) :
d dt δX (t) = A (t) δX (t) , (21.18) δX (t0 ) = δX0 avec : A (t) = DX F (X (t)) .
(21.19)
La dépendance de l’équation variationnelle au calcul de γ (X0 , t0 , t) implique la nécessité de résoudre d’un seul coup les deux systèmes d’équations différentielles : ⎧ dX = F (X, t) ⎪ dt (t) ⎪ ⎪ ⎨ dφ dt (t0 , t) = DX F (γ (X0 , t0 , t)) × φ (t0 , t) . (21.20) ⎪ X (t0 ) = X0 ⎪ ⎪ ⎩ φ (t0 , t0 ) = Id
322
Le temps dans la géolocalisation par satellites
La résolution numérique de systèmes d’équations différentielles du premier ordre fournit à la fois la trajectoire propagée à partir de la condition initiale et la sensibilité de cette trajectoire à toute variation de la condition initiale.
21.2.2
Génération des mesures théoriques et calcul des résidus de mesures
Disposant de la trajectoire propagée à partir du bulletin initial, nous avons accès à la position et vitesse du satellite à tout moment sur l’arc des mesures. L’information de géométrie est maintenant disponible pour produire les mesures théoriques aux dates des mesures réelles. Soit ti la date correspondante à la ie´me mesure réelle. Connaissant la mesure simulée Mth (ti , Y ) au temps ti on souhaite calculer la correction nécessaire δY (ti ) à réaliser sur le vecteur d’état Y (ti ) = (X (ti ) , μ (ti )) de telle sorte que les mesures théoriques correspondent au mieux à la mesure réelle sur la période temporelle considérée, au bruit résiduel εi , à la mesure réelle Mr´eel (ti , xr ), soit : Mr´eel (ti , Yr (ti )) = Mth (ti , Y (ti ) + δY (ti )) + εi .
(21.21)
Le problème des moindres carrés se reformule ainsi : trouver l’incrément δY tel que : (ti ) ∈ arg minδY ∈Ω Mr´eel (ti , Yr (ti )) ∀i ∈ [1, m] , δY 2
−Mth (ti , Y (ti ) + δY (ti )) .
(21.22)
L’approximation linéaire en Y (t) de la fonction de mesure s’écrit : Mth (Y (ti ) + δY (ti )) = Mth (ti , Y (ti )) + DY Mth (ti , Y (ti )) δY (ti ) , (21.23) où DY Mth (ti , Y (ti )) est la matrice jacobienne de la fonction de mesure Mth au point Y (ti ). Ainsi, l’écart à réaliser sur le vecteur d’état Y (ti ) afin de récupérer la valeur de la mesure réelle Mr´eel (ti , Yr (ti )) disponible en ti est donné par l’équation : Mr´eel (ti , Yr (ti )) − Mth (ti , Y (ti )) = DY Mth (ti , Y (ti )) δY (ti ) + εi th = ∂M . ∂X (ti , Y (ti )) δX (ti ) ∂Mth + ∂μ (ti , Y (ti )) δμ + εi (21.24) Grâce à la matrice de transition on peut relier la variation δX (ti ) évaluée à ti à une variation δX0 = δX (t0 ) à appliquer sur la condition initiale X (t0 ) : δX (ti ) = φ (ti , t0 ) δX0 .
(21.25)
On obtient alors une équation linéaire appelée équation de mesure qui associe linéairement la variation δY0 que l’on cherche à estimer aux résidus de mesures : Mr´eel (ti , Yr (ti )) − Mth (ti , Y (ti )) th th (ti , Y (ti )) φ (t, t0 ) δX0 + ∂M = ∂M ∂μ (ti , Y (ti )) δμ + εi . ∂X ∂Mth th = ∂M (t , Y (t )) φ (t, t ) , (t , Y (t )) δY0 + εi i i 0 i i ∂X ∂μ
(21.26)
Principes généraux de la restitution d’orbite GPS par moindres carrés
323
Équation que l’on écrit plus sobrement : bi = Ai δY0 + εi ,
(21.27)
où : ∂Mth th Ai = ∂M ∂X (ti , Y (ti )) φ (t, t0 ) , ∂μ (ti , Y (ti )) un vecteur ligne de taille n formée par les dérivées partielles des mesures par rapport aux paramètres estimés, δY0 = δY (t0 ) un vecteur colonne de taille n des paramètres à estimer et bi = Mr´eel (ti , Yr (ti )) − Mth (ti , Y (ti )) est le résidu de la mesure numéro i. Cette équation permet, pour chaque mesure, d’extraire un vecteur qui donne au temps t0 les corrections à appliquer aux conditions initiales pour faire passer la trajectoire simulée au point de mesure réelle à ε prés. On dispose ainsi de m estimations du vecteur correctif δY0 et il s’agit alors d’extraire un vecteur « moyen » au sens des moindres carrés puis de déterminer les corrélations qui existent entre les différentes composantes de ce vecteur. Cette information importante est contenue dans la covariance formelle de l’erreur d’identification de la correction δY0 . L’erreur résiduelle ε est la somme de plusieurs types d’erreurs d’origines différentes. Le principe d’une équation de mesure consiste à faire coïncider une mesure avec un modèle. La mesure n’est pas parfaite : comme elle est réalisée au moyen d’instruments physiques elle est nécessairement affectée d’un bruit résiduel provenant des moyens d’instrumentations, souvent considéré sans biais et aléatoire c’est-à-dire différent d’une mesure à l’autre. On parle donc d’erreurs de mesure pour évoquer les erreurs provenant de l’appareillage ayant servi à générer la mesure Mr´eel (t, Yr ). La modélisation de la mesure n’est pas parfaite : tous les paramètres qui affectent la mesure ne nous sont pas directement accessibles et certains effets ou phénomènes physiques, qui sont contenus dans la mesure, sont peu ou pas connus donc insuffisamment modélisés. Cette erreur de modélisation de la mesure contient également les insuffisances de la modélisation du système de forces qui s’appliquent au satellite, contenue dans la dynamique représentée par la fonction F , et que subissent les paramètres du vecteur d’état. On parle donc d’erreurs de modèle pour évoquer les erreurs provenant du manque de précision voire de représentativité des modèles de mesure et de dynamique utilisés pour calculer Mth (t, Y ). Enfin, l’équation de mesure est obtenue après linéarisation de la fonction de mesure Mth autour de l’état courant δY (t). Il existe donc une erreur provenant de l’approximation linéaire et qui est d’autant plus importante que le point (x, x) ˙ est loin de la vraie position ou de la vraie vitesse. Si on part de conditions initiales X0 trop éloignées de la solution cherchée, alors on sort du cadre linéaire et l’algorithme des moindres carrés peut diverger. L’erreur ε contient donc à la fois les erreurs de mesure, les erreurs de modèle et les erreurs de linéarisation. Le problème des moindres carrés s’exprime maintenant ainsi : trouver 0 tel que : l’incrément du vecteur d’état initial δY 0 ∈ arg minδY ∈Ω bi − Ai δY0 2 . ∀i ∈ [1, m] , δY 0
(21.28)
324
Le temps dans la géolocalisation par satellites
En collectionnant les équations précédentes pour chaque mesure, on obtient l’équation suivante : b = Ap + ε (21.29) où : b = (bi )i=1,···m : est un vecteur de taille m, écart entre les mesures réelles et les mesures prédites ; A = (Ai )i=1,···m : est la matrice m × n des dérivées partielles des mesures par rapport aux paramètres ajustés ; p = δY0 est un : vecteur de taille n, corrections sur les n paramètres ajustés ; ε = (εi )i=1,···m : est un vecteur de taille m qui représente les erreurs résiduelles sur chaque équation de mesure. La matrice A ∈ Rn×m , avec m n, est la matrice de l’application linéaire, notée également A ∈ L (Rn , Rm ) : Rn → Rm . p → Ap ∈ Im(A)
(21.30)
Si la matrice A est de rang plein, rg (A) = n alors le sous-espace vectoriel Im(A) de Rm est de dimension n, dim (Im (A)) = n. Dans l’équation (1), on peut considérer que les erreurs εi qui entachent les mesures bi sont des réalisations d’une variable aléatoire à valeur réelle. Ce caractère stochastique suggère de reformuler les équations de mesures posées en (1) par le formalisme des variables aléatoires (que l’on distingue des variables réelles par un suscrit). Les résidus de mesures b sont vus comme la réalisation d’une variable aléatoire b, de dimension m, qui suit une loi normale centrée sur Ap et de covariance cov(b) : b ; N (Ap, cov (b)) .
(21.31)
L’espérance de b est E (b) = Ap. Sa covariance est donnée par la définition classique : t t t cov (b) = E (b − E [b]) (b − E [b]) = E bbt − bE [b] − E [b] bt + E [b] E [b] . (21.32) L’équation (21.29) peut ainsi s’écrire avec les variables aléatoires : b = Ap + ε.
(21.33)
Le bruit de mesure ε suit maintenant une loi normale cen trée et de covariance cov (ε) = cov (b) : (21.34) ε ; N (0, cov (b)) . L’espérance de ε est nulle, E [ε] = 0 et sa covariance se simplifie : cov (ε) = E ε εt .
(21.35)
Principes généraux de la restitution d’orbite GPS par moindres carrés
325
La dimension des matrices cov (ε) et cov (b) est m × m. Chaque composante des variables aléatoires b et ε est considérée comme une variable aléatoire à une dimension. Dans les écritures, la valeur de bruit εi est la réalisation de la variable aléatoire εi . Les incertitudes, ou variance, des bruits εi sont notées σi2 . Formellement, les bruits de mesures εi peuvent être corrélés selon que les mesures sont indépendantes ou pas. Dans la pratique, on considère que les mesures sont décorrélées les unes des autres et donc que les lois normales εi sont toutes indépendantes. Avec cette hypothèse, la matrice de covariance des mesures est diagonale : ⎛ 2 ⎞ σ1 2 ⎜ ⎟ 2 .. cov (b) = diag σ1 , · · · , σm =⎝ (21.36) ⎠. . 2 σm Si les mesures sont entachées de la même incertitude alors cov (b) = σ 2 Im où Im est la matrice identité de taille m × m. Enfin on rappelle que, pour toute matrice M de dimension m × m, on a les relations : E [M ε] = M E [ε] , (21.37) t cov (M ε) = E M ε (M ε) = E M εεt M t = M E εεt M t = M cov(ε)M t . (21.38)
21.2.3
La pondération des mesures
Du fait de conditions de réalisation, du niveau variable de bruit, de la précision espérée et/ou atteignable, toutes les mesures ne se valent pas en ce qui concerne le contenu d’informations utiles et nécessaires pour atteindre de bonnes précisions d’orbite. Selon les mesures que l’on dispose, la mesure de code seule ou la mesure de code et de phase, il est intéressant de privilégier tel type de mesures plutôt qu’un autre pour donner plus de poids aux mesures précises et/ou moins bruitées par rapport aux autres mesures. Cela ne signifie pas que l’on doive définitivement écarter les mesures les moins précises bien au contraire. Tout d’abord car une mesure peu précise peut s’avérer être indispensable pour lever certaines ambiguïtés, par exemple la mesure de code est nécessaire pour exploiter la mesure de phase. Ensuite, la méthode des moindres carrés étant une méthode d’inférence statistique, ou d’inversion, la volumétrie des mesures est importante et conditionne la qualité du résultat. Au sein d’un même type de mesure, il peut être également utile de privilégier une partie des mesures sur le lot total, par exemple les mesures de code à basse élévation sont plus bruitées que des mesures au zénith. De même, les erreurs de propagation sont plus importantes, car moins bien modélisées, à basse élévation plutôt qu’au zénith. On attribue donc un poids wi à chaque mesure afin d’accorder une plus ou moins grande importance à celles-ci selon leurs qualités et/ou à
326
Le temps dans la géolocalisation par satellites
la confiance relative qu’on leur accorde. En notant par Ai la i´eme ligne de la matrice A, les équations de mesures pondérées s’écrivent maintenant : wi bi = wi Ai p + wi εi .
(21.39)
En cumulant toutes les mesures, on construit une matrice diagonale de poids de mesures W : ⎞ ⎛ w1 ⎟ ⎜ .. W =⎝ (21.40) ⎠. . wn Cette matrice permet d’écrire le système général d’équation de mesures pondérées : W b = W Ap + W ε. (21.41) Cette dernière formulation (21.41) est une extension de la première (21.29) car il suffit de prendre comme matrice des poids la matrice identité pour la retrouver. Afin de gagner en généralité, on considère par la suite un système d’équations de mesures pondérées. Enfin, comme nous l’avons déjà évoqué, nous pouvons reformuler l’équation (21.41) avec des variables aléatoires. On obtient ainsi : W b = W Ap + W ε.
21.2.4
(21.42)
Filtrage par estimation paramétrique
L’étape suivante consiste à résoudre l’équation de mesures (2) au sens des moindres carrés, c’est-à-dire à trouver :
pˆ ∈ Ω (21.43) 2 pˆ ∈ arg minp∈Ω W Ap − W b , qui permet d’extraire les paramètres de p que l’on cherche à estimer qui minimisent les résidus ε. Dans cette équation, le vecteur b est le vecteur des résidus de mesures contenant à la fois des erreurs de modélisation et des erreurs de mesures. Afin de simplifier les notations, nous utilisons la même variable pour désigner une variable aléatoire et une réalisation de celle-ci. La matrice A est la matrice des dérivées partielles de la fonction de mesures par rapport aux paramètres libérés. Le système d’équations (21.41) n’admet pas de résolution directe, car la matrice A n’est pas inversible, et chaque équation n’est bien sûr pas exacte. Tout ce que l’on peut produire est une solution qui vérifie un certain critère, par exemple celui de minimiser la somme des carrés des résidus W (b − Ap) qui correspond avec la méthode des moindres carrés standards. Cette méthode précise que résoudre l’équation pondérée (21.41) revient à trouver l’optimum p qui minimise la somme des carrés des résidus : 2
J (p) = W (b − Ap) .
(21.44)
Principes généraux de la restitution d’orbite GPS par moindres carrés
327
Le problème des moindres carrés est un problème d’optimisation de la fonctionnelle J où la norme || · || note la norme euclidienne d’un vecteur ||x|| = m √ xt x = xi . Le développement matriciel de la norme euclidienne permet i=1
d’écrire la fonctionnelle J avec un produit de matrices : J (p) = (b − Ap)t W t W (b − Ap) t . = (b − Ap) Γ (b − Ap) = bt Γ b − 2bt Γ Ap + pt At Γ Ap
(21.45)
La matrice Γ = W t W est appelée matrice de pondération : elle est diagonale et ses termes sont formés par le carré des poids de mesures. Le calcul explicite de la formulation matricielle donne : J (p) =
m
2
wi2 (bi − Ai p) .
(21.46)
i=1
On peut aisément généraliser le problème des moindres carrés en utilisant une matrice Γ symétrique définie positive et de taille m × m dépendant du nombre de mesures disponibles m. Cette matrice définit un nouveau produit scalaire (x, y)Γ = xt Γ y et une nouvelle norme associée · Γ avec lesquels on écrit la fonctionnelle : 2 J (p) = b − ApΓ . (21.47) Appliquons à J le calcul des variations : la fonctionnelle J atteint un optimum si la différentielle de J en p est identiquement nulle. dJ (p) · h = −ht At Γ (b − Ap) + (b − Ap)T Γ (−Ah) = −2ht At Γ b − At Γ Ap . (21.48) Si dJ (p) · h = 0 pour tout vecteur h non nul, alors At Γ b − At Γ Ap = 0. Le système d’équations At Γ Ap = At Γ b est appelé équations normales. Si la matrice At Γ Aest inversible, on estime la valeur de p par : −1 t pˆ = At Γ A A Γb .
(21.49)
La résolution du problème des moindres carrés ainsi posé se ramène donc à calculer les matrices At Γ A et vecteur At Γ b puis inverser la matrice At Γ A. L’estimateur pˆ est une fonction linéaire des résidus de mesures donc si ces derniers suivent une loi normale alors l’estimateur également. Il est non biaisé, E (ˆ p) = p et sa covariance se calcule par : −1 t −1 cov (ˆ p) = At Γ A A Γ cov (b) Γ A At Γ A .
(21.50) −1
Dans la suite, pour alléger les écritures on pose L = (At Γ A) trivialement LA = I et au final : pˆ ; N p, Lcov (b) Lt .
At Γ . On a (21.51)
328
Le temps dans la géolocalisation par satellites
Fig. 21.3 – Solution des moindres carrés par projection orthogonale du vecteur des résidus sur l’image de l’application linéaire A.
La valeur du critère à l’optimum est : J (ˆ p) = (b − Aˆ p)t Γ (b − Aˆ p) = bt Γ (I − AL) b = χ2 .
(21.52)
Le choix de la lettre χ2 n’est pas innocente car les résidus de mesures (b − Aˆ p) sont censés suivre des lois normales indépendantes, et la somme des carrés de lois normales indépendantes suit une loi de Chi2. Les équations normales se retrouvent également par une interprétation géométrique élégante du problème des moindres carrés. Chercher l’optimum pˆ qui minimise le critère J c’est chercher le vecteur ˆb = Aˆ p ∈ Im(A) tel que la distance ||b − ˆb||Γ soit minimale dans l’espace des mesures Rm , pour le produit scalaire Γ . Ce minimum est atteint si le vecteur ˆb est la projection orthogonale, pour le produit scalaire Γ , du vecteur b sur l’hyperplan Im(A). La situation est schématisée en figure 21.3. Si ˆb est la projection orthogonale de b ∈ Rm sur Im(A) alors b − ˆb est orthogonal à tout vecteur de Im(A), autrement dit, pour tout vecteur v de Rn on a la relation dans l’espace Rm : Av, b − ˆb = (Av)t Γ b − ˆb = v t At Γ (b − Aˆ p) = 0. (21.53) Γ
p) = 0, ce qui correspond exactement aux équations C’est-à-dire At Γ (b − Aˆ normales. L’estimation de pˆ définie précédemment conduit à définir la relation de projection entre les vecteurs b et ˆb ∈ Im(A) : ˆb = Aˆ p = ALb .
(21.54)
L’opérateur matriciel V = AL est donc le projecteur orthogonal, pour le produit scalaire Γ , de tout vecteur b ∈ Rm sur le sous-espace vectoriel Im(A) ⊂ Rm parallèlement à Im(A)⊥ . Comme tout projecteur vérifie la propriété V 2 = V , on a, pour tout vecteur v de Rn , la relation V Av = ALAv = Av, autrement dit (I − V ) Av = 0.
Principes généraux de la restitution d’orbite GPS par moindres carrés
329
Fig. 21.4 – Les vecteurs de mesures avant b et après ajustement εˆ par moindres carrés.
21.2.5
Les résidus de mesures
Par définition, le vecteur εˆ défini par εˆ = b − ˆb est appelé résidu des moindres carrés. Dans notre cas, il représente l’écart entre les résidus de mesures avant ajustement b = Mr´eel (Yr ) − Mth (Y ), et leurs projections orthogonales ˆb sur th ˆ ˆ, on obtient : Im(A), soit ˆb = ∂M ∂Y (Y ) δ Y . En développant l’expression de ε . = Mr´eel (Yr ) − Mth Y + δY εˆ = Mr´eel (Yr ) − Mth (Y ) − DY Mth (Y ) δY (21.55) D’après l’équation (21.55), le vecteur εˆ représente les résidus de mesures obtenus après ajustement, c’est-à-dire après l’effet de la correction du vecteur d’état sur la fonction de mesure. Ce vecteur εˆ « ramasse » toutes les composantes des erreurs que l’on ne peut pas expliquer via l’opérateur A dans l’espace des mesures. Autrement dit, les résidus εˆ représentent tout ce que le filtre n’a pas pu absorber sous la forme d’un écart d’orbite pˆ. Ces erreurs peuvent autant provenir de la modélisation dynamique du satellite que de la modélisation des mesures. Son calcul littéral est le suivant : εˆ = b − ˆb = b − V b = (I − V ) b .
(21.56)
Les résidus de mesures après estimations sont une fonction linéaire de l’ensemble des erreurs de modélisation : ils sont obtenus (voir la figure 21.4) comme la projection du vecteur b sur Im(A)⊥ parallèlement à Im(A). Par conséquent, les résidus estimés εˆ ont des amplitudes toujours inférieures aux erreurs de modélisation de mesures que représente le vecteur b. Le vecteur Γ εˆ est solution de l’équation At y = 0 où y est un vecteur de R et At ∈ Rm×n , avec m n. La matrice At est la matrice de l’application linéaire, notée également At ∈ L (Rm , Rn ) telle que Ker (At ) = Im(A)⊥ : Rm ⊥ Im(A)
→ →
Rn . 0
(21.57)
330
Le temps dans la géolocalisation par satellites
Il est pratique de reformuler l’expression des résidus εˆ en y injectant l’expression b = Ap + ε. On obtient immédiatement (car (I − V ) Ap = 0) : εˆ = (I − V ) (Ap + ε) = (I − V ) ε .
(21.58)
Le résidu associé à une mesure est la combinaison linéaire des erreurs de toutes les mesures traitées. Cette combinaison linéaire dépend de la pondération de chaque mesure (matrice de pondération Γ ), et de la structure de la matrice carrée C = At Γ A. La norme des résidus de mesures se calcule sans difficultés en remarquant que la matrice Γ V est symétrique, ce qui implique que V t Γ V = Γ V . Ces égalités permettent d’arriver au développement εˆt Γ εˆ = εt Γ ε − εt Γ V ε ce qui permet de déduire que : (21.59) ||ˆ ε||Γ ≤ ||ε||Γ . Autrement dit, les résidus de mesures après ajustement ont globalement et systématiquement une amplitude plus faible que les erreurs de mesures. Comme l’espérance du bruit de mesure est nulle, les résidus ont également une espérance nulle : E [ˆ ε] = (I − V ) E [ε] = 0. (21.60) Le calcul de covariance des résidus εˆ s’écrit alors : cov (ˆ ε) = cov ((I − V ) ε) . = (I − V ) cov (ε) (I − V )t
(21.61)
En tant que projection orthogonale des erreurs de mesures ε, la distribution des résidus εˆ est plus concentrée (pour la métrique Γ ) que celle des erreurs ε. De plus, les résidus de mesures sont toujours corrélés et de variances différentes, et ce même dans le cas limite où les erreurs de mesures sont décorrélées et d’égales précisions (typiquement si cov (ε) = σ 2 I). La valeur du critère des moindres carrés à l’optimum s’écrit comme une fonction linéaire de ces résidus : J (ˆ p) = bt Γ εˆ = εˆt Γ εˆ.
(21.62)
Puisque les vecteurs εˆ et ˆb sont orthogonaux pour le produit scalaire Γ , (c’està-dire εˆt Γ ˆb = 0), on déduit du théorème de Pythagore (bt Γ b = εˆt Γ εˆ + ˆbt Γ ˆb) que : (21.63) ||ˆ ε||Γ ≤ ||b||Γ . Cette dernière inégalité atteste que les résidus de mesures après ajustement sont d’amplitudes plus faibles que les résidus de mesure avant ajustement.
21.2.6
Les erreurs d’identifications
L’estimation des corrections du vecteur d’état s’accompagne du calcul de l’erreur d’identification qui est commise : e = pˆ − p = Lb − p = L (Ap + ε) − p = Lε .
(21.64)
Principes généraux de la restitution d’orbite GPS par moindres carrés
331
Comme pour les résidus de mesures, l’erreur d’identification dépend des erreurs de mesures ε, de la pondération de chaque mesure (matrice des carrés des poids Γ ), et de la structure de la matrice carrée C. Cette erreur d’identification a une espérance nulle : E [e] = LE [ε] = 0. (21.65) La covariance de cette erreur d’identification est : cov (e) = cov (Lε) . = L cov (ε) Lt
(21.66)
La valeur de la covariance des erreurs d’identification dépend en particulier de la covariance des erreurs de mesures. Cette covariance est d’autant plus faible que les mesures sont bien uniformément réparties sur tout l’arc d’observation et qu’elles contiennent l’information nécessaire à l’ajustement des paramètres du vecteur d’état. La covariance est d’autant plus forte que le nombre de paramètres à ajuster est grand pour un nombre fixé de mesures (donc à information constante) car on favorise ainsi leur dépendance linéaire. Cherchons maintenant la pondération Γ qui minimise la covariance de l’erreur d’identification cov (e). À chaque matrice de pondération Γ correspond −1 l’opérateur L = (At Γ A) At Γ , on fixe ainsi l’opérateur L∗ correspondant à la −1 t A cov−1 (ε) pondération spécifique Γ = cov−1 (ε) soit L∗ = At cov−1 (ε) A pour lequel on a toujours L∗ A = I. Développons le calcul de cov (e) avec L = L∗ + (L − L∗ ) : cov (e) =L∗ cov ( ) Lt∗ + (L − L∗ ) cov (ε) Lt∗ t
t
+ L∗ cov (ε) (L − L∗ ) + (L − L∗ ) cov (ε) (L − L∗ ) .
(21.67)
Les deux termes centraux sont transposés l’un de l’autre, d’autre part : −1 (L − L∗ ) cov (ε) Lt∗ = (L − L∗ ) cov (ε) cov−1 (ε) A At cov−1 (ε) A −1 = (LA − L∗ A) At cov−1 (ε) A = 0.
(21.68)
Le dernier terme (L − L∗ ) cov (ε) (L − L∗ )t est positif ou nul. On a finalement : t
cov (e) = L∗ cov (ε) Lt∗ + (L − L∗ ) cov (ε) (L − L∗ ) .
(21.69)
Le minimum de covariance est donc atteint en prenant L = L∗ soit : cov (ε) = Γ −1 .
(21.70)
Dans ce cas, la covariance formelle des erreurs d’ajustements est égale à : −1 cov (e) = At Γ A .
(21.71)
332
Le temps dans la géolocalisation par satellites
Autrement dit, c’est avec la matrice de pondération réglé à cov −1 (ε) que l’on obtient la meilleure estimation possible de p pour un ensemble de mesures données. La covariance cov (e) contient la structure des erreurs d’ajustement des paramètres du problème des moindres carrés. Elle rend compte de l’observabilité du système formé par les m mesures. Le système sera d’autant mieux observable que les valeurs propres de la matrice At Γ A seront de modules élevés et regroupés, autrement dit l’estimateur pˆ sera d’autant plus précis que le module des valeurs propres de la matrice de covariance sera petit et regroupé. Pour un estimateur optimal (cov (ε) = Γ −1 ), la covariance des résidus de mesures après ajustement se simplifie élégamment, en remarquant que la matrice V Γ −1 est symétrique et par suite que V Γ −1 V t = V Γ −1 . Cette matrice de covariance s’écrit donc : cov (ˆ ε)=(I − V ) Γ −1 (I − V )
t
=(I − V ) Γ −1 .
(21.72)
Dans la suite de la discussion, nous allons simplifier les écritures en convenant de remplacer les matrices W b et W A directement par les notations b et A. Avec cette convention, la covariance des erreurs normales devient l’unité cov (ε) = I. Nous pouvons alors réécrire les résultats précédents par : Estimateur des moindres carrés et valeur du critère à l’optimum
−1
p= ˆ At A At b −1 t t A b I − A At A J (p)=b ˆ
Résidus de mesures après ajustement εˆ et covariance formelle −1 t εˆ= I − A At A A ε t −1 t A cov (ˆ ε)=I − A A A
Erreurs d’ajustement e et covariance formelle −1 t A ε e= At A t −1 cov (e)= A A
La forme particulière de la covariance des résidus de mesures (cov (ˆ ε) = I − V ) implique que, pour chaque résidu on ait Var (ˆ εk ) ≤ Var (εk ). À partir de cette inégalité et de la formule de Köning-Huygens (Var (X) = E X 2 − εk ] et E [εk ] E [X]2 ), on déduit que E εˆ2k ≤ E ε2k , puisque les espérances E [ˆ sont nulles. Donc, en moyenne, chaque résidu a une amplitude inférieure à l’erreur de la mesure associée. En particulier, si Vk,k = 1 alors E εˆ2k = 0 ce qui implique que le résidu εˆk est nul ! Donc un résidu εˆk nul ne signifie pas que la mesure associée soit sans erreur. Nous pouvons trouver une nouvelle formulation de ces expressions par une utilisation habile de la factorisation QR de matrices. Posons A = QR où Q est une matrice orthogonale de dimension m × m et R est une matrice triangulaire m × n. supérieure Posons T = P R où P = In 0 est une matrice de dimension n × m où la matrice In est la matrice identité de rang n, T est une matrice de dimension n × n qui est l’extraction de la partie triangulaire de R. Notons enfin S = P t P la matrice symétrique de dimension m×m contenant la matrice In sur les n premières lignes et colonnes et zéros ailleurs.
Principes généraux de la restitution d’orbite GPS par moindres carrés
333
Telles que nous les avons construites on a, P P t = In , S 2 = S (S est un projecteur) et SR = R (S conserve Im(A)). Nous avons alors les relations suivantes : −1 A (At A) At = QSQt . (21.73) −1 (At A) At = T −1 P SQt Ces égalités s’établissent rapidement après quelques multiplications de matrices. Pour la première, partons du membre de gauche, et l’on commence par introduire préalablement la formulation A = QR −1 t −1 t t A At A A = QR Rt Qt QR RQ. (21.74) Comme la matrice Q est orthogonale, elle est inversible et son inverse est sa transposée Qt Q = QQt = Im on a alors : −1 t −1 t t A = QR Rt R RQ. (21.75) A At A On introduit la relation SR = R :
−1 −1 t t A = QSR (SR) SR R t S t Qt . A At A
On utilise la relation SR = P t P R = P t T : −1 t −1 t A At A A = QP t T T t P P t T T P Qt .
(21.76)
(21.77)
Puis, on utilise la propriété P P t = In pour obtenir la forme finale : −1 t A = QP t P Qt A At A = QSQt .
(21.78)
La seconde équation se dérive de la première en écrivant sous forme QR le premier facteur A : −1 t QR At A A = QSQt . (21.79) Comme la matrice Q est orthogonale elle est inversible : −1 t A = SQt . R At A
(21.80)
On multiplie à gauche par la matrice P : −1 t P R At A A = P SQt .
(21.81)
On reconnaît la matrice T = P R que l’on inverse : −1 t T At A A = P SQt ,
(21.82)
t −1 t A = T −1 P SQt . AA
(21.83)
334
Le temps dans la géolocalisation par satellites
Une fois ces équations établies, nous pouvons réécrire à nouveau les résultats précédents de la façon suivante : Estimateur des moindres carrés et valeur du critère à l’optimum
Résidus de mesures après ajustement εˆ et covariance formelle
Erreurs d’ajustement e et covariance formelle
p ˆ
=
T −1 P SQt b
ε ˆ
=
Q (I − S) Qt b
e
=
J (p) ˆ
=
bt Q (I − S) Qt b
cov (ε) ˆ
=
Q (I − S) Qt
cov (e)
=
T −1 P SQt ε −1 T tT
Ces efforts de calcul nous offrent un éclairage nouveau sur l’interprétation des moindres carrés. On rappelle que QSQt est le projecteur de Rm sur Im(A), t ⊥ Q(I − S) Q est le projecteur de Rm sur Im(A) , et que l’espace des mesures Rm est la somme directe Rm = Im(A) ⊕ Im(A)⊥ . t Le projecteur Q(I − S) Q rabat les résidus de mesures b ∈ Rm avant ajus⊥ tement sur les résidus obtenus après ajustement εˆ ∈ Im(A) . De la formule t (21.58) on déduit que εˆ = Q(I − S) Q ε, et donc que les résidus de mesures après ajustement s’interprètent également comme une projection du vecteur des erreurs ε ∈ Rm . La formulation du projecteur nouvellement calculée fait apparaitre une indépendance complète au rang de la matrice A et donc de la qualité de l’inversion de At ΓA, ou de façon équivalente de la matrice T . Par conséquent, les résidus εˆ ne sont jamais affectés par un problème d’observabilité globale se traduisant par des difficultés à inverser la matrice T (valeurs proches de zéro). Autrement dit l’effet d’un paramètre inobservable, ou peu observable dans le problème des moindres carrés, est invisible dans la structure des résidus. Le projecteur QSQt rabat le vecteur des erreurs subies ε ∈ Rm sur Im(A). Le filtre traduit ensuite cette projection en une erreur d’ajustement par la transformation linéaire e = U (QSQt ) ε avec U = T −1 P Qt un endomorphisme qui préserve Im(A). Les erreurs d’identification ne sont donc fonctions que de la projection du vecteur des erreurs de mesures et de modélisations sur Im(A). Pour résumer, le vecteur des erreurs subies se projette sur deux espaces complémentaires. Le premier capte la composante des erreurs qui est inexplicable par le filtre sous la forme d’une correction d’orbite. Le filtre transfère en totalité cette erreur dans les résidus de mesures obtenus sans que la qualité de l’orbite n’en soit affectée. Le second capte la seule composante que le filtre peut absorber et qu’il reporte entièrement en un écart d’orbite qui dégrade celle-ci de façon directe et transparente, c’est-à-dire indétectable à la lecture des résidus. Le RMS de ces résidus n’est autre que : RM S = ||ˆ ε|| = ||b − Aˆ p|| = J (ˆ p ) = χ2 . (21.84) Il est fondamental de garder à l’esprit qu’un RMS faible des résidus de mesures après ajustement ne signifie pas pour autant que l’orbite calculée soit précise. En effet, le processus des moindres carrés visera toujours à minimiser
Principes généraux de la restitution d’orbite GPS par moindres carrés
335
les résidus quitte à biaiser l’orbite. Il faut également être prudent dans la modélisation de la dynamique car des coefficients ou des directions peu ou pas observés vont engendrer de mauvais conditionnements du problème (matrice At Γ A mal conditionnée) et rendre la solution peu précise tout en produisant des RMS faibles. En revanche, si le problème est bien posé et que l’orbite calculée est précise, les résidus contiennent au plus le bruit des mesures. L’important est d’analyser la structure des résidus de mesures après ajustement, pour chaque station et chaque satellite. Le processus des moindres carrés va centrer automatiquement l’ensemble des résidus de mesures après ajustement autour de zéro. Si la modélisation est correcte, chacun de ces résidus doit être centré autour de zéro en milieu d’arc. Tout signal visible doit être interprété correctement. Dans la pratique, la matrice C = At Γ A issue des mesures est singulière, c’est-à-dire qu’elle admet des vecteurs propres isotropes (ut Cu ∼ = 0), ce qui rend son inversion délicate. Pour contrer ce phénomène, on rajoute au critère J un terme supplémentaire qui contient des valeurs « a priori » de certains t paramètres libérés x = (x1 , · · · , xi , · · ·) .
21.3
Algorithme général
Chacune des quatre étapes de la restitution correspond à des processus relativement indépendants. L’enchaînement itératif est le suivant : 1. initialisation du vecteur d’état : Yk = (xk , x˙ k , λk , μk )t ,
k = 0,
(21.85)
2. génération de la dynamique : génère la trajectoire position-vitesse (xk (t) , x˙ k (t))t par intégration des équations du mouvement, puis calcule les dérivées partielles du vecteur position-vitesse par rapport aux paramètres de bulletin x et x˙ puis par rapport aux paramètres dynamiques λ pour construire la matrice de transition ; 3. génération des mesures théoriques et calcul des résidus de mesures : calcule les mesures prédites aux dates des mesures réelles en utilisant l’équation des mesures H (Yk ), puis calcule les dérivées partielles des mesures par rapport aux paramètres du vecteur d’état ; 4. filtrage par estimation paramétrique : résout l’équation de filtrage (2) en évaluant les paramètres libérés δYk . On dispose alors de la correction à apporter aux paramètres de bulletin : Yk+1 = Yk + δ Yˆk , (21.86) 5. critère de convergence : un critère de convergence doit être défini pour arrêter le processus. Ce critère est communément basé sur la variation relative des corrections δ Yˆk . Le processus se termine dès que l’on a atteint le critère de convergence voulu. Tant que ce critère n’est pas atteint, le processus se poursuit en 2.
336
21.4
Le temps dans la géolocalisation par satellites
Prise en compte de contraintes
Pour modifier et affiner les résultats des paramètres globaux, on peut recourir à l’addition de contraintes ciblées sur certains paramètres de telle station en intervenant soit sur la matrice H des dérivées partielles soit directement sur la matrice At Γ A avant la résolution du problème. Ajouter une équation de contrainte sur un paramètre revient à ajouter de l’observabilité par une information additionnelle pondérée. Cela revient à ajouter de nouvelles mesures de type : x = x,
(21.87)
avec x la valeur a priori que l’on attribue au paramètre x, pondéré par le poids : (21.88) w = 1/σ. Le critère à minimiser devient la nouvelle fonctionnelle : t
t
J (p) = (b − Ap) Γ (b − Ap) + (p − p) Γ (p − p) ,
(21.89)
2 où lamatrice Γ est définie positive et égale à la diagonale w . La perturbaΓ 0 est maintenant définie positive ce qui rend le système plus tion 0 Γ observable. Ce processus est également connu sous le nom de régularisation de Tychonov. Le premier terme de la fonctionnelle, b − Apt Γ (b − Ap), contraint la variable p de telle sorte que Ap suive les résidus b avec la pondération Γ . Le t second terme, (p − p) Γ (p − p), contraint certains paramètres de la variable p à rester proches de ceux de p avec la pondération Γ . Comme précédemment, la solution optimale s’obtient en calculant la différentielle de la fonctionnelle J. Pour tout vecteur h on a :
dJ (p) · h = −2ht (At Γ b − At Γ Ap) + 2ht Γ (p − p) . = −2ht At Γ b + Γ p − At Γ A + Γ p
(21.90)
L’optimum est atteint si la différentielle de J en p est identiquement nulle. Si dJ (p) · h = 0 pour tout vecteur h non nul, alors on a nécessairement : t A Γ A + Γ p = At Γ b + Γ p. (21.91) Cette dernière équation fournit la solution optimale de la fonctionnelle J : −1 t A Γb + Γp . pˆ = At Γ A + Γ
(21.92)
Ce résultat se retrouve également en enrichissant la matrice d’observation A des équations de contraintes linéaires. L’ajout de contraintes revient donc à concaténer par le bas la matrice A (ajouter à la suite) la matrice identité de taille le nombre de colonnes que A qui est égal au nombre de paramètres
Principes généraux de la restitution d’orbite GPS par moindres carrés
337
contraints du problème. La matrice de pondération Γ est augmentée du nombre d’équations rajoutées avec sur sa diagonale les termes 1/σ 2 différents pour chaque type de paramètres. De même, on concatène le vecteur second membre b d’un vecteur non nul p contenant les valeurs a priori. Le système d’équations à considérer est maintenant : ! ! Γ 0 Γ 0 A b p= . (21.93) I p 0 Γ 0 Γ En les deux termes de l’équation par la matrice transposée tmultipliant A I , on retrouve formellement les équations normales du problème contraint : ! ! Γ 0 Γ 0 t t A b A I A I p = I p 0 Γ 0 Γ . (21.94) t t A Γ A + vΓ p = A Γb + Γp Cette approche pratique met en évidence, au passage, que les équations normales satisfont à la propriété additive. Les équations normales du problème contraint s’obtiennent en ajoutant les équations normales des contraintes, Γ p = Γ p, aux équations normales du problème non contraint At Γ Ap = At Γ b. Cette sommation fournie une nouvelle matrice quadratique qui vaut At Γ A+ Γ et qui doit présenter un meilleur conditionnement avec l’introduction de la matrice Γ que sans. Les matrices At Γ A et Γ ont la même taille. La matrice de pondération Γ a des termes non nuls seulement sur les lignes et colonnes correspondant aux paramètres contraints et disposés uniquement sur la diagonale, chaque terme valant l’inverse du carré de la covariance du paramètre visé. L’introduction de contraintes permet de modifier la solution du problème des moindres carrés. Selon l’amplitude du poids associé, elles permettent de bloquer (avec une faible covariance) ou au contraire de libérer (avec une grande covariance) l’ajustement du paramètre en question.
21.5
Traitement des informations a priori
Lors du traitement des mesures de l’arc courant, il se peut que nous ayons une information a priori des valeurs du vecteur d’état, vue comme variable aléatoire. L’information a priori consiste en la donnée d’une estimation initiale p0 du vecteur d’état, assortie d’une covariance initiale cov (p0 ) = P0 . Implicitement nous disons que l’information a priori suit une loi normale de moyenne p0 et de covariance P0 . La quantité à minimiser est la fonctionnelle : J (p) = (b − Ap) Γ (b − Ap) + (p − p0 ) P0−1 (p − p0 ) . t
t
(21.95)
Le second terme, (p − p0 ) P0−1 (p − p0 ), contraint la variable p à rester proche de p0 avec la pondération P0−1 . Compte tenu des arguments développés dans t
338
Le temps dans la géolocalisation par satellites
la section précédente, l’estimateur qui minimise la fonctionnelle J s’écrit : −1 t A Γ b + P0−1 p0 . pˆ = At Γ A + P0−1
(21.96)
−1 La covariance de l’estimateur pˆ est la matrice At Γ A + P0−1 . Comme attendu, si la covariance P0 est très forte, le traitement des informations a priori n’affecte pas (ou très peu) l’estimateur initial des moindres carrés, et on −1 a sensiblement pˆ ∼ = (At Γ A) At Γ b. Cependant, exprimée telle quelle, cette formulation de covariance est difficilement interprétable. Il faut faire appel à un lemme d’inversion matricielle d’algèbre linéaire pour y voir plus clair. Ce lemme donne explicitement l’inverse d’une matrice lorsque celle-ci peut s’écrire sous une forme bien spécifique : −1 AN. (21.97) M −1 = N −1 + At R−1 A ⇒ M = N − N At AN At + R En posant M −1 = P0−1 + At Γ A, N = P0 et R−1 = Γ , on obtient la nouvelle formulation suivante : −1 cov (ˆ p) = P0 − P0 At AP0 At + R AP0 . (21.98) La matrice R est souvent appelée matrice des bruits de mesures. D’autre part, la matrice définie par : −1 K = P0 At AP0 At + R , (21.99) est appelée matrice de gain. Elle est d’une utilisation systématique dans la formulation de Kalman, qui est écrite pour le traitement des mesures en temps réel. Finalement, la matrice de covariance de l’estimateur pˆ devient : cov (ˆ p) = (I − KA) P0 .
(21.100)
Cette nouvelle écriture montre que la covariance de l’estimateur pˆ est formellement inférieure à la covariance initiale P0 . La décroissance de la matrice de covariance traduit la prise en compte des informations additionnelles qu’apportent les nouvelles mesures à travers la composante KA. Un faible bruit de mesures conduira au calcul d’un gain élevé et à une covariance cov (ˆ p) d’autant plus faible. Inversement, la formulation de l’estimateur calculée avec la nouvelle expression de la covariance : (21.101) pˆ = p0 + P0 At R−1 b − KA P0 At R−1 b + p0 , met en évidence que l’estimateur des moindres carrés pˆ sera d’autant plus proche de sa valeur initiale p0 que le bruit de mesures sera élevé. Un fort bruit de mesure diminuera donc l’effet de ces dernières sur l’estimation de la variable p et sa covariance sera sensiblement proche de sa covariance initiale. Le lecteur désirant approfondir les notions que nous venons d’introduire pourra se référer aux ouvrages de Zarrouati (1987), de Tapley et al. (2004) ainsi qu’au chapitre de Paul Legendre dans le livre du CNES 1995).
Principes généraux de la restitution d’orbite GPS par moindres carrés
21.6
339
La restitution des orbites et horloges des satellites GPS
Cette section est dédiée à la spécificité du calcul des orbites GPS à partir d’un grand nombre de stations de réception au sol. On pourrait imaginer un processus simplifié dans lequel chaque satellite de la constellation est estimé individuellement à partir de mesures faites au sol par un procédé de résolution de type point inverse. Chaque mesure va apporter une information sur le biais d’horloge satellite mais va également introduire un biais additionnel correspondant à chaque station visible du satellite. Dans la majorité des cas, les biais d’horloges stations sont inconnus et on se retrouve alors dans la situation défavorable où une mesure de plus introduit une inconnue en plus. C’est pour cette raison que le calcul des orbites de constellation GPS ne peut se faire que d’un seul coup, en traitant en même temps tous les satellites car on tire ainsi parti de l’ensemble du réseau d’information que constituent les lignes de vues entre les satellites et les stations. C’est uniquement ainsi que l’on pourra restituer à la fois les orbites et tous les biais d’horloges satellites et stations avec une bonne précision. Cela produit inévitablement de gros problèmes de moindres carrés où le vecteur d’état contient tous les paramètres de dynamique et de mesures.
21.6.1
Dynamique appliquée pour les GPS
Le tableau suivant liste les principaux effets dynamiques qui s’appliquent aux satellites GPS. Forces applicables aux orbites MEO Gravité en GM/r2 Aplatissement de la Terre (J2 ) Attraction gravitationnelle de la Lune Attraction gravitationnelle du Soleil Ordres supérieurs du potentiel de gravitation terrestre Pression de radiation solaire directe Pression selon l’axe des générateurs solaires Pression atmosphérique
Effets sur les satellites Accélération Erreur d’orbite 3D (N = m/s2 ) après un jour (m) 0, 59 5 × 10−5 5 × 10−6
10000 3000
2 × 10−6
800
3 × 10−7
200
9 × 10−8
200
5 × 10−10
2
0
340
Le temps dans la géolocalisation par satellites
L’effet de l’aplatissement de la Terre au pôle (terme J2 du développement du potentiel en harmonique sphérique) et le renflement de la Terre à l’équateur produisent deux effets principaux sur l’orbite. Le bulbe équatorial exerce un couple gravitationnel sur le plan de l’orbite qui en modifie l’inclinaison et produit un mouvement séculaire de rotation de la ligne des nœuds donc du plan de l’orbite. Cet effet dépend de l’inclinaison de l’orbite : il est nul par exemple pour une orbite polaire. Le second effet est une excitation gravitationnelle du bulbe équatorial sur le satellite en direction radiale à chaque passage à l’équateur. La plus grande concentration de masse à l’équateur exerce une attraction plus importante sur le satellite qui l’attire davantage dans sa direction. En réponse, le satellite accélère et son demi-grand axe diminue au passage à l’équateur. En revanche, lors du passage aux pôles, c’est l’effet inverse, le satellite ralentit et son demi-grand axe augmente. Cet effet est harmonique à deux fois la période orbitale. La force d’attraction luni-solaire a également un impact sur l’inclinaison de l’orbite et la rotation du plan de l’orbite. Ces corps exercent également des forces de marées sur la Terre, ce qui modifie le champ de gravité terrestre. La force de pression de radiation solaire qui s’exerce sur chaque satellite est fonction du maître couple qui est exposé au vent solaire, donc à l’attitude du satellite, mais aussi aux propriétés d’absorption et de diffusion (soit directe, soit spéculaire) de la surface du satellite. Les panneaux solaires des satellites GPS sont toujours orientés dans la direction du Soleil. Dans le cas limite où le Soleil est perpendiculaire au plan de l’orbite, la force de pression de radiation exerce un couple sur le plan de l’orbite, entraînant une rotation de ce dernier pour le placer dans la direction du vent solaire. D’un autre côté, si le Soleil est dans le plan de l’orbite alors il y a une variation de la surface éclairée du corps du satellite qui est à deux fois la période orbitale. La direction constante du vent va accélérer le satellite d’un côté de l’orbite, lorsque la vitesse du vent s’ajoute à la vitesse du satellite, et le freiner de l’autre lorsque la vitesse du vent et la vitesse du satellite ont des directions opposées. L’effet global sur l’orbite est une modification de l’excentricité. Si la direction de cette force est toujours orientée du Soleil vers le satellite, son intensité varie selon l’angle entre le plan de l’orbite et la direction du Soleil. Les modèles s’efforcent de reproduire correctement cette force en ajustant, par satellite, un coefficient global de pression de radiation solaire et des paramètres empiriques périodiques (un voire plusieurs cycles par révolution) sur plusieurs axes. La force de biais dans l’axe des panneaux solaires est la résultante d’un couple thermique interne au satellite. Cet effet agit principalement le long de la trace du satellite. Cette force est relativement constante dans le temps mais elle est complètement inconnue ; il faut donc pouvoir la caler. Une fois le modèle défini, on produit l’éphéméride complète des satellites en même temps que les matrices de transitions. L’éphéméride va permettre de calculer, à chaque date d’échantillon des mesures, la position du centre de masse du satellite. Ces positions vont permettre à leurs tours de pouvoir modéliser chaque mesure présente correspondant à une date d’échantillon.
Principes généraux de la restitution d’orbite GPS par moindres carrés
21.6.2
341
Modélisation de la mesure GPS
À un événement de réception donné, le récepteur fournit une mesure de pseudodistance. Un passage est défini comme l’ensemble des mesures collectées entre une station et un satellite lorsqu’ils sont en visibilité radioélectrique. Connaissant parfaitement la position du récepteur et une approximation de la position du satellite, nous pouvons modéliser cette mesure, autrement dit reproduire la mesure réelle (au bruit de mesure près) connaissant tous les délais additifs dont la mesure réelle est entachée. Une fois la mesure reconstruite, l’écart avec la mesure réelle fournit une information sur les corrections d’orbites à réaliser sur le satellite. La correction optimale est définie au sens des moindres carrés c’est-à-dire celle qui minimise les résidus de mesures, différence entre les mesures réelles et les mesures prédites. L’instant d’émission du signal GNSS est par définition l’instant d’apparition du signal au centre de phase de l’antenne satellite. Pour pouvoir satisfaire cette définition, le signal est émis quelques instants en avance par la charge utile de navigation de façon à arriver au bon moment au centre de phase de l’antenne. Il reste une erreur résiduelle Δtsat qui se retrouve dans les mesures et qu’il faut résoudre. Pour la mesure de code, le temps de propagation correspond au délai entre l’instant d’émission du signal au centre de phase de l’antenne satellite et le temps de réception de ce signal défini au niveau de l’horloge récepteur. Ce temps est la somme des contributeurs déjà identifiés : – les biais d’horloge émetteurs Δtsat et récepteur Δtrec affectés des biais instrumentaux. Ces biais sont associés, pour le satellite au délai entre la génération du signal GPS au top de l’horloge bord et son émission au centre de phase, et pour la station au délai entre l’arrivée effective du signal au centre de phase récepteur et le temps de la mesure ; – la correction relativiste Δtr des horloges bord ; – la correction relativiste Δtshapiro sur le temps de propagation ; – les retards Δttropo liés à la propagation du signal dans la troposphère. Par ailleurs, la dynamique des satellites décrit l’évolution du centre de masse des satellites alors que les mesures sont faites au centre de phase de la combinaison des observables en formulation géométrique. De même, les positions des stations sont toutes référencées à leurs origines corrigées des marées ter rec restres. La distance géométrique R s’écrit entre les origines des stations X à la date de réception trec corrigées des marées terrestres et le centre de masse sat à la date d’émission tsat . Il est donc nécessaire d’appliquer du satellite X une correction supplémentaire correspondant aux écarts au centre de phase. La distance géométrique à modéliser correspond au vecteur w alors que l’on rec (trec ) − utilise (voir la figure 21.5) pour cette modélisation le vecteur u = X sat sat = u + asat − arec , la correction à apporter X (t ). En remarquant que w
342
Le temps dans la géolocalisation par satellites
Fig. 21.5 – Effet des biais d’antennes (vecteurs asat et arec ) sur la distance géométrique mesurée w. sur la distance géométrique R = ||u|| s’écrit : Kant = ||u|| − ||u + asat − arec ||.
(21.102)
La mesure de code GPS en combinaison « géométrique » P R est alors modélisée de la façon suivante autour d’une date d’échantillon donnée en temps GPS : P R = R + c Δtrec − Δtsat − Δtr + Δtshapiro + Δttropo − Kant . (21.103) Les paramètres inconnus, donc à ajuster, de cette équation sont les biais d’horloges récepteurs Δtrec et satellites Δtsat (combinés en formulation géométrique) ainsi que l’élongation troposphérique Δttropo . Tous les autres termes sont calculables en fonction de la position et la vitesse a priori des satellites ainsi que de la position des stations. Les mesures de phases GPS en combinaison géométrique λL ressemblent beaucoup aux mesures de code. Elles introduisent une ambiguïté entière constante par passage ainsi qu’une contribution produite par l’écart des axes de polarisation des antennes émetteurs et récepteur, phénomène d’enroulement de la phase en fonction de l’évolution de ces écarts. La modélisation de la mesure de phase en combinaison géométrique est la suivante : λL = (R + λW ) + c Δtrec − Δtsat − Δtr + Δtshapiro + Δttropo − Kant − λN. (21.104) Cette modélisation suppose que les biais instrumentaux des mesures de codes et de phases sont identiques, ce qui veut dire qu’il n’y a pas de distinction entre les biais d’horloge de code et de phase en formulation géométrique. L’introduction de la mesure de phase nécessite d’augmenter le vecteur d’état de toutes les nouvelles ambiguïtés, ce qui conduit à une définition plus
Principes généraux de la restitution d’orbite GPS par moindres carrés
343
complexe des passages (notamment le cas des mesures manquantes) et de bien gérer les sauts de cycles. L’ambiguïté de phase N est commune à toutes les mesures d’un même passage. Le calcul du temps de propagation du signal entre la position du récepteur à la date de réception τrec et la position du satellite à la date d’émission peut être obtenu de différentes manières. Méthode utilisant la pseudo-distance La modélisation consiste à partir du temps de réception et d’estimer une date d’émission à partir des pseudo-distances qui sont une évaluation directe du temps de transmission aux biais d’horloges près. Le temps de propagation ΔtR du signal entre les centres de phases s’écrit ΔtR = P R/c.
(21.105)
Ce temps de propagation permet de calculer le temps propre d’émission du signal au niveau satellite. Le temps propre d’émission τ sat est calculé à partir du temps propre de réception τrec duquel on retranche le temps de transmission : (21.106) τ sat = τrec − P R/c. Ce temps d’émission doit être maintenant recalé à la référence GPS en appliquant la correction d’horloge satellite Δtsat diffusée dans le message de navigation selon les prescriptions données par le document GPS : (21.107) tsat = τrec − P R/c − Δtsat tsat . Comme cette équation est implicite, on peut la résoudre de façon itérative de façon à stabiliser la correction d’horloge diffusée à la vraie date d’émission. Pour cela, on lance la récurrence :
sat t0 = τ sat , (21.108) sat tn+1 = τrec − P R/c − Δtsat (tsat n ) " " sat " arrêt dès que "tsat n − tn−1 < ε. Même si elle est moins précise que la méthode itérative, on peut toutefois obtenir une bonne estimation du temps d’émission en utilisant directement le temps propre τ sat pour calculer le biais d’horloge au niveau satellite, autrement dit utiliser l’approximation tsat = τrec − P R/c − Δtsat (τ sat ). À partir de cette date d’émission, on calcule la position du satellite sat (tsat ) en référentiel ECEF, définie à tsat , toujours selon les prescriptions X du document d’interface IS-GPS-200. Méthode géométrique La seconde méthode consiste en une approche purement géométrique. Le temps de transmission est donné par l’équation suivante : ΔtR =
1 sat (τrec − Δtrec − ΔtR ) ||. ||Xrec (τrec − Δtrec ) − X c
(21.109)
344
Le temps dans la géolocalisation par satellites
La date de réception τrec , faite en temps local récepteur, est ramenée en temps GPS par application du biais d’horloge récepteur connu Δtrec . Les positions sont toutes reportées en repère inertiel ECI. Cette équation n’est pas résoluble immédiatement car le temps de propagation apparaît dans les deux termes de l’équation. Cette équation étant implicite, une résolution possible est une résolution par itération en commençant par un temps de propagation nul :
= 0 Δt0R . n+1 1 ΔtR = c ||Xrec (τrec − Δtrec ) − X sat (τrec − Δtrec − ΔtnR )|| (21.110) Arrêt dès que l’écart entre deux itérations successives est faible " n " "Δt − Δtn−1 " < ε. Ici, le point délicat est de déterminer la position du R R satellite aux dates souhaitées. Si on dispose d’une éphéméride, on peut dérouler le processus itératif en calculant la position du satellite par interpolation. À la convergence, la position du satellite n’évolue plus. Plus précisément on applique les points suivants : sat au temps de réception τrec − Δtrec 1. on calcule la position du satellite X par interpolation ; 2. on calcule le temps de transmission Δtr du signal ; 3. on recalcule la position du satellite par interpolation à la date τrec − Δtrec − ΔtR ; 4. on compare les deux positions du satellite précédemment calculées et on reprend le calcul au point 2 si la différence diffère d’un seuil prédéfini. Si on ne dispose pas d’éphéméride, on va bouger le satellite de la distance correspondant au temps de transmission en se servant de la composante vitesse du bulletin d’orbite (initial ou celui de la dernière itération de calcul) et en faisant l’hypothèse d’une situation linéaire. sat (τrec ) + V sat (τrec ) (−Δtrec − ΔtR ) . sat (τrec − Δtrec − ΔtR ) = X X (21.111) Pour fixer les idées, avec une vitesse globale de 4,7 km/s et pour un temps de transit de 80 ms, cela donne une correction sur orbite de 376 m environ : sat au temps propre sat et la vitesse V 1. on part de la position du satellite X de réception τrec ; 2. on calcule le temps de transmission ΔtR ; sat − V sat (Δtrec + ΔtR ) et on 3. on déplace le satellite de la quantité X sat obtient une nouvelle position X ; 4. on compare les deux positions du satellite précédemment calculées et on reprend le calcul au point 2 si la différence diffère d’un seuil prédéfini. Comparé à la méthode précédente, l’algorithme donne de facto la position du satellite à la date d’émission.
Principes généraux de la restitution d’orbite GPS par moindres carrés
345
Les biais d’horloges station sont inconnus au moment de la première itération, ce qui pose problème lors de la modélisation de la mesure car on n’a pas la date en temps GPS où faire cette modélisation. Dans ce cas, les calculs sont menés en prenant des valeurs nulles pour ces biais. Si on fait la modélisation en événement récepteur, on a affaire à des mesures toutes synchrones au niveau récepteur, par contre les émissions ne le sont pas, de même que les dates de réception entre les différents récepteurs. Comme le biais d’horloge récepteur est commun à toutes les mesures faites à cette même date, il sera ajusté au cours de la première itération. Ces biais permettent de corriger les dates de réception pour la deuxième itération et ainsi de suite. Le calcul des corrections relativistes a déjà été mentionné dans les sections précédentes. L’élongation troposphérique est liée à la station, elle comprend une composante sèche, donnée généralement par un modèle (GPT/GMF) et une partie humide qui dépend de l’humidité relative sur la ligne de visée et qui varie avec l’élévation du satellite. Comme il n’est pas possible d’ajuster un biais différent par ligne de vue, cela ferait trop d’inconnues, on modélise l’élongation totale par une valeur à la verticale locale rabattue dans la direction de l’axe à vue : dtropo = fs (El) dtropo,sv + fh (El) dtropo,hv .
(21.112)
On commence par corriger les mesures de la composante sèche par un modèle physique utilisant des données de météorologie locale à la station et on ajuste l’élongation verticale humide. Comme la correction troposphérique humide a une dynamique à quelques heures il faut définir des intervalles de temps sur lesquels une modélisation sera appliquée, par exemple une constante sur une demi-heure ou un segment de droite sur une paire d’heures. On définit ainsi un jeu de paramètres troposphériques par station, correspondant au retard vertical, et par intervalle de temps définis. L’incrément vertical de correction troposphérique humide δdtropo,hv correspond alors à la contribution de la partie humide de la troposphère et est ajusté par le processus. Cet incrément vertical est ensuite projeté dans la direction de visée par la fonction de rabattement. La modélisation des biais d’horloges peut être faite de différentes manières. On peut choisir de modéliser le comportement de ces biais par un polynôme sur tout l’arc ou définir une modélisation par une droite sur des intervalles de temps définis. On peut enfin estimer un jeu de biais d’horloges différents à chaque date d’échantillon de mesures. Le choix de la modélisation va affecter sérieusement le nombre de paramètres total à ajuster. Il convient alors de classer les différents paramètres du vecteur d’état selon leur durée d’activation dans la matrice des dérivées partielles des mesures. Un paramètre est dit global s’il a des dérivées partielles non nulles à toutes les dates de l’arc d’ajustement. Les paramètres de bulletins sont des exemples des paramètres globaux. Un paramètre est dit local si ses dérivées partielles sont nulles en dehors d’un intervalle de temps localisé dans l’arc d’ajustement, typiquement les paramètres troposphériques. Il y a enfin le cas limite où des paramètres n’ont de dérivées partielles non
346
Le temps dans la géolocalisation par satellites
nulles qu’à une seule date de l’arc d’ajustement. C’est le cas par exemple des paramètres horloges définis par date. Dans la suite, la formulation du filtrage est décrite sans modéliser les horloges c’est-à-dire en ajustant un biais pour chaque horloge par date d’échantillon. Cette approche permet un calcul plus précis des orbites. Enfin, une fois la modélisation de la mesure posée, il faut évaluer la sensibilité de cette modélisation par rapport aux paramètres que l’on cherche à identifier et donc calculer les dérivées partielles de la fonction de mesure. Une remarque sur la dérivée partielle de la fonction de mesure par rapport aux horloges. Rigoureusement ces dérivées s’écrivent : ∂ΔτR ∂Mth = + 1, ∂hrec ∂Δtrec
(21.113)
et
∂ΔτR ∂Mth = − 1. (21.114) ∂hsat ∂Δtsat Les +1 et -1 proviennent de la contribution linéaire des biais d’horloges Δtrec et Δtsat dans la modélisation de la mesure. Dans la pratique, les termes des dérivées partielles du temps de propagation par rapport à ces biais d’horloges sont minuscules si bien que nous ne les négligerons par la suite lors du traitement dédié à la résolution des horloges.
21.6.3
Filtrage du problème GPS
Le fonctionnement du système GPS nécessite une connaissance précise des positions et des horloges des satellites émetteurs pour permettre un positionnement le plus précis possible. Pour obtenir ce niveau de précision, il est nécessaire : – de traiter simultanément l’ensemble des mesures acquises grâce à un réseau mondial de stations au sol sur tous les satellites de la constellation ; – de résoudre simultanément les orbites et les paramètres d’horloges, troposphériques et ambiguïtés de toute la constellation dans son ensemble, en utilisant les mesures fournies par le réseau de station au sol. Le traitement particulier des mesures GPS nécessite de prendre en compte à chaque date d’échantillon les horloges de toutes les stations et satellites observables, c’est-à-dire les horloges pour lesquelles un nombre minimal de mesures les font intervenir. Ces paramètres horloges sont à ajuster pour pouvoir estimer le bulletin initial de chaque satellite GPS. Le processus classique de restitution conduit donc à calculer les horloges instantanées pour chaque station et satellite, c’est-à-dire sans modèle d’évolution particulier, une valeur d’horloge pour chaque date. En fin d’itération, seuls les paramètres de bulletin, et éventuellement d’autres paramètres de modèle (pression de radiation solaire), sont nécessaires pour propager l’orbite des satellites GPS. Le filtre résout les équations normales AT Γ Ap = AT Γ b par bloc selon un traitement chronologique classique des mesures. On va voir que ce traitement
Principes généraux de la restitution d’orbite GPS par moindres carrés
347
est le plus efficace car il fait apparaître une structure diagonale par bloc qui permet une résolution aisée et élégante. Les équations normales s’écrivent Cp = B avec C = AT Γ A et B = AT Γ b. Le critère que l’on cherche à minimiser est le suivant : J (p) = ||b − Ap||2Γ = pt Cp − 2B t p + bt Γ b.
(21.115)
La solution pˆ = C −1 B est optimale au sens des moindres carrés et la valeur du critère à l’optimum s’écrit : J (ˆ p) = bt Γ b − B t pˆ.
(21.116)
Considérons un lot de mesures à une date donnée tn dont les dérivées partielles se mettent sous la forme : An = A1,n A2,n . (21.117) Avec A1 la matrice des dérivées partielles des mesures par rapport aux paramètres globaux, ceux pour lesquels la valeur des dérivées partielles des mesures est non identiquement nulle en dehors d’un intervalle borné de l’arc d’ajustement (bulletin, coefficient de pression de radiation solaire. . . ), et A2,n la matrice des dérivées partielles des mesures par rapport aux paramètres horloges de la date tn . Pour une date donnée, la partie horloges A2,n de la matrice des dérivées partielles An contient une ligne par mesure et une colonne par horloge. Sur chaque ligne, elle contient deux valeurs non nulles correspondant aux horloges émetteurs et récepteurs. Si la mesure correspondant à la ligne l met en jeu le récepteur j et l’émetteur i, on a : A2,n (l, j) =
∂Hl = 1, ∂hj
(21.118)
et
∂Hl = −1, (21.119) ∂hi correspondant à la contribution hj − hi = c Δtrec,j − Δtsat,i des horloges au résidu de mesures (en supposant la pondération de la mesure unitaire). La formation des équations normales à cette date fait apparaître la structure suivante : A2,n (l, i) =
Atn An =
At1,n At2,n
A1,n
A2,n
=
At1,n A1,n At2,n A1,n
At1,n A2,n At2,n A2,n
=
C11,n C21,n
C12,n C22,n
(21.120) En concaténant toutes les informations de toutes les dates de l’échantillon de mesure, on voit que la matrice C est décomposée en paramètres globaux, et en paramètres horloges à chaque date. Le vecteur second membre est noté B.
.
348
Le temps dans la géolocalisation par satellites
La formulation des équations de mesures conduit à la présence d’une structure diagonale par bloc de la matrice symétrique C : ⎡ ⎤ C11 C12,1 C12,2 · · · C12,N ⎡ pG ⎤ ⎡ BG ⎤ ⎢ C21,1 C22,1 0 ··· 0 ⎥ ⎥ ⎢ pH,1 ⎥ ⎢ ⎥⎢ ⎥ ⎢ BH,1 ⎥ ⎢ ⎥⎢ .. ⎢ pH,2 ⎥ ⎢ BH,2 ⎥ ⎢ C21,2 ⎥ 0 C22,2 0 . ⎥=⎢ ⎥ . (21.121) ⎢ ⎥⎢ ⎥ .. ⎥ ⎢ .. ⎢ ⎥⎢ .. .. . ⎣ ⎦ ⎦ ⎣ .. . . ⎣ . . 0 0 ⎦ pH,N BH,N 0 ··· 0 C22,N C21,N La diagonale de la matrice C est composée par les blocs de sous-matrice C22,n par date tn ce qui conduit à segmenter les vecteurs p et B par les blocs pH,n et BH,n définis à chaque date et qui concernent uniquement les paramètres horloge de la date traitée. La sous-matrice carrée C11 de C, la partie pG du vecteur d’état et la partie BG du second membre ne concernent que les paramètres globaux (coordonnées, troposphère) et ambiguïtés. Enfin, les matrices C12,n de C correspondent aux termes de couplages entre ces deux types de paramètres. À chaque date on est alors ramené à résoudre un système du type : ! ! ! pG BG C12,n C11 = . (21.122) C21,n C22,n pH,n BH,n C’est-à-dire à résoudre les équations linéaires :
C11 pG + C12,n pH,n = BG . C21,n pG + C22,n pH,n = BH,n
(21.123)
On commence par extraire l’information des horloges (seconde équation) pour les injecter dans la première équation et calculer pG . Cela revient à ne prendre en compte que la contribution des horloges à l’époque tn pour le calcul de la solution globale sans se soucier de résoudre explicitement la solution des horloges. Formellement on obtient :
C11 pG + C12,n pH,n = BG . (21.124) −1 pH,n = C22,n (BH,n − C21,n pG ) Les paramètres globaux pG se calculent par accumulation des équations suivantes construites aux différentes dates tn : −1 −1 C11 − C12,n C22,n C21,n pG = BG − C12,n C22,n BH,n . (21.125) −1 −1 C21,n et C12,n C22,n ne se calculent que sur les paraIci, les matrices C12,n C22,n mètres actifs de l’époque tn . Une fois les équations assemblées sur tout l’arc d’ajustement, les paramètres globaux se calculent par inversion directe :
) pG =
C11 −
N n=1
*−1 ) −1 C12,n C22,n C21,n
BG −
N
* −1 C12,n C22,n BH,n
.
n=1
(21.126)
Principes généraux de la restitution d’orbite GPS par moindres carrés
349
−1 Pour réaliser ce calcul, il faut donc au préalable inverser le bloc horloge C22,n construit à l’époque tn du batch considéré. La résolution des horloges à chaque date est faite au cours d’une seconde passe, connaissant la solution XG obtenue avec la formule plus haut : −1 pH,n = C22,n B2,n ,
(21.127)
B2,n = (BH,n − C21,n pG ) ,
(21.128)
où : ce qui correspond à minimiser le critère des moindres carrés : JH,n (pH,n ) = ||A2,n pH,n − bn ||2 .
(21.129)
Le vecteur pH,n contient la valeur des horloges des r stations et q satellites de la date tn : , + (21.130) XH,n = h1,n , . . . , hr,n , h1,n , . . . , hq,n . La résolution du problème global suppose que le bloc horloges C22,n doit être inversible à chaque date tn . L’inversion de C22,n correspond à résoudre les horloges à une date donnée, avec tous les autres paramètres connus (ambiguïtés, paramètres troposphériques. . . ). Dans la suite, on s’intéresse uniquement au problème horloge d’une date donnée (en éliminant l’indice de date des notations). Cela revient à résoudre le système d’équations C22 pH = B2 et en particulier à la structure de la matrice entière C22 = At2 A2 . Le terme diagonal C22 (k, k) représente le nombre de mesures effectuées à la date courante par la station ou le satellite correspondant à l’indice k. Tous les termes extra-diagonaux de la ligne et colonne k valent −1 si une connexion existe avec le reste des horloges, 0 sinon. Définie ainsi la matrice C22 n’est pas de rang plein, elle est singulière car chaque ligne et colonne de C22 a une somme nulle. En effet, comme on l’a déjà mentionné en section 3.2, les résidus sont rigoureusement identiques si on rajoute une même constante à chaque horloge. Examinons un exemple. Supposons donnés trois stations et quatre satellites dont la configuration est celle de la figure 21.6. Toutes les horloges à l’exception de celle du satellite 4 sont connectées entre elles. On écrit à présent la matrice des dérivées partielles des mesures par rapport aux paramètres horloges. Puisque la contribution des horloges aux résidus de mesures est de hj pour les stations et −hi pour les satellites, les dérivées partielles des mesures par rapport aux paramètres horloges sont respectivement +1 pour les stations et −1 pour les satellites, il y a des zéros partout ailleurs. Les colonnes de la matrice A2 sont rangées par ordre lexicographique des horloges stations puis des horloges satellites. En ligne sont rangées les mesures, l’ordre intervient peu : l’important est que toutes les mesures soient faites à la même date. Dans le tableau ci-dessous, la mesure 1 correspond à la ligne de vue entre la station 1 (dérivée partielle +1) et le satellite 1 (dérivée partielle −1).
350
Le temps dans la géolocalisation par satellites
Fig. 21.6 – Réseau type entre un ensemble de stations sol et de satellites. Horloges Mesures 1 2 3 4 5 6
Sta 1
Sta 2
Sta 3
Sat 1
Sat 2
Sat 3
Sat 4
1 1 0 0 0 0
0 0 1 1 0 0
0 0 0 0 1 0
-1 0 -1 0 0 0
0 -1 0 -1 0 0
0 0 0 0 -1 0
0 0 0 0 0 0
Remarquons que, dans cet exemple, seules les mesures entre les stations 1, 2 et 3 et les satellites 1 et 2 vont participer aux calculs des orbites, car pour le satellite 3 la direction selon l’axe à vue et l’horloge étant corrélés (section 3.2) l’information sur l’orbite dans la direction axe à vue va partir dans l’horloge. Avec le tableau des dérivées partielles A2 , on obtient immédiatement la matrice symétrique At2 A2 . ⎛ ⎞ 2 0 0 −1 −1 0 0 ⎜ 0 2 0 −1 −1 0 0 ⎟ ⎜ ⎟ ⎜ 0 0 2 0 −1 −1 0 ⎟ ⎜ ⎟ 2 0 0 0 ⎟ (21.131) C22 = ⎜ ⎜ −1 −1 0 ⎟. ⎜ −1 −1 −1 0 ⎟ 3 0 0 ⎜ ⎟ ⎝ 0 0 −1 0 0 1 0 ⎠ 0 0 0 0 0 0 0 Chaque ligne et colonne de la matrice C22 correspond aux couplages du paramètre horloge de cette ligne (ou de cette colonne) avec tous les autres paramètres horloges du problème. Elle regroupe toutes les informations sur les
Principes généraux de la restitution d’orbite GPS par moindres carrés
351
mesures faites par chaque station sur chaque satellite. Chaque terme diagonal représente le nombre de mesures impliquant le paramètre horloge associé. Par exemple, la lecture de la deuxième ligne nous informe que le deuxième paramètre, c’est-à-dire la deuxième station, a effectué 2 mesures (2 sur la diagonale de la matrice à la deuxième colonne) et que ces mesures ont été faites sur les quatrième et cinquième paramètres : les horloges des satellites 1 et 2 (−1 en deuxième ligne et quatrième colonne, −1 en deuxième ligne et cinquième colonne). La lecture de la ligne 6 se rapportant au quatrième satellite nous informe qu’il est inobservé (des zéros sur la dernière ligne et colonne dans la matrice et notamment sur la diagonale). Enfin notons que lorsqu’une ligne entière est remplie de zéros, le terme du second membre B2 correspondant à cette ligne est également nul. Cet exemple simplifié illustre le problème horloge tel qu’il apparaît dans le cas plus complexe de données réelles faisant intervenir plusieurs dizaines de stations et toute la constellation des satellites. Le cas général fera apparaître dans la matrice C22 une ou plusieurs lignes et colonnes nulles qui signifient que les horloges correspondantes ne sont pas observées. On remarque enfin que la somme des termes de chaque ligne et chaque colonne de la matrice C22 est nulle, ce qui signifie qu’il y a une dépendance linéaire dans les paramètres horloges. Cette dépendance tient au fait que la structure du problème horloge ne fait intervenir que des différences d’horloges : (21.132) hj − hi = (hj + a) − hi + a . Ce qui signifie que si le vecteur pH est solution du problème horloge, alors pH + a est encore une solution, autrement dit l’ensemble des horloges n’a pas de référence fixe, et donc la dimension de l’espace des liaisons est de un. En notant n la taille de la matrice C22 et n0 le nombre de lignes (ou colonnes) nulles, le rang de la matrice C22 est : rg (C22 ) = n − n0 − 1.
(21.133)
Dans notre exemple, le rang est 4. Ainsi, on ne peut pas en l’état procéder à leurs inversions nécessaires pour résoudre le problème par blocs. Le problème a alors une infinité de solutions. Pour pouvoir identifier les horloges il faut donc obligatoirement lever cette singularité en apportant une information supplémentaire ou, autrement dit, en imposant une contrainte au système. Cela revient à fixer une référence dans laquelle seront exprimés tous les biais d’horloges. Plusieurs méthodes sont possibles. Par exemple, on peut fixer une horloge de référence en maintenant son biais à une valeur fixe. Cela revient à supprimer l’horloge de référence du processus d’estimation. Au niveau de la structure matricielle du problème, fixer une référence revient à mettre un 1 sur la diagonale de C22 associée à la référence, mettre à zéro tous les éléments de la ligne et colonne associés et enfin annuler la valeur du résidu associé. Le choix de la référence doit porter sur une station ayant au moins une mesure à chaque date à traiter. Le critère
352
Le temps dans la géolocalisation par satellites
Fig. 21.7 – Notion de réseau principal et réseau décroché pour la restitution de la constellation GNSS. des moindres carrés augmenté de cette contrainte s’écrit maintenant : JH (pH ) = ||A2 pH − b||2 + h2ref .
(21.134)
Le problème des lignes (ou colonne) nulles, où aucune mesure ne contient l’horloge concernée, est résoluble trivialement en imposant la valeur 1 sur les diagonales associées. Comme il n’y a aucune corrélation avec le reste des horloges et que les valeurs associées au second membre B2 sont nulles, cela n’affectera pas la solution du problème. Ce processus revient à « forcer l’observabilité » des paramètres ne portant aucune mesure. Il reste encore à examiner un cas pathologique qui peut maintenir la matrice C22 singulière : celui où un lot d’horloges se déconnecte temporairement de la référence. Dans ce cas-là, il y a formation d’un sous-réseau décroché. La structure du problème horloge est définie par l’arbre de connectivité que l’on parcourt en suivant les mesures à partir de l’horloge de référence. Une horloge sera identifiable si elle est reliée à l’horloge de référence. Si l’arbre de connectivité est connexe alors le problème horloge est résoluble et toutes les horloges sont synchronisées à cette horloge de référence. Dans le cas contraire, les horloges déconnectées de la référence ne pourront pas être résolues, et il faudra les éliminer avant inversion. La situation est illustrée dans la figure 21.7 issue de l’exemple précédent où la station 1 est choisie comme référence. La figure ci-dessus montre que les satellites 1 et 2 ainsi que la station 1 sont reliées à la référence. Par contre, la station 3 et le satellite 3 forment un sousréseau décroché. Il peut arriver que la partie décrochée, si elle est volumineuse, participe aussi à l’information de géométrie. Dans ce cas, il faut fixer une
Principes généraux de la restitution d’orbite GPS par moindres carrés
353
autre référence pour inverser le sous-problème décroché. Un algorithme de détection des sous-réseaux décrochés permet de calculer les corrections sur les horloges du sous-réseau principal. On peut ainsi définir les horloges de référence supplémentaires nécessaires à l’inversion de C22 .
21.7
Le besoin de synchronisation du temps dans les algorithmes de navigation
L’hypothèse fondamentale qui est sous-jacente aux algorithmes de navigation (calcul d’orbite et de temps) est l’hypothèse des vues communes qui consiste à supposer que le même événement soit vu simultanément par toutes les stations. Pour observer un événement ou un état de navigation (position d’un satellite, biais d’horloge d’un satellite ou d’une station, saute d’horloge. . . ) d’une constellation de satellites de navigation, on doit nécessairement exploiter la connectivité du réseau station-satellite, c’est-à-dire traiter d’un seul coup les vues communes. Idéalement, ces vues communes devraient être faites à un instant d’émission commun pour tous les satellites et à un instant de réception commun pour toutes les stations. Pour accéder aux biais d’horloges stations et satellites par exemple, il faut théoriquement que toutes les lignes de vues observent le même ensemble d’horloges au même instant. Or, ceci n’est pas réalisable, pour des raisons de géométrie et de temps de trajet, comme précisé ci-dessous.
21.7.1
Observation d’un biais d’horloge récepteur
Pour observer un seul et unique paramètre d’horloge récepteur, il est nécessaire que la station effectue ses mesures de façon synchrone entre les canaux au moment de la prise de mesure. Ainsi, chaque équation de mesure d’une station à un instant donné contiendra le même biais récepteur. Ce biais correspond à l’écart entre la datation de l’événement de réception en temps récepteur avec un temps de référence qui représente le temps de la physique (la référence TAI ou bien la référence GPS). La production de la mesure par le récepteur prend en compte un temps d’intégration qui permet d’éliminer le bruit contenu dans le signal et donc de faire ressortir (d’amplifier) le pic de corrélation. Sur le signal GPS C/A, ce temps est au minimum de 20 ms mais peut aller au-delà. Au niveau récepteur, il n’y a donc pas de notion de prise instantanée de la mesure mais d’une mesure sur une période de temps correspondant à la période d’intégration. La mesure contient donc l’intégration des défauts d’horloges sur cette durée (biais + dérive + bruits). La qualité de l’orbite issue du calcul est indépendante de la qualité l’horloge (ou oscillateur) du récepteur sous réserve de satisfaire à l’hypothèse de synchronicité de prise de mesures. Ceci est principalement le résultat
354
Le temps dans la géolocalisation par satellites
de l’algorithme interne d’orbitographie qui prévoie l’ajustement de nombreux paramètres horloges à chaque date de prise de mesure et donc une décorrélation orbite/horloge. Remarquons qu’il y a un facteur 10 entre l’ « ageing » (dérive en fréquence) d’une rubidium et celle d’un OXCO. Au final, la performance de l’oscillateur doit pouvoir garantir une dérive de 10−10 s/s.
21.7.2
Observation d’un biais d’horloge satellite
Un même paramètre d’horloge émetteur est observable à un instant donné si les prises de mesures sont effectuées de telle sorte que les distances géométriques satellite-stations soient toutes identiques. Or, cette configuration est tout simplement impossible car la configuration réelle implique nécessairement des distances différentes dans la géométrie satellite-stations terrestres. Par conséquent, les récepteurs ne voient pas la même horloge satellite en même temps. Du fait des temps de transmissions différents, deux stations éloignées effectuant leurs mesures de façon synchronisée vont calculer des temps d’émissions différents. À ces temps d’émissions différents vont correspondre un couple de position et d’horloge satellite différent. Chaque récepteur va donc capter une valeur d’horloge satellite sur une plage de dispersion autour d’une valeur moyenne de date d’émission. Typiquement, la plage de temps dont on parle est de l’ordre du rapport rayon terrestre sur c soit quelque 20 millisecondes, qui représente la dispersion maximale des récepteurs entre eux. Dans les équations de mesures, on ne considère pourtant qu’un seul paramètre d’horloge émetteur, ce qui signifie que l’on prend implicitement un modèle d’horloge émetteur. Ce modèle consiste à dire que l’horloge émetteur est parfaitement stable sur toute la plage de dispersion possible (les 20 ms cas pire), ce qui est raisonnable vu la grande stabilité des horloges en vol. Une dérive d’horloge réaliste de satellites GPS est de quelques picosecondes par seconde. Considérons une dérive d’horloge de 2 × 10−11 = 20 ps/s, la dispersion des paramètres d’horloges satellites sur les 20 ms est de 2 × 105 m ce qui est complètement noyé dans les erreurs résiduelles d’estimation.
21.7.3
Observation simultanée de biais d’horloge satellite et station
On a vu qu’il était physiquement impossible d’accéder à un même biais d’horloge satellite, et que l’on a à la place un petit intervalle de valeurs. Mais plus généralement, il n’est pas possible d’observer les biais d’horloges stations et satellites au même moment du fait des durées de transmission des signaux de navigation. Donc la synchronisation globale du réseau stations satellites se fait automatiquement à t pour les stations et à t − ttr pour les satellites, la durée ttr correspondant au temps de transmission. La durée de transmission dépend de la position du satellite et de la station. En moyenne, il représente entre 70
Principes généraux de la restitution d’orbite GPS par moindres carrés
355
et 90 ms. On parle alors d’un biais de synchronisation des horloges émetteurs par rapport aux horloges stations du temps de propagation moyen. En bref, la synchronisation « instantanée » de toutes les horloges du système à un instant donné n’est pas accessible. Il faut maintenant garantir que la prise de mesures soit synchrone entre tous les récepteurs. Chaque station doit caller sa prise de mesures de façon relativement synchrone avec les autres afin de pouvoir capter le même événement satellite dans les quelques millisecondes qui se situent autour de la date moyenne d’émission (comme déjà discuté). Il faudrait donc, autant que possible, que la prise de mesure se fasse autour d’une date commune, disons la seconde ronde du temps GPS. Ce point est discuté dans le paragraphe suivant.
21.7.4
Effet d’une dérive d’horloge satellite sur un réseau sol dont la prise de mesure est dispersée
Reprenons les cas d’un satellite présentant une dérive d’horloge de 2 × 10−11 = 20 ps/s. Considérons qu’il soit en visibilité de deux stations proches présentant chacune d’elles un biais de temps +100 ms pour l’une et −100 ms pour l’autre par rapport à une référence commune. La prise de mesures de ces deux stations présente donc une différence temporelle de 200 ms. Cette désynchronisation implique que les dates d’émissions satellites vont également être séparées approximativement de 200 ms. L’effet de la dérive de l’horloge sur cette plage de temps implique que les biais satellites vus par les deux stations diffèrent de 1,2 mm. La résolution des équations du problème horloge va produire une valeur moyenne d’horloge satellite autour d’une très faible dispersion. Ce calcul montre que l’estimation du biais d’horloge satellite comme une moyenne est tout à fait licite, même avec des décalages assez gros des stations au sol. Du fait de la très faible dérive des horloges satellites, le calcul des biais d’horloges satellites n’est pas affecté par des décalages importants des horloges des stations au sol.
21.8
La datation des mesures
Lorsque la mesure est prise, l’événement est daté en horloge interne pour fournir un couple (τrec , P Rτrec ). Cette datation τrec ainsi que la mesure P Rτrec contiennent le même décalage d’horloge sol par rapport à la référence GPS. Les récepteurs usuels travaillent sur leur horloge sol qui cadence le traitement et donc l’événement de prise de mesure. La prise de mesure par le récepteur est déclenchée lors d’une seconde ronde d’un temps interne récepteur. Ce temps interne est créé par le générateur de fréquence. Il y a deux possibilités pour estimer ce biais d’horloge : 1. première possibilité : le récepteur fait un calcul de point en résolvant position et temps : il estime donc le biais entre sa date de prise de mesure en référence de temps récepteur et en référence de temps GPS. Bien sûr
356
Le temps dans la géolocalisation par satellites ce calcul est possible car c’est le même offset qui est contenu dans les pseudo-distances ;
2. seconde possibilité : l’ensemble des mesures récepteurs arrivent dans le filtre d’orbitographie qui restitue d’un coup tous les biais de toutes les horloges. Le résultat de cette opération est censé être plus précis que le calcul fait par le récepteur lui-même. À la fin de ce processus, un biais d’horloge station Δtrec est calculé ce qui permet de dater la prise de mesure en référence de temps GPS. Si on voulait estimer la valeur que prendrait cette pseudo-distance si l’horloge du récepteur était parfaitement synchronisée à la référence de temps GPS, qui est commune au système de navigation, il suffit de retrancher à la pseudodistance ce biais de datation plus une composante géométrique correspondant au déplacement du satellite ainsi qu’une composante liée à la dérive d’horloge satellite sur une durée correspondante à ce biais. En effet, les biais d’horloges ne dépassent guère la milliseconde, ce qui justifie une correction de la pseudodistance par différentiation au premier ordre : trec
=
P Rtrec
=
τrec − Δtrec
sat (τrec ) − X sat (trec ) + h˙ sat Δtrec P Rτrec − cΔtrec − uij . X (21.135) avec uij le vecteur ligne de vue entre la station j et le satellite i. Cette expression replace la valeur de la pseudo-distance faite au temps propre τrec à celle que l’on aurait obtenue si on avait fait la mesure exactement à la seconde ronde trec du GPS. C’est le rôle du calcul d’orbitographie d’effectuer toutes les opérations nécessaires pour réconcilier les différents biais de datation de toutes les mesures de la constellation avec la position des satellites à la date GPS. Dans les algorithmes de navigation, il est important de disposer d’une datation précise. C’est à partir de cette datation qu’est calculée la date d’émission du satellite GNSS. Cette date d’émission permettra ensuite de retrouver la position du satellite dans son éphéméride et donc de pouvoir calculer précisément la distance géométrique récepteur-satellite. Cette distance géométrique sera ensuite retranchée des pseudo-distances pour résoudre – entre autres – le problème horloge. Le besoin de précision de la datation doit être de l’ordre de la microseconde pour que cela ait un impact sub-centimétrique au niveau de la position du satellite (4 km/s × 1 μs = 4 mm avec 4 km/s la vitesse moyenne du satellite en orbite). Le besoin de précision de cette datation va de pair avec la précision de pseudo-distance qui est prise par le récepteur. Les paragraphes suivants décrivent les méthodes classiques de remontée de la date d’émission. La précision de la datation de la mesure doit être de l’ordre de la microseconde.
Principes généraux de la restitution d’orbite GPS par moindres carrés
21.9
357
Traitement des mesures de phase en ambiguïtés entières
Les techniques de calcul de point précis ont connu depuis les années 2000 des développements très importants jusqu’à arriver maintenant à des précisions de l’ordre du centimètre en temps réel. Plusieurs techniques sont possibles selon les cas de configuration mais toutes reposent sur le traitement de la mesure de phase sur plusieurs fréquences, au moins deux, car c’est elle qui est la plus précise. Le problème majeur de l’utilisation de la mesure de phase est la résolution des ambiguïtés, idéalement en entier. On trouvera dans l’article de Teunissen et Khodabandeh (2015a) une présentation des différentes techniques de lever des ambiguïtés entières 31 . Cependant, les mesures de code sont toujours nécessaires car elles permettent de dater les mesures. Elles interviennent également dans certaines résolutions d’ambiguïté. Une fois que les ambiguïtés entières de phase sont résolues, les mesures de phases se comportent comme des mesures de code très précises, au calcul de l’enroulement de la phase près. En conséquence, les paramètres restants du modèle, tels que la position de l’utilisateur, peuvent être estimés avec une précision élevée comparable. Dans le cadre de la résolution des orbites de la constellation, lever les ambiguïtés entières signifie que l’on puisse déterminer au cycle près, grâce aux mesures de phase, toutes les distances entre les satellites et les stations en visibilité les uns les autres. La résolution de ces distances s’effectue également en tenant compte d’autres informations comme les phénomènes naturels d’ordre physique tels que les effets associés à la troposphère ainsi que les phénomènes liés aux instruments tels les biais d’horloges émetteur (satellites) ou récepteur (stations). La résolution des distances satellite-station est faisable si l’ensemble des paramètres peuvent être résolus. La résolution va s’appuyer sur un réseau dense de stations de réception dont la position est connue avec précision et fournit un calcul précis des orbites et des horloges des satellites de constellation de navigation. Même si un bon calcul d’orbite en ambiguïté flottante fournit des orbites GNSS précises à la dizaine de centimètres près, la précision ultime, c’est-à-dire subcentimétrique, passe par la résolution en ambiguïtés entière. Pour s’attaquer aux levés d’ambiguïtés, une stratégie possible consiste à s’arranger pour éliminer le plus d’erreurs possibles affectant les observations, typiquement l’élongation ionosphérique ou d’inconnues possibles comme les biais instrumentaux et les paramètres d’horloges. Historiquement, les premiers algorithmes ont utilisé le principe des vues communes lorsque plusieurs récepteurs voient plusieurs satellites en même temps. 31. Voir les articles de Wubbena et al. (2005), Collins (2008), Ge et al. (2008), Collins et al. (2009), Laurichesse et al. (2009), Teunissen et al. (2010), Teunissen et al. (2015b).
358
Le temps dans la géolocalisation par satellites
Fig. 21.8 – Combinaison simple (a) et doubles différences (b).
21.9.1
Combinaisons simples et doubles différences
Disposant de plusieurs récepteurs, les méthodes classiques consistent à former des combinaisons « simples ou doubles différences » de façon à éliminer les paramètres horloges à partir d’observables bi-fréquence combinées de façon à éliminer les élongations ionosphériques. Par exemple, une combinaison « simple différence » entre deux stations A et B mono fréquence qui observent simultanément un même satellite GNSS va éliminer les horloges de ce satellite (figure 21.8a). PB − PA λLB − λLA
= (RP,B − RP,A ) + (hP,B − hP,A ) = (RL,B − RL,A ) + (hL,B − hL,A ) −λ (NB − NA )
+ (TB − TA ) + (TB − TA )
.
(21.136) En combinaison « double différence » entre deux stations A et B bi-fréquence qui observent simultanément deux satellites GNSS 1 et 2 (figure 21.8b), les horloges stations s’éliminent et on arrive à la combinaison : 2 2 − P1 − P1 PB − PA B A 2 − T2 − T1 + T1 = R2P,B − R2P,A − R1P,B + R1P,A + TB A B A 2 λLB − λL2A − λL1B − λL1A 2 − T 2 − T 1 + T 1 −λ N 2 − N 2 − N 1 + N 1 = R2L,B − R2L,A − R1L,B + R1L,A + TB A B A B A B A
(21.137) L’avantage de ces formulations est que l’on élimine à la fois les horloges et les biais instrumentaux. Par contre, le bruit de mesure s’ajoute à chaque combinaison de mesures et la longueur des passages diminue. De plus, il faut gérer les équations « simples ou doubles différences » de façon à former des observables linéairement indépendantes. Pour les mesures « simples différences », la propriété d’indépendance linéaire est assurée en faisant préalablement le
.
Principes généraux de la restitution d’orbite GPS par moindres carrés
359
Fig. 21.9 – Branche commune pour des combinaisons simples et doubles différences.
choix d’un récepteur de référence et en construisant toutes les vues communes avec ce récepteur. Cependant, toutes les combinaisons « simples différences » partagent la ligne de vue entre le satellite et le récepteur de référence, ce qui crée des erreurs corrélées. Le même cas se produit lors de la collecte d’observables « doubles différences » comme dans l’exemple de la figure 21.9 où les combinaisons A1-A3B1-B3 et B2-B3-C2-C3 ont la branche B3 en commun.
21.9.2
Le cas zéro-différence
Pour finir, un calcul d’orbite précis de la constellation GPS basé sur un réseau mondial de récepteurs géodésiques au sol : les ingénieurs du CNES, D. Laurichesse et F. Mercier, ont proposé en 2007 une solution originale de levée d’ambiguïtés entières en formulation non différenciée, voir les articles de Mercier et Laurichesse (2008) et de Laurichesse et al. (2009). Au lieu d’éliminer les biais instrumentaux, ces auteurs ont choisi de les estimer en faisant l’hypothèse qu’ils sont à variations lentes. Le principe repose sur deux idées maîtresses : proposer une modélisation de mesures de code et de phase sur deux fréquences qui fait apparaître des composantes à variations lentes et rapides, puis une résolution des ambiguïtés entières en cascade en partant des plus grandes longueurs d’onde jusqu’aux plus petites. L’approche a donné naissance au concept d’horloges de code et d’horloges de phase. La solution est basée sur les mesures de code P1 (Y ) et P2 (Y ) sur les deux fréquences f1 et f2 dont la modélisation est la suivante : P1 P2 λ1 L1 λ2 L2 où :
= = = =
R1 R2 R1 + λ1 W R2 + λ2 W
+ + − −
e γ12 e e γ12 e
+ + + +
Δhp Δhp ΔhL ΔhL
+ + + +
Δκp γ12 Δκp ΔκL γ12 ΔκL
, −λ1 N1 −λ2 N2 (21.138)
360
Le temps dans la géolocalisation par satellites
R1 et R2 : notent les distances de propagation géométrique entre les centres de phase liées aux fréquences f1 et f2 contenant le retard troposphérique ainsi que les retards relativistes ; W : est la contribution de l’enroulement de la phase en cycles ; e : l’élongation ionosphérique pour la fréquence f1 en mètre. La formulation fait apparaître les horloges Δhp de code et ΔhL de phase combinées en formulation géométrique. Le système de biais instrumentaux Δκp et ΔκL permettent de transférer les horloges combinées Δhp et ΔhL en horloge f1 et f2 . Les quantités Δκp et ΔκL représentent les biais entre les deux mesures de code et les deux mesures de phase respectivement de façon similaire au TGD . Ces derniers s’éliminent naturellement lorsque l’on recrée la combinaison géométrique des mesures (c’est fait pour !). Les biais ΔhL − Δhp , ΔκL et Δκp sont supposés à variations lentes. La première étape consiste à estimer les ambiguïtés widelane Nw dont la longueur d’onde associée est autour de 87 cm. Pour cela, les auteurs forment une combinaison linéaire widelane f (L2 − L1 , P1 , P2 ) géométrique et ionosphérique entre les pseudo-distances P1 et P2 et la différence des phases L1 et L2 exprimées en cycles : f (L2 − L1 , P1 , P2 ) = (L2 − L1 ) +
P1 − 2ep P2 − 2γ12 ep − . λ1 λ2
(21.139)
Ici ep est l’estimation de l’élongation ionosphérique construite avec les mesures de code : P2 − P1 . (21.140) ep = γ12 − 1 qui contient les écarts de centre de phases affectés du facteur 1/ (γ12 − 1) ainsi que les biais instrumentaux Δκp . Pour comprendre la structure de ce nouvel observable f (L2 − L1 , P1 , P2 ), on commence par former les estimations des ambiguïtés de phase sur les deux fréquences : -1 = P1 − 2ep − L1 , N (21.141) λ1 -2 = P2 − 2γ12 ep − L2 . N λ2
(21.142)
Ces estimations fournissent une valeur des ambiguïtés de phase dont le bruit peut atteindre une dizaine de cycles : ! 1 R2 − R1 N1 = N1 − W − (ΔhL − Δhp ) + (ΔκL + Δκp ) + 2 , (21.143) λ1 γ12 − 1 ! -2 = N2 − W − 1 (ΔhL − Δhp ) + γ12 (ΔκL + Δκp ) + 2γ12 R2 − R1 . N λ2 γ12 − 1 (21.144)
Principes généraux de la restitution d’orbite GPS par moindres carrés
361
Avec un tel niveau de bruit, les valeurs entières des ambiguïtés N1 et N2 sont -w = N -2 − N -1 inobservables. Les auteurs forment alors l’ambiguïté widelane N qui élimine la contribution de la rotation de phase : γ12 1 2 (R2 − R1 ) Nw = Nw + λw (ΔhL − Δhp ) − − , (ΔκL + Δκp ) + λ2 λ1 λ1 + λ2 (21.145) dont la longueur d’onde associée s’écrit : 1 1 1 = − . λw λ1 λ2
(21.146)
La combinaison de type Melbourne-Wübenna est en fait l’estimée de l’ambiguïté équivalente à la longueur d’onde λw : -w , f (L2 − L1 , P1 , P2 ) = −N
(21.147)
laquelle se réécrit de façon plus compactée : f (L2 − L1 , P1 , P2 ) = −Nw + d + μrec − μsat .
(21.148)
La composante géométrique d contient uniquement les écarts des centres de phases entre les deux fréquences projetés sur la ligne de vue : d=
2 (R1 − R2 ) . λ1 + λ2
(21.149)
Cette quantité est relativement faible généralement en dessous de 0,1 cycle. Les quantités μrec et μsat sont appelés les biais widelane satellite et récepsat teur, combinaison linéaire de hp,rec − hL,rec , κL,rec + κp,rec et de hsat p − hL , sat sat κL + κp : μrec = λw (hp,rec − hL,rec ) +
λ2 − λ1 (κL,rec + κp,rec ) , λ21
λ2 − λ1 sat sat μsat = λw hsat + κL + κsat . p − hL p λ21
(21.150) (21.151)
La principale caractéristique de la combinaison f (L2 − L1 , P1 , P2 ) est qu’elle est exempte de toute modélisation faisant intervenir une combinaison couplée avec les mesures d’autres récepteurs : elle met seulement en jeu une ambiguïté widelane constante par passage et des biais widelane entre un récepteur et un émetteur dont la propriété de ces biais est d’être très stables dans le temps de telle façon qu’on peut les considérer constants sur plusieurs passages. De même, des récepteurs géodésiques présentent également des biais qui sont à faibles variations temporelles. Ceci suggère de prendre la moyenne de ces observables sur chaque passage dans lesquels la contribution de d est négligée, ce qui revient à considérer la formulation suivante : f (L2 − L1 , P1 , P2 ) = −Nw + μrec − μsat .
(21.152)
362
Le temps dans la géolocalisation par satellites
Cependant, il existe une infinité de solutions à cette équation. Il suffit pour cela d’incrémenter chacun des biais widelane par n’importe quels entiers relatifs b et c et d’augmenter l’ambiguïté Nw par a = b − c de façon à laisser la somme inchangée : f (L2 − L1 , P1 , P2 ) = − (Nw + a) + μrec + b − μsat + c.
(21.153)
C’est pourquoi seules les parties fractionnaires des biais widelane sont observables. De la même façon que pour le problème horloge, la résolution des biais widelane reste singulière sans contrainte supplémentaire car ces biais interviennent en tant que différences μrec − μsat dans les observables et par conséquent n’importe quel réel r que l’on ajoute à ces biais laisse invariantes les équations : μrec − μsat = (μrec + r) − (μsat + r). Pour résoudre les ambiguïtés « widelane », on commence par construire un jeu de biais widelane satellite en considérant l’ensemble des équations précédentes module 1 pour assurer la cohérence entre tous les passages. On est donc ramené au système d’équations suivantes : μrec − μsat ≡ f (L2 − L1 , P1 , P2 ) mod 1.
(21.154)
Plusieurs méthodes sont possibles pour résoudre ces biais. Les auteurs proposent un procédé itératif qui consiste d’abord à ajuster les biais widelane satellites à partir d’un réseau serré de bons récepteurs, ce qui revient à résoudre le système : (21.155) μsat ≡ −f (L2 − L1 , P1 , P2 ) mod 1. Notons que cette façon de faire revient implicitement à caler la référence de temps sur laquelle sont rapportés tous les biais d’horloges. Une fois les biais satellites ajustés, on exhibe les ambiguïtés widelane car toutes les mesures f (L2 − L1 , P1 , P2 ) + μsat se sont maintenant agglutinées autour de valeurs entières. Enfin, ayant estimé les biais satellites μsat et levé les ambiguïtés widelane Nw en valeurs entières, il est possible de fournir une estimation des biais widelane par station par exemple en effectuant un moindres carrés sur les mesures f (L2 − L1 , P1 , P2 ) + Nw + μsat . Ayant bloqué les ambiguïtés widelane, il s’agit maintenant de bloquer les ambiguïtés N1 dans les entiers. Pour cela, on utilise la combinaison géométrique de code et de phase entre les fréquences f1 et f2 . Cette combinaison contient un mélange des ambiguïtés f1 et f2 et c’est la relation suivante qui va tout faire fonctionner : γ12 λ1 N1 − λ2 N2 λ2 = λc N1 − Nw . γ12 − 1 γ12 − 1
(21.156)
Comme maintenant l’ambiguïté NW est connue, on forme la combinaison suivante : Qc −
Pc
λ2 γ12 −1 Nw
= Rc = Rc + λc W
+ Δhp + ΔhL
−λc N1
.
(21.157)
Principes généraux de la restitution d’orbite GPS par moindres carrés
363
Ces équations sont maintenant identiques à celles obtenues dans le cas monofréquence mais pour la combinaison géométrique. Au lieu d’avoir une longueur d’onde de 6 mm comme hérite la combinaison géométrique, ces équations font apparaître la longueur d’onde étroite qui est autour de 10,7 cm. Même si elle reste inférieure à la longueur d’onde λ1 qui est autour des 19 cm, il est maintenant possible de bloquer les ambiguïtés N1 dans le domaine des entiers. À noter que le bruit de ces mesures hérite du bruit de la combinaison géométrique, soit trois fois le bruit des mesures mono-fréquence. Plusieurs méthodes sont applicables pour résoudre ce système d’équations, on peut utiliser par exemple les doubles différences. Une autre approche consiste à effectuer un calcul d’orbite avec une résolution des ambiguïtés dans le domaine des flottants afin d’obtenir une estimation de la distance Rc à quelques centimètres près, ce qui nécessite tout de même d’ajuster les élongations troposphériques à la verticale pour chaque récepteur. Une fois la distance Rc connue avec suffisamment de précision, de même que la contribution de l’enroulement de phase (connaissant la position et l’attitude des satellites) il est possible de résoudre simultanément l’ambiguïté de phase N1 ainsi que les horloges de phase ΔhL par un traitement itératif des équations : λ2 rc = Qc − Nw − Rc − λc W = ΔhL − λc N1 . (21.158) γ12 − 1 Là encore, le problème est singulier sous deux aspects. Le premier porte sur les biais d’horloges satellites et récepteurs qui interviennent comme des différences, ce qui introduit une inobservabilité globale sur la référence de temps de ces horloges. La seconde est que, comme précédemment, on peut rajouter à chacun des deux biais d’horloge un nombre entier de longueur d’onde λc et retrancher leur somme à l’ambiguïté λc N1 sans que cela change l’équation. Il y a donc une indétermination entre les ambiguïtés et les horloges. Cette dernière situation se produit par exemple dans le cas de passages isolés entre un récepteur et un satellite déconnecté du reste du réseau. Le processus proposé nécessite un traitement itératif : à partir d’une solution d’horloge initiale (ΔhL )n (issue par exemple de la résolution des orbites et horloges avec ambiguïtés flottantes) on forme une estimation des ambiguïtés N1 en moyennant la différence ((ΔhL )n − rc ) /λc sur tout le passage : N1 =
(ΔhL )n − rc . λc
(21.159)
Dès qu’une valeur de cette moyenne est suffisamment proche d’un entier, on bloque l’ambiguïté à cet entier. On obtient ainsi un ensemble (N1 )n d’ambiguïtés entières bloquées. Puis on fournit une nouvelle estimation des horloges (ΔhL )n+1 = rc + λc (N1 )n en utilisant le jeu d’ambiguïtés bloqué courant. Une fois les ambiguïtés entières de phase N1 levées, on en déduit la valeur des ambiguïtés de phase N2 en utilisant la widelane : N2 = Nw + N1 . La position précise des satellites de la constellation peut maintenant être résolue en réalisant un nouveau calcul d’orbite en fixant cette fois-ci toutes les ambiguïtés N1 et N2 du problème à leurs valeurs entières.
364
Le temps dans la géolocalisation par satellites
Tous les traitements qui viennent d’être décrits comprennent des calculs de moyennes sur la durée des passages, ce qui est aisé lorsque l’on fait du post-traitement. En temps réel, il est possible de réaliser un moyennage sur des arcs glissants, ce qui introduit un temps de convergence à tout le processus. En 2018, D. Laurichesse et S. Banville (voir leur article [2018]) ont montré qu’avec quatre fréquences Galileo, les fréquences E1, E5a, E5b et E6, la convergence pouvait être immédiate car les ambiguïtés widelane sont résolues en cascade instantanément : on fixe d’abord les ambiguïtés de la widelane E5a–E5b (appelée également « extra widelane » avec une longueur d’onde de 9,76 m), puis on fixe les ambiguïtés widelane E5b–E6 (longueur d’onde de 4,19 m), puis enfin les ambiguïtés widelane E1–E5a (longueur d’onde de 0,75 m). Une fois toutes ces widelanes fixées, la mesure en combinaison géométrique présente un bruit de distance de 19 cm. Le calcul de point obtenu avec cette combinaison devient suffisamment précis pour fixer l’ambiguïté N1 à l’aide des mesures GPS.
Chapitre 22 Les systèmes d’augmentation par satellites 22.1
Le rôle d’un système SBAS
Le système GPS diffuse des informations contenant la position et le biais d’horloge de chaque satellite, ce qui permet le positionnement des utilisateurs dans le système de référence terrestre WGS 84. Bien que le système prévoie des informations qui renseignent sur l’état de santé de chaque satellite, les données de navigation qui sont transmises par le système GPS ne sont pas garanties au-delà de six heures. Autrement dit, les usagers du système GPS utilisent ces informations pour leur géolocalisation à leurs risques et périls. Ainsi, en cas de panne ou de dysfonctionnement du système GPS, un satellite peut diffuser une éphéméride qui, parfois, peut être éloignée de sa position réelle, de même pour son horloge. Il est même arrivé que le système GPS diffuse des éphémérides erronées sur ses satellites. Ces erreurs affectent naturellement les mesures de pseudo-distances, parfois de façon importante, et peuvent dégrader la qualité du positionnement. Ce statut ne permet pas d’utiliser le système GPS pour des applications critiques mettant en jeu des vies humaines, comme par exemple la réalisation par des avions de phases d’approches des aéroports. Par ailleurs, jusqu’en janvier 2000 le système GPS américain dégradait volontairement ses données de navigation à usages civils afin d’en limiter la précision et donc l’usage. Cette dégradation portait sur la correction d’horloge des satellites GPS dont on a vu l’importance des effets dans la précision de localisation. Les différentes organisations des aviations civiles, souhaitant tout de même utiliser le système GPS pour la navigation aérienne, ont commandé aux industriels un système d’augmentation capable de remplir deux principales missions à destination des usagers civils disposant de récepteurs mono-fréquence L1. La première est de calculer des messages de corrections qui permettent aux utilisateurs aéronautiques mono fréquence d’exploiter les données GPS pour un positionnement précis, même si le système GPS incorpore volontairement ou non des dégradations affectant la géolocalisation. La seconde est de surveiller en temps réel l’ensemble des données de navigation diffusées par le
366
Le temps dans la géolocalisation par satellites
système GPS afin de détecter des éventuelles anomalies et alerter les utilisateurs aéronautiques dans un temps compatible avec leur phase de vol. Le besoin des aviations civiles étant de couvrir une large zone, typiquement de l’ordre du continent, le choix de diffusion de ces messages s’est naturellement porté vers les satellites géostationnaires. Un tel système d’augmentation est ainsi appelé SBAS pour son acronyme anglais Satellite Based Augmentation System. Un SBAS transmet un signal contenant des informations sur la fiabilité et la précision des signaux de positionnement envoyés par GPS. Pour l’utilisateur mono-fréquence L1, ce signal d’augmentation est diffusé sur la bande L1. Il est modulé par un PRN dédié, et, tout comme les satellites GPS, contient les informations d’augmentations modulées par BPSK(1). Ainsi, le signal SBAS ressemble beaucoup à un signal GNSS de telle sorte que les récepteurs puissent le traiter sans modification majeure de leur conception. Ainsi, le rôle d’un SBAS est de décomposer les différents contributeurs aux erreurs de mesures, puis de diffuser aux utilisateurs, à travers des messages d’augmentations dédiés, les corrections associées à chacun des contributeurs d’erreur. Ces corrections sont recomposées par le récepteur des utilisateurs en fonction de leur position géographique, ce qui améliore la précision de positionnement et contribue à atténuer les sources d’erreurs qui affectent l’information de distance liées aux horloges des satellites, à leur positionnement ainsi qu’aux effets ionosphériques. Les SBAS actuels augmentent les utilisateurs GPS, mono-fréquence L1, utilisant le message de navigation L/NAV. Le futur des systèmes SBAS est de diffuser des données de correction d’orbite et d’horloge pour des satellites appartenant à des constellations différentes et destinées à des utilisateurs bi-fréquences L1/E1 et L5/E5a utilisant les messages L/NAV pour le GPS et F/NAV pour Galileo. Le signal SBAS DFMC, pour Dual Frequency Multiple Constellations, sera diffusé sur la bande de fréquence L5 et ne contiendra pas de corrections liées aux effets ionosphériques puisque les utilisateurs formeront au préalable la combinaison géométrique. Ce message distribuera uniquement des corrections d’augmentation et d’intégrité relatives aux erreurs d’orbite et d’horloge. Ce chapitre se focalise sur le SBAS historique conçu pour les utilisateurs mono fréquences L1.
22.2
Les standards applicables
Pour le domaine de l’aviation civile, un cadre d’intégrité a été élaboré et normalisé basé sur l’annexe A de la RTCA DO-229-E « Minimum Operational Performance Standards (MOPS) pour les équipements aéroportés GPS/WAAS » et l’appendice B de l’annexe 10 de la convention de Chicago, maintenu par l’OACI et communément appelé « Standards and Recommended Practices (SARPS) ». Le standard SARPS de l’OACI définit les différents niveaux de service et spécifie les interfaces des SBAS. Le standard MOPS RTCA est applicable à l’équipement du récepteur utilisateur et spécifie les fonctionnalités et
Les systèmes d’augmentation par satellites
367
performances. Tous les messages SBAS, ainsi que les modalités de calcul et d’application des corrections SBAS sont définis par le standard MOPS.
22.3
Architecture des systèmes SBAS
Tous les systèmes d’augmentation spatiaux connus regroupent les grandes fonctions suivantes, illustrées en figure 22.1. Un sous-système de récepteurs sols collecte les données de navigation à des positions géographiquement connues. La densification du réseau de station sol dépend de plusieurs facteurs dont principalement les contraintes imposées par l’élaboration de la correction ionosphérique qui est de loin le plus gros contributeur aux erreurs de mesures. Les stations de réception fournissent les mesures GNSS au centre de calcul. Un sous-système de calcul de correction et d’intégrité. Ce composant utilise les données de navigation fournies par les stations sols pour se construire un contexte complet de navigation. Les fonctions de ce centre de calcul sont les suivantes : – effectuer les prétraitements de mesures GPS code et phase : cette fonction a pour but d’identifier et de rejeter toute mesure aberrante dont l’introduction dans les modules algorithmiques pourrait corrompre le contexte de navigation ; – déterminer les orbites des satellites GPS : cette fonction est fournie par un module d’orbitographie Le centre de calcul détermine les orbites des satellites GPS à partir du réseau régional de stations sol ; – synchroniser les horloges stations et satellites : cette fonction permet de construire une référence de temps propre au SBAS et d’y rapporter tous les biais d’horloges stations et satellites ; – fournir les données d’intégrité des corrections d’orbites et d’horloges ; – construire un modèle interne de l’ionosphère pour calculer les corrections ionosphériques et les données d’intégrités associées ; – générer la séquence des messages d’augmentation SBAS ; – fournir les moyens de surveillance et de contrôle du système ; – fournir des vérifications indépendantes : comme toute erreur du centre de calcul peut avoir des répercussions sur la vie humaine (SoL service – Safety of Life) le système incorpore une fonction de vérification qui est complètement indépendante afin de valider la sûreté de fonctionnement obtenue en utilisant les corrections du SBAS. Le centre de calcul fournit au centre d’émission les messages d’augmentations à diffuser. Un sous-système d’émission des messages d’augmentation SBAS. Cette fonction se charge d’encoder et moduler les messages d’augmentations et de les transmettre à un ou plusieurs satellites géostationnaires afin qu’ils les diffusent sur la porteuse L1 de la même façon que les satellites GPS. Par ailleurs, les émissions des messages d’augmentation au sol sont réalisées de telle façon que
368
Le temps dans la géolocalisation par satellites
Fig. 22.1 – Architecture haut niveau d’un SBAS. la réémission du premier bit de ces messages SBAS par l’antenne du satellite géostationnaire soit proche de la seconde ronde du temps GPS. Le SBAS européen EGNOS (European Geostationary Navigation Overlay Service) est opérationnel en mode “ Open Service ” depuis 2009 et déclaré “ Safety of Life ” depuis 2011. Il offre les services suivants : – un service ouvert (Open Service), gratuit pour l’utilisateur, qui permet le positionnement et le raccord au temps universel coordonné (UTC) ; – un service de diffusion des données EGNOS sur Internet, à savoir EGNOS Data Access Service (EDAS), pour promouvoir le développement d’applications à usage professionnel ou commercial ; – un service Safety of Life (SoL) destiné aux utilisateurs pour lesquels la sécurité est essentielle. Ce service est fourni sans frais d’utilisation directs et répond notamment aux exigences de l’aviation civile sur les performances de continuité, disponibilité et précision. Par ailleurs, le service inclut un message d’intégrité alertant l’utilisateur de possibles défaillances du système GPS ou bien de signaux GPS émis hors de leurs spécifications. Le service OS est destiné aux applications générales. Il consiste en des signaux de synchronisation et de positionnement, librement accessibles depuis les satellites GEO, sans aucun coût direct pour les utilisateurs finaux. Ce service est accessible à tout utilisateur équipé d’un récepteur compatible GPS/SBAS dans
Les systèmes d’augmentation par satellites
369
la zone de performances du service ouvert. Aucune autorisation ni certification spécifique du destinataire n’est requise pour accéder aux signaux OS, ni pour les utiliser. La précision de la position, la précision de la synchronisation et la disponibilité seront meilleures que celles obtenues uniquement avec les satellites GNSS. Le fournisseur de service SBAS n’assume aucune garantie de service ni responsabilité pour l’utilisation des signaux OS. Le service d’accès aux données “ SDAS ” consiste à fournir aux clients autorisés (par exemple, des applications/fournisseurs de services à valeur ajoutée) tous les messages de corrections SBAS en temps réel (y compris les corrections d’horloge et d’éphémérides des satellites, les corrections de propagation et les informations d’intégrité) au format SBAS, les données brutes provenant des stations de réception de référence en temps réel, les données relatives au fonctionnement du système SBAS. Ce service de distribution de données est fourni sur la base d’accords commerciaux entre le fournisseur de service et ses clients. Les produits sont distribués dans le format tels que gérés par le système SBAS, les fournisseurs de services à valeur ajoutée seront chargés de traiter ces produits et de les adapter si besoin aux utilisateurs finaux. Le service SoL est destiné à la plupart des applications de transport dans différents domaines (par exemple, aéronautique, maritime et ferroviaire) où des vies pourraient être mises en danger si les performances du système de navigation étaient dégradées en deçà des limites de précision spécifiées sans prévenir les usagers dans les délais impartis. Il consiste en des signaux de synchronisation et de positionnement, assortis d’une garantie de service, accessibles de manière transparente depuis les satellites GEO et soumis à la souscription d’un accord de niveau de service spécifique. Le service SoL est accessible à tout utilisateur équipé d’un récepteur compatible GPS/SBAS dans les zones de performance des services SoL. Ce service est conforme aux exigences de l’aviation, mais est également destiné à prendre en charge des applications dans d’autres domaines. De plus, les opérations de navigation fondées sur le service SoL ne doivent être effectuées par l’utilisateur que si une autorisation spécifique délivrée par l’autorité compétente est reçue. L’autorisation est normalement soumise aux conditions et limitations opérationnelles spécifiées, à l’existence d’une procédure de navigation publiée, et à la certification des équipements de navigation à bord. Une garantie de service du fournisseur de services sur le service SoL ne sera fournie qu’aux abonnés de l’accord de niveau de service requis, et s’applique uniquement dans la zone de performance des différents niveaux de services SoL.
22.4
Les budgets d’erreurs de mesures pris en compte dans le standard MOPS
Rappelons que l’estimation de la distance entre un satellite d’une constellation de navigation et un utilisateur est basée sur la mesure du temps de propagation
370
Le temps dans la géolocalisation par satellites
d’un signal électromagnétique du satellite vers l’utilisateur. Les sources d’erreurs listées dans cette section qui affectent la précision de ces mesures de pseudo-distances sont soient corrigées par le système SBAS soient bornées selon les prescriptions données par le standard MOPS. Les erreurs de positionnement du satellite Si les orbites des satellites sont imprécises ou erronées, l’utilisateur ne pourra pas déterminer avec précision la position du satellite sur son orbite à un instant donné. Cela introduira une erreur dans le calcul de la position de l’utilisateur. L’effet de l’erreur d’orbite sur les mesures de distance dépend de la localisation de l’utilisateur. Cette erreur est corrigée par le SBAS. Les erreurs de biais d’horloges satellites Toute erreur de synchronisation des différentes horloges satellites aura un effet direct sur la précision de la mesure de distance. Une erreur de biais d’horloge satellite affecte tous les utilisateurs en visibilité du satellite de la même façon. Cette erreur est corrigée par le SBAS. Les effets de propagation ionosphériques L’ionosphère est une couche d’atmosphère ionisée située à quelques centaines de kilomètres de la surface de la Terre. Lors de la traversée de l’ionosphère, les signaux de navigation par satellites sont perturbés, ils subissent des réfractions ce qui entraîne des erreurs dans la mesure de la distance. Globalement, l’amplitude de cette erreur dépend du niveau d’activité solaire et de l’élévation du satellite au-dessus de l’horizon. Pour un satellite à basse élévation, disons 5◦ au-dessus de l’horizon, l’erreur affectant la mesure est environ trois à quatre fois plus importante que l’erreur affectant un satellite vu au zénith. Cette erreur est corrigée par le SBAS. Les effets de propagation troposphérique La troposphère est la partie inférieure de l’atmosphère où se produisent la plupart des phénomènes météorologiques. La propagation du signal dans cette région sera affectée par des conditions atmosphériques spécifiques (pression, température, humidité) ce qui modifie la vitesse de propagation des signaux. L’amplitude de cette erreur dépend également de l’élévation du satellite audessus de l’horizon. Pour un satellite à basse élévation, l’erreur affectant la mesure est environ dix fois plus grande que l’erreur affectant un satellite vu au zénith. Cette erreur est corrigée par le récepteur utilisateur à travers un modèle de correction décrit par le MOPS. La distorsion du signal Toute anomalie affectant la forme d’onde du signal de navigation peut avoir une incidence sur la détermination du temps de propagation dans le récepteur de l’utilisateur. Cette anomalie est détectée par le SBAS par l’introduction de récepteurs sol multi corrélateurs et une détection centralisée dans le centre de calcul.
Les systèmes d’augmentation par satellites
371
Les réflexions multiples Proche du récepteur, les signaux de navigation sont sujets aux réflexions par le sol ou par des objets proches (bâtiments, véhicules, etc.). Ces signaux réfléchis (indirects) se combinent avec les signaux directs et introduisent une déformation de la fonction de corrélation. Ainsi affecté, le récepteur peut accrocher et poursuivre le signal sur un pic de corrélation secondaire, ce qui introduit directement une erreur dans les mesures de distance effectuées. Ce sont des erreurs de trajets multiples qui affectent principalement la mesure de code. Ces erreurs sont traitées au niveau du récepteur au travers d’une fonction de lissage du code par la phase sur une durée spécifiée par le MOPS (100 secondes). Par ailleurs, l’erreur de multi trajets est bornée par un modèle du MOPS de même que l’erreur d’intégration du gradient ionosphérique. Le bruit thermique Arrivés au récepteur, les signaux de navigation ont des niveaux de puissance extrêmement faibles. Les mesures de pseudo-distance effectuées par le récepteur sont alors affectées par le bruit électromagnétique ambiant et en particulier par les signaux brouilleurs proches de la bande de fréquence utilisée pour la navigation. Cette erreur est bornée par un modèle défini dans le standard MOPS.
22.5
Génération des corrections SBAS L1
Comme on l’a vu, la fonction d’un système d’augmentation SBAS est de se « substituer » aux données de navigation GPS, que sont principalement la diffusion des éphémérides et les biais de synchronisation des horloges satellites, pour replacer l’utilisateur dans un environnement que le SBAS maîtrise, autrement dit où il est capable d’effectuer des opérations de contrôle et de calcul d’erreur résiduelles qui entachent les mesures de pseudo-distance après application des corrections SBAS, puis de délivrer des informations qui bornent ces erreurs résiduelles. Ces corrections viennent se rajouter aux données de navigation des satellites GNSS : ce sont des corrections différentielles. Afin de construire son contexte de navigation, le centre de calcul du SBAS effectue une restitution d’orbite (chapitre 20) et compare son calcul aux éphémérides diffusées dans les messages de navigation. En principe, ces corrections sont valables tout au long de la zone de diffusion du satellite géostationnaire. Cependant, en raison de la répartition géographique locale du réseau de stations sol, la précision de ces corrections se dégrade lorsqu’on s’éloigne du centre de la zone de service. Le centre de calcul effectue une synchronisation globale des horloges de chacune des stations de réception au sol et de chacun des satellites de la constellation. Cette synchronisation est référencée à une échelle de temps interne au SBAS qu’il est également en charge de construire et de maintenir. À partir des biais d’horloges satellites qu’il a calculés, le SBAS élabore des corrections d’horloge pour chaque satellite par rapport aux biais d’horloges radiodiffusés
372
Le temps dans la géolocalisation par satellites
dans les messages de navigation. Ces corrections sont également valables pour l’ensemble de la zone de diffusion du satellite géostationnaire (c’est-à-dire partout où le signal SBAS est reçu). Il faut noter que lorsqu’un utilisateur du système SBAS applique les corrections d’horloges satellites, il est automatiquement référencé dans l’échelle de temps du SBAS et non plus par rapport à la référence de temps de la constellation. Enfin, le centre de calcul élabore un modèle interne de distribution de TEC applicables sur la zone de service à partir duquel il construit des corrections qui compensent les perturbations de l’ionosphère sur les signaux de navigation. Cette fonction nécessite un réseau dense de stations sol sur la zone de service. Pour cette raison, le modèle ionosphérique diffusé par un SBAS n’est pas disponible pour l’ensemble de la zone de diffusion du satellite géostationnaire mais n’est fourni que pour une région centrée sur la zone de service. Ces trois séries de corrections sont ensuite discrétisées, encodées et diffusées aux utilisateurs afin d’améliorer la solution de navigation. Afin de limiter le nombre de bits à transmettre, les corrections d’orbites et d’horloges sont différentielles c’est-à-dire qu’elles ne remplacent pas les éphémérides et biais d’horloges satellites mais viennent se rajouter à elles. La correction ionosphérique est, par contre, une correction absolue. Il est utile de préciser que les systèmes GNSS (GPS et Galileo) diffusent dans leurs messages de navigation un modèle d’ionosphère simplifié. Il s’agit du modèle de Klobuchard pour le système GPS et le modèle empirique NeQuick développé par Radicella, Nava et Coïsson pour le système Galileo. Le modèle de Klobuchard est constitué de sept paramètres, rafraîchis journalièrement, qui permet de construire un modèle analytique mondial de corrections ionosphériques adapté aux usagers L1. Ce modèle est largement insuffisant pour corriger correctement le délai ionosphérique, typiquement ce modèle est capable de corriger entre 40 et 60 % des erreurs causées par l’ionosphère. Les SBAS diffusent un modèle qui est plus précis que celui de Klobuchard. Quoi qu’il en soit, un utilisateur monofréquence choisit le modèle qu’il applique, soit celui du SBAS soit celui de Klobuchard : lorsque les corrections SBAS sont disponibles l’utilisateur les applique automatiquement sur ces lignes de vues. Si les corrections SBAS sont indisponibles pour une ligne de vue donnée, il utilise alors le modèle de Klobuchard. Cependant, la possibilité d’utiliser le modèle de Klobuchar est limitée aux phases de vol en altitude, c’est-à-dire les modes “ en route ”. En mode approche (LNAV/VNAV ou LPV200), l’utilisation du modèle ionosphérique du SBAS est obligatoire.
22.6
Application des corrections SBAS L1
Chaque seconde, le système SBAS diffuse un message de 250 bits. Ce message est encodé sur la porteuse L1 de telle sorte qu’elle puisse être traitée par un
Les systèmes d’augmentation par satellites
373
récepteur comme un signal GPS. Le signal d’augmentation SBAS se différentie des autres messages GPS par un code PRN spécifique qui sont réservés aux systèmes SBAS : un code PRN (ou plusieurs) est (sont) réservé(s) pour chaque satellite géostationnaire du fournisseur de service SBAS. Les 250 bits par seconde sont à comparer aux 50 bits par seconde que diffusent tous les satellites GPS. Cela représente un débit trop faible pour diffuser la totalité des corrections SBAS ce qui implique un multiplexage temporel des corrections. Concernant l’envoi des corrections SBAS, l’idéal serait que l’utilisateur reçoive d’un seul coup toutes les corrections d’horloges et d’orbite car il pourrait ainsi les combiner de façon cohérente chaque seconde. Or, les amplitudes des corrections d’orbites et d’horloges sont telles que la bande passante ne permet pas de diffuser toute l’information nécessaire. Afin de gérer au mieux la bande passante, autrement dit de gérer la volumétrie de l’information diffusée, il a fallu définir une stratégie de diffusion la mieux adaptée possible pour garantir de bonnes performances de navigation. Ainsi, le standard MOPS fait la distinction entre les corrections ayant une évolution lente et celles à variabilités plus importantes, et va dédier des messages spécifiques pour chacun des deux types de corrections. Les erreurs d’orbites par exemple, sauf cas de manœuvre, évoluent lentement sur quelques dizaines de secondes et seront considérées comme des corrections « lentes ». Ce n’est pas le cas du comportement des erreurs d’horloges qui contiennent une variabilité court terme “ rapide ”. De plus, au moment de la conception des SBAS européen (EGNOS) et américain (WAAS), le département de la défense américaine (DoD) dégradait volontairement la précision du biais horloge diffusé dans le message de navigation (disponibilité sélective ou Selective Availability, SA). Il fallait donc prévoir des corrections d’horloge à fort taux de rafraîchissement, typiquement de l’ordre de six secondes. Afin d’insérer les informations sur le plus grand nombre de satellites possibles dans les messages d’augmentations, le standard MOPS prévoit de décomposer les corrections d’horloges en composantes à évolutions lentes et rapides. Le processus consiste à diffuser de temps en temps une correction d’horloge « moyenne », assortie de corrections relatives autour de cette moyenne, et envoyées à cadence élevée. La construction de la correction horloge lente δhsat s’obtient par exemple en traitant l la correction totale d’horloge δhsat par un filtre passe bas de façon à enlever les variations hautes fréquences. Par définition, les corrections d’horloges rapides représentent la différence entre la partie lente et la correction totale de l’horloge. δhsat = δhsat + δhsat l r .
(22.1)
sat et δhsat seront diffusées Pour un même satellite, les corrections lentes δ X l ensemble dans un message type dédié. La fréquence de rafraîchissement est de l’ordre de la centaine de secondes environ. Étant à évolution lente, il n’est donc pas nécessaire d’envoyer ces corrections pour tous les satellites visibles en même temps, elles peuvent être distribuées dans le temps et de façon asynchrone par satellite.
374
Le temps dans la géolocalisation par satellites
Il n’en va pas de même pour les corrections rapides d’horloge δhsat r . Pour ces corrections, on a besoin de les diffuser pour un maximum de satellites en même temps. On va donc les regrouper le plus possible et les envoyer aussi souvent que possible. Le standard MOPS permet d’envoyer ces corrections rapides par paquet de 13 satellites dans un même message. Ce chiffre est contraint par la bande passante maximale dont on dispose (250 bits par seconde). Par ailleurs, les corrections sont discrétisées avec une résolution de 12,5 cm. Pour pallier d’éventuelles variations rapides du biais d’horloge satellite, l’utilisateur n’applique pas directement le biais constant (δhsat r )courant , reçu à la date d’applicabilité t0f , jusqu’au prochain rafraîchissement Δt = t0f − t0f,pr´ec´edent plus tard mais il projette la valeur courante par une interpolation linéaire en utilisant une dérive des horloges basée sur la différence des deux dernières corrections rapides reçues. Il applique donc la correction : sat δhsat + RRC (t0f ) (t − t0f ) , (22.2) r (t) = δhr courant avec la valeur du RRC pour Range Rate Correction définie comme : RRC (t0f ) =
sat (δhsat r )courant − (δhr )pr´ ec´ edent
Δt
.
(22.3)
La validité du RRC cesse s’il n’y a pas de rafraîchissement de correction rapide pendant 8 secondes consécutives. L’utilisateur va donc apparier les dernières corrections rapides valides aux dernières corrections lentes valides.
22.6.1
Application de la correction d’horloge : calcul du temps d’émission et construction de la pseudo-distance
La correction d’horloge calculée par le SBAS se rajoute à la correction fournie par le système GPS. La correction d’horloge que l’utilisateur applique est donc la somme des deux : ΔtP1 + δhsat . (22.4) Ici la correction ΔtP1 (décrit au §9.2) est celle qui est construite avec les données GPS selon les prescriptions données par le document d’interface OSGPS-200 (ΔtP1 = ΔtPc − TGD ). Elle correspond au biais de temps qu’il faut appliquer au temps propre d’émission τ sat pour retrouver le temps d’émission du signal P1, en référence de temps GPS, au centre de phase de l’antenne. Il faut remarquer que le système SBAS est dédié aux utilisateurs civils et non militaire : ces utilisateurs civils utilisent les signaux C/A et pas les signaux P1. Formellement, il faudrait appliquer les ISC (définies en §9.29.3) pour retrouver un temps d’émission qui corresponde vraiment aux signaux C/A. Pourtant ce n’est pas ce qui est fait car c’est la correction SBAS qui contient implicitement cette correction. Le temps propre d’émission τ sat est corrigé par le biais total : τ sat − ΔtP1 + δhsat . (22.5)
Les systèmes d’augmentation par satellites
375
On introduit dans la correction d’horloge SBAS les composantes lentes et rapides : . (22.6) + δhsat τ sat − ΔtP1 + δhsat l r L’utilisateur définit le temps d’émission du signal en utilisant uniquement la correction lente δhsat : l . tsat = τ sat − ΔtP1 + δhsat l
(22.7)
Appliquant cette correction, l’utilisateur n’est plus référencé dans la base de temps GPS mais dans la base de temps du SBAS. On remarque ici que l’on n’a utilisé que la partie lente de l’horloge pour corriger le temps d’émission. Ce choix résulte du fait que l’utilisateur va apparier le calcul de la correction d’orbite du satellite, qui est une correction lente, en utilisant la correction d’horloge lente, les deux corrections étant diffusées dans le même message. La correction rapide est appliquée dans un second temps, directement dans la pseudo-distance. L’utilisateur construit sa pseudo-distance avec ce temps d’émission tsat corrigé : (22.8) P R = c τrec − tsat .
22.6.2
Correction de la pseudo-distance
L’utilisateur va corriger ses pseudo-distances en combinant les corrections d’horloges rapides, les retards ionosphérique et troposphérique de la façon suivante : P RC = P R + δhsat (22.9) r + e + T, où P R note la mesure de ce code P R lissée par la mesure de phase telle que décrite dans le paragraphe 7.4, P RC note la pseudo-distance corrigée. L’utilisateur qui applique le modèle du MOPS calcule le délai ionosphérique e projeté le long de la ligne de visée satellite-utilisateur. Le système SBAS ne diffuse pas de correction troposphérique : chaque utilisateur calcule son erreur propre en utilisant un modèle défini par le standard MOPS. En effet, ce retard dépend de plusieurs paramètres thermodynamiques comme la température, la pression mais également du taux d’humidité de l’air. Ces données sont à variabilités locales ce qui les rend impossibles à calculer et à diffuser par le système SBAS.
22.6.3
Correction de l’orbite du satellite au temps d’émission corrigé
sat (tsat ) est calculée à l’aide des éphémérides radioLa position du satellite X diffusées tels que décrits au paragraphe 11.2 au temps d’émission corrigé sat au temps tsat . L’utilisateur calcule ensuite la correction d’orbite SBAS δ X
376
Le temps dans la géolocalisation par satellites
Fig. 22.2 – Schéma d’ensemble des applications combinées des corrections d’orbite et d’horloge. Dans cette représentation, seule la dimension radiale est représentée.
d’émission corrigé : δX
sat
t
sat
⎞ ⎞ ⎛ δ x˙ δx = ⎝ δy ⎠ + ⎝ δ y˙ ⎠ tsat − t0 . δ z˙ δz ⎛
(22.10)
L’utilisateur effectuera son calcul de point en utilisant la position du satellite sat (tsat ) + δ X sat (tsat ). recalée par la correction SBAS c’est-à-dire : X Il ne reste plus à l’utilisateur qu’à traiter les mesures corrigées pour cal rec (trec ) tel que décrit au chapitre 11 et son biais culer son positionnement X d’horloge hrec . Le schéma d’ensemble est donné en figure 22.2.
22.7
Compensation partielle des erreurs d’orbites et d’horloges
L’erreur d’horloge δhsat diffusée est une valeur scalaire, c’est-à-dire qu’elle est la même pour tous les utilisateurs quelle que soit leur position géographique. sat est une erreur vectorielle avec une composante sur L’erreur d’orbite δ X les trois axes (x, y, z) du repère terrestre WGS84. Elle se répercute sur l’utilisateur comme la projection de ce vecteur d’erreur sur la ligne de visée satelliteutilisateur. Par conséquent, l’erreur effectivement subie par un utilisateur varie en fonction de sa position géographique. Or, le monde de la navigation a ceci de « magique », que les erreurs se compensent partiellement. L’erreur d’horloge compense donc partiellement l’erreur d’orbite. Mais comme on l’a vu ci-dessus, l’une des erreurs est scalaire et l’autre est vectorielle. La compensation d’une erreur par l’autre est donc plus ou moins
Les systèmes d’augmentation par satellites
377
bonne en fonction de l’étendue de la zone géographique à couvrir et de la position géographique de l’utilisateur à l’intérieur de celle-ci. Du point de vue utilisateur et des performances de précision de localisation attendu en utilisant les messages de correction SBAS, il n’est pas indispensable (même si cela est naturellement souhaitable) de disposer de corrections d’orbites et d’horloges les plus précises possibles chacune séparément. Le plus important pour l’utilisateur est que les deux corrections combinées ensembles produisent la meilleure performance possible sur toute la zone de service.
22.8
Application des marées terrestres
Les positions « vraies » des stations de références ne sont pas fixes en repère terrestre ITRF ou WGS84. Elles sont principalement affectées par les marées terrestres qui provoquent des variations de position dans la direction verticale, à période de 12 heures, avec des amplitudes allant de 20 à 50 cm. Des organismes de géodésie comme la NMA (Norwegian Mapping Authority) sont chargés de définir les positions de références des points que l’on considère, ici les stations de réception GNSS. Dans la plupart du temps, la position géodésique du récepteur en repère ITRF ou WGS84 correspond à une position sur la croûte terrestre moyenne. La vraie position ajoute à ces coordonnées la correction de position du géocentre, les effets des marées plus les différents effets de charges. Le calcul d’orbite que réalise le centre de calcul du SBAS doit prendre en compte l’effet des marées terrestres pour corriger la position des stations de référence ainsi que le potentiel terrestre. Ces corrections permettent de réduire les erreurs de modélisation de la mesure GNSS et donc une meilleure estimation de la position des satellites dans le référentiel inertiel, puis en référentiel terrestre WGS84 par conversion. La question se pose pour le calcul des horloges rapides qui fait l’objet d’un traitement dédié. Supposons que, pour ce calcul, la position des stations de référence soit corrigée des marées terrestres. L’effet des marées terrestres ne se voit plus dans les résidus de mesures (les résidus sont ce qui reste quand on ôte des mesures réelles les mesures théoriques construites sur un modèle) et les horloges satellites estimées par le centre de calcul correspondent uniquement aux corrections du temps propre à bord. Si on calcule la position d’une station de référence avec les mesures GNSS et les corrections d’orbites et d’horloges SBAS assemblées, alors on verra que la position de la station évolue dans le temps, dans le WGS84, et ceci en cohérence avec les corrections de marées que l’on a appliquées. A contrario, un utilisateur fixe dans le WGS84 qui ferait un calcul de positionnement avec ces corrections trouverait une position effectivement fixe. Maintenant si on s’intéresse à l’avion, l’application des corrections SBAS fournira une position dans le WGS84 sans connaissance des marées terrestres. L’utilisateur avionique aura alors besoin de savoir, via un modèle, s’il atterrit à marée haute ou à marée basse car la position de la piste évolue par rapport au
378
Le temps dans la géolocalisation par satellites
WGS84 selon la marée. Une fois l’avion en stationnement, sa position calculée avec les corrections SBAS évoluera dans le temps. Supposons maintenant que l’on ne prenne pas en compte les effets des marées terrestres dans la position des stations de référence. Autrement dit on utilise, pour chaque station, une position moyenne et fixe par configuration. Le défaut de modélisation des mesures GNSS va se retrouver dans les résidus de mesures et au final dans les corrections d’horloges des satellites diffusées par le SBAS. Si on fait un calcul de positionnement d’une station de référence avec les corrections SBAS, on trouvera une position fixe dans le WGS84. Cela signifie que l’utilisateur aéronautique trouvera également des coordonnées fixes lorsqu’il est au sol : il ne voit pas les marées. Il n’est donc pas nécessaire de dire aux avions si leur procédure d’approche se fait à marée haute ou basse. Par contre, un point fixe dans le WGS84 qui ferait un calcul de positionnement avec ces corrections trouverait une position qui varie en fonction des marées. Maintenant, le besoin de l’utilisateur aéronautique est d’avoir une position relativement au sol plutôt qu’une position réelle dans le WGS84. Les standards aéronautiques demandent que le positionnement de l’avion soit donné dans le repère WGS84 mais ils restent silencieux au sujet des marées terrestres. D’autre part, aucun modèle de marées terrestres n’est décrit dans le standard récepteur MOPS. Cela milite pour que le calcul des corrections d’horloges satellites SBAS se fasse sans prendre en compte les marées terrestres. En utilisant les corrections d’un tel SBAS, un récepteur au sol trouve effectivement une position fixe, alors que sa « vraie » position bouge dans le WGS84. La position produite n’est pas la position réelle en WGS84 mais peut s’interpréter comme la position de référence pardessus laquelle il faut rajouter les marées terrestres pour avoir la position réelle. Cette approche et ce raisonnement ne sont valides que pour des zones géographiques restreintes où la déformation de la croûte terrestre par les marées se comporte sensiblement comme un décalage plan. En effet, c’est seulement sous cette hypothèse que l’effet des marées peut être absorbé par les corrections d’horloges satellites. Par conséquent, cela pose une limitation sur un réseau de stations SBAS constitué de sites dont certains seraient à marée haute alors que d’autres seraient à marée basse. Dans ce cas, l’absence d’un modèle de marée terrestre va engendrer des erreurs résiduelles qu’un SBAS ne pourra pas rattraper, avec comme conséquence une augmentation des niveaux d’intégrité, notamment avec le paramètre UDRE (voir section 22.10).
22.9
La correction du retard ionosphérique d’EGNOS
La couche ionosphérique est soumise à des phénomènes physiques complexes faisant intervenir des recombinaisons rapides de paires iono-électrons. Son effet
Les systèmes d’augmentation par satellites
379
+
Fig. 22.3 – Construction de la fonction de rabattement F = 1/cosχ. sur les signaux GNSS correspond à un délai additionnel sur la mesure de pseudo-distance qui doit être corrigé par un utilisateur mono-fréquence. Le SBAS diffuse des informations permettant à l’utilisateur de construire cette correction. Comme le volume des données à transmettre est nécessairement limité, le SBAS effectue une compression de l’information de retards causés par l’ionosphère. Pour faire cette compression, le standard MOPS considère que la totalité de l’effet de l’ionosphère sur les signaux GNSS se concentrent sur une couche infiniment fine située à 350 km d’altitude. Par ailleurs, le standard prévoit également de n’envoyer uniquement que des délais verticaux c’est-à-dire des délais qui s’appliquent aux lignes de vue orthogonales à la couche ionosphérique. Le standard prévoit ainsi une fonction de rabattement F qui permet de projeter un délai vertical ve en délai oblique e en fonction de l’élévation locale de la ligne de visée selon la formulation : e = F.ve.
(22.11)
La fonction de rabattement se construit avec l’angle zénithal χ entre le point de percée P et le satellite S. ve = cos χ · e.
(22.12)
Le sinus de l’angle zénithal se calcule facilement en considérant le triangle rectangle POQ de la figure 22.3.
380
Le temps dans la géolocalisation par satellites
sin χ =
R. cos El , R+h
(22.13)
où : R : est le rayon équatorial de la Terre ; h : est la hauteur de la couche ionosphérique supposée infiniment fine ; El : est l’élévation de la ligne de vue en radians. La relation cos2 χ + sin2 χ = 1 permet de trouver l’expression de la fonction de rabattement F : 2 − 12
1 R cos El F = . = 1− cos χ R+h
(22.14)
La fonction de rabattement est d’autant plus représentative que l’ionosphère présente une homogénéité isotrope et que les élévations sont fortes. La première compression consiste à « écraser » toute l’épaisseur de la couche ionosphérique sur une membrane sphérique autour de la Terre. La seconde compression va consister à discrétiser la membrane sphérique en points (ou pixels) espacés de 5◦ par 5◦ de façon à former une grille carrée homogène. Les points de ces grilles sont appelés IGP pour Ionospheric Grid Point. Le SBAS diffuse le délai ionosphérique vertical relativement au signal L1 sur chaque point de la grille utilisable par un usagé situé dans la zone de service du SBAS. L’utilisateur récupère cette grille de données et l’applique à chacune de ses lignes de vues pour en extraire sa correction propre. Pour cela, l’utilisateur calcule les coordonnées du point de percement à l’intersection de la ligne de vue qu’il cherche à corriger avec la couche fine située à 350 km. Ayant localisé ce point de percement en longitude et latitude, l’utilisateur identifie le plus petit carré (ou à défaut le triangle) de la grille qui le contient. La dernière opération consiste à interpoler au point de percement les délais verticaux vei données aux quatre (ou trois) points de grille qui délimitent le carré (respectivement le triangle), puis à projeter ce délai vertical interpolé dans la direction de la ligne de visée au moyen de la fonction de rabattement. L’UISD pour User Ionospheric Slant Delay et l’UIVD pour User Ionospheric Vertical Delay sont donnés par interpolation linéaire : U IV D =
4
wi × vei ,
(22.15)
i=1
U ISD = F.U IV D.
(22.16)
Les poids sont donnés par un développement polynomial selon lequel la dérivée partielle selon une coordonnée est indépendante de celle-ci (l’interpolation est linéaire selon une coordonnée fixée) : wi (x, y) = ai,1 + ai,2 x + ai,3 y + ai,4 xy,
(22.17)
Les systèmes d’augmentation par satellites
381
Fig. 22.4 – Interpolation au point de percé IPP utilisateur à partir des quatre points de grille IGP. où x est l’écart de longitude entre le point de percement et les points de grilles impliqués dans le calcul situés à l’ouest et y l’écart de latitude par rapport aux points de grilles situés au sud. En posant que la valeur de chaque poids vaut 1 sur le point de grille associé et 0 sur tous les autres, on résout un système d’équations à quatre inconnues (les coefficients ai,j) où j = 1,· · · ,4) et quatre équations (une pour chaque sommet i du carré) pour arriver aux expressions suivantes : w1 = xy,
w2 = (1 − x) y,
w3 = (1 − x) (1 − y) ,
w4 = x (1 − y) . (22.18) Le point de percée entre une ligne de vue et la couche fine est appelé IPP pour Ionospheric Pearce Point (voir la figure 22.4). Parfois seuls trois points de grille sont disponibles pour interpoler le délai vertical au point de percement. La formule d’interpolation se dérive alors sous la forme ; 3
U IV D = wi × vei . (22.19) i=1
Avec comme poids : w1 = y,
22.10
w2 = 1 − x − y,
w3 = x.
(22.20)
La notion d’intégrité
Dans son acception générale, l’intégrité est une mesure du niveau de confiance dans l’exactitude des informations fournies par l’ensemble du système. La notion d’intégrité englobe l’aptitude d’un système à fournir, en temps voulu, des avertissements valides (autrement dit des alarmes).
382
Le temps dans la géolocalisation par satellites
Chaque système SBAS a pour fonction de se construire son propre contexte de navigation (calcul des orbites et horloges de chaque satellite de la constellation, calcul d’un modèle de distribution de TEC) et de ramener l’utilisateur dans ce contexte de navigation par l’envoi de corrections différentielles sur les messages de navigation radiodiffusés par le système GPS. Ainsi, le SBAS surveille en permanence l’état de la constellation à partir des mesures qu’il collecte au moyen de son propre réseau de récepteurs sol. Le SBAS est donc capable de détecter les erreurs où les pannes du système GPS et de transmettre à l’utilisateur soit des corrections appropriées soit des alarmes lui signifiant de ne pas utiliser tel ou tel satellite ou point de grille IGP.
22.10.1
UDRE
Le système SBAS doit fournir aux utilisateurs un moyen de calculer un intervalle de confiance sur la projection sur la ligne de vue d’un satellite de l’erreur entre les positions et horloge réelles des satellites et les positions et horloge calculées par le SBAS. Cet intervalle de confiance s’appelle l’UDRE pour User Differential Range Error. L’intégrité renvoie à la notion de confiance que l’utilisateur peut avoir dans le calcul de position. L’intégrité comprend donc à la fois la capacité du système à fournir des intervalles de confiance (UDRE) ainsi que des alarmes, dans un temps borné, en cas d’anomalies. Les données d’intégrité que diffuse un SBAS sont en fait les variances d’une loi de probabilité qui majore la distribution des erreurs résiduelles non modélisées. Le standard MOPS fait l’hypothèse que la distribution de ces erreurs 2 suit une loi normale (§A.4.1 du MOPS) dont la variance est notée σUDRE . Le MOPS spécifie la formule de calcul de l’UDRE utilisateur pour un satellite par l’expression : U DRE = 3, 29 × σUDRE × δU DRE.
(22.21)
L’UDRE utilisateur est obtenu comme le produit de deux termes. Le σUDRE est une valeur scalaire rafraîchie à intervalles réguliers et spécifiés (au plus toutes les 6 secondes dans EGNOS). Le terme d’incrément δUDRE est un facteur multiplicateur qui peut se formuler de deux façons différentes. La première est de définir une valeur spécifique par zone géographique spécifique. Par exemple, EGNOS V2 impose une valeur d’incrément à 1 pour un utilisateur se situant dans la zone de service, et 100 pour un utilisateur hors de cette zone. Ce faisant, l’écart-type σUDRE doit être construit de telle sorte qu’il borne les erreurs résiduelles d’orbite et d’horloge non modélisées de tous les utilisateurs. En particulier, cette valeur doit borner la pire erreur résiduelle, appelée SREW pour Satellite Residual Error Worst, vue par un utilisateur de la zone de service. La figure 22.5 illustre le concept d’intégrité applicable pour chaque satellite. La seconde méthode consiste à distribuer, à intervalles réguliers, une matrice P de covariance 4 × 4 des erreurs résiduelles de position et horloge
Les systèmes d’augmentation par satellites
383
Fig. 22.5 – Le modèle d’intégrité diffusé à l’utilisateur doit borner la pire erreur résiduelle non modélisée (et donc inconnue).
pour le satellite en question. le terme δU DRE se calcule alors selon la formule décrite par les standards : √ δU DRE = I T P I + εC . (22.22) Le vecteur I est un quadrivecteur dont les trois premières composantes sont le vecteur unitaire de la ligne de vue orienté dans le sens utilisateur vers satellite, et la dernière contient 1 correspondant au paramètre horloge.
I=
t xsat − xuser ysat − yuser zsat − zuser , , ,1 . r r r
(22.23)
Le terme additionnel εC compense les erreurs de discrétisation de la matrice de covariance. √ Mathématiquement, le terme I T P I permet d’obtenir l’intervalle de confiance à 1 sigma de l’erreur sur la ligne de vue comme l’illustre la figure 22.6. L’utilisation de la matrice de covariance des erreurs présente l’avantage d’avoir un calcul d’intervalle de confiance sur la ligne de vue qui dépend de la position de l’utilisateur. Sans cette matrice, une seule valeur est transmise par satellite, le σUDRE . Aussi, pour être sûr de couvrir l’erreur pour tous les utilisateurs dans la zone de service, le σUDRE doit être calculé pour couvrir
384
Le temps dans la géolocalisation par satellites
Fig. 22.6 – Projection des erreurs d’orbite et d’horloge représentée par l’ellipsoïde de confiance sur la ligne de vue utilisateur vers satellite.
l’utilisateur ayant la pire projection de l’erreur, ce qui est surdimensionné pour les autres utilisateurs.
22.10.2
GIVE
L’intégrité à chaque point de grille ionosphérique est contenue dans l’information GIVE = 3.29 × σGIVE. Cette valeur est construite de façon à borner les erreurs résiduelles d’estimation de délai ionosphérique verticales à l’IGP pour le signal L1, en supposant que celles-ci suivent une loi normale de variance 2 σGIV E (§A.4.1 du MOPS). En effet les corrections ionosphériques diffusées par le SBAS contiennent inévitablement un certain niveau d’incertitude car l’estimation effectuée n’est pas parfaite : – le retard estimé est affecté par le bruit de mesure et par les insuffisances de la méthode de calcul employée ; – le modèle d’ionosphère à couche mince ne peut pas représenter complètement l’ionosphère réelle ; – la fonction d’interpolation du MOPS génère des erreurs lors de la reconstruction des délais verticaux ; – la fonction de rabattement n’est pas parfaitement exacte, surtout à basse élévation. Le GIVE associé à la correction ionosphérique sur chaque IGP représente une protection vis-à-vis de trois principales contributions différentes : – il protège les utilisateurs vis-à-vis des erreurs d’estimation, contenant le niveau de bruit de mesure ainsi que les erreurs de modélisation. Cette contribution est associée à une distribution normale des erreurs ; – il protège les utilisateurs des limitations imposées par le modèle MOPS. Cette contribution doit borner les erreurs d’interpolation provenant des
Les systèmes d’augmentation par satellites
385
formules MOPS qui suppose que l’ionosphère évolue quadratiquement au-dessus de chaque carré de la grille IGP ; – il protège les utilisateurs contre les irrégularités anormales de l’ionosphère pouvant se déployer sur de petites échelles spatiales et évoluant plus ou moins rapidement dans le temps. En particulier, l’ionosphère peut souffrir d’irrégularités locales à court terme qui sont insuffisamment échantillonnées par les mesures que fournissent les stations au sol. Cette contribution est une contre-mesure à des événements sporadiques et fugitifs de l’ionosphère tels que la compression ou la déplétion de la concentration électronique mais également de l’amplitude de la turbulence. À partir des données d’intégrité GIVE fournies aux IGP, l’utilisateur calcul la borne UIRE = 3,29 × σUIRE qui couvre l’erreur UISDerr de la correction ionosphérique UISD le long de la ligne de vue. L’UIRE pour User Ionospheric Residual Error et l’UIVE pour User Ionospheric Vertical Error sont donnés par les formules : 4
2 2 σUIV E = wi × σi,GIV (22.24) E, i=1 2 2 = F 2 × σUIV σUIRE E.
(22.25)
Le système SBAS est également équipé d’une fonction de surveillance des données d’intégrité UDRE et GIVE qu’il diffuse.
22.10.3
Caractérisation de l’intégrité
L’intégrité est caractérisée par les quatre paramètres suivants que sont : 1. la limite d’alarme ; 2. le délai d’alarme ou TTA pour Time To Alarm ; 3. les niveaux de protection ; 4. le risque d’intégrité. La limite d’alarme est la valeur de l’erreur maximale de position autorisée. C’est une limite au-delà de laquelle la valeur mesurée d’un paramètre donné provoque le déclenchement d’une alarme. Cette limite dépend de la phase de vol. On décompose la limite d’alarme en limite d’alarme horizontale (HAL, Horizontal Alarm Limit) et en limite d’alarme verticale (VAL, Vertical Alarm Limit). Ces deux limites définissent un volume d’alarme sous la forme d’un cylindre centré sur la vraie position (mais inconnue) de l’utilisateur (représentation en figure 22.7). Le délai d’alarme est l’intervalle de temps maximal admissible entre le moment où le système de navigation dépasse les limites de tolérance et le moment où l’équipement donne l’alarme. Autrement dit, c’est le temps écoulé entre l’instant où l’erreur de positionnement utilisateur n’est plus bornée par la limite d’alarme et l’instant où cette erreur se retrouve à nouveau en dessous
386
Le temps dans la géolocalisation par satellites
de la limite d’alarme. Le délai d’alarme ne sera jamais inférieur à une valeur contrainte par le système SBAS car il faut un certain temps incompressible entre le moment où un événement de non-intégrité survienne et le moment où il est détecté par le système SBAS puis celui où l’utilisateur reçoit les informations du SBAS qui le replace dans une situation intègre. Les niveaux de protection sont les limites de fiabilité supérieures relatives à l’erreur de position GNSS. Ils sont construits par l’utilisateur d’après des modèles des composantes des erreurs dans le domaine de la pseudo-distance, qui sont des distributions normales indépendantes à moyenne nulle. L’utilisateur calcule des niveaux de protection dans les directions horizontale (HPL, Horizontal Protection Level) et verticale (VPL, Vertical Protection Level). Ces deux niveaux définissent également un volume de protection en forme de cylindre centré sur la vraie position (mais inconnue) de l’utilisateur (représentation en figure 22.7). Le risque d’intégrité est la probabilité, au cours de la période de fonctionnement du système, qu’une erreur, quelle qu’en soit la source, puisse entraîner une erreur de positionnement dépassant la limite d’alarme, sans que l’utilisateur soit informé dans le délai d’alarme imparti. Ces définitions seront précisées dans une section dédiée. Pour un service d’approche à guidage vertical, les valeurs associées à ces paramètres sont les suivants : Critères Limite d’alarme en vertical Limite d’alarme en horizontal Délai d’alarme Risque d’intégrité
Approche APV-I 50 m
Approche CAT-I 10 m
Approche CAT-II 4.4 m
40 m
40 m
17.9 m
6s 2 × 10−7 par 150 secondes
6s 2 × 10−7 par 150 secondes
1.5−2.5 s 1 × 10−9 par 150 secondes
Les procédures de niveaux APV-I (Approach with Vertical guidance) et CAT-I permettent des approches de précision pour des hauteurs de décision supérieures ou égales à 250 et 200 pieds respectivement (environ 75 et 60 mètres). La hauteur de décision correspond à la hauteur par rapport à la piste à laquelle la décision de remise de gaz ou de poursuivre l’atterrissage est prise. Le SBAS européen EGNOS mono-fréquence permet des approches de niveau APV-I mais pas de niveau CAT-I car la limite d’alarme est trop restrictive pour rendre le service disponible. Un service intermédiaire a été défini correspondant aux niveaux de performance des approches de type ILS CAT-I (Instrument Landing System). Il s’agit du service LPV200 (Localizer Performance with Vertical guidance pour des hauteurs de décision supérieures ou égales à 200 pieds) qui définit les limites d’alarmes verticales et horizontales à 35 m et 40 m, respectivement. Pour se rapprocher de la contrainte CATI dans le vertical (VAL à 10 mètres), on ajoute à l’exigence de disponibilité
Les systèmes d’augmentation par satellites
387
LPV200, une exigence sur la queue de distribution des erreurs de position dans la direction verticale, en demandant que le système puisse garantir que la probabilité que l’erreur de position verticale dépasse 10 mètres (correspondant au VAL CAT-I), dans des conditions nominales, soit inférieure à 10−7 par approche (soit 150 secondes). En présence d’événements redoutés, l’exigence est ramenée à 15 mètres avec la probabilité de 10−5 par approche.
22.11
La construction des volumes de protection
L’erreur de positionnement GNSS est l’écart entre la position vraie et celle qui est déterminée par le récepteur GNSS. Selon le standard SARPS (OACI), les niveaux de protections sont les limites de fiabilité supérieures relatives à l’erreur de position GNSS. Ils sont construits par l’utilisateur d’après des modèles des composantes des erreurs (dans le domaine de la pseudo-distance), qui sont des distributions normales indépendantes à moyenne nulle. Les volumes de protection sont construits de façon à borner les erreurs de positions à la probabilité souhaitée (1 − α), avec α = 10−7 sur n’importe quel intervalle de 150 secondes pour les approches à guidage verticaux. La distribution des erreurs résiduelles non modélisées orbite horloge, ainsi que les erreurs résiduelles de délais verticaux aux IGP sont supposés suivre une loi normale (§A.4.1 du MOPS). On construit ces volumes de protection à l’aide de la covariance des erreurs de positionnement et de synchronisation. Cette matrice de variance-covariance C de dimension 4 contient toute la structure de ces erreurs. On lui associe l’ellipsoïde de confiance définie par l’équation XC−1 X t = k 2 . La matrice C définit la forme et l’orientation de l’ellipsoïde tandis que le coefficient de dilatation k définit son volume. Ce volume dépend de la probabilité (1 − α) pour laquelle l’ellipsoïde, centré sur la position estimée, contient la position vraie. Plutôt que de considérer un ellipsoïde de dimension trois, les standards définissent un majorant sous la forme d’un cylindre construit en bornant indépendamment les erreurs dans les directions verticales et dans le plan horizontal. Selon ce standard, chacune des trois composantes (x1 , x2 , x3 ) de l’erreur suivent des lois normales centrées indépendantes par hypothèse. 2 Lors du calcul de position, l’utilisateur va interpréter les variances σUDRE 2 et σUIRE comme un certain niveau de confiance à accorder sur les données de correction. Pour chaque ligne de vue, l’utilisateur va écrire l’équation d’intégrité qui consiste à assembler de façon quadratique les différentes variances correspondant aux différents postes d’erreurs et fournir l’UERE pour User Equivalent Range Error : 2 2 2 2 σUERE = σf2 lt + σUIRE + σair + σtropo .
(22.26)
La variance σf2 lt correspond au majorant des erreurs résiduelles non modélisées orbite horloge contenues dans le terme U DRE, affecté des différentes dégradations prévues par le standard. 2 La variance σUIRE correspond au majorant des erreurs de correction ionosphérique défini plus haut.
388
Le temps dans la géolocalisation par satellites
2 2 2 2 = σnoise + σmultipath + σdivg correspond à la somme des La variance σair 2 ), le variances des erreurs de mesures causées par le bruit thermique (σnoise 2 2 multitrajet (σiultipath ), et l’intégration des erreurs ionosphériques (σdivg ) sur la durée de l’intervalle de lissage code par phase. Enfin, l’utilisateur applique cette équation pour pondérer chaque mesure qu’il utilise pour son calcul de localisation, c’est-à-dire attribuer plus de poids aux mesures auxquelles on accorde plus de confiance dans les corrections apportées. En cumulant toutes les mesures participant au calcul du positionnement on construit la matrice des poids :
⎛
1 2 σ1,U ERE
⎜ Γ =⎜ ⎝
⎞
0 ..
1
0
⎟ ⎟. ⎠
.
(22.27)
2 σm,U ERE
La méthode des moindres carrés fournie l’estimation : −1 t A Γ b. pˆ = At Γ A
(22.28)
L’erreur d’estimation e s’écrit : −1 t −1 t A Γ b − p = At Γ A A (Γ Ap + ) − p e = pˆ − p = At Γ A −1 t t A Γ . (22.29) = A ΓA Cette erreur d’identification dépend : −1 – de la géométrie au moyen de la formulation C = (At Γ A) contenant le DOP ; – du poids des mesures au moyen de la matrice Γ ; – des erreurs des mesures ε La matrice des erreurs d’identification s’écrit : ⎛
d2east ⎜ dEN C=⎜ ⎝ dEU dET
dEN d2north dN U dET
dEU dN U d2up dUT
⎞ dET dET ⎟ ⎟. dUT ⎠ d2T
(22.30)
Le calcul des éléments de la variance-covariance peut également se faire par la somme de carrés via la matrice S définie par : ⎛
seast,1 ⎜ snorth,1 S=⎜ ⎝ sup,1 sT,1
seast,2 snorth,2 sup,2 sT,2
⎞ · · · seast,m · · · snorth,m ⎟ ⎟ = At Γ A −1 At Γ . ⎠ ··· sup,m ··· sT,m
(22.31)
Les systèmes d’augmentation par satellites
389
Avec cette formulation, la covariance cov (e) de l’erreur s’écrit cov (e) = SΓ−1 S t ce qui fournit : d2east =
m
d2north = d2EN =
2 s2east,i σi,UERE
i=1 m
i=1 m
i=1
2 s2north,i σi,UERE
.
(22.32)
2 seast,i snorth,i σi,UERE
Pour construire les volumes de protection, on décompose la structure des erreurs de positionnement en erreurs horizontales eH et erreurs verticales eV ce qui revient à considérer les sous-matrices extraites suivantes :
2 deast dEN , (22.33) CEN = dEN d2north CV = d2up .
(22.34)
Pour la direction horizontale, c’est-à-dire le plan tangent à l’ellipsoïde en repère WGS84, la matrice de covariance fournie canoniquement une ellipse de confiance E (voir chapitre 11.6) définie par l’ensemble : E (k) = X ∈ R2 |||X||C −1 = k 2 . (22.35) EN
√ La norme ||X||M = X t M X est celle définie au paragraphe 21.2. Cette ellipse contient les erreurs horizontales telles que : P (eH ⊂ E (k)) = 1 − α.
(22.36)
Géométriquement, cette ellipse est le lieu de coupure entre le graphe de la densité de probabilité f (X) de deux variables aléatoires, chacune suivant une loi normale, et le plan horizontal solution de l’équation f (X) = k. C’est l’ensemble des points de la distribution X ayant une densité de probabilité identique. Les axes d’inertie de l’ellipse sont portés par les vecteurs propres, rangés en colonne dans la matrice U définie par : CEN = U ΛU t .
(22.37)
La matrice U est orthogonale pour la norme euclidienne et Λ est la matrice diagonale des valeurs propres, Λ = diag (λ1 , λ2 ), λ1 > λ2 . Si la variable aléatoire X suit une loi normale centrée de covariance cov (eH ) alors : t – la variable aléatoire Y = (y1 , y2 ) = U t X, qui correspond à une rotation de la variable X suit√une loi normale centrée de covariance Λ, on a donc √ σy1 = λ1 et σy2 = λ2 . Les écarts-types σy1 et σy2 sont respectivement le demi-grand axe et le demi petit axe de l’ellipse standard définie par k = 1;
390
Le temps dans la géolocalisation par satellites
– la variable aléatoire Z définie par Z = Y t Λ−1 Y suit une loi de Chi2 à deux degrés de liberté ; √ – la variable aléatoire R définie par R = λ1 Z = y12 + λλ12 y22 , la somme de carrés des variables aléatoires, y1 pour l’une et λλ12 y2 pour l’autre, √ suit une loi de Rayleigh de paramètre λ1 . Dans le cas où λ1 = λ2 alors la norme euclidienne de X, notée ||X||, suit une loi de de Rayleigh √ de √ paramètre λ1 . Dans ce cas seulement l’ellipse est un cercle C λ1 k √ de rayon λ1 k. Le volume de protection dans la direction verticale est défini par : V P L = KV dup .
(22.38)
Le volume de protection dans le plan horizontal est donné par l’expression : HP L =
KH,N P A dmajor , KH,P A dmajor
dmajor =
λ1 .
(22.39)
(22.40)
Pour les modes d’approche sans précision (En route) l’erreur horizontale doit être bornée avec l’hypothèse pire cas où les demis grand et petit axes de l’ellipse sont égaux. Le domaine considéré n’est donc plus une ellipse mais un cercle. L’erreur est alors caractérisée par une distribution de Rayleigh. En pratique, on considère la distribution de paramètre 1 avec un risque d’intégrité correspondant à la probabilité α = 5 × 10−9 par échantillon indépendant, ce qui fournit pour le paramètre KH,N P A la valeur 6,18. Pour les modes d’approche à guidage vertical (APV, CAT), les valeurs KH,P A et KV sont choisies à 6 et 5, 33, respectivement. Ces valeurs correspondent aux probabilités respectives de 2 × 10−9 et 10−7 en supposant que l’erreur soit caractérisée par une distribution normale. Dans le domaine horizontal, une seule dimension est utilisée, celle pire cas qui se trouve dans la direction de la trajectoire suivie, et dont l’erreur de position dans cette direction est distribuée selon y1 N (0,λ1 ). La figure 22.7 illustre le concept d’intégrité appliqué à l’utilisateur (ici l’aviation civile) qui recouvre deux situations. La première est que l’erreur de position soit contenue à l’intérieur des volumes d’Alarmes. La seconde est de pouvoir alerter l’utilisateur en temps donné (le délai d’alarme) dès que l’erreur de positionnement dépasse le volume d’alarme. Ces alarmes concernent soit un satellite (ou un groupe de satellites), soit un point de grille ionosphérique (ou un groupe de points), et l’utilisateur calcule sa position sans ces satellites ou points de grilles. Ces alarmes sont censées identifier la cause de cette erreur de positionnement, ce qui permet à l’utilisateur de rester confiner dans le volume d’alarme. Avec ce concept, l’utilisateur peut fugitivement être à l’extérieur du volume d’alarme le temps du délai d’alarme.
Les systèmes d’augmentation par satellites
391
Fig. 22.7 – Volumes de protection et d’alarme autour d’un utilisateur aviation civile.
22.12
Les performances d’un système SBAS
La performance d’un système SBAS s’évalue selon les critères de précision, de disponibilité, d’intégrité et de continuité. Ces différents axes de performances sont définis comme suit où la lettre X désigne soit la dimension verticale V ou horizontale H.
22.12.1
Précision
La précision mesure le degré de conformité entre la position ou la vitesse estimée ou mesurée par un récepteur à un moment donné et sa position ou sa vitesse vraie. La précision du système de radionavigation est généralement présentée comme une mesure statistique de l’erreur de positionnement. Elle est donc considérée comme une variable aléatoire. L’erreur de positionnement ou XPE pour Position Error est la précision instantanée du calcul de positionnement. Il s’agit ici d’un tirage particulier de la variable aléatoire de position à un instant donné. L’erreur de navigation système ou XNSE pour Navigation System Error est définie comme le 95 quantile de la distribution des XPE. Comme il n’est pas possible de disposer instantanément d’une telle distribution dans l’espace, on pose l’hypothèse ergodique et on construit la distribution en rassemblant les XPE sur 24 heures (voir la figure 22.8) : XN SE = quantile95 (XP E) .
(22.41)
392
Le temps dans la géolocalisation par satellites
Fig. 22.8 – Mesure pratique de la précision au ki`eme percentile en faisant appel à
l’hypothèse ergodique : il est possible de connaître la précision instantanée au ki`eme percentile d’une distribution en prenant la valeur de précision du ki`eme percentile d’un ensemble d’échantillons collectés au cours du temps (typiquement 24 heures).
On admet l’hypothèse ergodique pour le calcul de la précision en prenant un nombre entier de périodes de la constellation et une période de combinaisonrecombinaison des espèces dans l’ionosphère (1 jour minimum). En pratique, l’erreur de position n’est pas connue de l’utilisateur. Ce dernier ne peut avoir accès qu’aux volumes de protections qui doivent borner l’erreur de position au risque d’intégrité près.
22.12.2
Disponibilité
La disponibilité d’un système de navigation est le pourcentage de temps pendant lequel le service fourni par le système est utilisable. La disponibilité est une indication de la capacité du système à fournir un service utilisable dans la zone de couverture spécifiée (zone géographique dans laquelle la diffusion du signal SBAS peut être reçue). La disponibilité est définie comme la fraction de temps attendue pendant laquelle un niveau de service particulier est fourni. Dans son acception générale, le service en question comprend à la fois la précision, l’intégrité et la continuité. Dans la pratique cependant, on spécifie la notion de disponibilité comme le rapport du volume de protection au volume d’alerte. Le système est déclaré disponible si et seulement si : XP L < XAL.
(22.42)
Les systèmes d’augmentation par satellites
393
On appelle également cette disponibilité « disponibilité de l’intégrité ». Une procédure d’approche d’aviation civile à guidage vertical n’est autorisée que si le système SBAS est disponible par rapport à la limite d’alarme associée à la phase de vol.
22.12.3
Intégrité
Le standard SARPS (OACI) définit l’intégrité comme la mesure du niveau de confiance dans l’exactitude des informations fournies par l’ensemble du système. La notion d’intégrité englobe l’aptitude d’un système à fournir, en temps voulu, des avertissements valides (alarmes). Selon les termes généraux du standard MOPS, les informations trompeuses (MI pour Misleading Information) sont définies comme toute information provenant d’un équipement, ou affichées au pilote, qui engendre une erreur de positionnement plus grande que la limite d’alerte (HAL/VAL) ou le niveau de protection actuel (HPL/VPL), sans indication de l’erreur dans le délai d’alerte de la phase de vol applicable. Pour un équipement ayant connaissance du mode de navigation, et donc de la limite d’alerte, l’information trompeuse est définie par rapport à la limite d’alerte. Si l’équipement n’est pas au courant du mode de navigation, alors des informations trompeuses sont définies par rapport au niveau de protection, car la limite d’alerte n’est pas connue. Un SBAS est dit intègre strictement sur une période d’observation s’il ne présente aucun MI sur cette période. On admet cependant que certains évènements de non-intégrité surgissent sur une période de temps donné. Ces évènements doivent cependant rester rares, voire très rares. Le risque d’intégrité se mesure en probabilité d’apparition de MI sur une plage de temps donné. Pour des modes de navigation de type « non-précision » (NPA) ou de précision (LPV, Localiser Performance with Vertical guidance) le SARPS définit une MI par rapport à la limite d’alerte. Pour le SARPS, un événement de non-intégrité est défini comme une situation où la fonction de navigation est disponible mais présente une erreur supérieure à la limite d’alerte XPE > XAL, sans indication de l’erreur dans le délai d’alarme pour la phase de vol applicable. Cependant, le standard MOPS (J.3.1) précise également que, pour des approches « En route » LNAV, le HPL doit borner l’erreur de position horizontale avec une probabilité de 1 − 10−7 sur n’importe quel intervalle d’une heure, c’est-à-dire que la probabilité que l’erreur de position horizontale dépasse le HPL ne doit pas dépasser 10−7 sur n’importe quel intervalle d’une heure sauf possiblement pour de brèves périodes inférieures au délai d’alerte. Pour des approches LP et LPV (LNAV/VNAV), la probabilité que les erreurs horizontales ou verticales, ou les deux à la fois, dépassent leurs niveaux de protection respectifs ne doit pas dépasser 2 × 10−7 pour n’importe quelle approche. Ce dernier paragraphe semble définir le risque d’intégrité par rapport aux niveaux de protection (XPL) et non par rapport aux limites d’alertes (XPA). Cette ambiguïté suggère de distinguer deux types d’événement d’intégrité.
394
Le temps dans la géolocalisation par satellites
Fig. 22.9 – Différentes situations de non-intégrité et de non-disponibilité.
Une information trompeuse (MI) désigne tout événement ou donnée tel que la fonction de navigation soit disponible mais qui présente une erreur supérieure au niveau de protection actuel XPE > XPL, sans indication de l’erreur dans le délai d’alarme pour la phase de vol applicable. Une information dangereusement trompeuse (HMI pour Hasardous Misleading Information) désigne tout événement ou donnée tel que la fonction de navigation soit disponible mais qui présente une erreur supérieure à la limite d’alarme XPE > XAL, sans indication de l’erreur dans le délai d’alarme pour la phase de vol applicable. Par définition, une solution de navigation est dite intègre si et seulement si elle est sans MI. Un événement qui ne remplit pas ces conditions est non intègre par définition. Dans cette acception, la probabilité d’événement de nonintégrité ne doit pas dépasser l’exigence requise selon le domaine de vol soit 10−7 sur n’importe quel intervalle d’une heure pour le NPA et 2 × 10−7 pour le LPV. On rappelle que le délai d’alarme SBAS, ou TTA-SBAS, est défini comme la durée maximale dans laquelle le système SBAS doit sortir d’une situation continue de non-intégrité. Plus précisément, le TTA est la durée entre l’instant d’apparition d’une situation de non-intégrité et l’instant de réception, mesuré à l’antenne du récepteur, du dernier bit du message SBAS supprimant la situation de non-intégrité. Si t note le début d’une non-intégrité alors le système doit revenir dans un état intègre en moins de TTA secondes, soit avant t + TTA. Pour cela, le système envoie soit un nouveau jeu de corrections ou de paramètres d’intégrité soit une alarme répétée 4 fois. Le délai d’alarme est égal au délai d’alarme SBAS plus le temps alloué au récepteur pour le traitement du message SBAS. La figure 22.9 fournit la zoologie des cas possibles de situation d’intégrité et de perte d’intégrité, de disponibilité et de perte de disponibilité, au cours du temps. Les données de navigation sont dites intègres si et seulement si les conditions suivantes sont réunies.
Les systèmes d’augmentation par satellites
395
Pour un service d’approche à guidage vertical LPV : ⎧ < ⎨ SREW |GIV Derr | < ⎩ |U IV Derr |