Introduction aux variétés différentielles: Nouvelle édition 9782759801206

Ce livre scientifique est une initiation aux variétés différentielles, préalable à des enseignements plus spécialisés. L

143 33 10MB

French Pages 384 [379] Year 2021

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Introduction aux variétés différentielles: Nouvelle édition
 9782759801206

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

Introduction aux variétés différentielles nouvelle édition

Jacques Lafontaine

17, avenue du Hoggar Parc d’Activité de Courtabœuf - BP 112 91944 Les Ulis Cedex A - France

Introduction aux variétés différentielles Cet ouvrage est labellisé par Grenoble Sciences, est un des titres du secteur Mathématiques de la Collection Grenoble Sciences d’EDP Sciences, qui regroupe des projets originaux et de qualité. Cette collection est dirigée par Jean Bornarel, Professeur à l’Université Joseph Fourier, Grenoble 1. Comité de lecture de l’ouvrage ››Pierre Averbuch, Directeur de recherche honoraire au CNRS, Grenoble ››Pierre Berard, Professeur à l’Université Joseph Fourier, Grenoble I ››Gaël Meigniez, Professeur à l’Université de Bretagne Sud ››Jean-Yves Merindol, Professeur, Directeur de l’ENS Cachan Cette nouvelle édition d’Introduction aux variétés différentielles de Jacques Lafontaine a été suivie par Laura Capolo pour la partie scientifique et par Anne-Laure Passavant et Sylvie Bordage du centre technique Grenoble Sciences pour sa réalisation pratique. L’illustration de couverture est l’œuvre d’Alice Giraud, d’après : Thomas Banchoff & Jeff Beall, Brown University : Bouteille de Klein ; Fropuff/ Inductiveload, Wikimedia commons : Immersion « 8 » de la bouteille de Klein ; éléments fournis par l’auteur. Autres ouvrages labellisés sur des thèmes proches (chez le même éditeur)  Analyse numérique et équations différentielles (Jean-Pierre Demailly)  Analyse statistique des données expérimentales (Konstantin Protassov)  Approximation Hilbertienne (Marc Attéia et Jean Gaches)  Description de la symétrie (Jean Sivardière)  Exercices corrigés d’analyse avec rappels de cours - Tome I (Daniel Alibert)  Exercices corrigés d’analyse avec rappels de cours - Tome II (Daniel Alibert)  Mathématiques pour l’étudiant scientifique - Tome I (Philippe-Jacques Haug)  Mathématiques pour l’étudiant scientifique - Tome II (Philippe-Jacques Haug)  Mathématiques Pour les Sciences de la Vie, de la Nature et de la Santé (Jean Paul et Françoise Bertrandias)  Méthodes numériques appliquées pour le scientifique et l’ingénieur (Jean-Philippe Grivet) Nombres et algèbre (Jean-Yves Mérindol) Outils mathématiques à l’usage des scientifiques et ingénieurs (E. Belorizky)

et d’autres titres sur le site internet : http://grenoble-sciences.ujf-grenoble.fr

ISBN 978-2-7598-0572-3 © EDP Sciences, 2010

Pour David,

Table des matières Table des matières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . I Comment utiliser cet ouvrage pap-ebook . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Notations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 Chapitre 1. Calcul différentiel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.1.1. Qu’est-ce que le calcul différentiel ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 1.1.2. Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 1.2. Différentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2.1. Définition et propriétés de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 1.2.2. Trois exemples fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.2.3. Fonctions de classe C p . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 1.3. Théorème des fonctions composées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.4. Inversion locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.1. Difféomorphismes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.4.2. Difféomorphismes locaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 1.4.3. Immersions, submersions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.5. Sous-variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.5.1. Propriétés de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 1.5.2. Exemples : sphères, tores, groupe orthogonal . . . . . . . . . . . . . . . . . . . . 30 1.5.3. Paramétrisations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 1.5.4. Vecteurs tangents, espace tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 1.6. Sous-groupes à un paramètre du groupe linéaire . . . . . . . . . . . . . . . . . . . . . . . 35 1.7. Points critiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 1.8. Valeurs critiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41

II

Introduction aux variétés différentielles 1.9. Calcul différentiel en dimension infinie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 1.10. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 1.11. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47

Chapitre 2. Notions de base sur les variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 2.1.1. Un exemple typique : les droites du plan . . . . . . . . . . . . . . . . . . . . . . . . 53 2.1.2. Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 2.2. Cartes, atlas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 2.2.1. Des variétés topologiques aux variétés lisses . . . . . . . . . . . . . . . . . . . . . 55 2.2.2. Premiers exemples . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 2.3. Fonctions différentiables ; difféomorphismes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 2.4. Le théorème de d’Alembert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 2.5. Les espaces projectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 2.6. L’espace vectoriel tangent ; applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 2.6.1. Espace tangent, application linéaire tangente . . . . . . . . . . . . . . . . . . . . 69 2.6.2. Difféomorphismes locaux, immersions, submersions, sous-variétés

71

2.7. Revêtements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 2.7.1. Quotient d’une variété par un groupe . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 2.7.2. Simple connexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 2.8. Dénombrabilité à l’infini . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84 2.9. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86 2.10. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88 Chapitre 3. Du local au global . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97 3.2. Fonctions plateau ; plongements de variétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98 3.3. Dérivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.3.1. Dérivations ponctuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 3.3.2. Un autre point de vue sur l’espace tangent . . . . . . . . . . . . . . . . . . . . . 105 3.3.3. Dérivations globales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107 3.4. Image d’un champ de vecteurs ; crochet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109 3.5. Le fibré tangent . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111

Table des matières

III

3.5.1. La variété des vecteurs tangents . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111 3.5.2. Fibrés vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 3.5.3. Champs de vecteurs sur les variétés ; hessien . . . . . . . . . . . . . . . . . . . 115 3.6. Le flot d’un champ de vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 3.7. Champs de vecteurs dépendant du temps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 3.8. Variétés de dimension un . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128 3.9. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130 3.10. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134 Chapitre 4. Autour des groupes de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 4.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143 4.2. Champs invariants à gauche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144 4.3. L’algèbre de Lie d’un groupe de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149 4.3.1. Propriétés de base ; représentation adjointe . . . . . . . . . . . . . . . . . . . . . 149 4.3.2. Des groupes aux algèbres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 152 4.3.3. Des algèbres aux groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 4.4. Digression sur les groupes topologiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 156 4.5. Groupes de Lie commutatifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4.5.1. Un théorème de structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162 4.5.2. Courbes elliptiques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 4.6. Espaces homogènes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 4.7. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 4.8. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 Chapitre 5. Formes différentielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 5.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 5.1.1. Des formes différentielles, pourquoi ? . . . . . . . . . . . . . . . . . . . . . . . . . . . 177 5.1.2. Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178 5.2. Algèbre multilinéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 5.2.1. Algèbre tensorielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179 5.2.2. Algèbre extérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 5.2.3. Application : la grassmannienne des 2-plans en dimension . . . . . . 185 5.3. Cas des ouverts d’un espace numérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186

IV

Introduction aux variétés différentielles 5.3.1. Formes de degré 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186 5.3.2. Formes de degré quelconque . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188 5.4. Différentielle extérieure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190 5.5. Produit intérieur, dérivée de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 194 5.6. Le lemme de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 5.6.1. Ouverts étoilés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199 5.6.2. Formes dépendant d’un paramètre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202 5.7. Formes différentielles sur une variété . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203 5.8. Équations de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207 5.8.1. Espace de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 208 5.8.2. Le champ électro-magnétique vu comme une forme différentielle

208

5.8.3. Champ électromagnétique et groupe de Lorentz . . . . . . . . . . . . . . . . 209 5.9. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 5.10. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214 Chapitre 6. Intégration et applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 6.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223 6.2. Orientation : des espaces vectoriels aux variétés . . . . . . . . . . . . . . . . . . . . . . 225 6.2.1. Atlas d’orientation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 225 6.2.2. Formes volume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 226 6.2.3. Revêtement des orientations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 230 6.3. Intégration sur les variétés ; une première application . . . . . . . . . . . . . . . . . 231 6.3.1. Intégrale d’une forme différentielle de degré maximum . . . . . . . . . . 231 6.3.2. Le théorème de la boule chevelue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 6.4. Théorème de Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 6.4.1. Intégration sur les parties compactes . . . . . . . . . . . . . . . . . . . . . . . . . . . 235 6.4.2. Les domaines réguliers et leur bord . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236 6.4.3. La formule de Stokes dans tous ses états . . . . . . . . . . . . . . . . . . . . . . . 239 6.5. Forme volume canonique d’une sous-variété de l’espace euclidien . . . . . . 243 6.6. Le théorème de Brouwer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 6.7. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250 6.8. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251

Table des matières

V

Chapitre 7. Cohomologie et théorie du degré . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 7.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 257 7.2. Espaces de de Rham . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 259 7.3. Cohomologie en degré maximum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260 7.4. Degré d’une application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 7.4.1. Cas du cercle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 264 7.4.2. Définition et propriétés de base dans le cas général . . . . . . . . . . . . . 266 7.4.3. Invariance du degré par homotopie ; applications . . . . . . . . . . . . . . . 268 7.4.4. Indice d’un champ de vecteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 7.5. Retrour sur le théorème de d’Alembert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 273 7.5.1. Deux preuves du théorème de d’Alembert utilisant le degré . . . . . 273 7.5.2. Comparaison des différentes preuves du théorème de d’Alembert 275 7.6. Enlacement . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 276 7.7. Invariance par homotopie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 280 7.8. Le principe de Mayer–Vietoris . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 7.8.1. Suites exactes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 283 7.8.2. La suite exacte de Mayer–Vietoris . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 285 7.8.3. Application : quelques calculs de cohomologie . . . . . . . . . . . . . . . . . . 287 7.8.4. Cas non compact . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289 7.9. Méthodes intégrales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290 7.10. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293 7.11. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294 Chapitre 8. Caractéristique d’Euler–Poincaré et théorème de Gauss–Bonnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 8.1. Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303 8.1.1. D’Euclide à Carl–Friedrich Gauss et Pierre–Ossian Bonnet . . . . . 303 8.1.2. Esquisse d’une preuve du théorème de Gauss–Bonnet . . . . . . . . . . 305 8.1.3. Résumé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 305 8.2. Caractéristique d’Euler–Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 8.2.1. Définition ; additivité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 306 8.2.2. Pavages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307 8.3. Invitation à la géométrie riemannienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 310

VI

Introduction aux variétés différentielles 8.4. Le théorème de Poincaré–Hopf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 314 8.4.1. Retour sur l’indice d’un champ de vecteurs . . . . . . . . . . . . . . . . . . . . . 314 8.4.2. Un théorème des résidus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 315 8.5. De Poincaré–Hopf à Gauss–Bonnet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 317 8.5.1. Avec le théorème de classification des surfaces . . . . . . . . . . . . . . . . . . 317 8.5.2. Avec les pavages : idée de la preuve . . . . . . . . . . . . . . . . . . . . . . . . . . . . 319 8.5.3. Mise en forme des arguments précédents . . . . . . . . . . . . . . . . . . . . . . . 320 8.6. Commentaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 8.6.1. Cas des surfaces plongées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322 8.6.2. Métriques riemanniennes canoniques sur les surfaces . . . . . . . . . . . . 323 8.6.3. Indications sur les dimensions supérieures . . . . . . . . . . . . . . . . . . . . . . 323 8.7. Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324

Annexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327 Solution d’exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 329 Bibliographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 367

Comment utiliser cet ouvrage pap-ebook (livre + site web) ?

Introduction aux variétés différentielles est avant tout un livre avec tous ses atouts et le lecteur trouvera ci-après un descriptif succinct. Mais il est aussi un pap-ebook de Grenoble Sciences, c’est-à-dire un livre enrichi par un site web qui lui est corrélé. Sur ce site web le lecteur trouvera : — des éléments pour combler ses lacunes de prérequis, — des exercices et des corrigés permettant de s’entrainer et quelques développements, — des approfondissements et parfois des pistes bibliographiques pour ceux qui désirent aller plus loin. Le site s’enrichit au cours du temps en fonction des suggestions. L’adresse de ce site compagnon est : http://grenoble-sciences.ujf-grenoble.fr/pap-ebook/lafontaine Le livre (et son site) est réalisé à destination de lecteurs variés. Ils trouveront donc des préliminaires, des détails techniques, des compléments souvent omis dans les ouvrages ciblés sur un seul public. Le premier chapitre et une bonne part des chapitres 5 et 6 forment un exposé relativement complet de calcul différentiel classique, du b.a.-ba à la formule de Stokes. Le chapitre 2 a l’ambition de faire comprendre ce que sont les variétés différentielles et comment s’en servir à celles et ceux à qui cette notion fait peur, qu’ils la jugent trop abstraite ou trop technique. Le chapitre 3 est plus technique, précisément parce qu’il expose des techniques trop souvent passées sous silence. Les deux derniers chapitres peuvent être abordés directement dès que l’on maîtrise peu ou prou les notions de variété et de forme différentielle. Notons aussi que quelqu’un qui, à partir du mot “holomorphe” dans l’index, ferait tous les exercices auquel ce mot fait référence, en tirerait une bonne sensibilisation au monde si différent des variétés complexes. A l’occasion de cette deuxième édition, le pap-ebook est devenu complètement autosuffisant en ce qui concerne le calcul différentiel proprement dit. Mais il est vain de parler de variétés sans faire de topologie. Il est donc très brièvement question de simple connexité et de revêtements. Sur ces points, le site web devrait apporter les compléments nécessaires. Les lecteurs peuvent d’ailleurs adresser à Grenoble Sciences des suggestions pour enrichir le site web compagnon. Elles seront exploitées dans la mesure du possible.

Introduction C’est à ce coup que Fontanet eut une troisième conception. Il s’écria : – Composons une Histoire de France, avec tous les détails, en cinquante volumes. Cette proposition m’enchanta, et je l’accueillis avec des battements de mains et des cris de joie... On nous envoya coucher. Mais je restai bien un quart d’heure dans mon lit sans dormir, tant j’étais agité par la pensée sublime d’une Histoire de France en cinquante volumes, avec tous les détails. Nous la commençâmes, cette histoire. Je ne sais, ma foi, plus pourquoi nous la commençâmes par le roi Teutobochus. Mais telle était l’exigence de notre plan. Notre premier chapitre nous mit en présence du roi Teutobochus, qui était haut de trente pieds, comme on put s’en assurer en mesurant ses ossements, retrouvés par hasard. 1 Dès le premier pas, affronter un tel géant ! Fontanet lui-même en fut étonné. – Il faut sauter par-dessus Teutobochus, me dit-il. Je n’osai point. L’Histoire de France en cinquante volumes s’arrêta à Teutobochus. Anatole France, Le Livre de mon ami. Cette charmante leçon de méthodologie s’applique fort bien au sujet de ce livre. Au lecteur de juger du parti que j’en ai tiré. Les premiers pas de la théorie des variétés peuvent, si l’on veut suivre l’exemple de Fontanet, donner lieu à des développements redoutables. On risque d’être rebuté par le sujet avant de s’apercevoir que les vraies difficultés sont ailleurs. Les variétés différentielles sont la généralisation naturelle des courbes et des surfaces. La notion de variété apparaît pour la première fois (sans explications !) dans la leçon inaugurale de Riemann, en 1851, et lui permet de donner une solution satisfaisante au problème du prolongement analytique des fonctions holomorphes. Il faut attendre un bon demi-siècle pour qu’une définition précise se dégage. Il s’agit de concevoir non pas des parties d’un espace Rn , avec n grand, définies par un certain nombre d’équations, mais d’une façon plus abstraite des objets – a priori non plongés dans l’espace “ordinaire” de dimension n, – pour lesquels la notion de fonction différentiable ait un sens. 1. Le lecteur qui mettrait en doute l’existence de Teutobochus est invité à lire Persistance des géants, de A. Schnapper (Annales E.S.C. 1986, no 1).

4

Introduction aux variétés différentielles

Les raisons pour s’intéresser à de “grandes” dimensions sont nombreuses. L’une des plus évidentes vient peut–être de la mécanique classique. L’espace des configurations d’un système articulé dépend vite de plus de trois paramètres : il en faut déjà six pour un solide. Le fait qu’il ne soit pas toujours souhaitable de considérer les objets étudiés comme des parties de Rn est plus caché. Par exemple l’ensemble des directions de l’espace usuel dépend de deux paramètres réels. C’est de façon naturelle une variété de dimension deux, appelée le plan projectif. Il admet certes de nombreuses réalisations comme sous–espace d’un espace euclidien. Mais ces réalisations ne sautent pas aux yeux, et il n’est pas évident non plus d’en trouver une qui soit plus “naturelle” que les autres. Et dans bien des cas, comme celui des systèmes articulés, où cette réalisation est évidente, on ne l’utilise que relativement peu. Ces variétés “abstraites” fournissent le cadre mathématique naturel de la mécanique classique (espace des configurations et espace des phases), mais aussi de la relativité générale et de la théorie des particules élémentaires. J’ai voulu écrire un texte qui, tout en restant élémentaire, aborde les variétés le plus directement possible, en s’intéressant principalement à leurs propriétés topologiques. De ce point de vue, une sphère étirée et/ou bosselée reste une sphère, et même dans le cadre des courbes et des surfaces, on s’intéresse aux propriétés topologiques ou différentielles, et non aux propriétés métriques (longueur, courbure, etc...). Il suffit au lecteur d’une bonne connaissance des bases du calcul différentiel, et d’un peu de topologie dite “générale”. Toutefois, quelques remarques, encadrées par le signe ** font appel à des connaissances plus élaborées. Un premier chapitre est consacré au calcul différentiel classique, exposé de façon à pouvoir s’appliquer le plus directement possible aux variétés. Les variétés proprement dites sont abordées aux deuxième et troisième chapitres. J’ai essayé de donner le plus vite possible des exemples et des résultats significatifs. Une classe d’exemples – les groupes de Lie et leurs espaces homogènes – m’a paru largement mériter un chapitre pour elle-même. Les chapitres 5, 6 et 7 sont consacrés aux formes différentielles et au parti qu’on peut en tirer pour comprendre la topologie des variétés. Chaque chapitre dépend des précédents, à une exception près : si les groupes de Lie (chapitre 4) interviennent dans les chapitre qui suivent, c’est seulement à titre d’exemples et à l’occasion d’exercices. Enfin, le dernier chapitre, qui est le principal ajoût de cette deuxième édition, traite du théorème de Gauss–Bonnet pour les surfaces. L’un des attraits de ce résultat est la variété des techniques qu’il met en œuvre. Mais surtout, il met en lumière un phénomène qui n’a cessé de me fasciner malgré des années de pratique : l’apparition des nombres entiers – devrait-on dire de la quantification ? – en géométrie. Chaque chapitre commence par une introduction relativement détaillée dans laquelle je me suis efforcé de donner des motivations et une description informelle du contenu, faisant appel à l’intuition géométrique du lecteur. Une section intitulée “Commentaires” indique les prolongements possibles des sujets abordés.

Introduction

5

Comme je l’ai expliqué plus haut, j’ai pris le parti de me limiter pour l’essentiel aux structures différentielles. Sauf dans le dernier chapitre, l’aspect métrique n’est abordé que très occasionnellement, l’aspect symplectique pas du tout. Je me suis un peu rattrapé dans les sections de “Commentaires”, et dans la bibliographie commentée qui accompagne ce texte. Les nombreux exercices (plus de cent cinquante) sont pour la plupart faciles. Ceux qui sont indiqués par une étoile sont un peu plus délicats pour les débutants. Ceux qui portent deux étoiles ne sont pas forcément techniques, mais plutôt du style “il fallait y penser”. Beaucoup peuvent être considérés comme des compléments de cours. C’est pourquoi j’ai fait figurer les solutions d’une centaine d’entre eux. Durant les années où j’ai assuré le cours de géométrie différentielle à Montpellier, j’ai bénéficié d’un public particulièrement agréable, exigeant et attentif, ne ménageant pas les questions. Son attitude m’a vivement encouragé au moment où je préparais les notes qui ont constitué la première moûture de ce livre. Une fois ce cours soumis à la collection Grenoble Sciences, j’ai profité des très nombreuses remarques et des suggestions stimulantes des membres du comité de lecture, portant sur le fond comme sur les détails. Malgré la diversité des horizons scientifiques et des tempéraments de ces collègues, je ne me suis jamais trouvé dans la situation du meunier cher à mon homonyme. C’est d’ailleurs à l’occasion de cette deuxième édition que les introductions détaillées dont il est question plus haut m’ont été suggérées. Un grand merci également à Laura Capolo, du service éditorial de Grenoble Sciences, ainsi qu’à Sylvie Bordage et Anne–Laure Passavant, du service technique, pour une excellente atmosphère de travail. Last, not least, j’ai été profondément influencé par mon maître Marcel Berger.

Notations

Il est fait référence à la sous-section (ou à défaut à la section) où la notation apparaît pour la première fois. Faut-il mettre des flèches sur les vecteurs ? Vaste débat, que nous avons tranché en mettant des flèches uniquement sur les vecteurs déterminés par → − deux points : ab désigne le vecteur d’origine a et d’extrémité b. h, i ⊗ N ∧ Vk [, ] [x] α] v`[ Ad B(0, r) C k (M ) C ∞ (M ) C ∞ (E) C ∞ (T M ) d deg(f ) dim dist div E∗ E(C, C 0 ) f∗ f∗ f|U Fm

produit scalaire euclidien produit tensoriel (de vecteurs ou de formes) produit tensoriel (d’espaces ou de fibrés vectoriels) produit extérieur puissance extérieure k-ième crochet de deux champs de vecteurs point de P n K de coordonnées homogènes x vecteur associé à la forme α forme associée au vecteur v somme ensembliste représentation adjointe boule ouverte de centre 0 et de rayon r fonctions de classe C k sur M fonctions lisses sur M sections lisses du fibré vectoriel E champs de vecteurs lisses sur la variété M différentielle extérieure degré de l’application f dimension distance divergence espace dual de l’espace vectoriel E enlacement de deux courbes C et C 0 image directe par l’application f image réciproque par l’application f restriction de f à l’ouvert U germes de fonctions en m

5.2.1 5.2.1 5.2.2 5.2.2 3.4 2.5 5.3.1 5.3.1 3.5.1 4.3 1.2.3 1.2.3 3.5.2 3.5.2 5.4 7.4.1

5.5 5.2.1 7.6 3.4 5.3.2 3.3.1

8

Introduction aux variétés différentielles G0 G H Hp I iX J(f ) ou Jac(f ) Lg LX M M1 ]M2 N (M ) O(n) O(p, q) P nC P nR Rg rot Sn Sl(n, R) SO(n) SU (n) Sym(n) Supp(f ) T f, Tx f TM T ∗M Tn Tm M tr U (n) (U, φ) (Ui , φi )i∈I Vr (M ) Γ δ ∂D ∂k θφ $ ϕX t χ(M ) Ωg Ωp (M ) Ω(M ) Ω0 (M )

composante neutre du groupe de Lie G algèbre de Lie du groupe de Lie G corps des quaternions espace de cohomologie de degré p application inverse dans un groupe produit intérieur par le champ X jacobien de f translation à gauche par g dérivée de Lie espace de Minkowski somme connexe des variétés M1 et M2 fibré normal à la variété M groupe orthogonal groupe pseudo-orthogonal espace projectif complexe espace projectif réel translation à droite par g rotationnel sphère de dimension n groupe des matrices de déterminant 1 groupe des matrices orthogonales de déterminant 1 groupe des matrices unitaires de déterminant 1 matrices symétriques d’ordre n support de la fonction f application linéaire tangente fibré tangent à la variété M fibré cotangent à la variété M tore de dimension n espace tangent en M trace groupe des matrices unitaires carte d’une variété atlas d’une variété voisinage tubulaire de la sous-variété M application de Gauss dérivation bord du domaine D dérivation par rapport à la k-ième variable isomorphisme de Tx M sur Rn défini par φ forme volume canonique de la sphère flot du champ de vecteurs X caractéristique d’Euler–Poincaré de la variété M forme de courbure de la métrique riemannienne g formes différentielles de degré p sur M formes différentielles sur M formes différentielles sur M à support compact

4.2 4.3 4, ex. 7.2 4.2 5.5 1.2.1 4.2 5.5 5.8.1 2. ex. 3, ex. 1.5.2 1. ex. 2.5 2.5 4.2 5.5 1.6 1.6 2, ex. 1. ex. 3.2 2.6.1 3.5.1 5.7 1.5.2 2.6.1 1.2.2 2. ex. 2.2.1 2.2.1 3. ex. 8.6.1 3.3 6.4.2 1.2.1 2.6.1 8.6.1 3.6 8.1 8.3 5.3.2 5.3.2 6.3

2

28 20 19

4 9

4

24

Chapitre 1 Calcul différentiel

1.1. Introduction Dans ce chapitre, nous reprenons les bases du calcul différentiel, en nous efforçant de préparer le cadre des variétés. La plupart des concepts et des résultats étudiés sont des généralisations de concepts et de résultats de l’algèbre linéaire. On a un véritable dictionnaire : application différentiable difféomorphisme local sous-variété

– – –

application linéaire application linéaire inversible sous-espace vectoriel

Il s’agit de comprendre et d’expliciter ce dictionnaire.

1.1.1. Qu’est-ce que le calcul différentiel ? Schématiquement, une application (définie sur un ouvert d’un espace numérique) est différentiable en un point si on peut l’approcher au voisinage de ce point par une application linéaire, que l’on appelle sa différentielle, ou encore application linéaire tangente. Cette différentielle s’exprime bien sûr au moyen de dérivées partielles, mais c’est elle, et non les dérivées partielles, qui joue le rôle central. Le résultat de base, très justement appelé “chain rule” par les anglo-saxons, assure que la différentielle d’une composée d’applications différentiables est la composée des différentielles. On parlait autrefois de “l’invariance de la différentielle par changement de variables”, formulation pouvant prêter à confusion. Ce résultat donne entre autres une façon commode et transparente de calculer les dérivées partielles de fonctions composées, mais pour nous ce n’est pas l’essentiel.

10

Introduction aux variétés différentielles

Une notion fondamentale est celle de difféomorphisme. On entend par là une application différentiable qui admet une application réciproque elle-même différentiable. D’après le théorme ` des fonctions composées, la différentielle en tout point d’un difféomorphisme est une application linéaire inversible. Cette propríeté, qui n’est rien d’autre qu’une remarque “évidente”, admet une réciproque beaucoup plus forte : si la différentielle d’une application C 1 est différentiable en un point, c’est un difféomorphisme d’un voisinage de ce point sur son image (théorème d’inversion locale, voir 1.13). Ce résultat central, convenablement exploité, permet de donner des “formes normales” à un certain nombre d’êtres mathématiques. Soit par exemple une fonction f de classe C 1 de Rn dans R dont la différentielle en un point est a non nulle (c’est-à-dire dont une dérivée partielle en ce point est, non nulle). Alors, à changement de variables prés, cette fonction se ramène au voisinage du point en question à une application linéaire, et même si on veut à l’application (x1 , · · · , xn ) 7→ x1 (voir 1.18 pour l’énoncé précis). Autrement dit, on peut trouver un difféomorphisme φ d’un voisinage de 0 sur un voisinage de a tel que  f φ(x1 , · · · , xn ) = x1 + f (a). Ce résultat admet une version géométrique : soit S l’ensemble des points de Rn d’équation f (x) = f (a). Alors il existe, dans les mêmes condition, un difféomorphisme défini sur un voisinage U de a, qui envoie U ∩ S sur un morceau d’hyperplan (voir 1.20 et 1.21). On peut aussi se demander ce qui ce passe quand la différentielle est nulle. On regarde alors la partie d’ordre 2 du polynôme de Taylor. C’est une forme quadratique q. Si cette dernière est de rang maximum, la fonction se ramène au voisinage de a, après changement de variables, à cette forme quadratique. C’est le lemme de Morse, démontré dans l’exercice 11. Voir aussi le lemme 3.44. Ces résultats ont les points communs suivants : 1. Ce sont des conséquences (relativement immédiates dans les deux premiers cas, plus cachée pour le lemme de Morse) du théorème d’inversion locale. 2. Ils ont valables moyennant la non-dégénérescence d’un objet algébrique associé à la situation. 3. Ce sont des résultats locaux : la forme normale obtenue pour l’être mathématique étudié est valable au voisinage d’un point. Il faut penser au besoin à un exemple élémentaire : un petit morceau de cercle est homéomorphe et même difféomorphe à un intervalle, mais ce ne peut être le cas du cercle entier. Il y a bien d’autres résultats de ce type en calcul différentiel, par exemple le théorème du rang constant (voir l’exercice 10). En anticipant quelque peu, signalons aussi qu’un champ de vecteurs non nul en un point se ramène à un champ constant (voir l’exercice 16 du chapitre 3), et qu’une forme symplectique est localement équivalente à une forme bilinéaire alternée de rang maximum (théorème de Darboux, voir les exercices 14 et 17 du chapitre 5).

1 − Calcul différentiel

11

1.1.2. Résumé Les sections 1.2 à 1.5 rappellent les base du calcul différentiel d’une façon à préparer son extension à un cadre plus général que le cadre vectoriel, ce qui sera fait au chapitre suivant. Quelques résultats classiques ne sont pas repris, pour lesquels on peut consulter par exemple [Chaperon] ou [Rouvière] : théorème de Schwarz d’interversion des dérivées, formule de Taylor, suites et séries de fonctions différentiables. Nous voulons arriver assez vite aux variétés, et ces résultats, nonobstant leur importance, rentrent moins dans ce cadre. La section 1.6 est consacrée à un résultat qui fait moins souvent partie des exposés standard de calcul différentiel : si h est une application continue de R dans le groupe des matrices inversibles d’ordre n, telle que h(t + t0 ) = h(t)h(t0 ), alors h(t) est de la forme exp tA. En dimension 1, c’est tout simplement une caractérisation classique des fonctions exponentielles. En dimension supérieure, il faut utiliser le théorème d’inversion locale : il permet d’attraper un t0 non nul tel que h(t0 ) = exp B pour une matrice B convenable, et à partir de là on procède grosso modo comme en dimension 1. Les points critiques sont abordés dans la section 1.7. L’équation qui les caractérise est souvent intéressante pour elle-même. Nous ne pouvons résister à la tentation d’évoquer l’exemple suivant. Si C est une courbe fermée du plan, convexe pour simplifier, on s’intéresse aux polygones inscrits pour lesquels deux côtés consécutifs satisfont aux lois de Descartes (polygones de lumière pour les physiciens, trajectoires de billard pour les mathématiciens). Si la fonction “périmètre” (m1 , · · · , mn ) 7→

n X

−−→k avec la convention m k− m−i− m i+1 n+1 = m1

i=1

admet un point critique (M1 , · · · , Mn ), les points Mi sont les sommets d’un polygone de lumière, d’après le principe de Fermat ou la formule donnant la différentielle de la longueur (voir la sous-section 1.2.2). La fonction périmètre, en tant que fonction sur C n , admet un maximum, et ce dernier est réalisé (compacité). Sachant que les points où une fonction admet un maximum sont critiques, on a en principe un moyen de montrer l’existence de polygones de lumière. Tout marche très bien pour les triangles (vérifiez le !). Pour n = 4 une difficulté se présente : si A et B sont deux points tels −−→ que diam(C) = kABk, le quadruplet (A, B, A, B) réalise le maximum du périmètre. Il lui correspond un polygone dégénéré, à savoir le diamètre parcouru quatre fois ! Moralité : des méthodes plus sophistiquées de recherche de points critiques s’imposent, pour lesquelles nous renvoyons par exemple au très beau [Tabatchnikov]. Une fonction peut admettre beaucoup de points critiques. Dans le cas extrême d’une fonction constante, tous les points de l’ensemble de départ sont critiques. Mais il n’y a qu’une valeur critique, la constante en question. Ce cas extrême illustre la fait que les valeurs critiques sont toujours peu nombreuses. Le théorème de Sard (théorème 1.41) confirme cette intuition : elles forment un ensemble de mesure nulle. C’est l’essentiel de la section 1.8. Ce résultat, dont l’extension aux variétés est immédiate, est utilisé deux fois dans ce livre. Une première fois au chapitre 3. Une fois montré que toute variété compacte de dimension n se plonge dans RN , avec un N non explicite dont la valeur est fort mal contrôlée, il permet de faire baisser la dimension jusqu’à 2n + 1. Une seconde fois, et d’une façon beaucoup plus fondamentale, au chapitre 7, pour

12

Introduction aux variétés différentielles

montrer qu’il existe toujours des valeurs régulières (c’est-à-dire non critiques). On ne sait pas trouver “explicitement” une valeur régulière, mais l’on sait que presque tous les points sont des valeurs régulières. C’est une ruse classique en mathématiques. Enfin, la section 1.9 est consacrée au calcul différentiel en dimension infinie. Ce dernier était fort à la mode dans les années 60 du siècle écoulé. La généralité pour elle-même était un peu dans l’air du temps. Mais il a été remarqué par des mathématiciens américains travaillant sur les systèmes dynamiques que le théorème d’inversion locale en dimension infinie donne une preuve efficace d’un résultat de base sur l’existence et l’unicité des solutions de systèmes différentiels (voir le théorème 1.44). Cette méthode donne en prime la différentiabilité des solutions par rapport aux conditions initiales, alors que ce résultat important n’est pas si facile à obtenir avec les méthodes classiques.

1.2. Différentielles 1.2.1. Définition et propriétés de base Définition 1.1. Une application f d’un ouvert U de Rp à valeurs dans Rq est différentiable en un point a de U s’il existe une application linéaire L de Rp dans Rq telle que f (a + h) = f (a) + L · h + o(h). On dit alors que L est la différentielle de f en a, ou l’application linéaire tangente à f en a (les deux terminologies coexistent). La notation L · h en lieu et place de L(h) est choisie pour insister sur la linéarité. On a désigné par h 7→ o(h) une application d’un ouvert de Rp à valeurs dans Rq telle que, pour des normes k k1 et k k2 sur les espaces source et but, on ait ko(h)k2 = 0. lim h→0 khk1 Cette propriété ne dépend pas du choix des normes utilisées pour la formuler (il n’en sera plus de même quand nous étudierons la différentiabilité en dimension infinie, voir 1.9). Remarque. On peut réécrire cette définition sous la forme −−−−−−→ → + o(− → f (a)f (x) = L · − ax ax) En fait, Rp et Rq sont considérés à la fois comme des espaces affines où vivent les −−−−−→ → et − points x, f (x), et des espaces vectoriels où vivent les vecteurs − ax f (a)f (x). Cela conduit à reformuler la définition en remplaçant Rp et Rq par des espaces affines E et F de dimensions respectives p et q ; dans l’équation ci-dessus, L désigne alors → − → − une application linéaire entre les espaces vectoriels E et F associés à E et F . Le point de vue affine est expliqué de façon très économique dans le premier chapitre de [Troyanov].

1 − Calcul différentiel

13

Exemple : les courbes paramétrées Considérons le cas des applications de R dans un espace affine F , et désignons par → − → − F l’espace vectoriel associé. Toute application linéaire de R dans F est de la forme → − h 7→ hv, où v est un vecteur de F . En divisant par le nombre réel h, on voit que la → − différentiabilité en a équivaut alors à l’existence d’un vecteur v ∈ F tel que f (a + h) − f (a) = v + (h), où lim (h) = 0. h→0 h Autrement dit, f est alors dérivable en a et le vecteur v est égal à f 0 (a). Il est d’usage de donner aux applications de R dans un espace affine le nom de “courbes paramétrées”. Le vecteur f 0 (a) s’appelle alors vecteur tangent à la courbe en f (a). Nous verrons dans un instant qu’il y a des changements importants quand on passe de R à un espace de dimension supérieure à 1, c’est-à-dire des fonctions d’une variable aux fonctions de plusieurs variables. On a en tout cas la propriété suivante : Proposition 1.2. L’application L est unique. Démonstration. Soit L0 une deuxième application linéaire satisfaisant à la même propriété. Fixons h ∈ Rp , et considérons un accroissement de la forme th, où t est un réel non nul. On a f (a) + L · th + o(th) = f (a) + L0 · th + o(th), d’où L · th − L0 · th = t(L · h − L0 · h) = o(th). En divisant par t, on voit que L · h − L0 · h =

o(th) t

ce qui donne L = L0 si on fait tendre t vers 0. On notera dfa la différentielle de f en a. Remarque. Dans l’argument précédent, on peut se contenter de prendre des t positifs. On en déduit qu’une fonction f positivement homogène de degré 1 (c’est-à-dire une application de E dans F telle que f (tx) = tf (x) pour tout réel positif t) qui est différentiable en 0 est forcément linéaire. En particulier, une norme n’est jamais différentiable à l’origine. L’unicité de la différentielle vient aussi de son expression explicite en fonction des dérivées partielles des fonctions coordonnées.

14

Introduction aux variétés différentielles

Proposition 1.3. Si une application f d’un ouvert U de Rp dans R est différentiable en a ∈ U , elle admet des dérivées partielles du premier ordre en a, et dfa · h =

n X

∂i f (a)hi

(si h = (h1 , · · · , hn ).

i=1

Pn Démonstration. A priori, dfa · h = i=1 ui hi , où les réels ui sont à déterminer. En écrivant la propriété de différentiabilité pour un accroissement de la forme h = (0, · · · , t, · · · , 0)

(t à la i-ième place),

on voit que la fonction d’une variable réelle t 7→ f (a1 , · · · , ai + t, · · · , ap ) est différentiable, donc dérivable en 0, sa dérivée étant ui . Ce résultat se généralise facilement. Proposition 1.4. Si une application d’un ouvert U de Rp dans Rq est différentiable en a ∈ U , alors chacune des composantes f i de f admet des dérivées partielles en a, et la matrice de la différentielle, rapportée aux bases canoniques des espaces source et but, est  ∂j f i (a) 1≤i≤q,1≤j≤p · Démonstration. En exprimant la propriété de différentiabilité composante par composante, on voit que f est différentiable si et seulement si chaque composante f i l’est. Il suffit alors d’appliquer la proposition précédente aux f i .  Définition 1.5. La matrice ∂j f i 1≤i≤q,1≤j≤p est la matrice jacobienne de f . Nous convenons que les indices supérieurs correspondent aux lignes, et les indices inférieurs aux colonnes. Cet usage est lié à la convention d’Einstein, qui sera expliquée et justifiée dans la section 5.2. Le déterminant de la matrice jacobienne (si p = q) !, s’appelle le jacobien de f , noté J(f ). Si on remplace Rp et Rq par des espaces vectoriels de dimensions p et q rapportés à des bases (ei )1≤j≤p et (e0i )1≤i≤q , la matrice de la différentielle rapportée à ces bases s’écrit de la même façon, en désignant par f j la j-ième composante de f , et ∂j f i (a) la dérivée pour t = 0 de la fonction t 7→ f i (a + tej ). Si E = F , le jacobien de f est le déterminant de l’endomorphisme dfa . Pour ne pas alourdir l’exposé, nous nous placerons le plus souvent dans des espaces Rn munis de leur base canonique. Mais il existe bien des situations (par exemple quand on travaille avec des espaces d’applications linéaires) où cela n’a rien de naturel.

1 − Calcul différentiel

15

1.2.2. Trois exemples fondamentaux Longueur → admet en tout point Dans un espace euclidien, la fonction longueur (x, y) → k− xyk (x, y) où x 6= y la différentielle − → − → xy xy (u, v) 7→ h − , vi − h − → → , ui. kxyk kxyk Conditions de Cauchy–Riemann Une application de C dans C est holomorphe si et seulement si elle est C-différentiable (on remplace R par C dans la définition 1.1 : on veut que la différentielle soit Clinéaire). A l’instar de ce qui se passe pour les fonctions d’une variable réelle, on a f (z + h) = f (z) + Ah + o(h),

f (z + h) − f (z) , h→0 h

avec A = lim

ce qui permet de poser A = f 0 (z). En tant qu’application de R2 dans R2 , l’application f est encore différentiable, et sa matrice jacobienne est de la forme   a −b (si f 0 (z) = a + ib). b a On obtient les conditions de Cauchy–Riemann : f , vue comme qu’application de R2 dans R2 , est différentiable ; si P et Q sont ses composantes, on a ∂1 P = ∂2 Q et ∂2 P = −∂1 Q. En particulier, son jacobien est |f 0 (z)|2 . Il y a des situations où il est préférable de calculer la différentielle sans faire appel aux coordonnées. Inverse d’une matrice ; déterminant et trace Nous allons calculer les différentielles a) de l’application ϕ : A 7→ A−1 de Gl(Rn ) dans lui-même (en vérifiant au passage que Gl(n, R) est ouvert dans End(Rn )). On choisit une norme sur Rn , et on munit End(Rn ) de la norme opérateur associée. Autrement dit kAk = sup kAxk. kxk≤1

Si A et B sont deux endomorphismes, on a kABk ≤ kAkkBk. Alors si kHk < 1, la série ∞ X (−1)k H k k=0

est normalement convergente, donc convergente, et sa somme S vérifie évidemment la relation S(I + H) = (I + H)S = I.

16

Introduction aux variétés différentielles Ainsi I + H est inversible, d’inverse S et le développement en série de (I + H)−1 que nous venons d’obtenir donne k(I + H)−1 − I − Hk = k

∞ X

(−1)k H k k ≤

k=2

∞ X

kHkk =

k=2

kHk2 . 1 − kHk

Pour kHk < 1/2, il vient (I + H)−1 = I − H + r(H),

où kr(H)k < 2kHk2 ,

ce qui montre que la différentielle de ϕ en I est l’application H 7→ −H. Pour passer au cas général, on écrit (A + H)−1 = A(I + A−1 H)

−1

= (I + A−1 H)−1 A−1 .

En utilisant le même développement en série, on voit d’abord que Gl(Rn ) est ouvert dans End(Rn ) (si kHk < 1/kA−1 k, A + H est inversible), puis que la différentielle de ϕ en A est l’application linéaire H 7→ −A−1 HA−1 . On notera l’analogie avec la dérivée de la fonction 1/x ! b) de l’application A 7→ det A de End(Rn ) dans R. Nous laissons au lecteur le soin de vérifier, en utilisant la multilinéarité, que si a1 , . . . , an (resp. h1 , . . . , hn ) désignent les vecteurs colonnes de la matrice A (resp. H), on a ddetA · H =

n X

det(a1 , . . . , ak−1 , hk , ak+1 , . . . , an ).

k=1

Mais il existe une expression intrinsèque bien plus parlante. Examinons d’abord le cas où A = I. Alors n X hkk + termes de degré ≥ 2 par rapport aux hlk , det(I + H) = 1 + k=1

ce qui montre que la différentielle en I n’est autre que l’application H 7→ tr(H). Si maintenant A est inversible, on écrit comme dans a) A + H = A(I + A−1 H), et on en déduit que la différentielle est donnée par H 7→ det(A) tr(A−1 H). Pour passer au cas général, remarquons que ˜ det(A) tr(A−1 H) = tr(AH), où A˜ est la matrice des cofacteurs de A. Comme det est évidemment une fonction lisse, sa différentielle dans le cas général est donc ˜ H 7→ tr(AH). Cette dernière formule est aussi une conséquence directe de notre calcul initial.

1 − Calcul différentiel

17

1.2.3. Fonctions de classe C p Nous avons vu que les composantes d’une fonction différentiable le sont automatiquement. Par contre, une fonction définie sur un ouvert de Rp qui admet des dérivées partielles, c’est-à-dire telle que les fonctions partielles t 7→ f (a1 , · · · , ai + t, · · · , ap ) sont différentiables, n’est pas forcément différentiable si p > 1. Un contre-exemple simple est donné par la fonction f de deux variables définie par f (x, y) =

xy x2 + y 2

si

(x, y) 6= (0, 0) ,

et f (0, 0) = 0,

qui n’est pas continue à l’origine, bien qu’ayant des dérivées partielles en tout point. On a par contre le résultat fondamental suivant : Théorème 1.6. Soit f une application d’un ouvert U de Rp dans R. Si f a des dérivées partielles sur U qui sont continues en a, alors f est différentiable en a. Démonstration. Supposons que p = 2 pour alléger les notations. Le cas général se traite de la même façon. Posons a = (b, c). On a f (b + h, c + k) − f (b, c) = f (b + h, c + k) − f (b + h, c) + f (b + h, c) − f (b, c). D’une part f (b + h, c) − f (b, c) = ∂1 f (b, c)h + o(h). D’autre part, d’après le théorème des accroissements finis appliqué à la fonction t 7→ f (b + h, t), f (b + h, c + k) − f (b + h, c) = ∂2 f (b + h, c + θk)k

(0 < θ < 1).

Mais, en raison de la continuité de ∂2 f en a, ∂2 f (b + h, c + θk) = ∂2 f (b, c) + o(h, k)· C’est le critère pratique le plus commode et le plus souvent utilisé de différentiabilité. Il conduit à la définition suivante : Définition 1.7. Une application d’un ouvert U de Rp dans Rq est de classe C 1 si toutes ses dérivées partielles d’ordre 1 existent et sont continues sur U tout entier, de classe C p si ses dérivées partielles sont de classe C p−1 , et enfin de classe C ∞ (on dira aussi lisse) si elle est de classe C p pour tout entier p. Il est clair que la somme de deux fonctions de classe C p l’est aussi. Il en est de même de leur produit pour les fonctions à valeurs réelles. Remarque. La différentiabilité a un sens en un point (plus précisément, elle ne dépend que du comportement de la fonction dans un voisinage arbitraire du point considéré). Par contre, la propriété d’être de classe C p n’a de sens que sur un ouvert.

18

Introduction aux variétés différentielles

1.3. Théorème des fonctions composées Théorème 1.8. Soit f une application d’un ouvert U de Rm dans Rn , et g une application d’un ouvert V de Rn dans Rp . On suppose que f différentiable en a ∈ U , que f (a) ∈ V et que g est différentiable en f (a). Alors g ◦ f est différentiable en a, et d(g ◦ f )a = dgf (a) ◦ dfa . Autrement dit, la différentielle de la composée est la composée des différentielles. Démonstration. Remarquons d’abord que f étant continue en a, f −1 (V ) est un voisinage de a, et donc que g ◦ f est définie sur un ouvert U 0 contenant a. Si a + h ∈ U 0 , on a f (a + h) = f (a) + L · h + o(h)· Posons k = L · h + o(h). Alors   g f (a + h) = g f (a) + k

 = g f (a) + M · k + o(k)  = g f (a) + M · L · h + o(h).

Remarques a) En anglais, ce résultat porte le nom de “chain rule”, à la fois concis et parlant ! b) Au niveau des matrices jacobiennes de g et f , ce résultat donne la formule ∂j (g ◦ f )i =

n X

 ∂k g i f (a) . ∂j f k (a),

k=1

soit en d’autres termes i

[d(g ◦ f )a ]j =

n X 

dgf (a)

i k

k

[dfa ]j .

k=1

c) L’utilisation implicite de la “chain rule” est très fréquente. Soit par exemple E un espace vectoriel euclidien, le produit scalaire étant noté h, i. Si u et v sont deux applications d’un ouvert U de Rn dans E, la différentielle de f = hu, vi est donnée par dfa · h = hdua · h, v(a)i + hu(a), dva · hi. On peut soit le vérifier directement, soit considérer f comme la composée des  applications x 7→ (u(x), v(x) de U dans E × E et (y, z) 7→ hy, zi de E × E dans R.

1 − Calcul différentiel

19

Exemple : inversions Soit E un espace euclidien de dimension n. L’inversion de centre p et de module k est l’application Ip,k de E \ {p} dans lui-même définie par − → −−→ px . pIp,k (x) = k − → kpxk2 Elle est évidemment lisse. Prenons a = 0, k = 1 et posons I0,1 = I. La différentielle de I est donc h ha, hi 1 dIa · h = −2 a= Sa · h, kak2 kak4 kak2 où l’on a posé Sa .h = h − 2

ha, hi a. kak2

Il est clair que Sa .a = −a et que Sa .h = h si h appartient à l’hyperplan orthogonal à a. Donc Sa est la symétrie orthogonale par rapport à cet hyperplan. C’est une isométrie, et dIa est une similitude (inverse). g

I f

0

I

o

o

g

f

a

I (a )

Figure 1.1 – Inversion

Soient maintenant t 7→ f (t) et t 7→ g(t) deux courbes paramétrées telles que f (0) = g(0) = a. Les vecteurs tangents en I(a) aux courbes images par I sont d’après le théorème des fonctions composées dIa · f 0 (0) et dIa · g 0 (0). Donc d’après ce qui précède leur angle (en valeur absolue) est le même que celui de f 0 (0) et g 0 (0). Autrement dit, I conserve les angles. On dit que de telles applications sont conformes. Un théorème dû à Liouville assure que si n ≥ 3, toute application conforme d’un ouvert d’un espace euclidien de dimension n ≥ 3 dans un autre est la restriction d’un produit d’inversions (pour une preuve, voir par exemple [Berger], ch. 9). Pour n = 2 la situation est très différente : on voit en utilisant les conditions de Cauchy–Riemann (voir la sous-section1.2.2) que f est conforme si et seulement si elle est holomorphe ou antiholomorphe, alors que les produits d’inversions (appelés transformations de Möbius) sont beaucoup moins nombreux (ils engendrent un groupe de dimension finie, décrit dans l’exercice 16 du chapitre 2). Revenons aux généralités, en énonçant une conséquence immédiate mais fondamentale du théorème des fonctions composées. Corollaire 1.9. Toute composée d’applications de classe C p (1 ≤ p ≤ ∞) est ellemême de classe C p .

20

Introduction aux variétés différentielles

Notation différentielle. Elle est justifiée par le théorème des fonctions composées. On part de la remarque (évidente) qu’une application linéaire est différentiable et égale à sa différentielle, et on note (pour les distinguer si on veut) dt la différentielle de l’application identique de R dans R, et dxi la différentielle de la i-ième coordonnée d’un vecteur x de Rp . Soit maintenant f une application différentiable de Rp dans R. En notant hi la i-ième composante du vecteur h, on a dfa · h =

n X

∂i f (a)hi ·

i=1

Cela nous donne la valeur de la forme linéaire dfa pour le vecteur h. Comme dxi (h) = hi , il revient au même de dire que dfa =

n X

∂i f (a)dxi .

i=1

Autrement dit, la différentielle de f est une combinaison linéaire des différentielles des coordonnées, dont les coefficients sont les dérivées partielles. Remarque. Si on écrit simplement df , cela peut signifier : a) soit que l’on considère la différentielle de f en un point précisé par le contexte. b) soit que l’on considère l’application x 7→ dfx . Le calcul différentiel est particulièrement riche en ambiguïtés de ce type, indispensables si on veut éviter les cuistreries. Si maintenant g est une application différentiable de R dans Rn , le théorème des fonctions composées nous dit que la différentielle de f ◦ g s’obtient en remplaçant, dans l’expression de df , les dxi par les dg i , différentielles des composantes de g. On écrit d’abord n X dfx = ∂i f (x1 , x2 , · · · , xn )dxi , i=1

puis d(f ◦ g)t

= =

n X

 ∂i f g 1 (t), g 2 (t), · · · , g n (t) dg i

i=1 n X

  ∂i f (g 1 (t), g 2 (t), · · · , g n (t) g 0i (t) dt.

i=1

On en déduit que la dérivée de f ◦ g en t est égale à n X

 ∂i f g 1 (t), g 2 (t), · · · , g n (t) g 0i (t).

i=1

Remarque. Nous verrons deux généralisations très différentes de la différentielle. Tout d’abord nous verrons au chapitre prochain que la notion de fonction lisse a

1 − Calcul différentiel

21

un sens dans le cadre plus général des fonctions entre variétés (disons pour le moment entre courbes et surfaces) ; on emploiera alors plutôt l’appellation d’application linéaire tangente en un point (voir la section 2.6). Nous verrons ensuite que la différentielle des fonctions se prolonge en un opérateur linéaire défini sur les formes différentielles (voir la section 5.4). C’est cette double généralisation qui explique la coexistence, dans le cas des ouverts d’espaces vectoriels, de deux terminologies et de deux notations pour la même notion : différentielle de f en a, notée dfa ; application linéaire tangente à f en a, notée Ta f .

1.4. Inversion locale 1.4.1. Difféomorphismes Définition 1.10. Une application f d’un ouvert U de Rp dans un ouvert V de Rq est un difféomorphisme de classe C k si elle admet une application réciproque de classe C k . On dit alors que U et V sont difféomorphes. Notons g l’application réciproque. Le théorème des fonctions composées appliqué à f ◦ g et g ◦ f nous dit que si a ∈ U , les applications linéaires dfa et dgf (a) sont inverses l’une de l’autre. En particulier, nécessairement p = q. Remarque. Il est encore vrai qu’un ouvert de Rp ne peut être homéomorphe à un ouvert de Rq que si p = q. Ce résultat, appelé théorème d’invariance du domaine, est nettement plus difficile, et fait appel à la topologie algébrique (pour une preuve, voir par exemple [Karoubi–Leruste], chapitre V). Exemples : boules et produits d’intervalles a) Tous les intervalles ouverts de R sont difféomorphes entre eux, et difféomorphes à R. Il est clair que tous les intervalles ouverts bornés sont difféomorphes entre eux, ainsi que tous les intervalles de la forme ]a, +∞[ ou ] − ∞, b[. On a d’autre part les difféomorphismes t 7→ et de ]0, +∞[ sur R et t 7→

t 1 − t2

de ] − 1, 1[ sur R (par exemple). b) Toute boule ouverte de Rn (pour la norme euclidienne) est difféomorphe à Rn . En utilisant a), on voit que x 7→

x 1 − kxk2

est un difféomorphisme de la boule ouverte B(0, 1) sur Rn .

22

Introduction aux variétés différentielles

c) Dans R2 l’intérieur d’un carré est difféomorphe à un disque ouvert. Il suffit de remarquer (par exemple) que l’application (x, y) 7→ (

y x , ) 2 1 − x 1 − y2

réalise un difféomorphisme du carré ] − 1, 1[×] − 1, 1[ sur R2 . On a bien entendu des énoncés analogues en toute dimension. Par contre, nous verrons plus tard que Rn et Rn − {0} ne sont pas difféomorphes. Attention. L’exemple de t 7→ t3 de R dans R montre qu’un homéomorphisme lisse peut ne pas être un difféomorphisme. En effet sa différentielle en 0 n’est pas inversible, puisqu’elle est nulle. Par contre : Proposition 1.11. Soit f un homéomorphisme d’un ouvert U sur un ouvert V de Rp . Si f est de classe C k et si df est inversible en tout point, alors f est un difféomorphisme (de classe C k ) et −1

df (x) f −1 = (dfx )

·

Démonstration. On s’appuie sur un lemme facile mais utile, dont la démonstration est laissée en exercice. Lemme 1.12. Si A est une application linéaire bijective entre espaces vectoriels normés de dimension finie, il existe des constantes strictement positives m et M telles que ∀x 6= 0, mkxk < kA · xk < M kxk· Désignons par g l’application réciproque de f . Soit a ∈ U et b = f (a). Montrons d’abord que g est différentiable en b. Comme g est continue, g(b + h) = g(b) + ∆(h), o` u k∆(h)k = o(1)· En appliquant f aux deux membres, on obtient b + h = b + dfa · ∆(h) + o(∆(h)) puis ∆(h) = dfa

−1

· h + dfa

−1

· o(∆(h))·

Mais d’après le lemme, ∆(h) = O(h) donc la relation ci-dessus donne ∆(h) = dfa

−1

Donc g est différentiable en b, et dgb = dfg(b) alors du théorème des fonctions composées. Un résultat beaucoup plus fort est vrai.

· h + o(h)· −1

· Le fait que g est C k si f l’est vient

1 − Calcul différentiel

23

1.4.2. Difféomorphismes locaux Théorème 1.13 (dit d’inversion locale). Soit f une application C k (k ≥ 1) d’un ouvert U de Rp dans Rp , et a un point de U où la différentielle dfa est inversible. Alors il existe un ouvert V inclus dans U et contenant a tel que f : V −→ f (V ) soit un difféomorphisme de classe C k . Autrement dit, si la différentielle de f en a est un isomorphisme en tant qu’application linéaire, f est elle-même un isomorphisme en tant qu’application C k , pourvu qu’on ne s’éloigne pas trop de a. Démonstration. La preuve s’appuie sur un résultat classique de topologie, le théorème du point fixe pour les applications contractantes, dont nous rappelons l’énoncé. Attention : il s’agit d’une version “à paramètres”, dont on trouvera la preuve par exemple [Quéffélec], p. 151–152. Théorème 1.14. Soient (X, d) un espace métrique complet, Y un espace topologique, et f : X ×Y → X une application continue. On suppose f uniformément contractante, c’est-à-dire qu’il existe un réel positif k strictement inférieur à 1 tel que  d f (x, y), f (x0 , y) ≤ kd(x, x0 ) quels que soient x et x0 dans X et y dans Y . Alors, quel que soit y ∈ Y , l’équation f (x, y) = x admet une solution et une seule. Soit ϕ(y) cette solution. Alors l’application y 7→ ϕ(y) est continue. Quitte à composer avec des translations au départ et à l’arrivée, puis avec dfa−1 à l’arrivée, on se ramène au cas où a = f (a) = 0 et df0 = Id. En raison de la continuité de l’application x 7→ dfx , il existe une boule fermée B(0, r) ⊂ U sur laquelle kI−dfx k ≤ 21 . Alors, d’après l’inégalité des accroissements finis : 1. La restriction de f à B(0, r) est lipschitzienne de rapport 23 . 2. L’application continue F (x, y) = x − f (x) + y envoie B(0, r) × B(0, 2r ) dans B(0, r). 3. Quels que soient x et x0 de norme inférieure à r, kF (x, y) − F (x0 , y)k ≤

1 kx − x0 k. 2

Alors d’après le théorème 1.14, pour y ∈ B(0, 2r ), il existe un x et un seul dans B(0, r) tel que F (x, y) = x, c’est-à-dire f (x) = y, et l’application g : y 7→ x ainsi définie est continue. On en déduit l’existence d’ouverts U 0 et V 0 contenant 0 tels que g ◦ f|U 0 = Id|U 0

et f ◦ g|V 0 = Id|V 0 .

Il en résulte que f est un homéomorphisme de U 0 ∩ g −1 (V 0 ) sur V 0 ∩ f −1 (U 0 ). En appliquant la Proposition 1.11, on voit que f est en fait un difféomorphisme.

24

Introduction aux variétés différentielles

Corollaire 1.15. Soit f une application C k d’un ouvert U ⊂ Rm dans Rm . Si la différentielle de f est partout inversible, pour tout ouvert V de U , f (V ) est un ouvert de Rm . Démonstration. En effet, tout point de V est contenu dans un ouvert sur lequel f est un difféomorphisme. Exemple : “racine carrée” d’un endomorphisme proche de l’identité Il existe dans Gl(n, R) deux ouverts U et V contenant I tels que pour toute matrice B ∈ V il existe une unique matrice A ∈ U de carré B : comme (A + H)2 = A2 + AH + HA + H 2 , on voit que l’application f : A 7→ A2 est différentiable, la différentielle en A étant donnée par H 7→ AH + HA. Ainsi, f est C 1 , et il suffit d’appliquer le théorème d’inversion locale en A = I. Définition 1.16. Un difféomorphisme local ou une application étale est une application de classe C k (k ≥ 1) d’un ouvert U de Rp dans Rp dont la différentielle en tout point est inversible. D’après le théorème d’inversion locale, il revient au même de dire que tout point de U est contenu dans un sous-ouvert V tel que f |V soit un difféomorphisme sur son image. Notons aussi qu’une application C k (k ≥ 1 dont la différentielle en un point est inversible est un difféomorphisme local d’un voisinage de ce point sur son image. Il n’y a aucune raison pour qu’un difféomorphisme local soit injectif ; par contre, d’après la proposition 1.11 tout difféomorphisme local bijectif est un difféomorphisme. Notons enfin qu’un difféomorphisme local est une application ouverte (c’est à dire que l’image de tout ouvert est un ouvert) d’après le corollaire 1.15. Exemples a) L’application (r, θ) 7→ (r cos θ, r sin θ) est un difféomorphisme local de ]0, ∞[×R sur R2 − {0}· b) Si on identifie C à R2 , l’application z → 7 z 2 est un difféomorphisme local de 2 R − {0} sur lui-même, et l’application z → 7 ez un difféomorphisme local de R2 2 sur R \ {0}.

1.4.3. Immersions, submersions Il est remarquable qu’on puisse encore avoir des informations “locales” sur f en supposant seulement que sa différentielle en un point a est injective ou surjective. Pour alléger les énoncés, on a supposé que a = 0 et f (a) = 0, le cas général se déduit sans peine en faisant des translations.

1 − Calcul différentiel

25

Théorème 1.17. Soit f une application C 1 d’un ouvert U de Rp dans Rq . On suppose que 0 ∈ U et que la différentielle df0 est injective. Alors il existe un ouvert V de Rq contenant 0, un ouvert U 0 contenu dans U tel que f (U 0 ) ⊂ V , et un difféomorphisme ϕ de V sur son image tels que  ϕ f (x1 , · · · , xp ) = (x1 , · · · , xp , 0, · · · , 0). Démonstration. Nécessairement p ≤ q. Soient f 1 , · · · , f q les composantes de f . L’hypothèse signifie que la matrice jacobienne de f est de rang p. Après permutation des coordonnées dans l’espace d’arrivée si nécessaire, on peut donc supposer que la matrice  A = ∂j f i (0) 1≤i≤p ,1≤j≤p est inversible. On définit alors une application g de U × Rq−p dans Rq en posant g(x1 , · · · , xp , y 1 , · · · , y q−p ) = (f 1 (x), · · · , f p (x), y 1 + f p+1 (x), · · · , y q−p + f q (x))· La matrice jacobienne de g est de la forme   A 0 . ∗ I Elle est inversible, donc il existe un ouvert W contenant 0 tel que g|W soit un difféomorphisme sur son image. Le difféomorphisme cherché est ϕ = g −1 . Remarque. Une conséquence immédiate de ce théorème est l’existence d’une inverse à gauche locale pour f , c’est à dire d’une application d’un ouvert de Rq contenant 0 sur un ouvert de Rp telle que f1 ◦ f = IdRp : il suffit de prendre f1 = (ϕ1 , · · · , ϕq ), autrement dit de ne garder que les q premières coordonnées de ϕ. Exemple. Si p = 1 l’image de f est une courbe, et le théorème nous dit que tout morceau suffisamment petit de cette courbe peut être transformé en segment de droite par un difféomorphisme. IR q – p ϕ(V ) IR p

ϕ

IR q

V f

IR p

Figure 1.2 – Redressement d’une courbe

26

Introduction aux variétés différentielles

On a un résultat dual concernant les applications dont la différentielle est surjective. Cette fois, c’est en composant par un difféomorphisme à la source qu’on obtiendra une application linéaire. Théorème 1.18. Soit f une application C 1 d’un ouvert U de Rp dans Rq . On suppose que 0 ∈ U et que la différentielle df0 est surjective. Alors il existe un ouvert V de Rp contenant 0 et un difféomorphisme ψ de W sur son image tels que ψ(W ) ⊂ U et  f ψ(x1 , · · · , xp ) = (x1 , · · · , xq ). Démonstration. Nécessairement p ≥ q. Après permutation cette fois des coordonnées xi , on peut supposer que la matrice  B = ∂j f i (0) 1≤i≤q ,1≤j≤q est inversible, et on définit une application h de U dans Rp en posant h(x) = (f 1 (x), · · · , f q (x), xq+1 , · · · , xp )· La matrice jacobienne de h en zéro est de la forme   B ∗ . 0 I Il existe donc un ouvert W de Rp contenant 0 tel que h|W soit un difféomorphisme sur son image, et si ψ est son inverse on vérifie que  f (ψ(x1 , · · · , xp ) = (x1 , · · · , xq ). q+1 q En effet,  si x est de la forme h(u) = (f (u), u , · · · , u ), on a ψ(x) = u, donc f ψ(x) = f (u).

Remarque. De même que précédemment, on déduit de ce théorème l’existence d’une inverse à droite locale pour f , c’est à dire d’une application lisse f1 d’un ouvert de Rq contenant 0 sur un ouvert de Rp contenant 0 telle que f ◦ f1 = IdRq : il suffit de prendre f1 (x1 , . . . , xq ) = ψ(x1 , . . . , xq , 0, . . . , 0). Exemple. Si q = 1, ce résultat signifie que, modulo un difféomorphisme local de l’espace de départ, c’est à dire un “changement de variables”, une fonction scalaire à différentielle non nulle est assimilable à une forme linéaire. Remarque. Il existe un énoncé plus général, qui englobe les deux précédents, c’est le théorème du rang constant, voir l’exercice 10. Définitions 1.19. Une immersion (de classe C k ) d’un ouvert U ⊂ Rp dans Rq est une application (C k ) de U dans Rq dont la différentielle en tout point est injective. Une submersion est de même une application (C k ) de U dans Rq dont la différentielle en tout point est surjective.

1 − Calcul différentiel

27

Avec ces notations, notons que p ≤ q si f est une immersion, et p ≥ q si f est une submersion. Bien entendu, une application qui est à la fois une immersion et une submersion est un difféomorphisme local. Remarques a) Si la différentielle en un point a est injective (resp. surjective) il existe un ouvert contenant a pour lequel cette propriété subsiste. Pour le voir, on peut soit utiliser les théorèmes précédents, soit remarquer que cette propriété équivaut à la nonnullité d’un déterminant d’ordre p (resp. d’ordre q) extrait de la matrice jacobienne. Cette dernière condition est bien une condition “ouverte”. b) ** Les théorèmes 1.17 et 1.18 conduisent naturellement aux notions d’immersion et de submersion continue : une application continue f d’un ouvert U de Rp dans Rq est une immersion C o (resp. une submersion C o ) si après composition au but (resp. à la source) avec un homéomorphisme convenable elle devient une application linéaire injective (resp. surjective). ** DORÉNAVANT, SAUF MENTION CONTRAIRE EXPRESSE, TOUTES LES APPLICATIONS RENCONTRÉES SERONT SUPPOSÉES LISSES Remarque. Le mot “lisse”, à la fois bref et parlant, n’est le plus souvent employé qu’en Géométrie Algébrique. On peut se demander pourquoi les appellations “C ∞ ” ou “de classe C ∞ ” connaissent encore une telle fortune, alors que les Anglo–Saxons disent “smooth” et que la plupart des mathématiciens francophones tiennent à une terminologie élégante. De même, on peut regretter que la terminologie “application étale” (au lieu de difféomorphisme local), proposée par exemple dans [Dieudonné 1], n’ait pas tout le succès qu’elle mérite.

1.5. Sous-variétés 1.5.1. Propriétés de base Intuitivement, une sous-variété de dimension p de Rn est une réunion de petits morceaux qui peuvent chacun être “redressés” de façon à former des ouverts de Rp · On pourra se convaincre que pour un cercle deux morceaux sont nécessaires (et suffisants !). Définition 1.20. Une partie M ⊂ Rn est une sous-variété de dimension p de Rn si pour tout x de M, il existe des voisinages ouverts U et V de x et 0 dans Rn respectivement, et un difféomorphisme f : U → V tel que f (U ∩ M ) = V ∩ (Rp × {0})· On dit alors que M est de codimension n − p dans Rn . Cette définition se comprend mieux avec la figure 1.3 dans la tête. Notons que p est unique, autrement dit que M n’est pas une variété de dimension p1 6= p. La

28

Introduction aux variétés différentielles

vérification est laissée au lecteur, à moins qu’il n’attende de lire le chapitre suivant, où cette question sera élucidée dans un cadre plus général. Remarque. On peut bien entendu dans cette définition remplacer 0 et Rp × {0} par un point et un sous-espace affine de dimension p quelconques. IR p

M U

f (U ) =V f

Figure 1.3 – Sous-variété

Dans la pratique, une sous-variété peut être définie localement par des équations, ou par des représentations paramétriques. Le nombre de paramètres réels est égal à la dimension, et le nombre d’équations, égal à n − p si p est la dimension, s’appelle la codimension, comme en algèbre linéaire. Ce qui suit est une mise en forme de cette remarque. Théorème 1.21. Soit M une partie de Rn . Les propriétés suivantes sont équivalentes : a) M est une sous-variété de dimension p de Rn . b) Pour tout a de M , il existe un ouvert U de Rn contenant a et une submersion g : U → Rn−p telle que U ∩ M = g −1 (0)· c) Pour tout a de M , il existe un ouvert U de Rn contenant x, un ouvert Ω de Rp contenant 0, et une application h : Ω → Rn qui est à la fois une immersion dans Rn et un homéomorphisme de Ω sur U ∩ M . d) Pour tout a de M , il existe un ouvert U de Rn contenant a, un ouvert V de Rp contenant (a1 , · · · , ap ) et une application lisse G de V dans Rn−p tels que, après permutation éventuelle des coordonnées, U ∩ M soit égal au graphe de G. Démonstration. Montrons d’abord que (a) implique (b) et (c). Soit f le difféomorphisme défini sur un voisinage U de a ∈ M , dont (a) affirme l’existence. Alors f −1 est un difféomorphisme de f (U ) sur U . Sa restriction à Rp ×{0}∩f (U ) est une immersion de cet ouvert de Rp dans Rn , et un homéomorphisme sur U ∩ M , d’où (c).

1 − Calcul différentiel

29

Pour voir que (a) implique (b), considérons les composantes (f i )1≤i≤n de f . Par hypothèse, leurs différentielles sont linéairement indépendantes en tout point de U . Posons g = (f p+1 , · · · , f n ). On a bien une submersion de U dans Rn−p telle que M ∩ U = g −1 (0)· Supposons maintenant que (c) soit vérifiée. D’après le théorème 1.17, on peut, quitte à remplacer Ω par un sous-ouvert, trouver un difféomorphisme ϕ d’un ouvert U contenant h(0) = a dans Rn tel que (ϕ ◦ h)(x1 , · · · , xp ) = (x1 , · · · , xp , 0, · · · , 0)· Alors ϕ(U ∩ M ) = ϕ(h(Ω)) = ϕ(U ) ∩ (Rp × {0}). L’implication (ii) ⇒ (i) se montre de la même façon en utilisant cette fois le théorème 1.18. Montrons maintenant l’équivalence de (b) et (d). Le fait que (d) implique (b) est élémentaire : si M est localement le graphe d’une fonction G : V → Rn−p comme dans l’énoncé, de composantes G1 , · · · , Gn−p , l’application  g : x 7→ xi+p − Gi (x1 , · · · , xp ) 1≤i≤n−p est une submersion qui convient, quitte à restreindre son ouvert de définition. Inversement, une telle submersion étant donnée, on peut supposer comme dans la preuve du théorème 1.18, quitte à permuter les coordonnées, que la matrice  ∂i+p g j (a) 1≤i,j≤n−p est inversible. On applique alors le théorème d’inversion locale à la fonction  F : x → x1 , · · · , xp , g 1 (x), · · · , g n−p (x) . Son inverse locale est aussi de la forme  F −1 : x → x1 , · · · , xp , γ 1 (x), · · · , γ n−p (x) , ce qui fait apparaître M localement comme le graphe de  G : (x1 , · · · , xp ) 7→ γ j (x1 , · · · , xp , 0 · · · , 0) 1≤j≤n−p . Remarques a) L’implication (b)→ (d) est connue sous le nom de théorème des fonctions implicites. b) Soit g une application lisse d’un ouvert U de Rn dans Rp , et soit un a de Rp tel que g −1 (a) 6= ∅. Alors, pour que g −1 (a) soit une variété, il suffit que la différentielle de g soit surjective en tout point de g −1 (a). En effet si cette propriété est vraie en un point x, elle l’est aussi dans un voisinage de x (par exemple parce que la surjectivité équivaut à la non-nullité d’un déterminant d’ordre p extrait de la matrice jacobienne). Cet argument est très souvent utilisé.

30

Introduction aux variétés différentielles

1.5.2. Exemples : sphères, tores, groupe orthogonal a) La sphère S n définie par S n = {x = (x0 , ..., xn ) ∈ Rn+1 /x20 + ... + x2n − 1 = 0} est une sous-variété de dimension n (et de classe C ∞ ) de Rn+1 . L’application f : Rn+1 → R définie ci-dessus est bien une submersion en tout point de S n , sa différentielle en x étant df (x) = (2x0 , ..., 2xn ). b) Le tore T n de dimension n défini par T n = {z = (z1 , .., zn ) ∈ Cn / | z1 |2 = · · · =| zn |2 = 1} ou encore {x = (x1 , ..., x2n ) ∈ R2n / (x21 + x22 − 1, ..., x22n−1 + x22n − 1) = 0} est une sous-variété de R2n ' Cn . Ici, on peut aussi appliquer le critère (iii) en introduisant l’application h : (t1 , . . . , tn ) → (eit1 , . . . , eitn )

de Rn dans Cn .

Le tore de révolution (cf. exercice 13) est plus facile à voir géométriquement, mais un peu moins simple à manipuler.

Figure 1.4 – Tore de révolution

c) Le groupe orthogonal O(n) = {A ∈ Mn (R)/t AA = Id} est une sous-variété de dimension

n(n−1) 2

2

de Mn (R) ' Rn . En effet, on définit

f : Mn (R) → Sym(n) par f (A) = t AA − Id, où Sym(n) est l’espace vectoriel des matrices symétriques (n, n). Alors O(n) = f −1 (0) et f est une submersion en tout point de O(n). Notons d’abord que dfA · H = t AH + t HA· En particulier, si S est symétrique et A orthogonale, on a dfA (

AS ) = S. 2

Nous verrons dans la section 1.6 une démonstration utilisant (c).

1 − Calcul différentiel

31

d) La partie de R3 définie par l’équation x2 + y 2 − z 2 = 0 (cône de révolution) n’est pas une sous-variété. A priori, le critère (b) ne marche pas, mais ce n’est pas une raison ! (a contrario, remarquer que la droite d’équation x − y = 0 a aussi pour équation x3 − y 3 = 0). Le plus commode est de montrer que (c) n’est pas vrai : voir la figure ci-dessous.

0

Figure 1.5 – Un cône privé de son sommet n’est plus connexe

1.5.3. Paramétrisations Définitions 1.22. a) Une paramétrisation d’une sous-variété M de dimension p de Rn est une application d’un ouvert Ω de Rp dans Rn qui est à la fois une immersion dans Rn et un homéomorphisme de Ω sur un ouvert de M . b) Une paramétrisation locale est une application de Ω dans Rn qui induit une paramétrisation au voisinage de tout point de Ω. D’après le théorème 1.21 toute sous-variété peut être recouverte par des ouverts qui sont des images de paramétrisations. Exemples a) L’application t → (cos t, sin t) de R dans R2 est une paramétrisation locale du cercle x2 + y 2 = 1. De même, l’application (u, v) → (cos u, sin u, cos v, sin v) de R2 dans R4 est une paramétrisation locale du tore T 2 . b) L’image de l’application h de R2 dans R3 definie par g(u, v) = (sin u cos v, sin u sin v, cos u) est la sphère S 2 . Mais g n’est une paramétrisation locale qu’à condition d’enlever les droites u ≡ π2 mod π. Dans ce cas on obtient une paramétrisation locale de la sphère privée des deux pôles (rappelons que u et v sont les coordonnées sphériques

32

Introduction aux variétés différentielles – latitude et longitude – sur S 2 ). Pour montrer que S 2 est une sous-variété en utilisant ce point de vue, il faut ajouter à g d’autres paramétrisations, par exemple p (x, y) → (x, y, ± 1 − x2 − y 2 ) au voisinage des pôles Nord et Sud. Il est clair qu’une seule paramétrisation ne peut suffire, puisque S 2 est un espace compact, et ne peut donc être homéomorphe à un ouvert de R2 . Cette obligation d’avoir recours à plusieurs paramétrisations pour une sous-variété aussi simple est l’une des raisons qui justifient l’introduction des variétés.

Attention. La dissymétrie entre les critères (ii) et (iii) du théorème 1.21 n’est pas fortuite. Il n’est pas vrai que l’image d’un ouvert de Rp par une immersion soit toujours une sous-variété. Tout d’abord bien sûr parce qu’une immersion n’est pas forcément injective (points doubles). Mais ce n’est pas vrai même si on suppose l’immersion injective. Contre-exemple. L’application t → (cos t, sin t, cos



√ 2t, sin 2t)

est une immersion de R dans R4 , mais g(R) n’est pas une sous-variété de R4 . ** D’une part, pour tout nombre irrationnel α, l’ensemble Z + αZ est dense dans R (comparer au théorème 4.40), ce qui implique que g(R) est dense dans le tore T 2 . D’autre part, il résulte de la définition des sous-variétés que celles-ci sont des parties localement fermées (c’est-à-dire ouvertes dans leur adhérence) de l’espace ambiant. ** Nous verrons plus de détails sur cette question au chapitre suivant.

1.5.4. Vecteurs tangents, espace tangent Définition 1.23. Soient A ⊂ Rp et a un point de A. On dit qu’un vecteur v est tangent à A en a s’il existe une application différentiable c :] − , [→ Rp telle que c(] − , [) ⊂ A, c(0) = a et c0 (0) = v. Attention. Cette définition, contrairement à celle qui consisterait à prendre les dérivées à droite d’applications définies sur [0, [, est très restrictive, comme le montre l’exemple suivant : Exemple. Le seul vecteur tangent à l’origine à la courbe C image de R par l’application t 7→ (t2 , t3 ) est le vecteur nul : si u → c1 (u), c2 (u) est à valeurs dans C, alors c01 (0) = 0, puisque c1 (u) est toujours positif. Comme c2 = (c1 )3/2 , on a aussi c02 (0) = 0. Par contre, l’application u 7→ (u, u3/2 ) de [0, 1[ dans R2 a une image contenue dans C et une dérivée à droite non nulle à l’origine. En particulier, cette courbe n’est pas une sous-variété, en raison de la propriété suivante :

1 − Calcul différentiel

33

Figure 1.6 – Une courbe avec rebroussement n’est pas une sous-variété

Proposition 1.24. Les vecteurs tangents en un point à une sous-variété de dimension p de Rn forment un espace vectoriel de dimension p. Démonstration. Soit a un point de la sous-variété M , et f un difféomorphisme défini sur un ouvert U contenant a et tel que f (U ∩ M ) = f (U ) ∩ (Rp × {0}). On peut toujours supposer que f (a) = 0. Alors, si v est tangent en a, le théorème des fonctions composées appliqué à f ◦ c montre que df (a).v ∈ Rp × {0}. Inversement, si w ∈ Rp × {0}, en choisissant  de façon que ∀t, |t| < , tw ∈ f (U ) on voit que la courbe t → f −1 (tw) définit un vecteur tangent à M en a, à savoir df0−1 · w. Autrement dit, l’ensemble des vecteurs tangents s’identifie à l’image par l’application linéaire df0−1 du sous-espace vectoriel Rp × {0} de Rn . Définition 1.25. L’espace tangent à une sous-variété M de Rn en un point a, noté → soit tangent à M en a. Ta M , est l’ensemble des points m de Rn tels que le vecteur − am D’après ce qui précède, l’espace tangent en a est un sous-espace affine de dimension p de l’espace ambiant. Il devient un espace vectoriel pour le choix naturel de a comme origine puisqu’on peut le voir alors comme l’ensemble des extrémités des vecteurs tangents. Une question importante, qui sera discutée plus bas, est celle de la position d’une sous-variété par rapport à l’espace tangent en un point. Mais quand nous passerons aux variétés, le point de vue pertinent sera le point de vue vectoriel. Des arguments analogues à ceux de la preuve de 1.24 permettent de décrire l’espace tangent d’une sous-variété donnée par une submersion ou une paramétrisation. Si g est une submersion définie sur un voisinage U de a et telle que U ∩ M = g −1 g(a) , alors l’espace tangent en a est le noyau de l’application  linéaire dga : pour une courbe t 7→ c(t) définissant un vecteur tangent, on a g c(t) = g(a) donc dga · v = 0. Ainsi, Ker dga est inclus dans Ta M , et ces deux espaces sont égaux car ils ont même dimension ; les n − p composantes scalaires de g donnent par différentiation un système de n − p équations linéaires à n inconnues, de rang maximum, dont les solutions sont les vecteurs tangents.

34

Introduction aux variétés différentielles

De même, si M est définie au voisinage de a par une paramétrisation (telle que g(0) = a par exemple), l’espace tangent en a sera l’image de Rp par l’application linéaire dg0 . Exemple : surfaces de R3 Explicitons tout cela pour les sous-variétés de dimension 2 de R3 . Si une telle sousvariété S (comme “surface” !) est donnée au voisinage d’un point (a, b, c) par l’équation f = 0 (où l’on a supposé que f est une submersion), l’équation du plan tangent en (a, b, c) s’écrit (x − a)∂1 f (a, b, c) + (y − b)∂2 f (a, b, c) + (z − c)∂3 f (a, b, c) = 0. Si S est donnée au voisinage de ce même point par une paramétrisation  (u, v) → g(u, v), h(u, v), k(u, v) ,  avec par exemple (a, b, c) = g(0, 0), h(0, 0), k(0, 0) , ce même plan tangent sera donné par la représentation paramétrique   a + ∂1 g(0, 0)u + ∂2 g(0, 0)v (u, v) → b + ∂1 h(0, 0)u + ∂2 h(0, 0)v  c + ∂1 k(0, 0)u + ∂2 k(0, 0)v Pour connaître la position d’une surface S par rapport à un plan tangent, on peut toujours se ramener au cas où S a pour plan tangent en 0 le plan z = 0. Elle est alors au voisinage de 0 le graphe d’une fonction (x, y) 7→ G(x, y) dont la différentielle en 0 est nulle. Après composition par un difféomorphisme à la source, on peut “le plus souvent” se ramener au cas où G est une forme quadratique non dégénérée (lemme de Morse, cf. exercice 11). Alors, au voisinage de 0, S est d’un même côté du plan tangent en 0 si cette forme quadratique – ou, ce qui revient au même, la forme quadratique définie par les dérivées secondes de G en 0 – est du type + + ou − −, et S traverse son plan tangent si cette forme quadratique est du type ± ∓ (voir la figure 1.7 et l’exercice 22).

Figure 1.7 – Minimum, maximum, point selle

1 − Calcul différentiel

35

1.6. Sous-groupes à un paramètre du groupe linéaire Rappelons que, pour un corps K, on note Gl(n, K) le groupe multiplicatif des applications linéaires inversibles de K n dans lui-même. Les cas qui nous intéressent ici sont K = R ou K = C. Si K n est muni d’une norme, rappelons qu’il lui est associé une norme sur End(K n ), définie par ∀A ∈ End(K n ), kAk = sup kAxk. kxk≤1

Définition 1.26. L’exponentielle d’un endomorphisme A ∈ End(K n ) (K = R ou C) est l’endomorphisme défini par exp A =

∞ X Ak k=0

k!

.

Il est clair que cette série converge : en raison des propriétés de la norme d’une application linéaire, Ak kAkk k k≤ , k! k! et on a affaire à une série normalement convergente dans un espace vectoriel normé de dimension finie. On voit aussi que k exp Ak ≤ ekAk . On a de plus les propriétés suivantes : Lemme 1.27. a) exp est continue. b) Si A et B commutent, exp(A + B) = (exp A)(exp B)· En particulier, exp A est inversible d’inverse exp(−A). c) Si P est inversible, exp(P −1 AP ) = P −1 (exp A)P · d) det(exp A) = etr(A) · e) exp t A = t exp A , exp A = exp A. Démonstration. a) est immédiat : d’après l’inégalité ci-dessus, on a affaire à une série uniformément convergente sur tout compact.

36

Introduction aux variétés différentielles

b) Les deux membres étant des séries normalement convergentes, la démonstration 0 0 est la même que la démonstration classique de l’identité ez+z = ez ez pour z et 0 z dans C. On utilise l’identité k

(A + B) =

k   X k i=0

i

Ai B k−i

qui est vraie si A et B commutent. c) est immédiat d’après a) par passage à la limite, puisque pour tout entier k, P −1 Ak P = (P −1 AP )k · d) La propriété est évidente pour les matrices diagonales, elle est vraie d’après c) pour les matrices diagonalisables (et même pour les matrice réelles qui sont Cdiagonalisables), qui forment une partie dense de End(K n ), donc pour toutes les matrices, en raison de la continuité de exp et det (voir l’exercice 24 pour une autre preuve). e) est évident. Il est clair d’après la définition que l’exponentielle est différentiable en 0, et que la différentielle est l’application identique. Pour pouvoir appliquer le théorème d’inversion locale, il faut vérifier que exp est de classe C 1 . Le critère classique de continuité et de dérivabilité s’applique facilement, mais on peut dire beaucoup mieux par des moyens moins pédestres, à condition de faire un peu d’analyse complexe. Théorème 1.28. L’exponentielle est lisse. Démonstration. Pour toute matrice dont le spectre est contenu dans le disque ouvert D(r) = {z, |z| < r} du plan complexe, on a Z 1 exp A = (zI − A)−1 ez dz. 2iπ C(0,r) En effet, appelons provisoirement f (A) le second membre. Comme f (P −1 AP ) = P −1 f (A)P , il suffit d’utiliser le même argument de densité que dans le lemme précédent et de montrer que f (D) = exp D pour les matrices D diagonales, auquel cas on est ramené à la formule intégrale de Cauchy. L’intégrand du second membre est lisse (il est même analytique réel) sur l’ensemble (ouvert !) des matrices dont le spectre est contenu dans D(r), et on conclut en appliquant le théorème de dérivation des intégrales dépendant d’un paramètre. 1 Remarque. On peut donner de ce résultat une démonstration élémentaire, mais longuette, en utilisant les théorèmes habituels de dérivation terme à terme des séries de fonctions.

1. Cet argument élégant m’a été communiqué naguère par Max Karoubi à une terrasse de café place Jussieu.

1 − Calcul différentiel

37

Corollaire 1.29. Il existe un ouvert U de End(Rn ) contenant 0 tel que l’exponentielle soit un difféomorphisme de U sur son image. Nous allons en déduire le résultat fondamental suivant. Théorème 1.30. Pour tout morphisme continu f du groupe additif (R, +) dans Gl(n, R), il existe un unique endomorphisme A tel que ∀t ∈ R, f (t) = exp tA. Remarque. Inversement, d’après le lemme 1.27, t → exp tA est bien un morphisme continu de (R, +) dans Gl(n, R). Démonstration. On peut supposer f non constante (sinon on prend A = 0 !). Soit U une boule ouverte de centre 0 dans End(Rn ) telle que exp, restreinte à la boule de rayon double (que nous noterons 2U ), soit un difféomorphisme. D’après la continuité de f , il existe un intervalle I contenant 0 tel que f (I) ⊂ exp U , et donc, f étant non constant, un c ∈ I tel que f (c) = A ∈ exp U , avec A 6= I. D’après le choix de U , il existe B ∈ U , non nul, tel que exp B = A. Alors exp B/2 = f (c/2). En effet, toujours d’après le choix de U , on a c = exp B 0 , avec B 0 ∈ U. f 2 Ainsi exp 2B 0 = f (c) = exp B, alors que les endomorphismes 2B 0 et B sont tous deux dans l’ouvert 2U , sur lequel exp est un difféomorphisme, et en particulier une injection. Donc B 0 = B/2. Le même raisonnement prouve que pour tout entier p, exp

c B = f . 2p 2p

Donc d’après les propriétés algébriques de f , on a   kB kc exp p = f 2 2p quels que soient les entiers k et p. Mais les réels de la forme donc en utilisant à nouveau la continuité, on voit que

k 2p

sont denses dans R,

∀t ∈ R, exp tB = f (tc). Un argument analogue permet de montrer que l’exponentielle fournit des paramétrisations de certains sous-groupes de Gl(n, K). Définitions 1.31. a) Le groupe spécial linéaire, noté Sl(n, K) est le sous-groupe de Gl(n, K) formé des endomorphismes de déterminant 1.

38

Introduction aux variétés différentielles

b) Le groupe orthogonal, noté O(n), est le sous-groupe de Gl(n, R) formé des endomorphismes tel que t AA = I. c) Le groupe spécial orthogonal, noté SO(n), est le sous-groupe Sl(n, R) ∩ O(n). Nous avons vu que O(n) est une sous-variété de End(Rn ). De même, il résulte immédiatement de la fin de 1.2.2 que Sl(n, R) est aussi une sous-variété. D’autre part, les formules du lemme 1.27 montrent que l’exponentielle d’un endomorphisme de trace nulle est dans Sl(n, R), et que l’exponentielle d’un endomorphisme antisymétrique est dans O(n). Proposition 1.32. Il existe un ouvert V contenant 0 dans l’espace vectoriel des endomorphismes à trace nulle (resp. dans l’espace vectoriel des endomorphismes antisymétriques) tel que exp |U soit une paramétrisation de Sl(n, R) (resp. de O(n)). Démonstration. On choisit d’abord un ouvert U contenant 0 dans End(Rn ) tel que exp : U 7→ exp(U ) soit un difféomorphisme, et qui soit symétrique par rapport à l’origine (1er cas), et en plus stable par transposition (2e cas). Plaçons-nous par exemple dans le deuxième cas. Soit B ∈ exp(U ) ∩ O(n). Il existe un unique A ∈ U tel que B = exp A. On a alors B −1 = exp(−A)

et

t

B = exp t A,

donc −A = t A d’après le choix de U . Il suffit donc de prendre pour V l’intersection de U avec l’espace des endomorphismes antisymétriques.

1.7. Points critiques Définitions 1.33. a) Si f est une application lisse d’un ouvert U ⊂ Rm dans Rn , un point x ∈ U est dit critique si rg(dx f ) < n. b) Un point est dit régulier s’il n’est pas critique. Si m = n, les points réguliers sont ceux où la différentielle est inversible, autrement dit ceux auxquels le théorème d’inversion locale s’applique. Si l’espace d’arrivée est de dimension 1, un point est critique si et seulement si dx f = 0. En voici un exemple important. Proposition 1.34. Soit f une application C 1 d’un ouvert U de Rm à valeurs dans R. Si f admet un maximum (resp. minimum) local en a, autrement dit s’il existe un sous-ouvert V contenant a tel que ∀x ∈ V, f (x) ≤ f (a) (resp. f (x) ≥ f (a)), alors a est un point critique.

1 − Calcul différentiel

39

Démonstration. Supposons le contraire. Soit alors v un vecteur tel que da f · v 6= 0. Si le réel t est suffisamment petit, f (a + tv) − f (a) = da f · tv + o(tv) est non nul et a le même signe que da f · tv. En choisissant deux valeurs opposées d’un tel t on aboutit à une contradiction. Pour tirer pleinement parti de ce résultat, il est préférable d’être assuré de l’existence d’extrema, par exemple en utilisant des propriétés de compacité. C’est pourquoi cette propriété prend tout son intérêt quand on l’applique non pas à des ouverts de Rm , mais à des sous-variétés (ainsi qu’à des variétés, mais n’anticipons pas). Proposition 1.35. Soit S une sous-variété de Rm , et f une fonction numérique définie sur un ouvert contenant S. Si la restricition de f à S admet un maximum ou un minimum local en un point a de S, alors da f s’annule sur l’espace vectoriel tangent en a. Démonstration. Soit U un ouvert contenant a pour lequel il existe un difféomorphisme g sur un ouvert g(U ) contenant 0 tel que g(U ∩S) = g(U )∩(Rp ×{0} (voir la définition 1.20 ; ici p est la dimension de S. Alors, d’après la proposition 1.34, la différentielle de f ◦ g −1 en 0 s’annule sur Rp . L’énoncé s’en déduit, d’après la définition même de l’espace tangent. Remarque. En pratique, on utilise principalement ce résultat quand S est donnée au voisinage de a par une submersion. Si h1 , · · · , hn−p sont les coordonnées d’une telle submersion, la proposition ci-dessus dit précisément que dfa est combinaison linéaire des (dhi )a . Les coefficients de cette combinaison linéaire s’appellent les multiplicateurs de Lagrange. Voici un exemple d’application. Théorème 1.36. Tout endomorphisme autoadjoint d’un espace vectoriel euclidien est diagonalisable et admet une base orthogonale de vecteurs propres. Démonstration. On procède par récurrence sur la dimension de E. La propriété est évidente en dimension 1. Soit u un tel endomorphisme. Par définition, quels que soient x et y dans E, hu(x), yi = hx, u(y)i. La sphère unité S est compacte, donc la fonction f (x) = hu(x), xi réalise son maximum en un point a de S. Par ailleurs, la fonction f est lisse, et a pour différentielle da f · h = hu(h), ai + hu(a), hi = 2hu(a), hi, alors que l’espace tangent à S en a est l’orthogonal de a. D’après la proposition 1.35, u(a) est colinéaire à a, autrement dit a est vecteur propre. Mais comme u est autoadjoint, il laisse stable le sous-espace Ra⊥ , ce qui donne l’argument de récurrence. Remarques a) On a le même résultat dans le cadre hermitien. b) C’est en Analyse fonctionnelle que ce type d’argument prend toute son importance. Voir par exemple [Brezis], VI.4. Un exemple typique est le théorème de décomposition spectrale pour le laplacien. Si D est un domaine compact à bord

40

Introduction aux variétés différentielles lisse de Rn , son spectre pour le problème de Dirichlet est l’ensemble des λ pour lesquels il existe une fonction f ∈ C 2 (D) non identiquement nulle telle que ∆f = −λf

avec

f|∂D = 0.

On démontre que c’est une suite λ1 ≤ λ2 ≤ . . . ≤ λp ≤ . . ., avec limp→+∞ λp = +∞, et que L2 (D) admet une base hilbertienne formée de fonctions propres. Notons au passage que ∆ est “formellement 2 autoadjoint” pour le produit scalaire hilbertien, autrement dit que si f et g sont C 2 et nulles au bord, Z Z 1 n g∆f dx1 . . . dxn . f ∆gdx . . . dx = D

D

Voir l’exercice 14 du chapitre 6, où l’on montre aussi, avec les mêmes hypothèses sur f , que Z Z f ∆f dx1 . . . dxn = |dfx |2 dx1 . . . dxn . D

D

Ce théorème de décomposition spectrale est ainsi un parfait analogue du théorème 1.36, et sa preuve s’appuie, modulo les développements R d’analyse fonctionnelle adéquats, sur l’étude des extrema de la fonctionnelle D |dfx |2 dx1 . . . dxn sur la sphère unité de L2 (D). Voir par exemple [Attouch–Buttazzo–Michaille], ch. 7. Cette méthode variationnelle permet aussi de contrôler le volume des pavés d’un espace euclidien. Rappelons que la mesure de Lebesgue est normalisée en donnant la valeur 1 à un pavé (et par suite à tous les pavés) définis par une base orthonormée. Alors, si ( n ) X P = ti ai , 0 ≤ ti ≤ 1 i=1

est le pavé défini par n vecteurs a1 , · · · , an , vol(P ) = | det(a1 , · · · , an )|, le déterminant étant pris par rapport à une base orthonormée. En dimension 2, sachant que vol(P ) = ka1 kka2 k| sin α|, où α désigne l’angle des vecteurs a1 et a2 , il est clair que vol(P ) ≤ ka1 kka2 k, et que l’égalité est réalisée si et seulement si les vecteurs sont orthogonaux. Un résultat analogue est vrai en toute dimension. Théorème 1.37 (inégalité de Hadamard). Soit E un espace vectoriel euclidien de dimension n, et P le pavé défini par n vecteurs a1 , · · · , an . Alors vol(P ) ≤

n Y

kai k,

i=1

et l’égalité est réalisée si et seulement si les ai sont deux à deux orthogonaux. 2. Formellement parce que l’opérateur n’est pas défini sur l’espace tout entier.

1 − Calcul différentiel

41

Démonstration. Il suffit de prouver le résultat quand les ai sont de norme 1. Soit (v1 , · · · , vn ) un n-uple de vecteurs pour lesquels l’application continue (a1 , · · · , an ) 7→ | det(a1 , · · · , an )| atteint son maximum. Dans un voisinage de ce n-uple, elle est égale au déterminant (ou à son opposé). D’après la proposition 1.35 appliquée aux fonctions partielles ai 7→ det(a1 , · · · , an ), pour tout i le déterminant det(v1 , · · · , vi−1 , h, vi+1 , · · · vn ) est nul dès que hvi , hi = 0, autrement dit ⊥ (vi ) ⊂ Vect(v1 , · · · , vi−1 , vi+1 , · · · vn ). Ces deux sous-espaces sont de codimension 1, il sont donc égaux, et vi est orthogonal à tous les vk pour k 6= i. Le système (v1 , · · · , vn ) est orthonormé, et le maximum est égal à 1. Inversement, si l’égalité est réalisée, le volume vaut 1, il est maximum et le système est orthonormé.

1.8. Valeurs critiques Les phénomènes type “courbe de Peano” (application continue surjective de [0, 1] sur [0, 1]×[0, 1]) ne se produisent pas avec des fonctions différentiables. Donnons quelques précisions. Nous désignerons par µ la mesure de Lebesgue. Dans cette section et la suivante, il sera plus commode de désigner par f 0 (x) (au lieu de dfx ) la différentielle de f en x. Proposition 1.38. Soit M ⊂ Rn une sous-variété de dimension p < n. Alors M est de mesure nulle dans Rn . Démonstration. Il suffit de montrer que tout x ∈ M est contenu dans un ouvert U tel que U ∩ M soit de mesure nulle. Appliquons directement la définition des sousvariétés, et considérons un ouvert U contenant x et un difféomorphisme f : U → V tel que f (U ∩ M ) = V ∩ (Rp × {0}). Le membre de droite étant évidemment de mesure nulle, on est ramené à la propriété suivante : Lemme 1.39. Soit U ⊂ Rn un ouvert et f : U 7→ Rn une application de classe C 1 . L’image par f d’un ensemble de mesure nulle est de mesure nulle. Soit E un tel ensemble. Il suffit de montrer que pour toute boule fermée B ⊂ U , f (E ∩ B) est de mesure nulle. Si K = sup kf 0 (x)k, x∈B

le théorème des accroissements finis montre que f est K-Lipschitzienne sur B, donc transforme tout cube de mesure δ en ensemble de mesure inférieure à K n δ. Ainsi, si C ⊃ E ∩ B est une réunion de cubes vérifiant µ(C) < , on a   µ f (E ∩ B) ≤ µ f (C) < K n .

42

Introduction aux variétés différentielles

On peut en fait dire beaucoup mieux. Pour cela, donnons encore une définition. Définition 1.40. Si f est une application lisse d’un ouvert U ⊂ Rm dans Rn , un point y ∈ Rn est une valeur critique s’il existe un point critique x tel que y = f (x). Un point qui n’est pas une valeur critique s’appelle une valeur régulière. Remarque. D’après cette définition, un point qui n’est pas dans l’image de f est une valeur régulière. Cette convention est parfaitement cohérente avec tous les résultats concernant les valeurs régulières. Théorème 1.41 (théorème de Sard). L’ensemble des valeurs critiques d’une application lisse d’un ouvert U ⊂ Rm dans Rn est de mesure nulle. Nous ne donnerons la preuve que dans le cas, plus facile, où m ≤ n. Il suffit alors de supposer f de classe C 1 . Notons d’abord que le résultat est évident si m < n. Tous les points sont critiques, et en appliquant le lemme 1.39 à l’application f1 : U × Rn−m → Rn définie par f1 (x, y) = f (x) on voit que f (U ) est de mesure nulle. Dans le cas m = n, la preuve repose sur le lemme suivant, qui exprime qu’une fonction de classe C 1 est “uniformément différentiable” sur tout compact. Lemme 1.42. Si f est de classe C 1 sur U , pour tout compact convexe K ⊂ U , il existe un réel α > 0 et une fonction λ : [0, α] 7→ R+ telle que kf (y) − f (x) − f 0 (x) · (x − y)k < λ(kx − yk)kx − yk,

avec

lim λ(t) = 0,

t7→0

pour tous les points x, y ∈ K tels que kx − yk < α. Démonstration. On a 1

Z

 f 0 x + t(y − x) · (y − x)dt,

f (y) − f (x) = 0

d’où Z k

1

 f 0 x + t(y − x) · (y − x) − f 0 (x) · (y − x)dtk

0

Z ≤

1

 kf 0 x + t(y − x) · (y − x) − f 0 (x) · (y − x)kdt.

0

Le résultat est alors une conséquence de la continuité uniforme de f 0 sur K. Preuve du théorème. Soit C l’ensemble des points critiques. Il suffit de montrer que f (C ∩ A) est de mesure nulle pour tout cube A. Notons d’abord que si x ∈ C, l’espace vectoriel Im f 0 (x) est contenu dans un hyperplan de H ⊂ Rn . Soit alors r > 0, et y tel que ky − xk < r. Alors d’après le lemme la distance de f (y) à l’hyperplan affine H 0 parallèle à H et contenant f (x) est inférieure à λ(r). D’autre part, si K = supx∈B kf 0 (x)k, on a kf (y) − f (x)k < Kr.

1 − Calcul différentiel

43

 Ainsi, f B(x, r) est inclus dans un cylindre de base H 0 ∩ B(f (x), Kr) et de hauteur 2rλ(r). A plus forte raison,  µ f (B(x, r) ≤ 2n K n−1 rn λ(r). Maintenant, le cube A est inclus dans au plus (ak)n cubes de côté k1 , où l’on a désigné par a le côté de A. Chaque cube qui rencontre C peut être enfermé dans une boule √ B(x, 2 kn ), où x ∈ C. Finalement, si ωn rn désigne le volume d’une boule de rayon r, on trouve que  √ n  √   √   n n n n n n−1 µ f (A ∩ C) ≤ (ak) 2 K ωn 2 λ 2 ≤ C(n, a, K)λ 2 , k k k d’où la conclusion en faisant tendre k vers l’infini. Pour la preuve (plus difficile) dans le cas où m > n, voir par exemple [Hirsch].

1.9. Calcul différentiel en dimension infinie La notion de différentielle et le théorème des fonctions composées s’étendent mot pour mot au cas des espaces vectoriels normés, à condition d’exiger que la différentielle L soit une application linéaire continue. Le théorème d’inversion locale s’étend aussi tel que, à condition d’avoir affaire à des espaces de Banach (il faut supposer bien sûr que la différentielle a une inverse continue 3 . En effet la démonstration repose essentiellement sur le théorème du point fixe pour les applications contractantes, valable pour tous les espaces métriques complets. Nous allons voir que cette généralisation n’a rien de gratuit, et rend aussi des services en dimension finie. Commençons par la propriété suivante, qui est la variante la plus élémentaire de ce que les analystes appellent le “lemme ω”. Proposition 1.43. Soient I un intervalle compact I, U un ouvert de Rn , et f : U → Rn une fonction C 1 . Alors l’ensemble des fonctions continues g : I → U est un ouvert de C 0 (I, Rn ) (muni de la norme uniforme) sur lequel l’application g 7→ f ◦ g est continûment différentiable. Démonstration. La première partie est classique : soit g0 une fonction telle que g0 (I) ⊂ U . Comme g0 (I) et compact, sa distance au complémentaire de U est un nombre strictement positif α, et si kg − g0 k < α, on a bien g(I) ⊂ U . Pour la seconde, on applique le lemme 1.42 à un voisinage compact convenable de g0 (I). On a, avec les notations du lemme

    kf g(t) − f g0 (t) − dfg0 (t) · g(t) − g0 (t) k ≤ λ g(t) − g0 (t)k g(t) − g0 (t)k,

3. On peut bien sûr invoquer le théorème de Banach qui assure que l’inverse d’une application linéaire continue bijective d’un espace de Banach dans un autre est continue. En fait, dans tous les exemples auxquels on est confronté, cette continuité est très facile à vérifier.

44

Introduction aux variétés différentielles

ce qui donne précisément la différentiabilité de g 7→ f ◦ g, les espaces source C 0 (I, Rn ) et but C 0 (I, R) étant muni de la norme uniforme. La différentielle en g0 est l’application linéaire – clairement continue – qui à h ∈ C 0 (I, Rn ) associe la fonction numérique  t 7→ f 0 g0 (t) · h(t). Cette application dépend continûment de g0 en raison de la continuité uniforme de x 7→ f 0 (x) sur les compacts. Il a été remarqué par Joel Robbin (voir [Robbin]) au cours des années 70 du siècle dernier que l’on pouvait montrer des résultats d’existence de solutions d’équations différentielles en utilisant le théorème d’inversion locale “banachique”. On considère l’équation x0 = f (t, x), où f est disons une fonction de classe C 1 sur I × U , I étant un intervalle et U un ouvert de Rn . Si on impose à la fonction inconnue x : J → U la condition initiale x(t0 ) = x0 , (où J est un sous-intervalle de I) cette équation équivaut à l’équation intégrale Z t  x(t) = x0 + f u, x(u) du. t0

La démonstration traditionnelle du théorème d’existence et d’unicité consiste alors à montrer que dans un espace de fonctions convenable, l’application définie par le membre de gauche est contractante et admet donc un point fixe (pour cette démarche, voir par exemple [Demailly]). Il est possible d’utiliser directement le théorème d’inversion locale en procédant comme suit. Si [t0 − , t0 + ] est un intervalle (inconnu !) d’existence, on pose t = t0 + u

et

y(u) = x(t0 + u) − x0 .

L’équation différentielle est alors équivalente à  y 0 (u) = f t0 + u, x0 + y(u) . Soient E l’espace de Banach des fonctions C 1 sur [−1, 1], à valeurs dans Rn et nulles en 0, normé par la borne supérieure de la norme de la dérivée, et F = C 0 ([−1, 1], Rn ) muni de la norme uniforme. On définit une application ϕ de E ×R×R dans F ×R×R en posant    ϕ(y, x0 , ) = y 0 (u) − f t0 + u, x0 + y(g) , x0 ,  . On voit que ϕ est de classe C 1 . C’est une conséquence de la proposition 1.43 et d’une généralisation immédiate du théorème 1.6 qui assure qu’une fonction définie sur un espace produit est C 1 dès qu’elle est C 1 par rapport à chaque facteur séparément. Sa différentielle en (0, x0 , 0) est l’application linéaire (Y, X, E) → (Y 0 − Ef (t0 , x0 ), X, E)

de E × R × R dans F × R × R

1 − Calcul différentiel

45

dont l’inverse est évidemment Z u (Ef (t0 , x0 ) + Z(v))dv, X, E). (Z, X, E) → ( 0

Le théorème d’inversion locale donne alors directement l’existence et l’unicité locale de la solution, qui sera égale à ϕ−1 (0, x0 , ) pour  > 0 assez petit. On obtient en prime la différentiabilité par rapport à la condition initiale x0 . On a donc montré le résultat suivant : Théorème 1.44. Il existe un ouvert Ω ⊂ I × U et une fonction φ : Ω → U de classe C 1 tels que a) pour tout x0 ∈ U , I × {x0 } ∩ Ω est un intervalle ouvert contenant t0 ; b) f (t0 , x0 ) = x0 ;  c) ∂t φ(t, x0 ) = f t, φ(t, x0 ) ; d) Si u : J → U est une fonction C 1 définie sur  un intervalle ouvert J ⊂ I contenant t0 , telle que u(t0 ) = x0 et u0 (t) = f t, u(t) pour t ∈ J, alors u(t) = φ(t, x0 ) pour tout t ∈ J ∩ Ix0 .

1.10. Commentaires Modèles locaux d’applications Nous avons vu que toute fonction scalaire à différentielle non nulle en un point a peut se transformer par un changement de variable local de l’espace source en une fonction linéaire. Forts de cette réussite, nous pouvons nous poser en toute généralité la question suivante : si f est une fonction lisse sur un ouvert contenant a ∈ Rn , peut-on la ramener par un difféomorphisme local en a à un modèle qui soit le plus simple possible ? C’est exactement ce qui a été fait dans le cas des applications dont la différentielle est injective, surjective, ou plus généralement de rang constant au voisinage de a (voir l’exercice 10). Par exemple, si la différentielle de f d’une fonction numérique f est nulle, on peut se demander si l’on peut transformer f en une forme quadratique ? La réponse est oui si le développement de Taylor à l’ordre 2 de f est une forme quadratique non dégénérée (lemme de Morse, cf. exercice 11). Au-delà, les choses se compliquent vraiment. C’est la théorie des singularités, initiée par Hassler Whitney, et développée par René Thom toujours très vivante aujourd’hui, pour laquelle on pourra consulter par exemple [Demazure] (vivant, et accessible) et [Arnold 2] (70 pages très riches). Elle étudie aussi, bien entendu, les modèles locaux d’applications de Rp dans Rq au delà du cas simple où la différentielle a un rang constant au voisinage de a.

46

Introduction aux variétés différentielles

Transversalité Deux sous-variétés X et Y de Rn sont dites transverses si X ∩ Y = ∅ ou si pour tout p ∈ X ∩ Y , Tp X + Tp Y = Rn (on ne suppose pas que la somme est directe). Il est alors facile de montrer que X ∩ Y est aussi une sous-variété. On a très envie de dire que si on bouge un peu deux sous-variétés transverses, elles restent transverses. Pour le voir, (et d’abord pour donner un sens précis à cette assertion) il est préférable de généraliser cette définition de la façon suivante : on considère une application lisse f d’un ouvert de Rm dans Rn et une sous-variété X de Rn . Alors on dit que f est transverse à X en p ∈ Rm si Tf (p) X + Im(Tp f ) = Rn ou si f (p) ∈ / X, et que f est transverse à X si cela est vrai pour tout p. Par exemple, une submersion est transverse à tout point de l’espace but, et le théorème 1.18 admet une généralisation naturelle, et facile : si f est transverse à X, alors f −1 (X) est une sous-variété de Rm de même codimension que X. Le théorème de transversalité de Thom assure notamment que l’ensemble des applications transverses à une sous-variété fermée est un ouvert dense de l’espace des applications lisses de Rm dans Rn ). Pour un énoncé plus précis et plus général (il faut en particulier définir une topologie adéquate sur C ∞ (Rm , Rn ), et il s’avère utile de pouvoir remplacer Rm et Rn par des variétés) voir [Demazure], III.9. Voir aussi l’exercice 29 du chapitre 2 pour une forme faible de cet énoncé.

Affaiblissement des hypothèses de régularité Dans ce livre nous travaillons essentiellement avec des fonctions lisses. Mais s’affranchir de cette hypothèse n’a rien de gratuit. Il se trouve que les espaces de fonctions lisses ne peuvent pas être munis d’une norme (qui rende compte de la convergence de toutes les dérivées). De ce fait ils se prêtent mal à l’analyse fonctionnelle. Dans la plupart des problèmes d’analyse sur les domaines de Rn ou sur les variétés, on travaille plutôt avec des espaces L2 et surtout des espaces de Sobolev (par exemple l’espace des f tels que f et kdf k soient L2 ), quitte à montrer ensuite des théorèmes de régularité. C’est par exemple le cas du problème de Dirichlet évoqué après le théorème 1.36, où après avoir montré l’existence des fonctions propres dans l’espace de Sobolev adéquat, on prouve ensuite qu’elles sont lisses. Dans un autre ordre d’idées, citons la sous-section 8.5.3, où l’on doit appliquer à des champs de vecteurs C 1 par morceaux un résultat qui a priori n’est valable que pour les champs C 2 .

Cas analytique On peut aussi, au lieu de travailler avec des fonctions lisses, travailler avec des fonctions analytiques. Le théorème d’inversion locale et le théorème d’existence des solutions d’équations différentielles sont valables dans ce cadre (voir [Chaperon]). Nous n’aborderons pas ces questions pour des raisons de cohérence interne, vu notre usage intensif des “fonctions plateau” (voir la section 3.2).

1 − Calcul différentiel

47

1.11. Exercices 1. E et F désignant deux espaces vectoriels, écrire la différentielle d’une application bilinéaire φ de E × E dans F . 2. Laplacien et isométries Soit f une fonction C 2 sur un ouvert de Rn à valeurs dans R. Le Laplacien de f , noté ∆f , est défini par n X ∆f = ∂i2 f. i=1

a) On suppose que f est définie sur Rn (ou sur Rn − {0}), et ne dépend que de la distance à l’origine, autrement dit telle qu’il existe une fonction φ définie sur R+ (ou R+ − 0) telle que f (x) = φ(kxk)· Montrer que φ est de classe C 2 et calculer en fonction des dérivées de φ. b) * Caractériser les applications linéaires A de Rn dans Rn telles que, pour toute fonction C ∞ f , on ait ∆f ◦ A = ∆(f ◦ A)· c) ** Soit T une application de classe C 2 de Rn dans Rn satisfaisant à la propriété cidessus. Montrer que la différentielle de T est une application linéaire orthogonale. Que peut-on en déduire pour T ? 3. Dérivation et intégration a) Soient a,b, f des fonctions définies sur R. On suppose a et b dérivables, et f continue. Montrer que la fonction Z

b(x)

F (x) =

f (t)dt a(x)

est dérivable et calculer sa dérivée. b) Même question en remplaçant f (t) par h(t, x), où h est continue sur R2 et continûment dérivable par rapport à la deuxième variable. 4. Soit f une application différentiable de Rn − {0} dans R telle que pour tout t > 0 on ait f (tx) = tα f (x) (où α est réel). On dit alors que f est homogène de degré α. Montrer que dx f · x = αf (x) (identité d’Euler).

48

Introduction aux variétés différentielles

5. Montrer que R2 \ {0} est difféomorphe au complémentaire d’une boule fermée de R2 . 6. Rebroussements de “deuxième espèce” et difféomorphismes Montrer que l’application f : (x, y) 7→ (x, y − x2 ) est un difféomorphisme local au voisinage de 0. Dessiner la courbe t 7→ (t2 , t4 + t5 ) et sa transformée par f . Que remarque-t-on ? 7. Dessiner l’image par l’application z 7→ z 2 de C dans C d’une courbe fermée simple (c’est-à-dire sans points doubles). a) n’entourant pas l’origine ; b) entourant l’origine ; c) passant par l’origine. 8*. Décomposition de Cartan du groupe linéaire Rn étant muni d’une structure euclidienne, un endomorphisme symétrique S est dit positif si hSx, xi ≥ 0 pour tout x, strictement positif si hSx, xi pour tout x 6= 0. a) Montrer que si S est strictement positif, alors S est inversible ; montrer qu’un endomorphisme symétrique est strictement positif si et seulement s’il existe un réel k > 0 tel que ∀x ∈ Rn , hSx, xi ≥ kkxk2 (utiliser la diagonalisation des matrices symétriques). En déduire que l’ensemble n(n+1) des endomorphismes strictement positifs est un ouvert de R 2 . b) Montrer que tout endomorphisme strictement positif S a une racine carrée strictement positive T unique, et que l’application S→T est un difféomorphisme. c) Soit M un endomorphisme inversible de Rn . Montrer qu’il existe un endomorphisme orthogonal A et un endomorphisme strictement positif S tels que M = AS. Montrer que A et S sont uniques et que l’application M → (A, S) est différentiable. Montrer que l’on a des résultats analogues pour une décomposition de la forme M = S 0 A0 . NB. Cette décomposition est aussi appelée décomposition polaire. 9*. Pour S ∈ Sym(n) inversible, on définit une application fS de Mn (R) dans Sym(n) en posant fS (A) = t ASA. Montrer qu’il existe un ouvert U de Sym(n) contenant S, un ouvert V de Mn (R) contenant I, et une application lisse g de U dans V

1 − Calcul différentiel

49

telle que T = t g(T )Sg(T ). Quelle propriété en tire-t-on pour les formes quadratiques qS (x) =t xSx et qT (x) =t xT x définies par les matrices S et T ? 10*. Théorème du rang constant Ce résultat englobe les théorèmes 1.17 et 1.18 et s’énonce comme suit : Soit Ω un ouvert de Rn et f : Ω → Rm une application différentiable de rang r constant (ce qui veut dire que le rang de la différentielle est constant). Alors pour tout x0 ∈ Ω, il existe d’une part un difféomorphisme ϕ d’un ouvert U contenant 0 dans Rn sur un ouvert U 0 contenant x0 dans Ω, avec ϕ(0) = x0 , d’autre part un difféomorphisme ψ d’un ouvert V 0 contenant y0 = f (x0 ) sur un ouvert V 3 0 dans Rm , avec ψ (y0 ) = 0, tels que l’application ψ ◦ f ◦ ϕ : U −→ V coïncide avec la restriction à U d’une application linéaire de Rn dans Rm . a) Montrer qu’il suffit d’examiner le cas où x0 = 0, f (x0 ) = 0, et où f 0 (0) est de la forme  x1 , ..., xn 7→ (x1 , · · · , xr , 0, · · · , 0). b) Ces conditions étant satisfaites, soit g l’application de Ω dans Rm définie par   g x1 , ..., xn = f 1 (x), · · · , f r (x), xr+1 , · · · , xn où f j désigne la j e`me composante de f . Montrer que g définit un difféomorphisme entre deux voisinages ouverts de 0 dans Rn , et que l’application f1 définie sur un voisinage ouvert convenable de 0 dans Rn par f1 (g(x)) = f (x) est de la forme    f1 x1 , · · · , xn = x1 , · · · , xr , k 1 x1 , · · · , xr , · · · , k m−r x1 , · · · , xr où k est une application différentiable d’un voisinage ouvert de 0 dans Rr dans Rm−r , vérifiant k(0) = 0 et k 0 (0) = 0. c) Sur un voisinage ouvert convenable de 0 dans Rm , on définit l’application h à valeurs dans Rm par    h y 1 , · · · , y m = y 1 , · · · , y r , y r+1 + k 1 y 1 , · · · , y r , y m + k m−r y 1 , · · · , y r . Montrer que h définit un difféomorphisme entre deux voisinages ouverts de 0 dans Rm , et que l’application f2 définie au voisinage de 0 dans Rm par h (f2 (x)) = f1 (x) est de la forme   f2 x1 , · · · , xn = x1 , · · · , xr , 0, · · · , 0 . En déduire que pour tout y0 ∈ f (Rn ) , la préimage f −1 (y0 ) est une sous-variété de dimension n − r de Rn . Application : En considérant l’application f définie par f (M ) = t M M, montrer que  O(n) = M ∈ GL(n, R) | t M = M −1 est une sous-variété de dimension avec la démonstration du cours ?

n(n−1) 2

de GL(n, R). Quelle différence y-a-t-il

50

Introduction aux variétés différentielles

11**. Lemme de Morse Soit f : U 7→ R une fonction lisse sur un ouvert U de Rn . On suppose que 0 ∈ U est un point critique non dégénéré. Cela signifie que df0 = 0 et que la forme quadratique définie par la matrice  2 S = ∂ij f (0) 1≤i,j≤n est non dégénérée. Montrer qu’il existe un difféomorphisme φ d’un sous-ouvert contenant 0 sur un autre tel que f φ

−1



(x) = f (0) +

p X i=1

n X

x2i −

x2i ,

i=p+1

où (p, n − p) est la signature de la forme quadratique associée à S. Indication : on montrera d’abord, en appliquant deux fois le lemme 3.12 qu’il existe une application lisse h, définie sur un ouvert de Rn contenant 0 et à valeurs dans Sym(n), telle que f (x) = f (0) + t xh(x)x et h(0) = S. Puis on utilisera l’exercice 9. 12. Montrer que le graphe d’une application lisse de Rp dans Rq est une sous-variété de dimension p de Rp+q . 13. Ecrire l’équation de la surface de R3 engendrée par révolution autour de l’axe Oy du cercle de centre (a, 0, 0) et de rayon r du plan xOy. Montrer que c’est une sousvariété si et seulement si ar (tore de révolution). Montrer, en utilisant une paramétrisation bien choisie, que cette sous variété est homéomorphe, (et même difféomorphe en utilisant les notions du chapitre suivant) à S 1 × S 1 . 14. Montrer que le graphe de la fonction x → |x| n’est pas une sous-variété de R2 . 15. Montrer que si X est une sous-variété de Rn , l’ensemble des couples (x, v) ∈ Rn × Rn tels que x ∈ X et v est tangent à X en x est une sous-variété de Rn × Rn . 16. On considère l’hélice circulaire, d’équation paramétrique t 7→ (a cos t, a sin t, bt) dans un repère orthonormé. Montrer que la surface engendrée par l’ensemble des droites qui rencontrent l’hélice et rencontrent orthogonalement l’axe Oz (hélicoïde droit) est une sous-variété de R3 . 17. Montrer que f : t 7→ (

2 sin t sin 2t , ) 1 + cos2 t 1 + cos2 t

est une immersion de R dans R2 périodique de période 2π. L’image de tout intervalle de longueur inférieure à π est une sous-variété. Par contre, f (R) n’est pas une sousvariété (c’est une courbe fermée en forme de 8, appelée lemniscate de Bernoulli ). 18*. L’intersection de la sphère unité x2 + y 2 + z 2 = 1 et du cylindre d’équation x2 + y 2 − x = 0 est-elle une sous-variété ?

1 − Calcul différentiel

51

19. Groupe pseudo-orthogonal Soit Q la forme quadratique sur Rn définie par Q(x) =

p X

x2i



i=1

n X

x2i .

i=p+1

Montrer que l’ensemble des matrices A ∈ Mn R telles que Q(Ax) = Q(x) pour tout x est une sous-variété de dimension n(n − 1)/2. 20. Soit P un polynôme homogène à n+1 variables Pnsur R tel que les ∂i P n’aient aucun zéro commun autre que 0 (par exemple P (x) = i=0 xki ). Montrer que l’intersection de la sphère unité et de P −1 (0) est une sous-variété. 21*. Le tore à deux trous Montrer que la partie de R3 définie par l’équation  2 1 4x2 (1 − x2 ) − y 2 + z 2 − = 0 4 est une sous-variété de dimension 2. Tracer les sections par les plans z = cte, et en déduire que cette sous-variété est un “tore à deux trous”. 22*. Position d’une hypersurface par rapport à un plan tangent On désigne par (x0 , ·, xn ) les coordonnées dans Rn + 1. Soit S une sous-variété de codimension 1, contenant 0, et ayant l’hyperplan x0 = 0 pour plan tangent à l’origine. a) Montrer que S peut être définie au voisinage de 0 par le graphe d’une fonction (x1 , · · · , xn ) 7→ f (x1 , · · · , xn ) dont 0 est point critique. b) On suppose que la forme quadratique Q définie par 1

n

(x , · · · x ) 7→

n X

 2 ∂ij f (0) xi xj

i,j=1

est non dégénérée. Montrer que si Q est définie positive (resp. définie négative) f admet un minimum (resp. maximum) local strict en 0. c) On suppose maintenant que Q est de signature p, n − p, avec 0 < p < n. Montrer que tout voisinage de 0 contient à la fois des points de S situés au-dessus et des points situés au-dessous de T0 S. Montrer qu’il existe un ouvert U contenant 0 tel que U ∩ S ∩ T0 S \ {0} soit une sous-variété de dimension n − 1 de T0 S que l’on précisera. Que se passe-t-il si on rajoute 0 ? (On pourra commencer par le cas n = 2.) 23. L’exponentielle n’est pas un morphisme de groupes a) Calculer exp(A + B) et (exp A)(exp B) pour les matrices     0 1 0 0 A= et B = . 0 0 1 0

52

Introduction aux variétés différentielles

b) Montrer que si exp t(A + B) = (exp tA)(exp tB) pour tout t réel, alors A et B commutent. 24. Justifier en détails l’argument de la preuve de d) dans le théorème 1.27 ; donner une autre preuve en calculant la dérivée en 0 de l’application t 7→ det(exp tA). 25. Soit f : D(0, r) → C une fonction C-différentiable non constante telle que f (0) = 0 0. Montrer qu’il existe un  entier k > 0,un disque D(0,kr ) et un difféomorphisme 0 0 φ : D(0, r ) → φ D(0, r ) ⊂ D(0, r) tels que f φ(u) = u .

Chapitre 2 Notions de base sur les variétés

2.1. Introduction “La notion de variété est assez difficile à définir avec précision.” Ce début du chapitre III des “Leçons sur la Géométrie des espaces de Riemann” d’Élie Cartan a connu une certaine célébrité. En fait, il est suivi par une discussion heuristique stimulante de la notion de variété qui se lit toujours avec plaisir. Il faut signaler aussi la leçon inaugurale de Riemann, traduite et commentée dans [Spivak].

2.1.1. Un exemple typique : les droites du plan Pour voir comment les choses se passent, partons d’un exemple simple, mais pas trop, l’ensemble des droites du plan. Une telle droite dépend de 2 paramètres réels. On peut formaliser cette idée un peu vague en choisissant un système de coordonnées cartésiennes et en repérant chaque droite par son équation dans ce repère. Toute droite non verticale a une unique équation de la forme y = ax + b, et peut donc être codée par un couple (a, b) de nombres réels. De même, toute droite non horizontale a une unique équation de la forme x = cy + d, et peut être codée par le couple (c, d) correspondant. Celles qui ne sont ni verticales ni horizontales ont ainsi deux codages possibles. On passe facilement de l’un à l’autre par les formules c=

1 a

d=−

b a

(2.1)

qui montrent clairement que le passage d’un codage à l’autre est un difféomorphisme. En fait, il n’est pas trop difficile de voir que l’ensemble des droites peut être vu comme un espace topologique dans lequel les droites non verticales et les droites non horizontales constituent deux parties ouvertes homéomorphes à R2 , les codages décrits ci-dessus étant des homéomorphismes.

54

Introduction aux variétés différentielles

Nous venons de voir que les droites du plan forment une variété différentielle de dimension 2. Les ouverts précédents, munis des homéomormorphismes avec R2 que nous venons de décrire, sont ce qu’on appelle des cartes, et la formule (2.1) décrit un changement de carte. Ce point de vue permet entre autres de disposer de la notion de fonction lisse sur l’ensemble des droites : ce sera une fonction dont la restriction aux droites non verticales est lisse par rapport aux variables (a, b), et la restriction aux droites horizontales lisse par rapport aux variables (c, d). Les formules de (2.1) montrent la cohérence de ce point de vue : ces deux propriétés sont équivalentes pour les droites qui ne sont ni verticales ni horizontales. Il y a d’autres façons de représenter les droites du plan. Pour éviter de distinguer le cas “non horizontal” et le cas “non vertical” on peut se donner leur équation sous la forme ux + vy + w = 0 (avec (u, v) 6= (0, 0)). Mais une autre difficulté apparaît, puisque maintenant le triplet (u, v, w) n’est donné qu’à un coefficient multiplicatif près. En fait, il sera expliqué dans la section 2.5 que les triplets (u, v, w) de réels non tous nuls, après identification des triplets non proportionnels, forment une variété de dimension 2, le plan projectif. L’ensemble des droites apparaît alors comme le plan projectif privé d’un point, ce point correspondant aux triplets interdits (0, 0, w). En utilisant la structure euclidienne du plan, on peut aussi repérer les droites par leur direction et leur distance à l’origine : une droite dont la direction est le vecteur (cos θ, sin θ) a une équation de la forme (− sin θ)x + (cos θ)y − p = 0, où p est la distance (algébrique) à l’origine, mesurée dans la direction directement orthogonale. Mais attention : ce que nous venons de décrire est une bijection entre l’ensemble des droites orientées et le cylindre S 1 × R. Ce dernier est bien une variété : on peut le réaliser comme une sous-variété de R3 . On peut aussi dire que c’est le produit de deux variétés de dimension 1. Les équations de droites orientées (− sin θ)x + (cos θ)y − p = 0

et (− sin θ0 )x + (cos θ0 )y − p0 = 0

représentent la même droite si et seulement si p0 = −p

et θ0 = θ + π (modulo 2π)

Cette relation définit une action du groupe à deux éléments sur le cylindre S 1 × R : l’ensemble des droites apparaît ainsi comme le quotient du cylindre par cette action de groupe (le lecteur aura peut-être reconnu un avatar du ruban de Möbius). Cet exemple montre qu’il est important de disposer d’une notion de quotient pour les variétés. Les détails sont donnés dans la section 2.7. Le cas le plus simple est celui du quotient par un groupe fini agissant sans points fixes.

2.1.2. Résumé Les notions de variété et d’application lisse entre variétés sont une mise en forme dans un cadre général.

2 − Notions de base sur les variétés

55

Une fois le cadre mis en place, nous en profitons pour donner une preuve due à J. Milnor du théorème de d’Alembert, qui est grosso modo la suivante. Un polynôme P à coefficients complexes est une application lisse du plan complexe dans lui-même. Son prolongement par continuité à la sphère de Riemann est encore lisse (avec l’identification, explicitée plus bas, de S 2 à C ∪ {∞}). Soit f ce prolongement. Il n’a qu’un nombre fini de points singuliers (les zéros de P 0 et le point à l’infini) donc de valeurs singulières. Un argument mêlant toplogie et calcul différentiel montre que le cardinal de f −1 (y) est fini et localement constant quand y parcourt l’ensemble des valeurs régulières. Mais cet ensemble, qui est le complémentaire d’une partie finie de la sphère S 2 , est connexe, ce qui montre que le cardinal de f −1 (y) est en fait constant. Enfin, cette constante est non nulle dès que P n’est pas constant. Nous décrivons ensuite un exemple particulièrement important de variété, celui des espaces projectifs réels et complexes. Nous étendons ensuite aux variétés les notions et résultats vus au chapitre précédent dans le cadre vectoriel : immersions, submersions, espace tangent, sous-variétés. Les exemples de variétés que nous donnons au passage font apparaître deux notions fondamentales, dont l’introduction dans le cadre des sous-variétés de Rn aurait été peu commode : celle de fibration, et celle de revêtement. Certaines définitions, celle d’application lisse et surtout celle de vecteur tangent, peuvent paraître douloureuses au premier abord. Mais on dispose heureusement d’une boîte à outils (composition, restriction au départ où à l’arrivée) qui dispense le plus souvent d’y avoir recours directement (après tout, la notion rigoureuse de nombre réel n’est pas facile non plus, mais dans sa pratique quotidienne l’analyste n’y a recours que très rarement).

2.2. Cartes, atlas 2.2.1. Des variétés topologiques aux variétés lisses Définition 2.1. Une variété topologique de dimension n est un espace topologique séparé 1 dont tout point est contenu dans un ouvert homéomorphe à un ouvert de Rn . Il revient au même, quitte à prendre des ouverts plus petits, de supposer que M admet un recouvrement par des ouverts homéomorphes à des boules de Rn . Le théorème d’invariance du domaine (voir par exemple [Karoubi–Leruste], 5.3) assure que si deux ouverts de Rn et Rm sont homéomorphes, alors m = n. Deux variétés homéomorphes ont donc même dimension. Exemples. D’après leur définition, les sous-variétés de dimension n d’un espace vectoriel sont des variétés topologiques de dimension n. Le graphe de la fonction x 7→ |x| (ou celui de n’importe quelle application continue de R dans R) est une variété topologique de dimension 1, puisque la première projection est un homéomorphisme sur R. 1. On peut toujours supposer que la topologie est définie par une métrique ; le prix à payer est une plus grande complication de certaines constructions (fibré tangent, quotients)

56

Introduction aux variétés différentielles

Par contre, la réunion X des droites d’équations y = x et y = −x dans R2 n’est pas une variété topologique. En effet, le complémentaire de (0, 0) dans l’un quelconque de ses voisinages a au moins quatre composantes connexes, ce qui exclut l’existence d’ouverts de X contenant (0, 0) et homéomorphes à un intervalle. Définitions 2.2. a) Une carte d’une variété topologique X est la donnée d’un couple (U, ϕ) formé d’un ouvert U de X (le domaine de la carte) et d’un homéomorphisme ϕ de U sur un ouvert de Rn . b) Un atlas de X est une famille (Ui , ϕi )i∈I (pas nécessairement finie) de cartes, dont les domaines Ui recouvrent X. Il nous arrivera parfois de ne pas mentionner le domaine. L’expression système de coordonnées locales est parfois utilisée comme synonyme de carte. Cette terminologie parle d’elle-même : la surface de la terre est une sphère S 2 , que l’on peut considérer comme une variété de dimension 2. Les cartes sont des représentations planes, forcément partielles (un espace compact ne pouvant être homéomorphe à un ouvert de Rn ), et un atlas est nécessaire si on veut représenter toute la terre. Un point peut évidemment appartenir à plusieurs domaines de cartes. On a alors la propriété évidente suivante : Si deux cartes (U, ϕ) et (V, ψ) sont telles que U ∩ V 6= ∅, alors l’application ψ ◦ ϕ−1 : ϕ(U ∩ V ) → ψ(U ∩ V ) est un homéomorphisme. Dans le cas des sous-variétés d’un espace euclidien, on peut dire bien plus : l’application ci-dessus est un difféomorphisme. C’est une conséquence immédiate de la proposition suivante. Proposition 2.3. Soit M ⊂ Rn une sous-variété de dimension p, et soient (Ω1 , g1 ) et (Ω2 , g2 ) deux paramétrisations. Alors   g2−1 ◦ g1 : Ω1 ∩ g1−1 g2 (Ω2 ) → Ω2 ∩ g2−1 g1 (Ω1 ) est un difféomorphisme. Démonstration. Soit m ∈ g1 (Ω1 ) ∩ g2 (Ω2 ) (il n’y a rien à prouver si cette intersection est vide). D’après la définition 1.20 il existe un ouvert U contenant m et un difféomorphisme f de U dans Rn tels que f (U ∩ M ) = f (U ) ∩ ({0} × Rp ). Alors f ◦ g1 et f ◦ g2 sont des immersions de Ω1 et Ω2 dans Rn . Si maintenant on les considère comme des applications à valeur dans Rp , on obtient des homéomorphismes lisses à différentielle inversible, et donc des difféomorphismes. Il en est alors de même de −1

(f ◦ g2 )

◦ (f ◦ g1 ) = g2−1 ◦ g1 ·

2 − Notions de base sur les variétés

57

Comme souvent en Mathématiques, on érige en axiome une propriété vérifiée dans un cadre suffisamment naturel. Définitions 2.4. a) Deux cartes (U1 , ϕ1 ) et (U2 , ϕ2 ) d’une variété topologique M sont compatibles d’ordre k (1 ≤ k ≤ ∞) si U1 ∩ U2 = ∅ ou si l’application ϕ2 ◦ ϕ−1 : ϕ1 (U1 ∩ U2 ) → ϕ2 (U1 ∩ U2 ) 1 (dite fonction de transition) est un difféomorphisme C k . b) Un atlas de classe C k d’une variété topologique M est un atlas (Ui , ϕi )i∈I de M dont deux cartes quelconques sont toujours compatibles d’ordre k. U1 U2

ϕ1

ϕ2 ϕ1(u 1 ) ϕ2 IR

o

ϕ1–1

ϕ2(u 2 )

n

Figure 2.1 – Fonction de transition

Prenons par exemple une sous-variété lisse de codimension 1 de Rn , définie par une submersion f : Rn → R. Elle admet un atlas lisse de cardinal au plus n (dont les domaines sont les ouverts Ui de M où la i-ième dérivée partielle de f ne s’annule pas). Mais toute paramétrisation lisse aura pour inverse une carte compatible avec cet atlas. Cela conduit aux définitions suivantes. Définitions 2.5. a) Un atlas de classe C k d’une variété topologique M est dit maximal si toute carte compatible avec les cartes de l’atlas appartient elle-même à l’atlas (on trouvera aussi dans la littérature les adjectifs “complet” et “saturé”). Un tel atlas est aussi appelé structure différentielle de classe C k . b) Une variété différentielle de classe C k est une variété topologique munie d’une structure différentielle de classe C k . Tout atlas est évidemment contenu dans un unique atlas maximal, obtenu en ajoutant toutes les cartes compatibles avec les siennes. Par exemple, d’après la proposition 2.3 une sous-variété lisse de Rn a une structure lisse naturelle. Elle est obtenue en prenant l’atlas formé par les inverses de toutes ( !) les paramétrisations. En pratique, on définit une structure différentielle en partant d’un atlas “pas trop gros” : ce sera celle donnée par l’atlas maximal correspondant. On procède déjà ainsi pour les sous-variétés de Rn .

58

Introduction aux variétés différentielles

2.2.2. Premiers exemples La sphère La structure différentielle de la sphère S n d’équation par un atlas comportant deux cartes.

Pn

i=0

x2i = 1 peut être définie

Désignons par N et S les pôles Nord et Sud de S n (c’est-à-dire N = (1, 0, .., 0) et S = (−1, 0, ..., 0)) et posons U1 = S n \ {N } et U2 = S n \ {S}. On obtient des homéomorphismes notés iN et iS , de U1 et U2 dans Rn , les projections stéréographiques de pôle Nord et Sud, en associant à x ∈ Ui l’intersection avec l’hyperplan x0 = 0 de la droite passant par x et N (i = 1) ou S (i = 2). Explicitement, iN (x) =

(x1 , ..., xn ) 1 − x0

et iS (x) =

(x1 , ..., xn ) . 1 + x0

On vérifie facilement, même si ce n’est pas indispensable, que iN (resp. iS ) est la restriction à S n de l’inversion de pôle N (resp. S) et de module 2. N

x

iS (x ) iN (x )

S

Figure 2.2 – La sphère vue comme variété

On vérifie aussi que i−1 N (y) =

(|y|2 − 1, 2y1 , · · · , 2yn ) (|y|2 + 1)

et i−1 S (y) =

(−|y|2 + 1, 2y1 , · · · , 2yn ) . (|y|2 + 1)

Alors iS ◦ iN −1 est le difféomorphisme de Rn \ {0} sur lui-même donné par y→

y k y k2

(inversion de pôle 0 et de module 1)·

2 − Notions de base sur les variétés

59

Pour n = 1, il y a un atlas encore plus simple. Le cercle S 1 peut en effet être muni d’un atlas dont les fonctions de transition sont des translations. Partant de la paramétrisation locale h : t → (cos t, sin t) et on remarque que h|]0,2π[ et h|]−π,π[ sont des homéomorphismes sur U1 = S 1 \ {(1, 0)} et U2 = S 1 \ {(−1, 0)} respectivement. Appelons φ1 et φ2 les homéomorphismes réciproques. Notons (ce qui rend cet exemple un peu déroutant malgré sa simplicité) que U1 ∩ U2 a deux composantes connexes, que nous noterons U + et U − pour des raisons évidentes. Alors φ1 (U1 ∩ U2 ) = φ1 (U + ) ∪ φ1 (U − ) =]0, π[∪]π, 2π[ et φ2 φ−1 1 (t)



 =

t t − 2π

si t ∈]0, π[ si t ∈]π, 2π[

Voici maintenant un autre exemple de variété, qui a l’intérêt de ne pas se réaliser de façon évidente comme sous-variété de l’espace euclidien. La variété des droites affines du plan Nous avons vu cet exemple dans l’introduction ! Voir la sous-section 2.1.1.

2.3. Fonctions différentiables ; difféomorphismes Si on cherche à définir ce qu’est une application de classe C k entre variétés C k , il est naturel d’exiger que les cartes et leurs inverses soient C k , et aussi qu’une composée d’applications C k soit C k . Ce “cahier des charges” impose la définition suivante. Définition 2.6. Soient M et N deux variétés C k . Une application continue f de M dans N est dite de classe C k si quel que soit a ∈ M , il existe une carte (U, ϕ) de M , avec a ∈ U , une carte (V, ψ) de N , avec f (a) ∈ N , telle que l’application  ψ ◦ f ◦ ϕ−1 : ϕ f −1 (V ) ∩ U → ψ(V ) soit de classe C k . Remarques a) Cette définition se lit sur le diagramme commutatif U   ϕy

f

−−−−→

V  ψ y

ψ◦f ◦ϕ−1

ϕ(U ) −−−−−−→ ψ(V ) avec une petite précaution : il faut modifier les ouverts de départ (par exemple considérer non pas U mais U ∩ f −1 (V )) pour que les compositions d’applications soient bien définies.

60

Introduction aux variétés différentielles

b) Il est important de supposer f continue pour être sûr que ψ ◦ f ◦ ϕ−1 est définie sur un ouvert de Rm (si dim M = m). L’une des cartes est inutile si la variété source ou but est un ouvert d’un espace euclidien. Un cas très important est celui où N = R. Une application continue de M dans R sera C k si f ◦ ϕ−1 l’est pour toute carte (U, ϕ). Il en résulte que la somme et le produit de deux fonctions numériques C k sur une variété est C k . c) Il suffit que cette propriété soit vérifiée pour des atlas C k qui définissent les structures différentielles de M et N . Exemple. Soit M une sous-variété de dimension p de Rn , et f : Rn → N une application de classe C k . Alors la restriction de f à M est de classe C k : en reprenant la définition 1.20, on se ramène au cas évident où M = U ∩ Rp × {0}, pour un ouvert U ⊂ Rn . Exemple : prolongement “à l’infini” des polynômes Pour z ∈ C, soit P (z) = a0 z n + a1 z n−1 + · · · ... + an , où les ak sont des constantes complexes, et a0 6= 0, et n > 0. On considère la sphère S 2 comme une partie de C × R. Désignons par iN et iS les projections stéréographiques (voir la figure 2.2) de pôles Nord et Sud respectivement. On définit f : S 2 → S 2 par f (x) = i−1 N (P (iN (x)))

si x 6= N , et f (N ) = N ·

(Heuristiquement, C étant difféomorphe à S 2 \ {N }, on peut considérer S 2 comme C auquel on a rajouté un point à l’infini, et f apparaît alors comme le prolongement par continuité de P ). Il est facile de voir que f est continue, et on va montrer qu’elle est lisse. Sur S 2 \ {N } c’est vrai car iN ◦ f ◦ i−1 N = P qui est lisse. Il reste donc à étudier la situation au voisinage de N , ce qui peut se faire avec la carte (S 2 \ {S}, iS ). Au voisinage de 0 dans C on a  −1 (iS ◦ i−1 −1 N ◦ P ◦ iN ◦ iS )(z) si z 6= 0 (iS ◦ f ◦ iS )(z) = 0 si z = 0 Sachant que (iS ◦ i−1 N )(z) =

1 , on voit que z

−1 (iS ◦ i−1 N ◦ P ◦ iN ◦ iS )(z)

1

= P =

1 z



zn . a0 + a1 z + · · · an z n

Puisque n > 0 et a0 6= 0, l’expression obtenue est lisse au voisinage de 0, et redonne 0 pour z = 0, où elle n’était pas définie a priori. Revenons à la théorie générale. Nous devons vérifier la propriété suivante :

2 − Notions de base sur les variétés

61

Proposition 2.7. Toute composée d’applications C k est C k . Démonstration. Soient M ,N ,P trois variétés, f ∈ C k (M, N ) et g ∈ C k (N, P ). Pour a ∈ M , on prend des cartes (U, ϕ),(V, ψ),(W, χ) de M, N, P , les ouverts U, V, W contenant respectivement a, f (a), g(f (a)). La démonstration se lit alors sur le diagramme commutatif f g U −−−−→ V −−−−→ W       χy ϕy ψy ψ◦f ◦ϕ−1

χ◦g◦ψ −1

ϕ(U ) −−−−−−→ ψ(V ) −−−−−−→ χ(W ) Dans la deuxième ligne, on a des applications C k définies sur des ouverts d’espaces vectoriels, dont la composée est χ ◦ g ◦ f ◦ ϕ−1 . Mais attention : cette application   −1 −1 n’est définie que sur ϕ U ∩ f g (W ) ∩ V (ouf !). Cela n’a pas d’importance, l’essentiel étant d’avoir un ouvert contenant a. En particulier, si f est une application C k de Rm dans une variété M , et si N est une sous-variété de Rm , la restriction de f à N est C k . Un peu moins immédiate, mais tout aussi importante est la propriété suivante : Proposition 2.8. Si M est une sous-variété de Rn et si f est une application C k d’un ouvert U ⊂ Rm dans Rn telle que f (U ) ⊂ M , alors f est C k en tant qu’application de U dans M . Démonstration. La propriété est évidente quand M est un sous-espace vectoriel de Rn . La définition des sous-variétés permet de se ramener à ce cas. Soit a ∈ U , f (a) ∈ M , V un ouvert de Rn contenant f (a) pour lequel il existe un difféomorphisme g de V sur son image tel que g(V ∩ M ) = g(V ) ∩ (Rp × {0})

(p = dim M )·

Alors f ◦ g est une application C k de U dans Rp , d’après la remarque précédente, et la restriction de g à V ∩ M est une carte de M . Exemple : le groupe orthogonal Nous avons vu dans la section 1.5 que O(n) est une sous-variété de End(Rn ) (en fait de l’ouvert Gl(n, R) de End(Rn )). Les applications A 7→ A−1 et (A, B) 7→ AB sont évidemment des applications C k de Gl(n, R) dans lui-même et de Gl(n, R)×Gl(n, R) dans Gl(n, R) respectivement. Nous venons de voir que ces deux applications restent C k en tant qu’applications de O(n) dans lui-même et de O(n) × O(n) dans O(n) respectivement. Le groupe O(n) apparait ainsi comme une variété pour laquelle les applications multiplication et inverse sont lisses. Un tel groupe s’appelle un groupe de Lie. Cette situation sera étudiée plus systématiquement au chapitre 4. Ce qui précède a un sens à condition de définir le produit de deux variétés.

62

Introduction aux variétés différentielles

Définition 2.9. Si M et N sont deux variétés de classe C k munies d’atlas (Ui , ϕi )i∈I et (Vj , ψj )j∈J , la structure de variété produit sur M × N est donnée par l’atlas (Ui × Vj , ϕi × ψj )(i,j)∈I×J · Il est très facile de vérifier que les projections pr1 : M × N → M et pr2 : M × N → N sont de classe C k , et que pour n ∈ N fixé (par exemple), la restriction de pr1 à M × {n} est un difféomorphisme sur N. Définition 2.10. Un difféomorphisme de classe C k entre deux variétés M et N est une bijection qui est C k ainsi que la bijection réciproque. Exemple : quadriques Dans le produit E × F de deux espaces euclidiens de dimensions p et q, la quadrique Q d’équation kxk2 − kyk2 = 1, est une sous-variété de dimension p + q − 1. En tant que variété, Q est difféomorphe à S p−1 × Rq . La différentielle de f (x, y) = kxk2 − kyk2 est donnée par df(x,y) · (h, k) = 2hx, hi − 2hy, ki. Elle est surjective en tout point de Q, qui est donc une sous-variété de codimension 1 de Rp+q . L’application ! x ,y de Q dans S p−1 × Rq (x, y) 7→ p 1 + kyk2 est lisse. Elle admet une application réciproque, donnée par p (u, y) 7→ ( 1 + kyk2 u, y) où u ∈ S p−1 , qui est lisse pour les mêmes raisons. En particulier, Q est connexe si p > 1, et a deux composantes connexes si p = 1 : tout cela s’applique aussi bien à S 0 = {x ∈ R, x2 = 1} = {−1, 1}! Attention. Deux structures différentielles sur un même ensemble peuvent être difféomorphes mais distinctes, c’est-à-dire définies par des atlas maximaux différents. Voir l’exercice 27. A PARTIR DE MAINTENANT, SAUF MENTION CONTRAIRE EXPRESSE, TOUTES LES VARIÉTÉS ET LES APPLICATIONS RENCONTRÉES SERONT SUPPOSÉES LISSES De l’utilisation des cartes dans les définitions qui précèdent, on peut retenir un fil directeur : toute définition ou propriété des ouverts de Rn qui est invariante par difféomorphisme s’étend aux variétés.

2 − Notions de base sur les variétés

63

Définition 2.11. Si M et N sont deux variétés, une application f : M → N est un difféomorphisme local si tout point de M est contenu dans un ouvert U tel que f|U soit un difféomorphisme sur son image. À ce stade, on peut se demander s’il existe une version du théorème d’inversion locale adaptée aux variétés. La réponse est bien sûr oui, à condition de savoir définir la différentielle dans ce cadre. Nous verrons cela dans la section 2.6. Auparavant, montrons sur un exemple que nous avons d’ores et déjà les moyens de prouver des théorèmes significatifs.

2.4. Le théorème de d’Alembert Théorème 2.12. Tout polynôme non constant à coefficients complexes admet au moins un zéro dans C. Nous utiliserons au cours de la démonstration la notion suivante, qui généralise aux variétés une notion vue en 1.40. Définition 2.13. Soient X et Y deux variétés de même dimension, et f : X → Y une application lisse. Un point a ∈ X est dit point régulier de f si f restreinte à un voisinage convenable de a est un difféomorphisme local. Un point b ∈ Y est dit valeur régulière de f si son image réciproque f −1 (b) est formée de points réguliers. En particulier, tout b ∈ / f (X) est “valeur régulière”. Théorème 2.14. Soient X et Y deux variétés de même dimension, X étant supposée compacte. Soit f : X → Y une application lisse et y une valeur régulière de f , alors : a) f −1 (y) est fini. b) Il existe un ouvert V contenant y tel que :   ∀z ∈ V, card f −1 (z) = card f −1 (y) · Démonstration. Si f −1 (y) = ∅ il suffit de prouver b). Mais f (X) est l’image du compact X par une application continue : c’est une partie compacte, et donc fermée de Y . Il suffit de prendre V = Y \ f (X). Si f −1 (y) 6= ∅ notons d’abord que c’est un compact de X, en tant que fermé dans un compact. Soit x ∈ f −1 (y). Par hypothèse, x est régulier pour f : il existe un ouvert Ux contenant x tel que f|Ux soit un difféomorphisme de Ux sur f (Ux ). En particulier, x est le seul point de Ux tel que f (x) = y. La famille (Ux )x∈X est un recouvrement ouvert de f −1 (y). On peut en extraire un sous-recouvrement fini (Uxi )1≤i≤p , ce qui montre que f −1 (y) est un ensemble fini à p éléments (plus brièvement, on peut dire que l’espace topologique f −1 (y) est à la fois compact et discret, donc fini). Quitte à remplacer chaque ouvert Uxi par un ouvert plus petit, on peut supposer les Uxi deux à deux disjoints. Posons alors   V = f Ux1 ∩ · · · ∩ f (Uxp \ f X − Ux1 − · · · − Uxp ·

64

Introduction aux variétés différentielles

C’est une intersection finie d’ouverts contenant y. Si z ∈ V , alors par construction z a un antécédent et un seul dans chaque Uxi , et n’a pas d’autres antécédents, puisque V est disjoint de f (X \ ∪1≤i≤p Uxi ). Autrement  dit, card f −1 (z) = p· Démonstration du théorème de d’Alembert. Soit donc P (z) = a0 z n + a1 z n−1 + · · · ... + an un polynôme non constant à coefficients complexes. On lui associe le “prolongement à l’infini” f défini et étudié dans la section 2.3. Nous allons voir que f n’a qu’un nombre fini de valeurs non régulières. Sur S 2 \ {N }, f a le même nombre de valeurs non régulières que P (on a composé à droite et à gauche par des difféomorphismes). Mais la différentielle de P en un point z n’est autre que la multiplication par le nombre complexe P 0 (z), vue comme application linéaire de R2 dans R2 (voir la sous-section 1.2.2). Les points non réguliers de P sont ceux où P 0 s’annule, ils sont en nombre fini, et P n’a qu’un nombre fini de valeurs non régulières. Il en est de même de f vue comme application de S 2 \ {N } dans elle-même, donc de f comme application S 2 dans S 2 (si besoin est, on rajoute le pôle Nord). Notons F l’ensemble formé de ces valeurs. Puisque F est fini, S 2 \ F est connexe. D’après 2.14, la fonction  x 7→ card f −1 (x) est localement constante sur S 2 \ F , donc constante en raison de la connexité. Cette constante est non nulle. Sinon, f , et à plus forte raison P n’aurait que des valeurs singulières, ce qui voudrait dire que P 0 s’annule identiquement, donc que P est constant contrairement à l’hypothèse. Tous les points de S 2 \ F , et donc tous les points de S 2 , sont des valeurs prises par f . Revenant à la définition de f , on en déduit que tous les points de C sont des valeurs prises par P. 2

2.5. Les espaces projectifs Quand on pratique le dessin en perspective ou l’optique géométrique, il est naturel d’adjoindre au plan ou à l’espace des directions à l’infini. La situation modèle de la perspective conduit à procéder comme suit : on représente Rn comme le sousespace (affine !) {1} × Rn de Rn+1 . La perspective par rapport à l’origine est une bijection entre {1} × Rn et l’ensemble des droites (vectorielles) de Rn+1 qui ne sont pas contenues dans {0} × Rn (voir la figure 2.3). Ce sont les droites de {0} × Rn qui modélisent les points à l’infini. L’espace projectif formalise cette situation. Définition 2.15. L’espace projectif réel de dimension n, noté P n R est l’espace quotient de Rn+1 \ {0} par la relation d’ équivalence x∼y

si et seulement si

muni de la topologie quotient.

x et y sont colinéaires,

2 − Notions de base sur les variétés

65

1 × IRn

0 × IRn

Figure 2.3 – Une carte de l’espace projectif

Notant p : Rn+1 \{0} → P n R l’application de passage au quotient, on rappelle qu’une partie U de P n R est ouverte si et seulement si p−1 (U ) est ouvert dans Rn+1 \ {0} (voir [Quéffélec], p. 43–44). On peut donc considérer P n R comme l’ensemble des droites vectorielles de Rn+1 . Une autre interprétation est possible : la restriction de ∼ à S n identifie les points x and −x, et l’espace projectif réel est homéomorphe au quotient de S n par cette identification. On vérifie que P n R est séparé (voir aussi 2.7.1). On en déduit que P n R est compact, en tant qu’image de S n par l’application continue p. Définition 2.16. Le (n + 1)-uple x = (x0 , . . . , xn ) est un système de coordonnées homogènes de p(x). Il sera commode de noter [x] = [(x0 , . . . , xn )] le point de coordonnées homogènes x. Nous allons munir P n R d’un atlas (Ui , φi )0≤i≤n et donc en faire une variété. Posons Vi = {x = (x0 , ..., xn ) ∈ Rn+1 /xi 6= 0} (0 ≤ i ≤ n) et définissons les applications Φi : Vi → Rn par   x0 xbi xn ,··· , ,··· , Φi (x) = xi xi xi où le signe b signifie que le terme correspondant est omis. Ce sont des applications continues et Φi (x) = Φi (y) si et seulement si p(x) = p(y). D’après les propriétés de la topologie quotient, Ui = Φi (Vi ) est un ouvert de P n R, et Φi passe au quotient et donne une application bijective et continue φi de Ui dans Rn . Explicitement,   x0 xbi xn φi ([x]) = ,··· , ,··· , . xi xi xi L’application réciproque est donnée par φ−1 i (y0 , · · · , yn−1 ) = p(y0 , · · · , yi−1 , 1, yi , · · · , yn−1 ) , ce qui montre que φi est un homéomorphisme de Ui sur Rn .

66

Introduction aux variétés différentielles

Les fonctions de transition φj ◦ φi−1 sont bien des difféomorphismes de φi (Ui ∩ Uj ) sur φj (Ui ∩ Uj ), car pour yj 6= 0 on a   y0 yi−1 1 ybj yn−1 (φj ◦ φ−1 )(y , · · · , y ) = , · · · , , , · · · , , · · · , . 0 n−1 i yj yj yj yj yj Nous avons ainsi une structure de variété lisse sur P n R. On définit d’une façon analogue l’espace projectif complexe P n C. Il suffit dans tout ce qui précède de remplacer R par C, et de remarquer qu’une application de la forme (z, t) →

z t

de C × C \ {0} dans C

est lisse, si on la considère comme une application de R2 × R2 \ {0} dans R2 . Remarque. ** On peut aussi définir les variétés (analytiques) complexes. Une structure complexe sera définie par un atlas à valeur dans Cn tel que les fonctions de transition soient analytiques complexes. Un simple examen des formules ci-dessus montre que c’est bien le cas de P n C. Vu les propriétés très particulières des fonctions analytiques complexes (principe du maximum, etc), le monde des variétés complexes est très différent et nous n’en parlerons qu’épisodiquement.** Il est instructif de comprendre en termes de variétés les notions classiques d’analyse complexe. Par exemple, en reprenant la discussion du début de la section 2.3 sur le prolongement à l’infini des polynômes, on voit que les fonctions méromorphes sont les fonctions holomorphes à valeurs dans P 1 C. D’une façon analogue au cas réel, on peut considérer la trace de la relation d’équivalence sur l’ensemble des vecteurs de Cn+1 de norme 1, c’est-à-dire sur la sphère ( ) n+1 X 2n+1 n+1 2 S = (z0 , z1 , · · · , zn ) ∈ C / |zi | = 1 · i=0

En désignant toujours par p l’application de passage au quotient, il est clair que p(S 2n+1 ) = P n C (ce qui montre au passage la compacité de l’espace projectif complexe), et que, pour z, z 0 ∈ S 2n+1 , on a p(z) = p(z 0 ) si et seulement si z = uz 0 , où u est un complexe de module 1. Autrement dit, si on considère p : S 2n+1 → P n C l’image réciproque par p d’un point de P n C est un grand cercle de S 2n+1 . De plus, on a le Lemme 2.17. L’ouvert p−1 (Ui ) de S 2n+1 est difféomorphe à S 1 × Ui . Démonstration. Prenons le cas i = 0 pour alléger les notations. Un point x ∈ U0 a un système de coordonnées homogènes unique de la forme (1, ζ1 , · · · , ζn ) (le point n+1 (1, φ−1 ). 0 (x) de C

2 − Notions de base sur les variétés

67

Alors un point (z0 , · · · , zn ) de S 2n+1 vérifie p(z) = x si et seulement si u (z0 , z1 , · · · , zn ) = v (1, ζ1 , · · · , ζn ). u n X u t1 + |ζi |2 i=1

L’application (u, ζ) 7→ z est un difféomorphisme de S 1 × Cn sur p−1 (U0 ), et le difféomorphisme cherché s’obtient en composant par Id × φ0 Nous venons de voir un cas particulier de la situation suivante. Définition 2.18. Soient E et B deux variétés C k (0 ≤ k ≤ +∞). Une application C k de E dans B est une fibration (de base B et d’ espace total E), si pour tout k x ∈ B il existe un ouvert U contenant  x, une variété C F et un difféomorphisme −1 φ : U × F → p (U ) tel que p φ(y, z) = y quels que soient y dans U et z dans F . On dit aussi que E est un espace fibré. Notons que la restriction de p à p−1 (U ) est égale à pr1 ◦ φ−1 , ce qui prouve (en anticipant un peu, voir la sous-section 2.6.2) que p est une submersion. Pour b dans B, p−1 (b) = Eb est une sous-variété fermée de E, de dimension dim E − dim B, que l’on appelle fibre de b. Pour b ∈ U , Eb est difféomorphe à F . En fait, si la base B est connexe, la variété F est “toujours la même”. Lemme 2.19. Si p : E → B est une fibration de base connexe, les fibres Eb sont difféomorphes. Démonstration. Choisissons un point b0 de B.Pour tout b ∈ B, il existe un chemin continu γ : [0, 1] → B joignant b0 et b. Tout x ∈ γ([0, 1]) est contenu dans un ouvert Ux satisfaisant à la propriété de la définition 2.18. Par compacité, on peut trouver un nombre fini U1 , . . . Um recouvrant γ([0, 1]). On peut supposer que b0 ∈ U1 , b ∈ Um , et que Ui ∩ Ui+1 pour 1 ≤ i ≤ m − 1. Alors les fibres Ex pour x ∈ Ui sont difféomorphes entre elles, et difféomorphes aux fibres Ex pour x ∈ Ui+1 . Ainsi, Eb0 est difféomorphe à Eb . Cette propriété justifie le nom de fibre type pour F . Elle permet de voir qu’une submersion n’est pas nécessairement une fibration (le theorème 1.18 semble dire le contraire, mais il oblige à rapetisser l’ouvert de l’espace source, qui n’a aucune raison d’être de la forme p−1 (U ) pour un ouvert U du but). Pour un contre-exemple explicite, voir la section 2.9. Le lemme 2.17 dit exactement que p : S 2n+1 → P n C est une fibration de fibre type S 1 . Un argument analogue à celui de ce lemme montre de même que p : Rn+1 \ {0} → P n R est une fibration de fibre R∗ .

68

Introduction aux variétés différentielles

Définitions 2.20. a) La fibration triviale est celle pour laquelle E = B × F et p = pr1 ; on dira qu’une fibration est trivialisable s’il existe un difféomorphisme φ de E sur B × F tel que p = pr1 ◦ φ·. On dit aussi dans ces condition que le fibré E est trivial (resp. trivialisable), et que φ est une trivialisation. b) Un isomorphisme entre deux fibrés E1 et E2 ayant même base B est un difféomorphisme f : E1 → E2 tel que p2 ◦ f = p1 . Par exemple, un fibré trivialisable est isomorphe au fibré trivial. La définition 2.18 dit exactement que toute fibration devient trivialisable au dessus d’ouverts suffisamment petits de la base (dits ouverts trivialisants). Il est d’usage d’appeler “trivialité locale” cette propriété. Exemple : la fibration de Hopf Pour (u, v) ∈ S 3 = {(u, v) ∈ C2 , |u|2 + |v|2 = 1} , on pose h(u, v) = (2uv, |u|2 − |v|2 )· Nous allons voir que h est une fibration de S 3 sur S 2 de fibre S 1 . Il est immédiat que h envoie S 3 dans la sphère S 2 vue comme {(z, t) ∈ C × R, |z|2 + t2 = 1}. Si on pose N = (0, 1) et S = (0, −1) les calculs de 2.2 montrent que  u iN h(u, v) = v

et

 v iS h(u, v) = u

Il en résulte que S 2 \ {N } et S 2 \ {S} sont des ouverts trivialisants pour une fibration dont la fibre type est l’ensemble des complexes de module 1 (voir la preuve du lemme 2.17). On en déduit un difféomorphisme explicite entre P 1 C et S 2 , donné par   u v −1 [(u, v)] → i−1 si v = 6 0 et [(u, v)] → i si u 6= 0. N S v u Le difféomorphisme réciproque s’écrit (z, t) 7→ [(z, 1 − t)]

si t 6= 1

et

(z, t) 7→ [(1 + t, z)]

si t 6= −1.

On montre de la même façon que P 1 R est difféomorphe à S 1 : si on se restreint à R2 , on obtient l’application h : (u, v) → (u2 − v 2 , 2uv) de S 1 dans S 1 que l’on peut lire sur la figure 2.4. On peut aussi poser z = u + iv, et remarquer que l’application z 7→ z 2 de S 1 dans S 1 donne par passage au quotient un difféomorphisme entre S 1 / ± I et S 1 (voir la section 2.7).

2 − Notions de base sur les variétés

69

h(u,v)

v droite de pente − u

( – 1, 0 )

α



Figure 2.4 – De la droite projective au cercle

2.6. L’espace vectoriel tangent ; applications 2.6.1. Espace tangent, application linéaire tangente Jusqu’à présent, nous avons parlé d’applications lisses entre variétés mais pas de leur différentielle ! Pour définir cette dernière, il nous faut d’abord définir l’espace tangent en un point m à une variété M . Nous allons nous inspirer de ce qui a été fait pour les M sous-variétés de Rn , en utilisant les courbes passant par m. Nous désignerons par Cm (ou simplement Cm s’il n’y a pas d’ambiguïté) l’ensemble des courbes lisses c : I 7→ M définies sur un intervalle ouvert I contenant 0 et telles que c(0) = m. Définition 2.21. Deux courbes c1 : I1 → M et c2 : I2 → M de Cm sont tangentes en m si c1 (0) = c2 (0) = m et s’il existe une carte (U, φ), telle que m ∈ U et (φ ◦ c1 )0 (0) = (φ ◦ c2 )0 (0). On dit aussi que ces courbes ont même vitesse en m. Cette condition ne dépend pas du choix de la carte : si (V, ψ) est une deuxième carte définie sur un ouvert contenant m, le théorème des fonctions composées donne (ψ ◦ ci )0 (0) = d(ψ ◦ φ−1 )φ(m) · (φ ◦ c)0 (0). On a donc défini ainsi une relation d’équivalence sur Cm . En s’inspirant du cas des sous-variétés de Rn , on est conduit à la définition suivante. Définition 2.22. Soient M une variété lisse et m ∈ M . Un vecteur tangent à M en m est une classe d’équivalence de la relation d’équivalence ci-dessus. L’ensemble des vecteurs tangents en m est noté Tm M .

70

Introduction aux variétés différentielles

Une carte (U, φ) au voisinage de m étant donnée, on définit une application θφ de Tm M dans Rn (si n = dim M ), en posant θφ (ξ) = (φ ◦ c)0 (0) (le second membre est bien défini, puisqu’il ne dépend que de la classe d’équivalence de c). D’après sa définition même, θφ est injective. Enfin, θφ est surjective : un vecteur v ∈ Rn est l’image par θφ de la classe d’équivalence de la courbe t 7→ φ−1 (tv). Ainsi, l’application θφ : Tm M 7→ Rn est une bijection. Soit maintenant (V, ψ) une autre carte telle que m ∈ V , et v ∈ Rn . Alors −1 (θφ ◦ θψ )(v) = d(φ ◦ ψ −1 )ψ(m) · v.

On obtient une application linéaire. Cela permet de donner à Tm M une structure d’espace vectoriel sur R : si ξ, η ∈ Tm M, λ ∈ R, on pose   ξ + η = θφ−1 θφ (ξ) + θφ (η) et λξ = θφ−1 λθφ (ξ) , et le résultat ne dépend pas de φ. Définition 2.23. L’espace vectoriel tangent à m en M , noté Tm M , est l’ensemble des vecteurs tangents en m muni de la structure d’espace vectoriel définie ci-dessus. Exemples a) Si U est un ouvert d’un variété M , la construction précédente montre que Tm U est canoniquement isomorphe à Tm M . b) L’espace vectoriel tangent en a à un espace affine E s’identifie au vectorialisé Ea de E en a : à v ∈ Ea on associe la classe d’équivalence de la courbe t 7→ a + tv. c) Si M et M 0 sont deux variétés, l’espace tangent en (m, m0 ) à M × M 0 est la somme directe Tm M ⊕ Tm0 M 0 . Nous sommes maintenant en mesure de définir la différentielle d’une application lisse entre deux variétés. Définition 2.24. Si X et Y sont deux variétés, et f : X → Y une application lisse, l’application linéaire tangente en x ∈ X, notée Tx f est l’application déduite par passage au quotient de l’application c 7→ f ◦ c. de CxX dans CfY(x) . Soient (U, φ) et (V, ψ) des cartes de X et Y , dont les domaines U et V contiennent respectivement x et f (x). De la différentiabilité de ψ ◦ f ◦ φ−1 (voir la définition 2.6) et du fait que (ψ ◦ f ◦ φ−1 ) ◦ (φ ◦ c) = ψ ◦ f ◦ c on tire immédiatement que les images de deux courbes tangentes sont tangentes. On a de plus le diagramme commutatif Tx X   θφ y

Tx f

−−−−→

dφ(x) (ψ◦f ◦φ−1 )

Rp −−−−−−−−−−→ où p = dim X et q = dim Y .

Tf (x) Y   θψ y Rq

2 − Notions de base sur les variétés

71

Exemples a) Si M est une sous-variété de Rn , et i : M → Rn l’inclusion naturelle, Tm i est un isomorphisme entre Tm M et l’espace tangent de la définition 1.25 b) Si φ est une carte, Tx φ est l’isomorphisme θφ vu plus haut. c) Si f est une application lisse de M dans R, Tx f est une application linéaire de Tx M dans Tf (x) R ' R ; si (U, φ) est une carte dont le domaine contient m, alors Tx f ◦ θφ−1 est la différentielle de f ◦ φ−1 : φ(U ) → R. On continuera à noter dfx la différentielle d’une application à valeurs dans R (notons que dans ce cas certains auteurs, Bourbaki et [Berger–Gostiaux] par exemple, font la distinction entre Tx f , application linéaire de Tx M dans Tx R, et dfx , application linéaire de Tx M dans R). Proposition 2.25. Si f : X → Y et g : Y → Z sont deux applications lisses entre variétés, alors ∀x ∈ X, Tx (g ◦ f ) = Tf (x) g ◦ Tx f · Démonstration. Prenons des cartes (U, φ), (V, ψ) et (W, χ) au voisinage de x, f (x), g(f (x)) respectivement. La propriété annoncée est une conséquence des définitions et du théorème des fonctions composées ordinaire appliqué aux fonctions φ ◦ f ◦ ψ −1

et ψ ◦ g ◦ χ−1 .

2.6.2. Difféomorphismes locaux, immersions, submersions, sous-variétés Ce cadre étant établi, les développements de la section 1.4 concernant le théorème d’inversion locale et ses conséquences s’étendent mot pour mot aux variétés. Théorème 2.26. Soient X et Y deux variétés de dimensions respectives m et n et f : X → Y une application lisse, et x ∈ X. a) Si Tx f est bijective, il existe un ouvert U contenant x tel que f|U soit un difféomorphisme sur f (U ). b) Si Tx f est injective ou surjective, il existe des ouverts U contenant x et V contenant f (x), et des cartes (U, φ) et (V, ψ) tels que  (x1 , · · · , xn , 0, · · · , 0) si Tx f est injective (ψ ◦ f ◦ φ−1 )(x1 , · · · , xn ) = (x1 , · · · , xm ) si Tx f est surjective. Démonstration. On exprime f à l’aide de cartes et on applique les résultats de la section 1.4. Il est donc naturel d’étendre aux variétés les définitions vues de la secion 1.4.

72

Introduction aux variétés différentielles

Définitions 2.27. a) Une application f d’une variété X dans une variété Y est une immersion (resp. une submersion) si pour tout x ∈ X l’application linéaire tangente est injective (resp. surjective). b) Une partie M d’une variété X de dimension n est une sous-variété de dimension p si pour tout x de M, il existe des voisinages ouverts U et V de x dans X et de 0 dans Rn respectivement, et un difféomorphisme f : U → V tel que f (U ∩ M ) = V ∩ (Rp × {0})· Il revient bien sûr au même de dire que pour tout x ∈ M il existe une carte (U, φ), où x ∈ U , telle que φ(U ∩ M ) soit une sous-variété de Rn . c) Une application f de X dans Y est un plongement si f (X) est une sous-variété de Y et si f est un difféomorphisme de X sur f (X). d) Si f : X → Y est lisse, un point x ∈ X est dit point critique si rg(Tx f ) < dim Y ; l’image d’un point critique est une valeur critique. Exemple : extrema locaux Pour une application f : X → R, un point a ∈ X est critique si et seulement si la différentielle df est nulle en a. La proposition 1.34 s’étend immédiatement : un a ∈ X où f admet un extremum local est un point critique. On se ramène au cas de f ◦ φ−1 , où φ est une carte dont le domaine contient a. Notons aussi que dans le cas où X est une sous-variété Rn , la notion de point critique est équivalente à celle d’extremum lié. Supposons en effet X de codimension p et définie au voisinage d’un point a par une submersion g = (g 1 , . . . , g p ) dans Rp . Soit f une fonction lisse sur Rn . Le point a sera critique pour f|X si et seulement si dfa s’annule sur Ta X, ou encore p \

Ker dgai ⊂ Ker dfa .

i=1

Puisque les formes linéaires dgai sont par hypothèse indépendantes, cela revient à dire qu’il existe des réels (λi )1≤i≤p (appelés multiplicateurs de Lagrange) tels que dfa =

p X

λi dgai .

i=1

Exemple : hypersurfaces projectives Soit P un polynôme homogène à n + 1 variables, dont les dérivées partielles ∂i P ne s’annulent jamais simultanément si x 6= 0. La partie de P n R formée des points dont les coordonnées homogènes vérifient P (x) = 0 est une sous-variété de P n R. Supposons par exemple la première coordonnée homogène x0 non nulle, et utilisons les cartes vues de la section 2.5. Alors φ0 (U0 ∩ M ) = {u ∈ Rn \P (1, u1 , · · · , ..., un ) = 0}·

2 − Notions de base sur les variétés

73

D’après l’identité d’Euler (voir le chapitre 1, exercice 4), (deg P )P (1, u1 , · · · , un ) = ∂0 P (1, u1 , · · · , un ) +

n X

ui ∂i P (1, u1 , · · · , un )·

i=1

Donc, en un point de φ0 (U0 ∩ M ), les dérivées ∂i P (1, u1 , · · · , un ) ne peuvent s’annuler simultanément sans que ∂0 P (1, u1 , · · · , un ) ne s’annule aussi. Ces considérations s’appliquent telles que à l’espace projectif complexe. Proposition 2.28. a) Si f : X → Y est une submersion, alors pour tout y ∈ Y , l’image réciproque f −1 (y) est une sous-variété de X (éventuellement vide). b) Si X est compacte et si f : X → Y est une immersion injective, alors f est un plongement de X dans Y . Démonstration. Soit (U, φ) une carte de X dont le domaine contient un x tel que f (x) = y, et (V, ψ) une carte de Y dont le domaine contient y. Alors ψ ◦ f ◦ φ−1 est encore une submersion, et on est ramené au cas des ouverts de Rn (voir le théorème 1.21). Pour b), notons d’abord que, en raison de l’hypothèse de compacité, f est un homéomorphisme sur son image. Si alors (U, φ) est une carte au voisinage de x ∈ X, f ◦ φ−1 est une immersion et un homéomorphisme local, et les arguments de 1.21 s’appliquent encore. Attention. Ce dernier résultat est faux quand X n’est pas compacte. Nous avons déjà vu un exemple de cette situation dans la sous-section 1.5.3. Il est maintenant plus simple de présenter cet exemple comme l’immersion de R dans T 2 donnée par √ √ t → (cos t, sin t, cos 2t, sin 2t) (voir la figure 2.5). Il est d’usage d’appeler droite de Kronecker l’image d’une telle application. L’allusion au grand théoricien des nombres que fut Leopold Kronecker vient du parfum arithmétique de cet exemple.

Figure 2.5 – Droite de Kronecker

74

Introduction aux variétés différentielles

Il ne suffit même pas d’avoir une immersion injective dont l’image est fermée. Pour le voir, on peut prendre la restriction à ] − ∞, 1[ de l’immersion  2  t − 1 t(t2 − 1) t→ 2 , de ] − ∞, 1[ dans R2 . t + 1 t2 + 1 appelée familièrement “le serpent qui se mord le ventre” (figure 2.6).

Figure 2.6 – Serpent qui se mord le ventre

Dans les deux cas la topologie induite sur l’image n’est pas localement euclidienne. Sinon, ces deux exemples n’ont pas grand chose en commun, et le second est passablement artificiel. Cela justifie la définition suivante. Définition 2.29. Une immersion i d’une variété X dans une variété Y est dite stricte si pour toute variété Z et toute application lisse f : Z → Y telle que f (Z) ⊂ i(X), l’application i−1 ◦ f est lisse. La droite de Kronecker est donnée par une immersion stricte, alors que pour le serpent i−1 ◦ f peut ne pas être continue. Remarque. Quand on a une immersion (resp. une immersion stricte) de X dans Y , on dit aussi que X est une sous-variété immergée (resp. strictement immergée) de Y . Nous utiliserons peu cette notion qui est importante surtout en théorie des feuilletages. Terminons cette section par une généralistion importante de la proposition 2.28. Théorème 2.30. Soit f : X → Y une application lisse, et soit Z une sous-variété lisse de Y . On suppose que pour tout x de X tel que f (x) ∈ Z on a Im(Tx f ) + Tf (x)Z = Tf (x) Y

(hypothèse de transversalité).

−1

Alors f (Z) est une sous-variété de X, de codimension égale à codim(Z) si elle est non vide. Remarques a) À défaut d’intérêt, cet énoncé garde un sens si f −1 (Z) = ∅. b) Quand Z est un point, on retrouve la première partie de la proposition 2.28.

2 − Notions de base sur les variétés

75

Démonstration. La question étant locale, on peut se ramener, grâce à une carte convenable, au cas où Y est un ouvert de Rn et Z = (Rp × {0}) ∩ Y . D’après l’hypothèse, L il existe un sous-espace vectoriel Z 0 de Im(Tx f ) tel que Rn = Z 0 Rp × {0}. Soit Φ la projection sur Z 0 parallèlement à Rp × {0}. Alors f −1 (Z) = (Φ ◦ f )−1 (0). Il suffit donc de vérifier que la différentielle de Φ ◦ f vue comme fonction à valeurs dans Z 0 est surjective. Mais Im(Φ ◦ Tx f ) ⊃ Φ(Z 0 ) = Z 0 . Enfin, codim(Φ ◦ f )−1 (0)) = dim Z 0 = n − p = codimZ.

2.7. Revêtements Commençons par quelques rappels sur la topologie quotient. Si X est un espace topologique et R une relation d’équivalence sur X, il existe sur le quotient X/R une structure topologique naturelle. Par définition, une partie U de X/R sera ouverte si et seulement si son image réciproque par l’application de passage au quotient p : X 7→ X/R est ouverte dans X. Cette définition est faite pour assurer la propriété suivante : une application de f de X/R dans un espace topologique Z est continue si et seulement si f ◦ p : X → Z est continue. Autrement dit, les applications continues de source X/R sont les applications continues de source X qui sont constantes sur les classes d’équivalence. Si maintenant X est une variété, il n’y a aucune raison pour que X/R, munie de la topologie quotient, soit encore une variété : les contraintes topologiques sont trop fortes. De plus si on veut que les applications lisses de source X qui passent au quotient soient encore lisses, il est naturel d’exiger que si g = f ◦ p est une telle application, la différentielle de g détermine celle de f . Comme Tx g = Tp(x) f ◦ Tx p, ce sera bien le cas si p est une submersion (auquel cas les classes d’équivalences seront des sous-variétés fermées). N’allons pas plus loin, et notons simplement que la notion de variété quotient n’a rien d’immédiat. Pour plus de détails voir [Godement], ch.4 §9. Nous ne la traiterons que partiellement, en commençant par un cas particulier important, celui du quotient d’une variété par un groupe discret. Même dans ce cas, des considérations topologiques préalables sont indispensables.

2.7.1. Quotient d’une variété par un groupe Définitions 2.31. a) Une action (ou opération) à gauche d’un groupe Γ sur un ensemble X est une application (γ, x) 7→ γ.x de Γ × X dans X telle que e·x=x

et

quels que soient x ∈ X, γ1 , γ2 ∈ Γ.

γ1 · (γ2 · x) = (γ1 γ2 ) · x

76

Introduction aux variétés différentielles

b) Une action continue d’un groupe Γ sur un espace topologique X est une action telle que pour tout γ l’application x → 7 γ · x soit continue. c) Une action lisse d’un groupe Γ sur une variété X est une action telle que pour tout γ l’application x 7→ γ · x soit lisse. Remarques a) La définition a) revient à se donner un morphisme de Γ dans le groupe des bijections de X. b) Il résulte des définitions que pour γ fixé, l’application x 7→ γ · x est un homéomorphisme dans le cas b), et un difféomorphisme dans le cas c). c) On peut reformuler b) (resp. c) en disant que l’application (γ, x) 7→ γ · x est une application continue, de Γ × X dans X, Γ étant muni de la topologie discrète. Cela permet de faire le lien avec les actions de groupes topologiques et de groupes de Lie, que nous verrons au chapitre 4. Pour éviter les banalités, nous aurons besoin de la définition suivante. Définition 2.32. Une action de groupe est effective si pour γ 6= e l’application x 7→ γ ·x est différente de l’identité, autrement dit si l’homomorphisme γ 7→ (x 7→ γ ·x) de Γ dans le groupe des bijections de X est injectif. Dans ce cas, on notera encore γ l’application x 7→ γ · x. Exemple. L’action de Z sur R définie par (n, x) 7→ (−1)n x n’est pas effective, mais l’action analogue du groupe {±1} l’est. C’est un exemple d’une situation générale décrite dans l’exercice 18, qui justifie que l’on ne considère le plus souvent que des actions effectives. Définition 2.33. Si E est un espace topologique sur lequel agit un groupe Γ, le quotient de E par Γ, noté E/Γ, est l’espace des orbites de Γ, autrement dit le quotient de E par la relation d’équivalence x ' y ⇔ ∃γ ∈ Γ , y = γ · x , muni de la topologie quotient. On désigne par p l’application de passage au quotient. Rappelons que l’orbite d’un point x de E est sa classe d’équivalence, c’est-à-dire la partie {γ · x}, γ ∈ Γ de X. On la notera Γ · x. Nous avons en vue le cas où E est une variété, et cherchons des conditions suffisantes sur l’action de Γ pour que E/Γ soit une variété. Dans un premier temps, on va s’assurer que E/Γ est localement compact. Le point essentiel est la séparation. Définition 2.34. Un groupe discret Γ opère proprement sur un espace localement compact X si quels que soient les compacts K et L de X, l’ensemble {γ ∈ Γ , γ(K) ∩ L 6= ∅} est fini.

2 − Notions de base sur les variétés

77

Signalons la terminologie synonyme, très contestable bien que répandue, d’action discontinue. Exemples et contre-exemples a) Tout groupe fini opère proprement. b) L’action de Z sur R donnée par (n, x) → x + n est propre, mais celle donnée par (n, x) → 2n x ne l’est pas. c) Le groupe Zn opère proprement sur Rn par translations : il suffit de remarquer que tout compact de Rn est inclus dans un cube {(x1 , · · · , xn ), |xi | ≤ A}. Par contre, si α est un nombre irrationnel, l’action de Z2 sur R donnée par (m, n, x) → x + αm + n n’est pas propre. Elle est même tellement épouvantable que penser au sens courant du mot “propre” n’est pas contraire à l’intuition (on vérifiera par exemple que l’espace des orbites est muni de la topologie grossière). Pour d’autres exemples et contre-exemples, voir l’exercice 19. Théorème 2.35. a) Pour qu’une application f de E/Γ dans un espace topologique X soit continue, il faut et suffit que f ◦ p le soit. b) L’image par p d’un ouvert de E est un ouvert de E/Γ. c) Si E est localement compact et si Γ est un groupe discret opérant proprement, alors E/Γ est localement compact. Démonstration. Rappelons que par définition de la topologie quotient, une partie V de E/Γ est ouverte si et seulement si p−1 (U ) l’est. a) est alors immédiat. Pour b), il suffit de remarquer que p−1 (p(U )) = ∪γ∈Γ γ(U ) est ouvert dès que U est ouvert, les γ donnant des homéomorphismes de E. Passons à c). Pour prouver que E/Γ est séparé, ce qui est le point essentiel, il suffit de voir que si y 6∈ Γ · x, il existe des voisinages V et W de x et y respectivement tels que γ(V ) ∩ γ 0 (W ) = ∅ quels que soient γ, γ 0 ∈ Γ, ou encore V ∩ γ(W ) = ∅

78

Introduction aux variétés différentielles

quel que soit γ ∈ Γ. D’abord, E étant localement compact, x et y admettent des voisinages compacts disjoints K et L. L’action de Γ étant propre, γ(L) ne rencontre K que pour un nombre fini de γ, soient γ1 , . . . , γ n . Mais x 6= γi (y) quel que soit i, donc par continuité x et y sont contenus dans des voisinages compacts Ai et Bi tels que Ai ∩ γi (Bi ) = ∅. Il suffit maintenant de prendre V = K ∩ (∩ni=1 Ai ) W = L ∩ (∩ni=1 Bi ) . La locale compacité résulte immédiatement de b). Examinons maintenant le cas où l’espace que l’on quotiente est une variété. L’action x 7→ ±x de Z/2Z sur R donne un exemple fort simple d’action propre telle que le quotient ne soit pas une variété. On peut remarquer aussi que si un élément γ autre que l’identité a un point fixe, p risque fort de ne pas être une submersion : si γ(a) = a et si par exemple Ta γ − Ia est inversible, de l’égalité Ta p ◦ Ta γ = Ta p, déduite par différentiation en a de p ◦ γ = p, on tire Ta p = 0 ! La définition qui suit est faite pour écarter cette situation. Définition 2.36. Une action d’un groupe Γ sur un ensemble E est dite libre si ∀γ 6= e, ∀x ∈ E, γ · x 6= x. L’application de passage au quotient pour une action propre et libre d’un groupe discret sur un espace localement compact a des propriétés remarquables qui méritent d’être dégagées pour elles-mêmes. Définition 2.37. Une application continue p : X → B est un revêtement de base B et d’espace total X si tout b ∈ B est contenu dans un ouvert U tel que p−1 (U ) soit une réunion (finie ou non) d’ouverts (Vα )α∈A deux à deux disjoints de X tels que la restriction de p à chaque Vα soit un homéomorphisme sur U . Si X et B sont des variétés et p une application lisse, en remplaçant dans ce qui précède homéomorphisme par difféomorphisme on obtient une notion de revêtement lisse. Si B est connexe, il résulte de la définition que le cardinal de p−1 (x) est constant. On l’appelle de degré du revêtement. Remarques a) Un revêtement est en fait une fibration où les fibres sont munies de la topologie discrète (comparer au théorème 2.14). b) Si X est une variété, il revient au même de supposer que tout b ∈ B est contenu dans un ouvert connexe U tel que la restriction de p à chaque composante connexe de p−1 (U ) soit un difféomorphisme (ou un homéomorphisme).

2 − Notions de base sur les variétés

79

V3 V3 V2

X V2

V1 V1 U

B

B

U

Figure 2.7 – Trivialité locale

Exemples a) Si I est un ensemble quelconque muni de la topologie discrète, la projection de I × B sur B est un revêtement : pour chaque i ∈ I, {i} × B est une partie ouverte et fermée de l’espace total qui est homéomorphe à la base. Un tel revêtement est dit trivial. Plus généralement, un revêtement p : X → B sera dit trivialisable s’il existe un espace discret I et un homéomorphisme f : B × I → X tels que p ◦ f soit la projection de B × I sur B. Notons que la définition des revêtements peut se reformuler en disant que tout point de la base est contenu dans un ouvert U tel que p : p−1 (U ) → U soit trivialisable. Notons qu’un revêtement dont l’espace total X est connexe n’est pas trivialisable, à moins que p soit un homéomorphisme. b) Prenons X = R, B = S 1 , et p(t) = (cos t, sin t). Soit τ ∈]0, π]. Pour chaque t0 , considérons l’ouvert  U = { cos(t0 + t), sin(t0 + t) , t ∈] − τ, τ [}. Alors p−1 (U ) = ∪n∈Z ]t0 − τ + 2nπ, t0 + τ + 2nπ[. c) On prend X = B = C∗ , ou X = B = S 1 , et dans les deux cas p(z) = z k . Ici, le même argument qu’en b) montre que tout b ∈ B est contenu dans un ouvert U tel que p−1 (U ) se compose de k ouverts homéomorphes à U .

80

Introduction aux variétés différentielles

eit 0

t0 – τ

t0

t0 + τ

t0 + 2π

p

Figure 2.8 – Revêtement du cercle par la droite

d) Si f : X → Y est une application lisse entre deux variétés de même dimension, et si X est compacte, f est un revêtement de l’ensemble des points réguliers sur l’ensemble des valeurs régulières. C’est le contenu de l’énoncé du théorème 2.14. Dans le cas b), p passe au quotient en un homéomorphisme (et même un difféomorphisme, comme on le verra dans un instant) de R2 /2πZ sur S 1 . Dans le cas c), deux points ont même image par p si et seulement si ils sont transformés l’un de l’autre par une rotation de centre 0 et d’angle 2rπ/k. Ces rotations définissent une action du groupe Zk = Z/kZ, et on en déduit que S 1 /Zk est homéomorphe à S 1 . Il s’agit là d’exemples de la situation décrite par le théorème suivant. Théorème 2.38. a) Si un groupe discret Γ agit proprement et librement sur un espace localement compact X, l’application p : X → X/Γ est un revêtement. b) Si de plus X est une variété sur laquelle Γ opère différentiablement, il existe sur X/Γ une unique structure de variété pour laquelle p est un revêtement lisse. Démonstration. On s’appuie essentiellement sur le lemme suivant. Lemme 2.39. Sous les mêmes hypothèses, tout x ∈ X est contenu dans un ouvert V dont les transformés γ(V ) sont deux à deux disjoints. Démonstration. Soit W un voisinage compact de x. D’après l’hypothèse de propreté, W ne peut rencontre qu’un nombre fini de ses transformés par les éléments de Γ, disons γ1 (W ), γ2 (W ),..γp (W ). Pour chaque i entre 1 et p, on peut trouver des ouverts disjoints Wi0 contenant x et W ”i contenant γi (x). Il suffit alors de prendre  V = W ∩ ∩1≤i≤p Wi0 ∩ γi−1 (W ”i ) . Alors par construction V ne rencontre pas les γi (V ), et puisque V ⊂ W , V ne rencontre pas non plus les autres γ(V )

2 − Notions de base sur les variétés

81

Preuve du théorème. Si on pose U = p(V ), on voit que p−1 (U ) = ∪γ∈Γ γ(V ). La restriction de p à chaque γ(V ) est par construction une bijection sur U . Elle est continue et ouverte, c’est donc un homéomorphisme, ce qui montre la première partie. Si, dans le cas où X est une variété lisse, on veut que p soit un revêtement lisse, la structure de variété sur l’espace quotient est imposée. Soient en effet y ∈ X/Γ, et U contenant y tel que p−1 (U ) soit réunion d’ouverts disjoints difféomorphes à U . D’après a), si V est l’un d’entre eux, les autres sont de la forme γ(V ), où γ parcourt Γ. Quitte à remplacer V par un ouvert plus petit contenant le point x de V d’image y, on peut toujours supposer que V (et donc γ(V ) pour tout γ) est difféomorphe à un ouvert de Rn . Alors, si φγ,V : γ(V ) → Rn est une carte, il doit en être de même de n φγ,V ◦ p−1 |γ(V ) : U → R .

La condition de compatibilité est bien satisfaite. Pour le même U , la fonction de transition est    −1   −1 −1 0 0 φγ,V ◦ p−1 = φγ,V ◦ p−1 |γ(V ) ◦ φγ ,V ◦ p|γ 0 (V ) |γ(V ) ◦ p|γ (V ) ◦ φγ 0 ,V =

φγ,V ◦ γ −1 ◦ γ 0 ◦ φ−1 γ 0 ,V ,

qui est une expression locale du difféomorphisme γ −1 ◦ γ 0 . Pour deux ouverts U et U 0 différents et se rencontrant, on procède de même, après avoir remarqué qu’il existe un γ0 tel que [  p−1 (U ∩ U 0 ) = γ V ∩ γ0 (V 0 ) . γ∈Γ

Corollaire 2.40. Sous les hypothèses b) ci-dessus, pour qu’une application f de X/Γ dans une variété Y soit lisse, il faut et suffit que f ◦ p le soit. Démonstration. Il suffit d’utiliser le fait que p est un difféomorphisme local. Exemples : les projectifs réels et les tores a) Le groupe à deux éléments opère proprement et librement sur S n par x 7→ ±x, et la variété quotient est difféomorphe à P n R Cela permet une vision plus géométrique du projectif : le plan projectif privé d’un disque ouvert est homéomorphe au quotient de la sphère privée de deux disques diamétralement opposés. Ce quotient peut aussi s’obtenir à partir d’un rectangle en identifiant deux côtés opposés après avoir inversé les sens de parcours. L’espace ainsi obtenu s’appelle le ruban de Möbius.

82

Introduction aux variétés différentielles ** C’est une variété à bord (cette notion sera abordée au chapitre 6) dont le bord a une seule composante connexe. Le plan projectif lui-même peut se voir comme un ruban de Möbius auquel on a ajouté un disque de même bord. On se doute qu’une telle réalisation est impossible dans l’espace de dimension 3. En fait, il n’existe pas de plongement de P 2 R dans R3 , car P 2 R n’est pas orientable (cette assertion sera expliquée et démontrée dans la section 6.2), alors que toute sous-variété compacte de codimension 1 de Rn est orientable. **

Figure 2.9 – Du plan projectif au ruban de Möbius

b) L’action (n, x) 7→ x + n de Z sur R est propre et libre, et la variété R/Z est difféomorphe à S 1 . On obtient un tel difféomorphisme en faisant passer au quotient l’application x 7→ exp 2iπx. De même, Zn opère librement sur Rn , et le quotient Rn /Zn est difféomorphe au tore T n .

2.7.2. Simple connexité Au lieu de quotienter des variétés par des groupes, on peut procéder à l’envers et chercher les revêtements d’une variété donnée. C’est l’objet de la théorie élémentaire de l’homotopie (cf. [Gramain], [Pham], [Stillwell]), dont nous allons donner les résultats de base, sans démonstration, mais avec suffisamment d’exemples pour donner une idée de ce qui se passe. La propriété fondamentale en jeu est la simple connexité. C’est, grosso modo, la connexité par arcs de l’espace des courbes fermées. Définitions 2.41. a) Un lacet d’un espace topologique X est une application continue de S 1 dans X. b) Deux lacets de X donnés par des applications f et g sont homotopes s’il existe une application continue H : [0, 1] × X → X telle que, pour tout x dans X, H(0, x) = f (x) et H(1, x) = g(x). c) Un espace connexe par arcs est dit simplement connexe si tout lacet est homotope à une application constante.

2 − Notions de base sur les variétés

83

Un exemple évident mais important est celui de Rn : deux lacets de Rn (ou plus généralement d’une partie convexe de Rn ) sont homotopes. En particulier, les parties convexes de Rn sont simplement connexes. Il est tout aussi immédiat que le produit de deux espaces simplement connexes l’est aussi. Une machine à produire des exemples est le résulat suivant. Proposition 2.42 (admis). Soit X un espace topologique s’écrivant U ∪ V , où U et V sont deux ouverts simplement connexes dont l’intersection est connexe par arcs. Alors X est simplement connexe. Donnons simplement le point de départ de la preuve. Si f : S 1 → X est une application continue, on applique la “propriété de Lebesgue” au recouvrement de S 1 par f −1 (U ) et f −1 (V ). Pour les détails, voir [Gramain] (début du ch. 2) ou [Apéry], p. 25. Corollaire 2.43. La sphère S n (pour n ≥ 2) et l’espace projectif complexe P n C sont simplement connexes. Démonstration. On regarde S n comme {x ∈ Rn+1 ,

n X

x2i = 1}

i=0

et on applique la proposition à U = {x ∈ S n , x0 < 21 } et V = {x ∈ S n , x0 > − 21 }. Pour P n C, on utilise les coordonnées homogènes. D’après la section 2.5, les ouverts U et V définis respectivement par z0 6= 0 et z1 6= 0 sont difféomorphes à Cn , et leur intersection au complémentaire d’un hyperplan complexe de Cn . Cet argument ne s’applique ni à S 1 ni à P n R : dans ce cas U ∩ V n’est pas connexe. En fait, si la simple-connexité est en général facile à prouver, la non-simple connexité l’est beaucoup moins. Il est bien vrai que S 1 et P n R ne sont pas simplement connexes, c’est une conséquence de la théorie de l’homotopie, et plus précisément du résultat suivant. Théorème 2.44 (admis). Tout revêtement d’une variété simplement connexe est trivialisable. En particulier, tout revêment connexe d’une variété simplement connexe est un difféomorphisme. Donc P n R, qui admet un revêtement de degré 2 par S n , n’est pas simplement connexe. Corollaire 2.45 (théorème de monodromie). Soit p : Y → X un revêtement d’une variété lisse X, X 0 une variété lisse simplement connexe, et f : X 0 → X une application lisse. Soit a0 un point de X 0 . Alors quel que soit le point b ∈ Y tel que g(b) = f (a0 ), il existe une application lisse g : X 0 → Y et une seule telle que p ◦ g = f et g(a0 ) = b. Démonstration. On introduit Y 0 = {(x0 , y) ∈ X 0 × Y, f (x0 ) = p(y)}

84

Introduction aux variétés différentielles

C’est une sous-variété de X 0 × Y . En effet, c’est l’image réciproque de la diagonale de X × X par (f, p) : X 0 × Y → X × X ; l’image de T(x0 ,y) (f, p) contient {0} × Tx X (on a désigné par x la valeur commune de f (x0 ) et p(y)), qui est un supplémentaire dans T(x,x) X × X du tangent à la diagonale. On peut donc appliquer le théorème 2.30. Soient p0 et f 0 les restrictions à Y 0 des projections de X 0 × Y sur les espaces facteurs. Alors p0 : Y 0 → X 0 est un revêtement : si U est un ouvert trivialisant pour p, on vérifie que f −1 (U ) est un ouvert trivialisant pour p0 . Comme X 0 est simplement connexe, ce revêtement est trivialisable : la restriction de p0 à chaque composante connexe de y 0 est un difféomorphisme d’après 2.44. Soient Y00 la composante qui contient (a0 , b), et q le difféomorphisme réciproque de la restriction de p0 à Y00 . Alors on peut prendre g = pr2 ◦ q. Vérifions maintenant l’unicité. Soient g1 et g2 deux applications lisses telles que p◦g1 = p ◦ g2 = f , avec g1 (a0 ) = g2 (a0 ) = b. Alors l’ensemble est x ∈ X 0 tels que g1 (x) = g2 (x) est non vide, fermé (c’est une propriété générale des fonctions continues), et ouvert (utiliser le fait que p est un revêtement). Comme X 0 est connexe, g1 = g2 . On démontre (mêmes références) que toute variété X est difféomorphe à un quotient Y /Γ, où Y est une variété simplement connexe, et Γ un groupe agissant proprement et librement sur Y . Le groupe Γ et la variété Y , uniques à isomorphisme et difféomorphisme près respectivement, s’appellent le groupe fondamental et le revêtement universel de X. Ainsi, le groupe fondamental de T n est Zn , et celui de P n R le groupe à deux éléments.

2.8. Dénombrabilité à l’infini Nous terminons ce chapitre en rassemblant quelques propriétés topologiques des variétés, élémentaires mais utiles. D’après la définition, une variété lisse (et même une variété topologique) est un espace localement compact, localement connexe (c’est-à-dire que tout point admet une base de voisinages connexes). En particulier, toute composante connexe d’une variété M est un ouvert de M , donc une sous-variété de même dimension. L’étude d’une variété peut donc se ramener à celle de ses composantes connexes. On a de plus la propriété suivante : Proposition 2.46. Un ouvert connexe d’une variété (topologique) est connexe par arcs. Démonstration. Sur un tel ouvert U , on définit une relation d’équivalence en disant que deux points x et y sont équivalents s’il existe une application continue c d’un intervalle fermé [a, b] dans U telle que c(a) = x et c(b) = y. Les classes d’équivalences sont ouvertes, il n’y en a donc qu’une. Comme dans le cas euclidien, on aimerait pouvoir dire qu’une sous-variété de codimension strictement positive est de mesure nulle dans la variété ambiante, et plus généralement avoir un énoncé analogue au théorème de Sard. Tentons une définition.

2 − Notions de base sur les variétés

85

Définition 2.47. Soit X une variété. Une partie E ⊂ X est négligeable si pour tout x ∈ X il existe une carte (U, φ), U contenant x, telle que φ(U ∩ E) soit de mesure nulle dans φ(U ). D’après le lemme 1.39, cette propriété ne dépend pas des cartes choisies. Il est de plus immédiat que toute réunion dénombrable d’ensembles négligeables est négligeable. La démonstration du théorème de Sard vue en chapitre 1 s’étend alors telle que, mais à une condition : comme nous allons appliquer ces arguments à des domaines de cartes de l’espace de départ, nous aurons besoin de supposer l’existence d’un atlas dénombrable. On est conduit à la définition suivante. Définition 2.48. Une variété X est dénombrable à l’infini si elle est réunion dénombrable de compacts. ˆ de X a ** Cela revient à dire que le point à l’infini du compactifié d’Alexandroff X une base dénombrable de voisinages, ce qui explique la terminologie. Rappelons (voir ˆ est la réunion disjonte de X et d’un point ω, “le point à [Quéffélec], p. 186) que X ˆ en prenant une base d’ouverts formée par l’infini”. On définit une topologie sur X les ouverts de X et les ensembles ω ∪ (X \ K), où K parcourt l’ensemble des parties compactes de X. ** Cette hypothèse étant satisfaite, la structure de variété peut être définie par un atlas au plus dénombrable. Si X = ∪n∈N Kn , où les Kn sont compacts, et si (Ui , φi )i∈I est un atlas qui définit la structure différentielle de X, chaque Kn peut être recouvert par un nombre fini d’ouverts Ui . Alors la variété X elle-même peut être recouverte par une infinité dénombrable de Ui , puisque toute réunion dénombrable d’ensembles finis est dénombrables. Nous avons donc montré le résultat suivant. Théorème 2.49. Soient X et Y deux variétés, et f : X → Y une application lisse. Si X est dénombrable à l’infini, l’ensemble des valeurs critiques de f est une partie négligeable de Y . Nous n’utiliserons ce résultat que dans le cas où dim X ≤ dim Y , où nous l’avons démontré. Pour le cas général, voir [Hirsch]. DORÉNAVANT, TOUTES LES VARIÉTÉS CONSIDÉRÉES SERONT SUPPOSÉES DÉNOMBRABLES À L’INFINI Remarque. En anglais, la dénombrabilité à l’infini est appelée “second axiom of countability”. Les variétés non dénombrables à l’infini sont des êtres mathématiques relativement pathologiques. Un exemple amusant, qui utilise la théorie des ordinaux, est celui de la longue droite, ou droite transfinie obtenue en recollant une infinité non dénombrable d’exemplaires de R. Pour une description explicite, voir l’appendice de [Spivak], ou [Douady], p.14–15.

86

Introduction aux variétés différentielles

2.9. Commentaires Comment se donner une variété Les nombres réels sont définis par des sections (on dit aussi coupures) ou par des classes d’équivalence de suites de Cauchy. Ces points de vue sont rarement utilisés dans la vie (mathématique) de tous les jours où l’on manipule plutôt des réels donnés définis par exemple comme solution d’une équation ou somme d’une série. Il en est de même pour les variétés. Les exemples les plus simples sont les sous-variétés d’un espace euclidien. (Cette simplicité peut être trompeuse : il n’est pas toujours facile de tirer par exemple d’un système d’équations des informations topologiques précises, comme il n’est pas toujours facile non plus de savoir si un réel donné par la somme d’une série est rationnel, algébrique ou transcendant). Nous avons vu que certaines actions de groupe sur des variétés donnent des variétés par passage au quotient, et nous verrons un chapitre 4 un autre type de quotient. Enfin, l’exercice 28 suggère la possibilité d’obtenir des variétés en recollant deux ou plusieurs variétés le long d’ouverts difféomorphes.

Variétés topologiques et variétés lisses Après avoir défini les variétés, nous avons été très discrets sur les questions d’existence et d’unicité. Nous serons très brefs à ce sujet. Il s’agit de questions difficiles. En dimension 2, on démontre que toute variété topologique a une unique structure de variété lisse à difféomorphisme près. Ce résultat est faux en dimension supérieure : il existe des variétés topologiques qui n’ont même pas de structure C 1 , et d’autres qui ont plusieurs structures lisses non difféomorphes. Le premier exemple, celui de la sphère S 7 , fut découvert par Kervaire et Milnor dans les années 50. Cette variété admet des descriptions assez simples : on peut la réaliser (à l’instar de la sphère S 7 “standard”, voir l’exercice 16 du chapitre 7) comme l’espace total d’une fibration convenable sur S 4 à fibres S 3 ou comme une sous-variété de codimension 3 de R10 donnée par des équations polynômiales. Il est par contre difficile de montrer que la variété ainsi obtenue n’est pas difféomorphe à S 7 munie de sa structure standard. Pour quelques détails, voir par exemple [Dieudonné 2, VII. B]. Si n 6= 4, la structure différentielle de Rn est unique (toujours à difféomorphisme près, voir [Stalling]), mais on sait depuis les années 1980 qu’il existe sur R4 une infinité de structures lisses non difféomorphes ! Pour une idée de cette construction, voir [Lawson]. Pour revenir à des considérations plus accessibles, qui sont à la base de théories géométriques très riches, on peut s’intéresser à des atlas dont les fonctions de transition conservent une propriété géométrique locale de Rn plus ou moins forte. On obtient alors des structures plus riches que la simple structure de variété, dont voici quelques exemples.

2 − Notions de base sur les variétés

87

Feuilletages Un feuilletage de codimension q sur une variété M de dimension n est la donnée sur M de cartes à valeurs dans des ouverts de la forme U × V , où U et V sont ouverts dans Rp et Rq respectivement, les fonctions de transition étant de la forme  (x, y) → f (x, y), g(y) où x ∈ U, y ∈ V . Les équations y = cte définissent alors dans la variété ambiante X des sous-variétés strictement immergées (qui ne seront pas en général des sous-variétés) de codimension q, les feuilles, qui forment une partition de X. Les coordonnées y montrent que localement, on peut paramétrer les feuilles par une sous-variété “transverse” de dimension q. Même dans le cas simple où les feuilles sont définies par une submersion globale, leur type topologique peut changer : la fonction f (x, y, z) = (1 − x2 − y 2 )ez définit ainsi un feuilletage de codimension 1 sur R3 dont les feuilles f −1 (c) sont difféomorphes à R2 si c > 0, et à S 1 × R si c ≤ 0. Pour en savoir plus à ce sujet, voir par exemple [Hector–Hirsch].

Structures plates On peut imposer aux fonctions de transition des contraintes encore plus plus fortes. Un cas extrême consisterait, à leur imposer d’être des translations. C’est vraiment trop restrictif : on peut démontrer qu’une variété compacte de ce type est un tore. Si les fonctions de transition sont des isométries affines de Rn , la situation est plus intéressante, mais encore restrictive. On obtient les variétés riemanniennes plates. Ce sont les quotients de Rn par un sous-groupe discret d’isométries sans point fixe. Pour chaque n, il n’y a qu’un nombre fini de types topologiques de telles variétés, et ce sont toutes des quotients de tores (pour plus de détails, voir [Wolf]). Les variétés affines sont celles que l’on obtient en imposant aux fonctions de transition d’être des transformations affines de Rn . La situation est beaucoup plus riche, et encore mystérieuse aujourd’hui : on est amené à étudier non seulement les quotients de Rn sous l’action de sous-groupes discrets du groupe affine, mais aussi les quotients de certains ouverts de Rn par de telles actions. L’exemple le plus simple d’une telle sitation est celui du quotient de Rn \ {0} par le groupe engendré par l’homothètie x 7→ λx (λ 6= 1). D’une façon analogue, on peut prendre des cartes à valeurs dans des ouverts de P n R ou de S n , et imposer aux fonctions de transition d’être données par des éléments de P Gl(n+1, R) – voir l’exercice 5 ci-dessous – dans le premier cas (variétés projectives), ou du groupe de Möbius – voir l’exercice 12 – dans le second (variétés conformément plates). Pour ces questions, voir par exemple [Kulkarni–Pinkall].

88

Introduction aux variétés différentielles

2.10. Exercices 1. Un espace non séparé localement homéomorphe à R ` Soit X la droite réelle avec l’origine dédoublée. Autrement dit, X = R {α}, les ouverts de X étant des réunions d’ouverts de R et d’ensembles de la forme U \ {0} ∪ {α}, où U est ouvert dans R. Montrer que tout point de X est contenu dans un ouvert difféomorphe à R, mais que X n’est pas séparé. 2. On munit R2 de sa structure euclidienne canonique. A tout point a, on associe la fonction fa , définie sur la variété M des droites par la formule fa (d) = (dist(a, d))2 . Montrer que la fonction fa est lisse. 3. Montrer que l’ensemble des points (x, y, z, t) ∈ R4 tels que x2 + y 2 = z 2 + t 2 =

1 2

est une sous-variété de S 3 , difféomorphe à S 1 × S 1 . Donner de même des exemples de sous-variétés de S 2n−1 difféomorphes à (S 1 )n . 4. Groupes unitaire et spécial unitaire a) Montrer, en utilisant une submersion convenable, que l’ensemble U (n) des matrices unitaires (matrices à coefficients complexes d’ordre n telles que t AA = I) est une 2 sous-variété de R2n de dimension n2 . Utiliser l’application exponentielle pour obtenir des paramétrisations de U (n). b) Montrer de même que l’ensemble SU (n) des matrices spéciales unitaires (défini par les conditions A ∈ U (n) et det A = 1) est une sous-variété de dimension n2 − 1. c) Montrer que SU (2) est difféomorphe à S 3 . 5. Montrer que toute application linéaire inversible A ∈ Gl(n + 1, R) définit par passage au quotient P n R un difféomorphisme, et que le groupe des difféomorphismes ainsi obtenu est isomorphe à Gl(n + 1, R)/R∗ I. * Ecrire explicitement l’action de Sl(2, R) sur S 1 ainsi obtenue. N.B. Ce groupe est noté P Gl(n + 1, R), et appelé bien sûr le groupe projectif. Tout se passe de même si on remplace R par C. 6. Quadriques projectives a) Soit q une forme quadratique de rang maximum sur R4 , et soit p la projection canonique de R4 \ {0} sur P 3 R. Montrer que p(q −1 (0)) est une sous-variété de P 3 R (éventuellement vide). b) Montrer que si q est de type (1, 3) ou (3, 1) cette sous-variété est difféomorphe à S2.

2 − Notions de base sur les variétés

89

c) Montrer que si q est de type (2, 2) cette sous-variété est difféomorphe à P 1 R×P 1 R, c’est-à-dire à S 1 × S 1 . d*) Plus généralement, étant donné une formequadratique non dégénérée q sur Rn+1 , étudier la topologie de la variété p q −1 (0) . 7. Généralités sur les immersions et les submersions a) Montrer que la composée de deux immersions (resp. submersions) est une immersion (resp. une submersion). b) Soient X et Y deux variétés, et f : X → Y une application lisse. Montrer que le graphe de f est une sous-variété fermée de X × Y , et que l’application g : x → 7 (x, f (x)) est un plongement. 8*. Donner un exemple de plongement de T 3 dans R4 ; de S 2 × S 2 dans R5 . 9. Soient v : I → Rn+1 \ {0} une application lisse (I ⊂ R désignant un intervalle ouvert) et p : Rn+1 \ {0} → P n R la projection canonique. Montrer que p ◦ v est une immersion en t si et seulement si les vecteurs v(t) et v 0 (t) sont indépendants. 10. Autres exemples de plongements a) Soit f une application lisse T -périodique de R dans une variété X, injective sur [0, T [. Montrer que f (R) est une sous-variété de X difféomorphisme à S 1 . (On appelle courbe fermée une telle sous-variété). b) Montrer que l’application (u, v) → (un , · · · , un−k v k , · · · , v n )

de R2 \ {0} dans Rn+1

définit une immersion de P 1 R dans P n R. Cette immersion est-elle un plongement ? 11. Un peu plus sur les submersions a) Soit f : X → Y une submersion d’une variété X dans une variété Y . Montrer que f (X) est ouvert dans Y . En déduire que si X est compacte et Y connexe, f est surjective. Cette propriété subsiste-t-elle si X n’est pas compacte ? b) Soit Z une sous-variété de Y . Montrer (toujours en supposant que f est une submersion) que f −1 (Z) est une sous-variété de X. c)* Exemple : si h : S 3 → S 2 est la fibration de Hopf, montrer que l’image réciproque d’une courbe fermée de S 2 est une sous-variété de S 3 qui est difféomorphe à S 1 ×S 1 . 12. Soit M une variété. Montrer que l’espace tangent à la diagonale de M × M est la diagonale de Tm M × Tm M .

90

Introduction aux variétés différentielles

13. Un plongement du plan projectif dans R4 : la surface de Veronese a) Montrer que l’application v de R3 dans R6 donnée par √ √ √ v(x, y, z) = (x2 , y 2 , z 2 , 2xy, 2yz, 2zx) définit une immersion de S 2 dans R6 . Indication : montrer d’abord que v est une immersion de R3 \ {0} dans R6 . b) L’application v est-elle injective ? Montrer qu’elle définit un homéomorphisme V de P 2 R sur v(S 2 ). c) Montrer que v(S 2 ) est une sous-variété de R6 et que V est un plongement de P 2 R dans R6 (on pourra utiliser le fait que l’application p : (x, y, z) 7→ [(x, y, z)] de S 2 dans P 2 R est un difféomorphisme local.) d) Montrer que v(S 2 ) = V (P 2 R) est inclus dans H ∩ S 5 , où H est un hyperplan (affine) de R6 et S 5 la sphère unité. * En déduire qu’il existe un plongement de P 2 R dans R5 et même dans R4 . ** Par contre, il n’existe pas de plongement de P 2 R dans R3 . En effet, toute hypersurface compacte de Rn est orientable (voir [Hirsch]), alors que P 2 R ne l’est pas (voir le chapitre 6 pour cette notion et ce résultat). Il existe par contre une foule d’immersions du plan projectif dans R3 . On trouvera dans [Apéry] des exemples explicites et des beaux dessins. ** 14. Une fibration utile On définit une application p de SO(n + 1) dans S n en posant p(g) = g · e0 , où e0 désigne le premier vecteur de la base canonique de Rn+1 . a) Montrer que p est lisse, et que l’image réciproque d’un point est une sous-variété de SO(n + 1) difféomorphe à SO(n). b*) Montrer que p est une fibration. 15. Une surjection du projectif sur la sphère de même dimension a) Montrer que le sous-ensemble des points de P n R dont une coordonnée homogène (la première par exemple) est nulle forme une sous-variété difféomorphe à P n−1 R. b) On considère l’application de Rn+1 \ {0} dans Rn+1 définie par   2txn −t2 + kxk2 2tx1 , · · · , , , (t, x1 , · · · , xn ) → 2 t + kxk2 t2 + kxk2 t2 + kxk2 où l’on a posé kxk2 =

n X i=1

x2i .

2 − Notions de base sur les variétés

91

Montrer que cette application définit par passage au quotient une application p de P n R dans S n , et que p est lisse. Quelle est l’image réciproque du pôle Nord N = (0, · · · , 0, 1) ? du pôle Sud (0, · · · , 0, −1) ? c) En utilisant la projection stéréographique de pôle N , montrer que p induit un difféomorphisme de P n R \ p−1 (N ) sur S n \ {N }. d) Que peut-on dire de p pour n = 1 ? e) Montrer que l’ensemble des points de P n R dont une coordonnée homogène (la première par exemple) est non nulle est connexe. En admettant le fait que le complémentaire dans S 2 d’une courbe fermée simple a deux composantes connexes, en déduire que P 2 R n’est pas homéomorphe à S 2 . f) On considère maintenant l’application de Cn+1 \ {0} dans Cn × R définie par   2ζzn kzk2 − |ζ|2 2ζz1 , · · · , , , (ζ, z1 , · · · , zn ) → |ζ|2 + kzk2 |ζ|2 + kzk2 |ζ|2 + kzk2 où l’on a posé kzk2 =

n X

|zi2 |.

i=1

En imitant ce qui précède, montrer qu’on peut définir ainsi une application lisse q de P n C dans S 2n , qui induit un difféomorphisme entre P n C\P n−1 C et S 2n \{N }. Que se passe-t-il pour n = 1 ? 16*. Compactification conforme de Rn ; groupe de Möbius. 2 a) L’espace Rn étant muni de la norme euclidienne habituelle, on définit une application p de Rn dans P n+1 R par la formule 1 1 p(x) = [( , x, kxk2 )]. 2 2 Montrer que p est un difféomorphisme de Rn sur la “quadrique” Qn de P n+1 R d’équation n X 4X0 Xn+1 − Xi2 = 0 i=1

privée du point [(1, 0, . . . , 0)]. b) Montrer que Qn est difféomorphe à S n . c) On appelle O(1, n+1) le sous-groupe de Gl(n+2, R) qui laisse la forme quadratique 4X0 Xn+1 −

n X

Xi2

i=1

(de signature (1, n + 1) !) invariante, et P O(1, n + 1) le sous-groupe correspondant de P Gl(n + 2, R) (voir l’exercice 5). Montrer que P O(1, n + 1) est le sous-groupe 2. Cet exercice s’adresse de préférence aux lecteurs ayant quelques notions de “géométrie élémentaire”, telles qu’elles ont exposées dans [Berger] par exemple.

92

Introduction aux variétés différentielles de P Gl(n + 2, R) qui laisse Qn globalement invariante. En utilisant le transport par p donné par a), montrer que les transformations suivantes se prolongent d’une façon unique en des transformations de P O(1, n + 1) que l’on explicitera : 1. les isométries linéaires 2. les homothéties 3. les translations

x kxk2 Inversement, soit r ∈ O(1, n + 1) une réflexion. (Rappelons qu’on entend par là que r2 = 1, r 6= I, et que r laisse un hyperplan invariant point par point). Montrer que la transformation projective associée à r est obtenue en prolongeant à une inversion. 4. l’inversion x →

17*. Eclatement Soit E le sous-ensemble de P 1 R × R2 donné par l’ équation xY − yX = 0 (On a désigné par (x, y) les coordonnées d’un point de R2 , et par (X, Y ) les coordonnées homogènes d’un point de P 1 R. Autrement dit, E est l’ensemble des couples (p, D) formés d’un point p ∈ R2 et d’une droite D passant par l’origine tels que p ∈ D). a) Montrer que E est sous-variété de dimension 2 de P 1 R × R2 (E s’appelle l’éclaté de R2 en 0 ; les questions c) et d) donnent le pourquoi de cette terminologie). b) Montrer que les restrictions à E des projections de P 1 R × R2 sur les espaces facteurs sont des applications lisses. c) Soit π la restriction à E de la deuxième projection. Montrer que π −1 (0) est difféomorphe à P 1 R. Montrer que π induit un difféomorphisme de E \ π −1 (0) sur R2 \ {0}. d) Notons r le difféomorphisme réciproque du difféomorphisme vu en c). Soit alors c une application lisse de I =] − , [ dans R2 telle que c(t) 6= 0 pour t 6= 0 , c(0) = 0 , c0 (0) 6= 0. Montrer que l’application r ◦ c : I \ {0} → E se prolonge d’une manière unique en une application continue c : I → E. Montrer que c est lisse (utiliser le lemme 3.12 dit lemme de Hadamard). Application : si par exemple F est le “folium de Descartes” d’équation x3 + y 3 − 3xy = 0 dans R2 (que l’on dessinera), il existe une unique sous-variété lisse F˜ de E telle que F˜ ∩ π −1 (0) soit formé de deux points et que la restriction de π à F˜ \ F˜ ∩ π −1 (0) soit un difféomorphisme sur son image. e) Montrer que E est difféomorphe à la variété des droites M vue dans la soussection 2.2.2.

2 − Notions de base sur les variétés

93

f) Si φ est un difféomorphisme d’un ouvert U de R2 contenant 0, tel que φ(0) = 0, montrer qu’il existe un unique difféomorphisme φˆ de π −1 (U ) tel que π ◦ φˆ = φ ◦ π. En déduire une définition de l’éclaté en un point d’une variété de dimension 2 quelconque. 18. Soit Γ un groupe agissant sur un ensemble X, et soit Γo le noyau du morphisme de groupes γ 7→ (x 7→ γ · x de Γ dans le groupe des bijection de X. Montrer que l’on a une action “naturelle” du groupe quotient Γ/Γo sur X, et que cette action est effective. Comparer à l’exercice 5. L’action de SO(n + 1) sur X = P n R obtenue par passage au quotient de l’action naturelle sur Rn+1 est-elle effective ? 19. Montrer que l’action de Z sur R2 définie par n.(x, y) = (2n x, 2−n y) n’est pas propre, et que l’action induite sur R2 \ {0} ne l’est pas non plus. Montrer que l’on obtient une action propre si on se restreint au demi-plan y > 0. 20. On fait opérer Γ = Z/nZ sur R2 ' C par rotations d’angle 2kπ/n par rapport à l’origine. Montrer que l’espace quotient est une variété (difféomorphe à R2 ), que l’application de passage au quotient est lisse mais n’est pas une submersion. 21. Encore le ruban de Möbius On prend Γ = Z, X = R × R, et on pose n.(x, y) = (x + n, (−1)n y). Montrer que c’est une action propre et libre, et que R2 /Γ est difféomorphe au quotient de S 1 × R par l’action du groupe à deux éléments engendré par la transformation (u, y) → (−u, −y). Soit M la variété ainsi obtenue. Montrer que M est difféomorphe à la variété des droites du plan vue en 2.2.2, ainsi qu’à P 2 R privé d’un point. Montrer que cette variété est aussi l’espace total d’un fibré vectoriel de dimension 1 sur le cercle. 22. Espaces lenticulaires a) Montrer que le seul sous-groupe (non réduit à l’élément neutre) de O(2n + 1) opérant librement sur S 2n (pour l’action induite par l’action linéaire sur R2n+1 est le groupe à deux éléments {Id, −Id}. b) On considère S 3 comme l’ensemble des {(z, z 0 ) ∈ C × C, |z|2 + |z 0 |2 = 1}.

94

Introduction aux variétés différentielles Soit p entier positif, et u une racine primitive p-ième de l’unité dans C. Montrer qu’en posant k.(z, z 0 ) = (uk z, uk z 0 ), on définit une action libre du groupe Γ = Z/pZ sur S 3 , et donc que S 3 /Γ est une variété.

23. Suspension d’un difféomorphisme a) Si X est une variété et φ un difféomorphisme de X, on définit une action propre et libre de Z sur R × X en posant  n · (t, x) = t + n, φn (x) . Montrer que cette action est propre et libre. b*) Montrer que la variété quotient est un espace fibré de base S 1 et de fibre type X. 24*. Revêtements et difféomorphismes locaux a) Soit f : X → Y un difféomorphisme local. Montrer que si X est compacte et Y connexe, f est un revetêment. b*) Donner un exemple d’un difféomorphisme local surjectif d’une variété connexe sur une variété compacte qui n’est pas un revêtement. 25. Essayer de reprendre la démonstration du théorème de d’Alembert pour les polynômes à coefficients réels. Qu’est-ce qui ne marche pas ? 26. Supposons les structures différentielles de M et N données par des atlas maximaux (Ui , ϕi )i∈I et (Vj , ψj )j∈J . L’atlas (Ui × Vj , ϕi × ψj )(i,j)∈I×J · sur M × N est-il maximal ? 27. Structures difféomorphes distinctes √ Montrer que l’atlas (R, 3 t) définit sur R une structure de variété différentielle difféomorphe à la structure canonique donnée par (R, t), mais différente de cette dernière. 28**. Somme connexe Soient M1 et M2 deux variétés lisses de dimension n, et (U1 , φ1 ) (resp. (U2 , φ2 )) une carte de M1 (resp. M2 ) telle que φi soit un difféomorphisme de Ui sur la boule ouverte B(0, 2) (Rn étant muni de la norme euclidienne canonique). Soit C la couronne {x ∈ Rn , 21 < kxk < 2}. a) Montrer que x 7→

x kxk2

est un difféomorphisme de C.

2 − Notions de base sur les variétés

95

b) On considère l’espace topologique X obtenu à partir de la somme disjointe a  M1 \ φ−1 B(0, 1/2) B(0, 1/2) M2 \ φ−1 1 2 −1 −1 en identifiant φ−1 1 (C) et φ2 (C) au moyen du difféomorphisme φ2 ◦ f ◦ φ1 (autrement dit, on quotiente cette somme disjointe par la relation d’équivence : x et y sont équivalents s’ils sont égaux, ou si l’un (disons x) est dans φ−1 1 (C), l’autre dans −1 φ−1 2 (C) et si y = (φ2 ◦ f ◦ φ1 )(x).

M1 ϕ2

ϕ1

o

f

o

M2

ϕ1–1

ϕ2

C

Figure 2.11 – Somme connexe

 Montrer que Mi \ φ−1 B(0, 1/2) est homéomorphe à son image par l’application i de passage au quotient. Soit Vi cette image, munie de la structure différentielle transportée par cet homéomorphisme (c’est à dire l’unique structure différentielle telle que cet homéomorphisme soit un difféomorphisme). Montrer qu’il existe sur X une structure différentielle (et une seule) telle que les inclusions Vi → X soient des difféomorphismes sur leur image dans X. L’espace X, muni de cette structure différentielle, est la somme connexe de M1 et M2 , et se note M1 ]M2 . c) Montrer que M ]S n est difféomorphe à M , et que T 2 ]T 2 est difféomorphe au “tore à deux trous” de l’exercice 20 du chapitre 1. d**) Montrer que R2 ]P 2 R est difféomorphe à l’éclaté de R2 en 0 (voir l’exercice 17). 29*. Théorème de transversalité faible Soient X, T et Y trois variétés, et f : X × T → Y une application lisse. On suppose f transverse à une sous-variété M de Y . Montrer que pour presque tout t ∈ T , l’application ft : X → Y est transverse à M (utiliser le théorème de Sard dans le cas ou la dimension de la source est supérieure à celle du but). 30. Soit M une variété topologique connexe de dimension 2 au moins. Montrer que le complémentaire de toute partie finie est connexe.

Chapitre 3 Du local au global

3.1. Introduction Ce chapitre est une série de variations sur les thèmes suivants : – sur une variété lisse, il y a “beaucoup” de fonctions lisses ; – il y a aussi “beaucoup” de difféomorphismes. Notons que la première propriété va de soi pour les sous-variétés de Rn , alors que la seconde n’est pas plus facile pour les sous-variétés que pour les variétés “abstraites” vues au chapitre précédent. L’existence sur Rn de fonctions continues (autres que la fonction nulle) à support compact est banale. Celle de fonctions lisses à support compact l’est un peu moins. Cette propriété, expliquée en détail dans la section 3.2, est fondamentale : si dans une variété U est un ouvert difféomorphe à Rn , on peut transporter à cet ouvert toute fonction lisse sur Rn à support compact. Cette fonction sera encore à support compact dans U , ce qui permet de la prolonger par zéro en dehors de U . Grâce à ce procédé, on trouve suffisamment de fonctions pour pouvoir plonger toute variété compacte dans un espace RN (théorème 3.7). Attention ! Sur une sous-variété de RN , on a gratuitement une foule de fonctions lisses, en restraignant à cette sous-variété les fonctions lisses sur RN , mais ici les choses se passent “à l’envers” : c’est l’existence de fonctions lisses sur une variété qui permet de la réaliser comme sous-variété. 1 Ce théorème de plongement fournit un moyen commode de montrer des théorèmes d’approximation (voir par exemple le théorème 7.20 ou le lemme 8.19). La suite du chapitre est consacrée aux champs de vecteurs. Ces derniers interviennent dans la modélisation d’une foule de phénomènes naturels : vitesse des points d’un solide ou d’un fluide en mouvement, champ de pesanteur, champ électrique, etc... Pour 1. Rien ne va plus pour les variétés complexes : sur une variété complexe compacte, les fonctions holomorphes sont constantes d’après le principe du maximum.

98

Introduction aux variétés différentielles

le mathématicien, un champ de vecteurs est aussi et surtout une “transformation infinitésimale” (on les appelait ainsi autrefois) et même un difféomorphisme infinitésimal. Sur un ouvert U ⊂ Rn , un champ de vecteurs peut se voir comme une application lisse de U dans Rn . Sur une variété, il faut se donner pour tout m ∈ M un vecteur vm de l’espace tangent en m, et pouvoir donner un sens à la propriété de lissité par rapport à m. Le prix à payer est l’introduction d’une structure de variété lisse sur le fibré tangent, défini comme la réunion disjointe des espaces tangents. Les choses sont facilitées par le va et vient entre ce point de vue géométrique et un point de vue algébrique : les champs de vecteurs sur une variété lisse M s’identifient aux dérivations de C ∞ (M ), c’est-à-dire aux applications linéaires de C ∞ (M ) dans lui-même qui satisfont à la propriété de Leibnitz (voir la définition 3.14). Ce point de vue permet de définir une notion fondamentale, le crochet [X, Y ], qui rend compte de la non-commutation des difféomorphismes infinitésimaux X et Y . Cette non-commutation s’exprime dans la proposition 3.37 et le théorème 3.38. On associe naturellement à tout champ de vecteurs une équation différentielle, celle de ses trajectoires. Le terme de flot pour l’expression φt (x), qui désigne la valeur au temps t de la solution qui vaut x pour t = 0, évoque l’exemple du champ des vecteurs vitesse cité plus haut. Le cadre des variétés est alors très commode : contrairement à ce qui peut arriver sur un ouvert de Rn , les solutions de cette équation sur une variété compacte sont prolongeables à R tout entier, et dans ce cas le flot définit un groupe à un paramètre de difféomorphismes (théorème 3.39). Une conséquence importante est le fait que, si f est une fonction lisse sur une variété compacte, les sous-niveaux f ≤ a et f ≤ b ont la même topologie dès qu’aucun niveau intermédiaire ne contient de points critiques (théorème 3.40). Enfin, nous revenons au théorème de plongement pour en déduire que toute variété (dénombrable à l’infini) de dimension 1 est difféomorphe au cercle ou à la droite. La surprise, s’agissant d’un résultat aussi naturel, est la relative difficulté de la preuve.

3.2. Fonctions plateau ; plongements de variétés Comme nous l’avions expliqué dans l’introduction, il nous faut commencer par prouver l’existence de fonctions lisses à support compact, sur Rn d’abord, puis sur toute variété. Définition 3.1. Une fonction plateau sur une variété M est une fonction lisse à valeurs dans [0, 1] pour laquelle il existe deux ouverts U et V d’adhérences compactes, avec U ⊂ V , tels que supp f ⊂ V

et

f (x) = 1

pour

x ∈ U.

Rappelons que le support d’une fonction continue est l’adhérence de l’ensemble des points où elle est non nulle.

3 − Du local au global

99 y

0

x

Figure 3.1 – Une fonction plateau

Proposition 3.2. Si U et V sont deux boules ouvertes de Rn de même centre, avec U ⊂ V , il existe une fonction lisse égale à 1 sur U et à support inclus dans V . Démonstration. On commence par remarquer que la fonction fa d’une variable réelle définie par fa (t) = exp

1 t2 − a2

si |t| < a et fa (t) = 0 si

|t| ≥ a

est lisse. Il en est de même de Rt ga (t) = R −∞ +∞ −∞

fa (u)du fa (u)du

qui est nulle pour t ≤ −a et égale à 1 pour t ≥ a. Alors si b > a, la fonction ga (b − t) vaut 1 sur [0, b − a] et 0 si t > a + b. Sur Rn , il suffit alors de prendre une fonction de la forme ga (b − kxk2 ). Donnons tout de suite un exemple spectaculaire de l’utilisation des fonctions plateau : la démonstration d’un théorème dû à Émile Borel, qui assure que l’on peut prescrire arbitrairement la suite des dérivées en un point donné d’une fonction lisse. Ce résultat n’étant pas utilisé dans la suite, nous nous contenterons d’un résumé de la preuve. Théorème 3.3. Soit (an )n≥0 une suite de nombres réels. Alors il existe une fonction lisse f ∈ C ∞ (R) telle que f (n) (0) = an

quel que soit n.

Démonstration. Soit ρ une fonction plateau sur R telle que ρ(x) = 1 ρ(x) = 0 On pose f (x) =

∞ X

an

n=0

si si

xn ρ(bn x), n!

|x| < 12 |x| > 1.

où bn = |an | + n.

On vérifie que f est lisse, et que ∀n , f (n) (0) = an .

100

Introduction aux variétés différentielles

Pour obtenir l’existence de fonctions lisses sur une variété quelconque, nous utiliserons de façon répétée la propriété suivante, élémentaire mais fondamentale : Proposition 3.4. Soient U et V deux ouverts d’une variété M , tels que M = U ∪ V , et soient f : U → N et g : V → N deux applications lisses dans une variété N , dont les restrictions à U ∩ V sont égales. Il existe alors une fonction lisse h : M → N telle que h|U = f et h|V = g. En particulier, si U est un ouvert de M , et si N = R, toute fonction lisse à support dans U se prolonge à M en une fonction lisse nulle en dehors de U : il suffit d’appliquer ce qui précède à U et M \ supp f . Corollaire 3.5. a) Soit U un ouvert d’une variété M . Alors pour tout a ∈ U , il existe un ouvert relativement compact V contenant a tel que V ⊂ U , et une fonction plateau égale à 1 sur V et à support dans U. b) Si K est un compact de M , et U ⊃ K un ouvert, il existe une fonction plateau à support dans U et valant 1 sur K. Démonstration. a) Soit (U 0 , ϕ) une carte de domaine inclus dans U telle que ϕ(a) = 0. On peut alors trouver deux réels strictement positifs r1 et r2 (avec r1 < r2 ) tels que B(0, r1 ) ⊂ B(0, r2 ) ⊂ ϕ(U 0 ), et g une fonction plateau sur Rn valant 1 sur B(0, r1 ) et 0 hors de B(0, r2 ). La fonction g◦ ϕ n’esta priori définie que sur U . Mais comme son support est inclus dans ϕ−1 B(0, r2 ) , elle se prolonge donc d’après ce qui précède en une fonction   lisse sur M nulle hors de U . Par construction, elle vaut 1 sur ϕ−1 B(0, r1 ) . b) Tout point x ∈ K est contenu dans un ouvert de carte Vx ⊂ U auquel on peut appliquer i). On obtient pour chaque x un ouvert Wx contenant x tel que Wx ⊂ Vx , et une fonction plateau fx valant 1 sur Wx , et à support contenu dans Vx . Les ouverts Wx forment un recouvrement de K, dont on extrait un sous-recouvrement fini (Wxi )1≤i≤k . Alors la fonction g =1−

k Y

(1 − fxi )

i=1

vaut 1 sur la réunion des (Wxi ), et supp g ⊂

k [ i=1

Vxi .

3 − Du local au global

101

Pour utiliser pleinement ce résultat, nous aurons besoin de la propriété suivante, purement topologique. Lemme 3.6. Soit (Ui )i∈I un recouvrement ouvert fini d’une variété compacte M. Il existe alors un recouvrement ouvert (Vi )i∈I tel que Vi ⊂ Ui pour tout i. Démonstration. Tout x ∈ M est contenu dans un ouvert Ui(x) du recouvrement. Il existe aussi un ouvert Wx contenant x tel que Wx ⊂ Ui(x) (cette propriété, évidente pour Rn , est vraie pour les variétés topologiques d’après leur définition). Alors les (Wx )x∈M forment un recouvrement ouvert de M, dont on extrait un sous-recouvrement fini (Wxk )1≤k≤p . Le résultat s’ensuit, en prenant Vi = (∪Wxk )i(xk )=i . Ces outils somme toute assez frustes nous permettent de montrer que toute variété est en fait une sous-variété d’un espace RN convenable. L’importance conceptuelle de ce résultat se passe de commentaire. Théorème 3.7. Toute variété compacte admet un plongement dans un espace Rm . Démonstration. Soit (Ui , ϕi )1≤i≤N un atlas fini de M. D’après le corollaire 3.5 et le lemme 3.6 il existe un recouvrement ouvert (Vi )1≤i≤N tel que Vi ⊂ Ui pour tout i, et pour chaque i une fonction plateau fi à support dans Ui et valant 1 sur Vi . D’après la proposition 3.4, la fonction fi ϕi , prolongée par 0 hors de Ui , donne une application lisse de M dans Rn , où n = dim M . En posant F = (f1 ϕ1 , · · · , fN ϕN , f1 , · · · , fN ) , on obtient une application lisse de M dans RN (n+1) . C’est une immersion. En effet, chaque x appartient à un ouvert Vi , et le i-ième bloc de Tx F est alors égal à Tx ϕi , qui est bijective, ce qui montre que Tx F est injective. Montrons maintenant que F est injective. Soient x et y deux points de M tels que F (x) = F (y). En particulier, ∀i , fi (x) = fi (y). Les Vi recouvrant M , il existe un i tel que fi (x) 6= 0. Alors x et y sont dans Ui , et pour cet i, l’égalité fi (x)ϕi (x) = fi (y)ϕi (y) donne ϕi (x) = ϕi (y), puis x = y puisque ϕi est bijective. On conclut en appliquant la proposition 2.28 : une immersion injective d’une variété compacte est un plongement.

En utilisant des techniques complètement différentes, on peut améliorer ce résultat.

102

Introduction aux variétés différentielles

Corollaire 3.8 (théorème de Whitney “facile”). Toute variété compacte lisse de dimension n se plonge dans R2n+1 . Démonstration. On part du plongement f de X dans un Rm . On va voir qu’en composant f avec une projection bien choisie, on obtient un plongement dans Rm−1 . Pour ce faire, on munit Rm d’un produit scalaire euclidien, et on introduit, pour tout vecteur unitaire v ∈ S m−1 , la projection pv sur l’orthogonal de v dans Rm . Posons Y = f (X). Pour que la restriction de pv à Y soit injective, il faut et suffit que, quels que soient x et y distincts dans Y , le vecteur − → xy → k− xyk soit différent de v, ou encore que v n’appartienne pas à l’image de l’application − → xy (x, y) 7→ − → kxyk

de Y × Y \ ∆ dans S m−1 ,

où l’on a désigné par ∆ la diagonale de Y . D’après le théorème de Sard (théorème 2.49), il existe de tels v dès que 2n < m − 1. Pour que pv |Y soit une immersion, il faut et suffit – voir la figure 3.2 – que v n’appartienne à aucun sous-espace tangent à Y (remarquons que c’est la version infinitésimale de la condition précédente). Introduisons Z = {(x, v) ∈ X × S N −1 , v ∈ Tf (x) Y }. On vérifie que Z est une sous-variété de dimension 2n − 1 de X × S N −1 (voir l’exercice 15 du chapitre 1. En particulier pr2 (Z) est de mesure nulle dès que 2n < m. y

v x

x

Figure 3.2 – Une projection peut faire apparaître des singularités

En itérant ce procédé, on voit que X admet une immersion dans R2n et un plongement dans R2n+1 .

3 − Du local au global

103

Remarques a) La même propriété reste vraie pour les variétés dénombrables à l’infini, et la preuve est essentiellement la même (voir [Hirsch]). b) Avec beaucoup plus de travail et des techniques complètement différentes, H. Whitney a démontré que toute variété compacte lisse de dimension n se plonge dans R2n (voir [Adachi]). Ce résultat est optimal, mais on peut faire mieux dans certains cas : par exemple P 2 R n’est pas plongeable dans R3 , mais toute surface orientable 2 l’est, comme on le voit en utilisant la classification des surfaces (voir la section 7.10).

3.3. Dérivations 3.3.1. Dérivations ponctuelles Nous allons maintenant revenir sur l’espace tangent d’un point de vue différent, en exploitant le fait, déjà utilisé dans la proposition 3.4, que la lissité est une propriété locale. Définition 3.9. Soit X un espace topologique et x ∈ X. Deux fonctions définies chacune sur un ouvert contenant x sont dites avoir même germe en x s’il existe un sous-ouvert contenant x sur lequel elles sont égales. Autrement dit, on introduit sur l’ensemble des fonctions définies sur un ouvert contenant x la relation d’équivalence (f : U → R) ∼ (g : V → R) si et seulement si il existe un ouvert W contenant x, W ⊂ U ∩ V tel que f|W = g|W . L’ensemble des germes est l’ensemble quotient de cette relation d’équivalence. La continuité en x par exemple ne dépend que du germe. Si f est une fonction définie sur un ouvert U contenant x, nous noterons f˙ son germe. Mais nous ferons souvent l’abus de noter un germe par l’un de ses représentants. L’ensemble des germes est muni naturellement d’une structure d’anneau : on définit l’addition et la multiplication par l’intermédiaire des réprésentants. Nous nous intéresserons au cas des variétés, et désignerons par Fm M l’ensemble des germes en m des fonctions lisses sur la variété M . C’est évidemment un sous-anneau de l’anneau des germes. Remarques a) Cette notion de germe présente aussi un intérêt pour les fonctions continues, C p , ou analytiques. Par exemple, l’anneau des germes en 0 des fonctions holomorphes d’une variable complexe s’identifie à l’anneau des séries entières à rayon de convergence non nul. Pour les fonctions lisses, la situation est bien sûr plus compliquée :

104

Introduction aux variétés différentielles

si m ∈ Rn , le développement de Taylor en m d’une fonction lisse au voisinage de m ne dépend que du germe de f, mais la connaissance de ce développement ne détermine pas le germe. Témoin la fonction fa de la proposition 3.2, dont toutes les dérivées en a sont nulles. b) Pour toute variété M et tout point m ∈ M , l’espace Fm M est isomorphe à F0 Rn . Prenons en effet une carte (U, ϕ) avec m ∈ M et ϕ(m) = 0, et associons à toute fonction f definie sur un ouvert V contenant m la fonction f ◦ ϕ−1 definie sur ϕ(U ∩ V ). L’application f → f ◦ ϕ−1 passe au quotient et donne un isomorphisme (parmi bien d’autres !) entre Fm M et F0 Rn . Soit v un vecteur de Rn . Si f est une fonction lisse sur un ouvert contenant 0, la dérivée directionnelle de f par rapport à v, c’est à dire le nombre T0 f · v =

n X

∂j f (0)v j

j=1

ne dépend bien sûr que du germe de f en 0. Nous allons utiliser les propriétés algébriques de l’application f˙ 7→ T0 f · v pour donner une définition de l’espace tangent à une variété qui n’utilise ni cartes, ni même coordonnées sur Rn . Définition 3.10. Une dérivation ponctuelle en un point m de M est une application linéaire δ : Fm M → R telle que pour f˙, g˙ ∈ Fm M on ait δ(f˙.g) ˙ = f (m)δ(g) ˙ + g(m)δ(f˙). Le nom de dérivation est justifié par l’analogie avec la formule donnant la dérivée d’un produit, mais aussi par le résultat suivant : Théorème 3.11. Il existe une bijection naturelle entre Rn et les dérivations de Fm Rn . Plus précisément, pour une telle dérivation δ, il existe un unique vecteur v ∈ Rn tel que n X δ(f ) = Tm f · v = ∂j f (m)v j . j=1

Nous utiliserons le lemme suivant, qui est un outil technique fondamental. Lemme 3.12 (lemme de Hadamard). Toute fonction C p (1 ≤ p ≤ +∞) définie sur une boule ouverte de centre 0 dans Rn peut se mettre sous la forme f (x) = f (0) +

n X

xj hj (x),

j=1

où les hj sont C p−1 . De plus, hj (0) = ∂i f (0). Démonstration. On a Z f (x) − f (0) = 0

1

n

X d f (tx)dt = xj dt j=1

Z

1

∂j f (tx)dt , 0

3 − Du local au global

105

et l’existence des hj résulte alors du théorème de dérivation sous le signe somme. Un calcul direct montre que nécessairement hj (0) = ∂j f (0). (Notons que les hj ne sont pas uniques, même si cette démonstration donne un choix explicite possible). Preuve du théorème. Soient f˙ ∈ Fm Rn , et f un representant de f˙. On a δ(f ) = δ(f − f (m)), puisque d’après la definition δ(1.1) = δ(1) + δ(1) et donc

δ(constante) = 0.

D’après le lemme, δ(f ) =

n X

δ(xj − mj )hj (m) et hj (m) = ∂j f (m).

j=1

Il est clair que l’application f → ∂j f (m) ne depend que de f˙, et qu’elle est elle-même une dérivation.

2

Ce résultat s’étend directement aux variétés, et permet de donner une nouvelle définition de l’espace tangent, qui ne fait pas appel aux cartes. Théorème 3.13. Si M est une variété lisse et m ∈ M , l’ensemble des dérivations sur Fm M est isomorphe à Tm M : pour toute dérivation δ, il existe un unique ξ ∈ Tm M tel que δ(f ) = dfm .ξ. Démonstration. Soit (U, ϕ) une carte telle que m ∈ U et ϕ(m) = 0. Si δ est une dérivation de Fm M , l’application g → δ(g ◦ ϕ) est une dérivation de F0 Rn . Soit donc v le vecteur tel que δ(g ◦ ϕ) = d0 g.v. Alors, si f = g ◦ ϕ, on a δf = dfm · ξ , où ξ = θϕ−1 (v) (voir la définition 2.23).

3.3.2. Un autre point de vue sur l’espace tangent Nous allons voir une autre définition de l’espace tangent, qui fait la synthése entre le point de vue de l’espace des vecteurs vitesse (définition 2.21) et celui des dérivations. 2 Il y a un prix à payer : un peu plus de formalisme algébrique. Cette sous-section peut être omise en première lecture, et ne sera pas utilisée dans la suite. M Pour une variété M et un point m ∈ M , on considère l’ensemble Cm des courbes c :] − 1, 1[7→ M telles que c(0) = m, et on introduit l’espace vectoriel TmM des combiM naisons linéaires réelles (finies) d’éléments de Cm , autrement dit le R-espace vectoriel M dont une base est formée des éléments de Cm .

2. Ce point de vue très éclairant m’a été communiqué par Marc Troyanov.

106

Introduction aux variétés différentielles

M M Pour un germe f˙ ∈ Fm et c ∈ Cm , on pose

 d B(f˙, c) = f c(t) |t=0 . dt Dans le membre de droite, f désigne en fait une fonction définie sur un ouvert contenant m et représentant f˙, il est clair, comme dans les situations analogues étudiées dans la section 3.3, que le résultat ne dépend pas du représentant de f˙ choisi. M On prolonge B à Fm × TmM par linéarité, c’est-à-dire en posant

B(f˙,

k X

λi ci ) =

i=1

k X

λi B(f˙, ci ).

i=1

M × TmM . On introduit aussi les Par construction B est une forme bilinéaire sur Fm noyaux de B, qui sont par définition M 0 (Fm )

(TmM )0

M = {f˙ ∈ Fm , ∀u ∈ TmM , B(f˙, u) = 0} = {u ∈ T M , ∀f˙ ∈ F M , B(f˙, u) = 0}. m

m

Dans ces conditions, B passe au quotient, et donne une forme bilinéaire M M 0 b : Fm /(Fm ) × TmM /(TmM )0 → R

non dégénérée. Toutes ces données sont “naturelles”, c’est-à-dire équivariantes par rapport aux difféomorphismes. Si φ est un difféomorphisme d’un ouvert U contenant M sur un ouvert U 0 d’une variété M 0 , alors f 7→ f ◦ φ−1 définit un isomorphisme d’espaces vectoriels M M0 , et c 7→ φ ◦ c définit, en prolongeant par linéarité, un isomorphisme de Fm sur Fφ(m) 0

M Nous noterons T0 (φ) et T(φ) ces isomorphismes. Il est immédiat que de TmM sur Tφ(m)

B(T0 (φ) · f, T(φ) · u) = B(f, u) T(ψ ◦ φ) = T(ψ) ◦ T(φ) T0 (ψ ◦ φ) = T0 (ψ) ◦ T0 (φ).

(3.1)

Il résulte de ces remarques que TmM /(TmM )0 s’identife “naturellement” avec Tm M , c’està-dire qu’il existe un isomorphisme IsM,m tel que, avec les notations précédentes, Tm φ ◦ IsM,m = IsM 0 ,φ(m) ◦ T(φ). En effet, deux courbes c1 et c2 sont tangentes en m au sens de la définition 2.21 si et seulement si c1 et c2 sont équivalentes modulo (Tm M )0 : si c1 − c2 ∈ (TmM )0 , en testant l’égalité B(f˙, c1 ) = B(f˙, c2 ) pour des germes de fonctions coordonnées d’une carte locale φ, on voit que (φ ◦ c1 )0 (0) = (φ ◦ c2 )0 (0). Inversement, si cette égalité est vraie pour une carte φ, c’est-à-dire si les courbes φ ◦ c1 et φ ◦ c2 de Rn ont même Rn 0 vitesse, alors φ ◦ c1 − φ ◦ c2 ∈ (T0 ) et d’après les équations (3.1), c1 − c2 ∈ (TmM )0 .

3 − Du local au global

107

M En résumé, on a une application de Cm dans Tm M qui se prolonge par linéarité à M Tm , passe au quotient en donnant une injection de TmM /(TmM )0 . Cette application est aussi surjective : toujours d’après les équations (3.1), il suffit de le vérifier pour Rn , ce qui est élémentaire : on prend les courbes t 7→ tv.

De plus, d’après la définition même de B, l’application f˙ 7→ B(f, c) est une dérivation ponctuelle, qui ne dépend que de la classe d’équivalence de c. Pour voir que toute dérivation ponctuelle est de cette forme, il suffit, toujours d’après les équations (3.1), de le faire pour Rn et d’appliquer le théorème 3.11. Ce point de vue donne en prime une réalisation naturelle de l’espace vectoriel cotanM M 0 gent, puisque grâce à la forme bilinéaire b l’espace Fm /(Fm ) apparaît comme le dual de Tm M . En reprenant les formules (3.1) pour une application φ pas nécessairement inversible, on voit aussi que T(φ) donne par passage au quotient une application linéaire de M M /(Tφ(m) )0 qui s’identifie à Tm φ. TmM /(TmM )0 dans Tφ(m)

3.3.3. Dérivations globales Nous allons maintenant “globaliser” la situation précédente. Définition 3.14. Une dérivation (on dira parfois dérivation globale si on veut insister sur la différence avec ce qui précède) sur une variété lisse M est une application linéaire δ de C ∞ (M ) dans lui-même telle que pour

f, g ∈ C ∞ (M ),

δ(f.g) = f.δ(g) + g.δ(f ).

Cette définition a l’air purement algébrique, mais elle permet de “localiser” les dérivations : Théorème 3.15. Soit δ une dérivation sur une variété M . Alors a) Si f et g sont deux fonctions lisses dont les restrictions à un ouvert U ⊂ M sont égales, (δf )|U = (δg)|U b) Pour tout ouvert U ⊂ M , il existe une unique dérivation sur U , notée δ|U , telle que  δ|U f|U = (δf )|U pour f ∈ C ∞ (M ). Démonstration. a) En raison de la linéarité, il suffit de montrer que si f s’annule sur U , il en est de même de δf. Pour chaque x ∈ U , prenons un ouvert V contenant x tel que V ⊂ U et une fonction plateau h à support dans U , égale à 1 sur V . Alors f = (1 − h)f et par suite δf = (1 − h)δf + f δ(1 − h). Donc δf est nulle sur tous les ouverts V , c’est à dire sur U.

108

Introduction aux variétés différentielles

b) Il y a une (petite !) difficulté qui vient de ce qu’une fonction lisse sur U ne se prolonge pas en général à M . Pour tout x de U , on prend un ouvert V et une fonction h comme dans i). Alors, si f ∈ C ∞ (U ), d’après la proposition 3.4 la fonction  f h est définie et lisse sur tout M , et pour y ∈ V on pose (δ|U f )(y) = δ(f h) (y). D’après i), la fonction δ|U f est ainsi définie sans ambiguïté, et on obtient bien une dérivation ayant les propriétés voulues. Venons-en à la caractérisation des dérivations sur les ouverts U ⊂ Rn . Il est clair que pour i ∈ [1, n], l’application f 7→ ∂i f est une dérivation, et que plus généralement, si X1 , · · · , Xn sont des fonctions lisses, f → LX f =

n X

Xi ∂i f

i=1

est une dérivation. Mieux : Théorème 3.16. L’espace vectoriel des dérivations sur un ouvert U de Rn est isomorphe à C ∞ (U, Rn ). Démonstration. A X dans C ∞ (U, Rn ) on associe la dérivation LX donnée par la formule ci-dessus. L’application X 7→ LX est injective : si X ne s’annule pas en a ∈ U , il existe une fonction lisse f telle que (LX f ) (a) = Ta f · X(a) 6= 0. Montrons maintenant la surjectivité dans le cas de Rn . Si δ est un dérivation, remarquons d’abord que comme dans le cas des dérivations ponctuelles, δ s’annule pour les fonctions constantes. Pour y ∈ Rn , écrivons la décomposition f (x) − f (y) =

n X (xi − y i )hi,y (x) i=1

du lemme de Hadamard. Alors n n  X X  (δf )(y) = δ f − f (y) (y) = δ(xi − y i )(y)hi,y (y) = δ(xi )(y)∂i f (y). i=1

i=1

Le même argument s’applique tel que à un ouvert convexe : c’est la convexité qui permet d’appliquer le lemme de Hadamard à la fonction x 7→ f (x) − f (y). On passe au cas général en appliquant le théorème 3.15 aux boules ouvertes de U . Ce résultat, confronté au résultat analogue sur les dérivations ponctuelles, nous conduit à l’adoption d’une nouvelle terminologie. Définition 3.17. Un champ de vecteurs sur un ouvert U de Rn est une application lisse de U dans Rn . L’application LX de C ∞ (U, R) dans lui-même introduite ci-dessus est la dérivation associée à X. Nous venons de voir que si δ est une dérivation sur U ⊂ Rn , l’application X : U → Rn qui lui est associée par le théorème 3.16 s’interprète comme attachant à x ∈ U un vecteur Xx ∈ Tx U ' Rn , et cela de façon lisse, ce qui justifie le nom de champ de

3 − Du local au global

109

vecteurs. Nous allons voir que les dérivations sur une variété quelconque admettent une caractérisation analogue à celle du théorème 3.16. Cela nécessite quelques développements sur les dérivations et les champs de vecteurs sur les ouverts de Rn , qui s’étendront facilement aux variétés.

3.4. Image d’un champ de vecteurs ; crochet Si X ∈ C ∞ (U, Rn ) est un champ de vecteurs sur un ouvert U de Rn , nous noterons désormais Xx sa valeur en un point x. Ainsi, la dérivation associée est donnée par (LX f ) (x) = Tx f · Xx . La dérivation associée au champ constant égal au i-ième vecteur de la base canonique de Rn étant tout simplement f 7→ ∂i f, nous désignerons par ∂i ce champ de vecteurs. Ainsi, X pourra s’écrire n X

X i ∂i ,

où les

Xi

sont des fonctions lisses.

i=1

Si ϕ : U → V est un difféomorphisme, la composition g 7→ g ◦ ϕ est un isomorphisme d’anneaux entre C ∞ (V ) et C ∞ (U ). La conjugaison par cet isomorphisme permet de passer d’une dérivation sur U à une dérivation sur V . Définitions 3.18. Soient ϕ : U → V un difféomorphisme entre ouverts de Rn , et δ une dérivation sur U. L’image de δ par ϕ est la dérivation  g → δ(g ◦ ϕ) ◦ ϕ−1 sur V . Si X est le champ de vecteurs associé à δ, nous noterons ϕ∗ X le champ associé à l’image de δ, et dirons aussi que ce champ est l’image de X par ϕ. Ainsi,  Lϕ∗ X f = LX (f ◦ ϕ) ◦ ϕ−1 . Proposition 3.19. On a (ϕ∗ X)y = Tϕ−1 (y) ϕ · Xϕ−1 (y) . Démonstration. D’après le théorème des fonctions composées,  δ(g ◦ ϕ) (x) = Tx (g ◦ ϕ) · Xx = Tϕ(x) g (Tx ϕ · Xx ) , d’où le résultat en remplaçant x par ϕ−1 (y).

110

Introduction aux variétés différentielles

Exemples a) L’image par une translation du champ ∂i est le champ lui-même. b) L’image par l’homothétie hλ : x 7→ λx du champ n X

X i ∂i

i=1

est le champ n X

λ(X i ◦ hλ )∂i .

i=1

c) L’image par l’exponentielle du champ

d d sur R est le champ x sur R∗+ . dx dx

Remarque. On vérifiera facilement que pour une application lisse ϕ : U 7→ V on peut définir l’image d’une dérivation ponctuelle δm par δϕ(m) · g = δm · (g ◦ ϕ) , et que si δm est donnée par un vecteur tangent v ∈ Tm U, alors δϕ(m) est donnée par Tm ϕ · v. Par contre, pour définir l’image d’une dérivation globale, on est obligé de “remonter” de V à U , donc de supposer que ϕ est inversible, et même que ϕ−1 est lisse. On vérifiera par exemple que si ϕ est l’application t 7→ t3 de R dans R, il n’existe pas de champ de vecteur X sur R tel que Xϕ(t) = Tt ϕ · (d/dt)t . Si δ1 et δ2 sont deux dérivations, leur composée ne sera pas une dérivation, puisque δ1 (δ2 (f g)) = δ1 (δ2 f )g + (δ1 f )(δ2 g) + (δ1 g)(δ2 f ) + δ1 (δ2 g)f. Mais cette formule permet aussi de voir que δ1 ◦ δ2 − δ2 ◦ δ1 (ce que les algébristes appellent le commutateur de δ1 et δ2 ) est une dérivation. Définition 3.20. Le crochet de deux champs de vecteurs X et Y , noté [X, Y ], est le champ de vecteurs correspondant à la dérivation LX LY − LY LX . Proposition 3.21. Si X et Y sont donnés sur un ouvert U de Rn par X=

n X

X i ∂i

et

Y =

i=1

alors [X, Y ] =

n X

i

Z ∂i ,

n X

Y i ∂i

i=1



i

Z =

i=1

n X

 X j ∂j Y i − Y j ∂j X i .

j=1

Démonstration. Si f est une fonction lisse, ! n n X X  2 i LX LY f = LX Y ∂i f = X j ∂j Y i ∂i f + X j Y i ∂ij f . i=1

i,j=1

En intervertissant les rôles de X et Y et en appliquant le théorème de Schwarz, on obtient le résultat cherché.

3 − Du local au global

111

Remarques a) Il est souvent commode, pour éviter les erreurs de calcul, d’utiliser la définition du crochet plutôt que la formule ci-dessus. On voit ainsi beaucoup plus vite, par exemple, que [f X, gY ] = f (LX g)Y − g(LY f )X + f g[X, Y ]. b) Le crochet a un caractère local : si V est un sous-ouvert de U , et si X et Y sont deux champs de vecteurs sur U , [X|V , Y|V ] = [X, Y ]|V . Cette propriété peut se voir en utilisant la formule explicite, mais il est plus instructif de remarquer qu’elle résulte du théorème 3.15. Exemple. Soit A le champ de vecteurs x 7→ Ax sur Rn , où A est une matrice (n, n). (Un tel champ est dit linéaire). En coordonnées,   n n X X  Ax = aij xj  ∂i . i=1

j=1

Alors [A, B]x = (BA − AB) · x. (Attention au signe !) Lemme 3.22 (identité de Jacobi). Si X, Y, Z sont trois champs de vecteurs, alors [X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0.

Démonstration. Sur les dérivations correspondantes, la vérification algébrique est immédiate. Le point de vue des dérivation permet aussi de ramener la preuve du résultat suivant à une vérification fastidieuse, mais facile. Proposition 3.23. Si X et Y sont deux champs de vecteurs sur U et si ϕ est un difféomorphisme de U sur V , alors ϕ∗ [X, Y ] = [ϕ∗ X, ϕ∗ Y ].

3.5. Le fibré tangent 3.5.1. La variété des vecteurs tangents Sur une variété, comme nous l’avons vu, la notion de dérivation garde un sens. Dans ces conditions, on aimerait bien avoir un résultat analogue au théorème 3.11 pour les dérivations ponctuelles : une dérivation sur une variété M devrait pouvoir nous permettre d’associer à chaque point m de M un vecteur tangent Xm de Tm M, cette

112

Introduction aux variétés différentielles

correspondance étant lisse en un sens à préciser. Pour ce faire nous allons montrer que l’ensemble des vecteurs tangents est lui-même une variété d’une façon naturelle. Posons tout d’abord a TM = Tm M. m∈M

Pour le moment, T M est la somme ensembliste (c’est-à-dire la réunion disjointe) des différents espaces vectoriels tangents à M , sans aucune topologie. Pour chaque carte (U, ϕ), l’application Φ : (x, ξ) → (ϕ(x), Tx ϕ · ξ) est une bijection de T U sur ϕ(U ) × Rn . Un atlas (Ui , ϕi )i∈I de M étant donné, on munit T M d’une topologie en imposant les conditions suivantes : 1. les T Ui sont des ouverts de T M ; 2. les applications Φi sont des homéomorphismes. Ainsi Ω ⊂ T M est ouvert si et seulement si Φi (Ω ∩ T Ui ) est pour tout i un ouvert de ϕ(Ui ) × Rn . Pour voir que ces conditions sont cohérentes, on remarque que d’après la définition même de l’espace tangent, si Ui ∩ Uj 6= ∅, l’application n n Φi ◦ Φ−1 j : ϕj (Ui ∩ Uj ) × R → ϕi (Ui ∩ Uj ) × R

donnée par −1 (y, v) → (ϕi ◦ ϕ−1 j )(y), Ty (ϕi ◦ ϕj ) · v



est un homéomorphisme et même un difféomorphisme. On a donc défini une topologie sur T M qui en fait une variété topologique munie de l’atlas (T Ui , Φi )i∈I . Cet atlas étant lisse, T M est une variété lisse de dimension 2 dim M . À ce stade, il est bon de remarquer que si M est une variété C p (avec p > 0), alors T M est une variété C p−1 . Cette variété s’appelle le fibré tangent à M . Justifions ce nom. Proposition 3.24. La projection canonique p de T M sur M est une fibration. Démonstration. Il suffit d’introduire l’application ψi : p−1 (Ui ) = T Ui → Ui × Rn

donnée par

ψi (ξx ) = (x, Tx ϕ· ξx ).

On peut dire mieux : la restriction de ψi à la fibre Tx M est un isomorphisme d’espaces vectoriels de Tx M sur Rn . Si maintenant M1 et M2 sont deux variétés et f : M1 → M2 une application lisse, en considérant tous les (Tx f )x∈M1 simultanément, on trouve une application que nous noterons T f de T M1 dans T M2 , qui est lisse (et C p−1 si f est C p ) et dont la restriction à chaque fibre Tx M1 est l’application linéaire Tx f . Cela se traduit par le diagramme commutatif Tf

T M1 −−−−→ T M2     p1 y p2 y f

M1 −−−−→ M2 De plus, si M3 est une troisième variété et g : M2 → M3 une application lisse, d’après la version “variétés” du théorème des fonctions composées (voir la proposition 2.25), T (g ◦ f ) = T g ◦ T f .

3 − Du local au global

113

3.5.2. Fibrés vectoriels Cette situation est le prototype d’une situation plus générale qui mérite d’être dégagée. Définition 3.25. Un fibré vectoriel réel (resp. complexe) de rang k sur une variété B est un espace fibré (E, p, B) tel que a) la fibre type F et les fibres p−1 (b), b ∈ B sont des espaces vectoriels réels (resp. complexes) de dimension k ; b) pour toute trivialisation locale ϕ, la restriction de ϕ à p−1 (b) (qui envoie p−1 (b) dans {b} × F ) induit un isomorphisme d’espaces vectoriels sur F . La fibre p−1 (b) est notée Eb . Exemples a) Le fibré produit M × Rk , dit fibré trivial de rang k sur M . b) Le fibré tangent à une variété de dimension n est un fibré vectoriel réel de rang n. c) Si M est une sous-variété plongée dans un espace euclidien E, le fibré normal à M , noté N (M ) est l’ensemble des couples (x, v) de M × E tels que v soit orthogonal à Tx M ; la projection sur M est la restriction à M × E de pr1 . Ce fibré a pour rang la codimension de M dans E. Voir l’exercice 20. Les définitions suivantes sont à mettre en parallèle avec celles que nous avons vues dans la section 2.5 pour les fibrés. Définitions 3.26. a) Un morphisme entre deux fibrés vectoriels (E1 , p1 , B1 ) et (E2 , p2 , B2 ) (n’ayant pas nécessairement le même rang) est une application lisse f : E1 → E2 qui envoie fibre sur fibre (ce qui veut dire qu’il existe une application g : B1 → B2 rendant le diagramme f E1 −−−−→ E2     p1 y p2 y g

B1 −−−−→ B2 commutatif ), et dont la restriction à chaque fibre (E1 )b est une application linéaire de (E1 )b dans (E2 )g(b) . b) Si f est un difféomorphisme (auquel cas les applications fibre sur fibre seront des isomorphismes d’espaces vectoriels) on dit que f est un isomorphisme de fibrés vectoriels. c) Un fibré est trivialisable s’il est isomorphe à un fibré trivial. Une variété dont le fibré tangent est trivialisable est dite parallélisable. Exemple. Le cercle S 1 est parallélisable, comme le montre la figure 3.3.

114

Introduction aux variétés différentielles

Figure 3.3 – Fibré tangent à S 1

Pour d’autres exemples, voir l’exercice 12, le chapitre 4, et la discussion qui suit la proposition 3.28. Cette situation est assez exceptionnelle. La notion suivante est une notion clé pour mieux comprendre le fibré tangent, et plus généralement les fibrés vectoriels. Définitions 3.27. a) Une section d’un fibré vectoriel E de base B est une application lisse s de B dans E telle que p ◦ s = IdB (ce qui revient à dire que s(x) ∈ Ex pour tout x de B). b) Un champ de vecteurs sur une variété est une section du fibré tangent. On notera C ∞ (E) l’ensemble des sections (lisses) de E, et donc C ∞ (T M ) l’ensemble des champs de vecteurs sur M . Il existe sur C ∞ (E) une structure naturelle d’espace vectoriel, obtenue en posant (s + t)(x) = s(x) + t(x) (addition dans la fibre Ex ). La section nulle définit un plongement de B dans E.  Les sections d’un fibré trivial B × Rk sont de la forme x 7→ x, f (x) , et s’identifient donc aux fonctions définies sur B à valeurs dans Rk . En particulier, si U est un ouvert de Rn , C ∞ (T U ) s’identifie à C ∞ (U, Rn ). Comme dans le cas des ouverts de Rn , nous noterons désormais Xx au lieu de X(x) la valeur en x d’un champ X. Si (Ui , ϕi )i∈I est un atlas de M , on voit en utilisant l’atlas correspondant de T M qu’un champ de vecteurs peut être donné par une famille d’applications Xi ∈ C ∞ (Ui , Rn ) telle que  ∀x ∈ Ui ∩ Uj , Xi (x) = Tϕj (x) ϕi ◦ ϕ−1 · Xj (x). j On peut aussi se donner les fonctions X i = Xi ◦ ϕ−1 i . Pour chaque i, on a ainsi un champ de vecteurs sur ϕi (Ui ), et la condition ci-dessus équivaut à  ϕj ◦ ϕ−1 Xi = Xj sur ϕj (Ui ∩ Uj ). i ∗ Cela veut dire simplement que sur Ui , ϕi∗ X = X i .

3 − Du local au global

115

Proposition 3.28. Pour qu’un fibré vectoriel E de rang k sur une variété B soit trivialisable, il faut et suffit qu’il existe k sections dont les valeurs en tout point x ∈ B forment une base de Ex . Démonstration. Si (ei )1≤i≤k est la base canonique de Rk et si ϕ est une trivialisation de E, on introduit les k sections x → ϕ−1 (x, ei ). Inversement, soient (sα )1≤α≤k k sections partout linéairement indépendantes. Décomposons ex ∈ E suivant la base sα (x), autrement dit posons ξx =

n X

λα (ξx )Xxα .

α=1

Nous laissons au lecteur le soin de vérifier, en utilisant la propriété de trivialité locale, que les fonctions λα sont lisses sur E. On en déduit une trivialisation ϕ en posant ϕ(x) = (p(x), λ1 (x), · · · , λn (x)) . Nous venons de voir que ϕ est lisse ; il en est de même de son inverse, donnée explicitement par k X ϕ−1 (x, v1 , · · · , vk ) = vα sα (x). α=1

Exemples a) Pour qu’un fibré vectoriel de rang 1 soit trivialisable, il faut et suffit qu’il admette une section partout non nulle. Un exemple important de fibré de rang 1 non trivialisable est le ruban de Möbius infini, vu comme fibré sur S 1 (voir l’exercice 21). b) Nous verrons plus loin (voir les théorèmes 6.17 et 7.23) que pour tout champ de vecteurs sur S 2n , il existe un point x tel que Xx = 0x (un tel point s’appelle un zéro du champ de vecteurs considéré). A fortiori, les sphères de dimension paire ne sont pas parallélisables. Par contre, d’après la question c) de l’exercice 4 du chapitre 2 la sphère de dimension 3 est parallélisable : elle est difféomorphe à SU (2), ainsi qu’au groupe multiplicatif des quaternions de norme 1, et nous verrons au prochain chapitre que tout groupe de Lie est parallélisable. c) ** Pour des raisons algébriques analogues, mais plus subtiles, S 7 est parallélisable (voir [Steenrood] par exemple). Inversement, les seules sphères parallèlisables sont S 1 , S 3 et S 7 . C’est un résultat profond dû à A. Dold (voir [Bott–Milnor]).**

3.5.3. Champs de vecteurs sur les variétés ; hessien Comme dans le cas des ouverts de Rn , on associe à tout champ de vecteurs X l’application f 7→ LX f de C ∞ (M ) dans lui même définie par (LX f )(x) = Tx f · Xx et on a la même caractérisation des dérivations.

116

Introduction aux variétés différentielles

Théorème 3.29. L’application L : X 7→ LX est une bijection de C ∞ (T M ) sur l’ensemble des dérivations de M. Démonstration. Notons d’abord que L est injective. Soit en effet a ∈ M tel que Xa 6= 0. Alors, si (U, ϕ) est une carte dont le domaine contient a, il existe une fonction f ∈ C ∞ (U ) telle que LX f (a) 6= 0 : le vecteur Ta ϕ · Xa a au moins une coordonnée non nulle, disons la k-ième, et on prend pour f la k-ième composante de la carte ϕ. Si V est un ouvert contenant a tel que V ⊂ U , il existe d’après le corollaire 3.5 une fonction lisse f égale à 1 sur V et à support contenu dans U. Alors f g ∈ C ∞ (Rn ) et LX (f g)(a) = LX (f )(a). Montrons maintenant que L est surjective. Soit (Ui , ϕi )i∈I un atlas de M , et soit δ une dérivation. D’après le théorème 3.15, pour tout ouvert U ⊂ M, δ induit une dérivation de C ∞ (U ). Alors l’application  h 7→ ϕi ◦ δ(h ◦ ϕ−1 i ) est une dérivation de C ∞ (ϕi (Ui )) . On sait déjà dans ce cas d’après le théorème 3.16 qu’il existe un champ de vecteurs Y i sur ϕi (Ui ) tel que  ϕi ◦ δ(h ◦ ϕ−1 i ) = LY i h. i Alors, si X i = ϕ−1 i ∗ Y , bien évidemment δUi = LX i . Donc si Ui ∩ Uj 6= ∅, les dérivations LX i et LX j induisent la même dérivation sur Ui ∩Uj , et d’après la première partie les champs X i et X j ont même restriction à Ui ∩ Uj .

IL RÉSULTE IMMEDIATEMENT DE CE THÉORÈME QUE LES DÉFINITIONS ET LES PROPRIÉTÉS DE L’IMAGE DIRECTE ET DU CROCHET DES CHAMPS DE VECTEURS SUR LES OUVERTS DE Rn S’ÉTENDENT AUX VARIÉTÉS Cela peut se voir aussi d’une façon plus pédestre, mais instructive, en utilisant les conditions de compatibilité données ci-dessus. Remarque. Le point de vue des dérivations permet aussi de justifier un abus de notation très commode : si (U, ϕ) est une carte locale de M , on notera encore ∂i le champ sur U qui est l’image par ϕ−1 du champ de vecteurs ∂i sur ϕ(U ). Une telle écriture sous-entend bien entendu le choix d’une carte. Un champ de vecteurs sur U s’écrit alors d’une manière unique sous la forme n X

X i ∂i

avec

X i ∈ C ∞ (U ).

i=1

Terminons ce paragraphe par une application importante aux points critiques. Théorème 3.30. Soit f : M → R une fonction C 2 sur une variété M , a un point où dfa = 0, et u, v deux vecteurs tangents en a. Soient X et Y deux champs de vecteurs définis sur un ouvert contenant a, tels que Xa = u, Ya = v. Alors X · df (Y )(a) = Y · df (X)(a)

(∗)

Le nombre ainsi obtenu ne dépend, f étant donnée, que de u et v.

3 − Du local au global

117

Démonstration. D’après la définition même du crochet, X · df (Y ) − Y · df (X) = [X, Y ] · f = df ([X, Y ]), d’où la première assertion de l’énoncé. La deuxième s’ensuit : le premier membre de (∗) montre qu’en tant que fonction de X, la quantité considérée ne dépend que de Xa , et le second qu’en tant que fonction de Y , elle ne dépend que de Ya . Ainsi, on a associe à toute fonction ayant un point critique en a une forme bilinéaire symétrique sur Ta M . Définitions 3.31. a) La forme bilinéaire symétrique ainsi obtenue est le hessien de f en a. b) Un point critique sera dit non dégénéré si cette forme bilinéaire est non dégénérée. Bien entendu pour deux champs de vecteurs définis par des coordonnées locales, avec les notations de la remarque ci-dessus, on aura  2 Hessfa (∂i , ∂j ) = ∂ij f φ(a) (3.2) Plutôt que la forme bilinéaire symétrique, on considère souvent la forme quadratique associée, que l’on appelle aussi hessien avec un léger abus. On voit avec (3.2) que si le hessien est défini positif (resp. défini négatif) en a, le point critique correspond à un minimum local (resp. un maximum local). Attention. Sur Rn , les analystes utilisent couramment la matrice hessienne ∂ 2 ij f et la forme blinéaire associée. On a alors Hess(f ◦ φ)(a)(u, v) = Hess(f )(Ta φ · u, Ta φ · v) + Tφ(a) f · Hessφ(u, v). Cette formule permet de donner une définiton équivalente du hessien en un point critique pour les fonctions C 2 sur une variété, en utilisant directement la définition de l’espace tangent.

3.6. Le flot d’un champ de vecteurs Il est temps d’aborder un aspect plus géométrique des champs de vecteurs : pour un champ de vecteurs x 7→ Vx du plan, le simple tracé des vecteurs Vx vus comme vecteurs d’origine x (mais cela n’est-il pas lié au fibré tangent ?) permet de voir une famille de courbes auxquelles ces vecteurs sont tangents. Définition 3.32. On appelle trajectoire ou courbe intégrale d’un champ de vecteurs X sur une variété M toute courbe t 7→ c(t), définie sur un intervalle ouvert I ⊂ R et à valeurs dans M, de classe C 1 , et telle que ∀t ∈ I, c0 (t) = Xc(t) .

118

Introduction aux variétés différentielles

Figure 3.4 – Trajectoires du champ (x, −y) dans le plan

Pn Pour un ouvert U de Rn , si X = i=1 X i ∂i , cela revient à dire que les composantes de c sont solutions du système différentiel du premier ordre dci = X i (c1 , · · · , cn ) dt

(1 ≤ i ≤ n).

Les fonctions X i étant lisses, on peut appliquer le résultat classique d’existence et d’unicité pour les systèmes différentiels vu dans la section 1.9. Théorème 3.33. Soit X un champ de vecteurs sur un ouvert U de Rn et x un point de U. Alors il existe un intervalle ouvert I contenant 0 et une trajectoire c : I → U de X telle que c(0) = x ; si c1 : I1 → U est une autre trajectoire ayant la même propriété, c et c1 coïncident sur I ∩ I1 . En utilisant la terminologie de la section 3.3, cela signifie que le germe de c est unique. On démontre ensuite qu’il existe un unique intervalle de définition maximal de c. Nous noterons cx la trajectoire correspondante. On peut alors préciser l’énoncé précédent (“dépendance des conditions initiales”) :

3 − Du local au global

119

si Ix est l’intervalle de définition (maximal) de cx , la réunion des Ix × {x}, quand x parcourt U , est un ouvert Ω de R × U , contenant {0} × U , pour lequel l’application (x, t) → cx (t) est lisse. Exemples (pour mémoire). Si U = R et Xx = x, on a cx (t) = xet , et Ω = R × R. Mais si X(x) = x2 , alors cx (t) =

x 1 − tx

et

Ω = {(x, t) ∈ R2 , xt < 1}.

Ainsi les trajectoires ne sont pas forcément définies sur tout R.

x1

1/x1

Figure 3.5 – Explosion en temps fini

Revenons au cas général. Le système différentiel donné dans la définition 3.32 est un système autonome (c’est-à-dire que la variable t n’intervient pas dans le membre de droite). Par conséquent, si t 7→ c(t) est une trajectoire, il en est de même de t 7→ c(t+a) pour n’importe quel réel a. Tenant compte de l’unicité, on obtient l’identité cx (t + a) = ccx (a) (t).

120

Introduction aux variétés différentielles

Nous allons réécrire cette relation (valable sous la seule condition que les deux membres aient un sens) en mettant l’accent sur la variable “espace” plutôt que la variable “temps”. Autrement dit, on pose ϕX t (x) = cx (t). En particulier ϕX 0 (x) = x, et l’identité ci-dessus donne  X ϕX ϕX t+t0 (x) = ϕt t0 (x) . C’est un abus d’écriture pour l’assertion suivante : si le membre de droite est défini  (c’est-à-dire si (t0 , x) et t, ϕX t0 (x) sont dans Ω) le membre de gauche l’est aussi, et ils sont égaux. On écrit alors, avec un abus évident X X X X ϕX t+t0 = ϕt ◦ ϕt0 = ϕt0 ◦ ϕt .

Définition 3.34. L’application ϕX : Ω → U s’appelle le flot du champ de vecteurs X.

Les ϕX t sont des difféomorphismes sur leur image (mais attention : leur domaine de définition peut être différent de U si t 6= 0. Voir l’exemple qui suit le théorème 3.33. En raison de l’identité ci-dessus, on appelle aussi ϕX le groupe local à un paramètre de difféomorphismes associé au champ X. Ce n’est pas toujours un groupe ! Le mot local est là pour rappeler les restrictions éventuelles sur les domaines de définition de ϕX et des ϕX t . Nous omettrons X dans cette notation dès qu’il n’y aura pas d’ambigüité. Avant de poursuivre, donnons ou rappelons quelques exemples typiques sur Rn . 1. Si X =

n X

ai ∂i (champ constant), ϕt (x) = x + ta.

i=1

2. Si X =

n X

xi ∂i (champ radial ), ϕt (x) = et x.

i=1

3. Si A est le champ linéaire associé à l’endomorphisme A, défini par Ax = Ax, on a ϕt (x) = (exp tA).x. Notons que la discussion qui précède fournit en prime une démonstration du fait que exp(t + t0 )A = (exp tA)(exp t0 A). La propriété suivante, très utile en pratique, permet le passage inverse du flot au champ. Lemme 3.35. Soit h une application lisse définie sur un ouvert de I × U contenant {0} × U et à valeurs dans U telle que a) h(t, h(t0 , x)) = h(t + t0 , x) dès que les deux membres ont un sens. b) h(0, x) = x. c)

d h(t, x)|t=0 = Xx . dt

3 − Du local au global

121

Alors h(t, x) = ϕX t (x) partout où h est définie. Démonstration. Il suffit de remarquer que d d d h(t, x)|t=t0 = h(t + t0 , x)|t=0 = h(t, h(t0 , x))|t=0 = Xh(t0 ,x) . dt dt dt Définitions 3.36. Une application h satisfaisant aux conditions du lemme 3.35 est un groupe local à un paramètre, et le champ de vecteurs Xx =

d h(t, x)|t=0 dt

est le générateur infinitésimal de h. Etudions maintenant le flot de l’image d’un champ de vecteurs. Proposition 3.37. Soient X un champ de vecteurs sur un ouvert U ⊂ Rn et ψ : U 7→ V un difféomorphisme. Si ϕt est le flot de X, celui du champ image ψ∗ X est ψ ◦ ϕt ◦ ψ −1 . Démonstration. D’après le lemme 3.35 appliqué à h(t, x) = ψ ◦ ϕt ◦ ψ −1 (x), il suffit de remarquer que  d ψ ◦ ϕt ◦ ψ −1 (x)|t=0 = Tψ−1 (x) ψ · Xψ−1 (x) = ψ∗ Xx . dt Exemple. Reprenons le champ linéaire A associé à A ∈ End(Rn ), et considérons le difféomorphisme donné par une matrice inversible P. Alors P∗ Ax = P AP −1 · x , et on retrouve le fait que exp P AP −1 = P (exp A)P −1 . Si de plus la matrice P est elle-même de la forme exp tB, alors (exp tB)(exp A)(exp −tB)

=

(1 + tB + O(t2 ))A(1 − tB + O(t2 ))

= A + t(BA − AB) + O(t2 ) et par suite d (exp tB)(exp A)(exp −tB) · x = (BA − AB) · x. dt Mais cela s’écrit aussi   d exp tB∗ A x t=0 = [A, B]x . dt Cette dernière propriété est vraie dans un contexte bien plus général.

122

Introduction aux variétés différentielles

Théorème 3.38. Soient X et Y deux champs de vecteurs sur un ouvert U de Rn , et soit ϕYt le flot de Y . Alors   d (ϕYt∗ X)|t=0 = [X, Y ]. dt Démonstration. Nous utiliserons la propriété suivante, qui est une version à paramètres du lemme de Hadamard. Soit f : [−, ] × U → R une application lisse telle que f (0, x) = 0. Alors f peut s’écrire f (t, x) = tg(t, x) où g est lisse et ∂f (0, x) = g(0, x). ∂t Nous allons raisonner sur les dérivations, et regarder l’effet de ϕt∗ X sur une fonction  f. Soit donc f (t, x) = f ϕt (x) − f (x), et posons gt = g(t, .) avec g0 = LY f . Alors  (Lϕt∗ X )f = LX (f ◦ ϕt ) ◦ ϕ−t (d’après le théorème 3.16)  = LX (f + tgt ) ◦ ϕ−t =

(LX f ) ◦ ϕ−t + t(LX gt ) ◦ ϕ−t .

La dérivée par rapport à t du premier terme pour t = 0 est −LY (LX f, ) celle du second LX g0 = LX LY f. Remarque. Soient X, Y et Z trois champs de vecteurs, et ϕt le flot de Z. En dérivant par rapport à t l’identité Z Z ϕZ t∗ [X, Y ] = [ϕt∗ X, ϕt∗ Y ] on obtient [[X, Y ], Z] = [[X, Z], Y ] + [X, [Z, Y ]], retrouvant ainsi l’identité de Jacobi. TOUT CE QUE NOUS AVONS VU DANS CE PARAGRAPHE S’APPLIQUE AUX VARIÉTÉS Le seul endroit où nous utilisons un résultat spécifique (en apparence) aux ouverts de Rn est 3.33 : ce théorème fait appel à la théorie classique des équations différentielles. Mais si X est un champ de vecteurs sur une variété M munie d’un atlas (Ui , ϕi )i∈I , et si θi,t est le flot du champ ϕi∗ X sur ϕi (Ui ), alors ϕ−1 i ◦ θi,t ◦ ϕi est un groupe à un paramètre de difféomorphismes de Ui , et par construction son générateur infinitésimal est X. On en déduit que −1 ϕ−1 i ◦ θi,t ◦ ϕi = ϕj ◦ θj,t ◦ ϕj

3 − Du local au global

123

sur Ui ∩ Uj , puisqu’un groupe à un paramètre est déterminé par son générateur infinitésimal. De plus, pour l’étude des flots de champs de vecteurs, les variétés compactes sont un cadre plus naturel et plus agréable que les ouverts de Rn , en raison de la propriété suivante : Théorème 3.39. Si X est un champ de vecteurs sur une variété M compacte, alors le flot de X est défini sur R×M. En particulier, ϕt est pour tout t un difféomorphisme de M . Démonstration. A priori, le domaine de définition du flot ϕ est un ouvert Ω ⊂ R×M , contenant {0} × M , et le domaine de définition de la trajectoire cx est l’intervalle Ix = Ω ∩ R × {x}. Posons Ix =]α, β[, et supposons par exemple que β < +∞. Si (tn ) est une suite de réels qui tend en croissant vers β, en raison de la compacité de M , la suite cx (tn ) admet une valeur d’adhérence y. Il existe alors un  > 0 et un ouvert U contenant M tels que ], [×U ⊂ Ω. Soit alors tn tel que |tn − β| <  et cx (tn ) ∈ U . La trajectoire s 7→ d(s) satisfaisant à la condition initiale d(0) = cx (tn ) est définie sur l’intervalle ], [, et d’après le théorème 3.33, d(s) = cx (tn + s) si tn + s ∈ Ix . En posant  cx (t) si t ∈ Ix c˜x (t) = d(t − tn ) si tn ≤ t < tn +  on obtient une trajectoire qui prolonge cx strictement au delà de l’extrémité β de Ix , contrairement à l’hypothèse de maximalité de Ix . La relation X X X X ϕX t+t0 = ϕt ◦ ϕt0 = ϕt0 ◦ ϕt

est maintenant vérifiée quels que soient t, t0 et x. En particulier, ϕt est un difféomorphisme d’inverse ϕ−t . Remarques a) Ce résultat est encore vrai pour les champs de vecteurs à support compact sur une variété non compacte : il suffit de remarquer que les trajectoires non constantes d’un champ de vecteurs sont contenues dans son support. b) On en déduit qu’une variété lisse, compacte ou non, admet “beaucoup” de difféomorphismes. Il suffit de voir, en utilisant une carte et une fonction plateau à support dans l’ouvert de carte, qu’une variété admet toujours des champs de vecteurs non triviaux à support compact. On peut en déduire (voir l’exercice 15) que le groupe des difféomorphismes est k-transitif pour tout k. Le résultat suivant montre combien il est utile de pouvoir construire ainsi des difféomorphismes. Théorème 3.40. Soit f une fonction lisse à valeurs réelles sur une variété compacte M . Pour tout réel a, on pose M a = {x ∈ M, f (x) ≤ a} . Si a < b et si f −1 ([a, b]) ne contient aucun point critique, il existe un difféomorphisme de M envoyant M a sur M b .

124

Introduction aux variétés différentielles

Démonstration. Supposons M plongée dans un espace euclidien RN , ce qui est possible d’après le théorème 3.7. Alors on va envoyer M a sur M b en “tirant” le long des trajectoires orthogonales aux sous-variétés f = cte (voir la figure 3.6).

f =b

a bf bb f =a

Figure 3.6 – D’un niveau à l’autre

Plus précisément, on définit à partir de f un champ de vecteurs ∇f en imposant la relation h∇m f, ui = dfm (u), ∀m ∈ M, u ∈ Tm M, où l’on a désigné par h, i le produit scalaire euclidien de RN . L’ensemble des points critiques de f est fermé, donc f −1 ([a, b]) est contenu dans un ouvert U sans points critiques. Soit alors g une fonction plateau, égale à 1 sur f −1 ([a, b]) et à support contenu dans U . On définit un champ de vecteurs sur M en posant Xm =

g(m) ∇fm . h∇fm , ∇fm i

Si ϕt est son flot, on a  d f ϕt (m) = dfϕt (m) · Xϕt (m) = g(m) ≥ 0, dt et

 d f ϕt (m) = 1 si m ∈ f −1 ([a, b]). dt

Il en résulte que ϕb−a (M a ) = M b et ϕa−b (M b ) = M a . Remarques a) ** Le plongement de M dans un RN n’a rien d’essentiel. Nous avons pris le gradient de f par rapport à la métrique riemannienne h, i|M , mais toute autre métrique riemannienne aurait aussi bien fait l’affaire.**

3 − Du local au global

125

b) Si l’on dispose de la notion de variété à bord, on peut dire que M a et M b sont difféomorphes. c) Le même résultat subsiste si M n’est pas compacte, pourvu que f −1 ([a, b]) le soit. Cette dernière hypothèse est par contre essentielle, comme on s’en rend compte en enlevant un point.

3.7. Champs de vecteurs dépendant du temps Chercher les trajectoires d’un champ de vecteurs sur un ouvert de Rn , ou même sur une variété, revient comme nous l’avons vu à résoudre un système différentiel autonome. Par ailleurs, un système différentiel non autonome sur un ouvert de Rn , c’est-à-dire de la forme  dci = X i (t, c1 (t), · · · , cn (t) (1 ≤ i ≤ n) dt se ramène au système autonome sur R × U donné par dτ =1 dt i  dc = X i (τ (t), c1 (t), · · · , cn (t) (1 ≤ i ≤ n) dt Ce procédé s’étend sans difficulté aux variétés. Définition 3.41. Si M est une variété et I ⊂ R un intervalle, on appelle champ de vecteurs sur M  dépendant du temps une application lisse X de I × M dans T M telle que p X(t, x) = x (on a désigné par p la projection de T M sur M ). ˜ sur I × M défini par On s’empresse bien sûr d’associer à X le champ de vecteurs X  ˜ (t,x) = 1, X(t, x) . X On adapte la définition 3.32, et on appelle trajectoire de X toute courbe c : J → M , où J ⊂ I, telle que c0 (t) = Xc(t) (t). Les trajectoires de X sont alors les projections ˜ sur I × M . Le théorème d’existence et d’unicité locales sur M des trajectoires de X des trajectoires s’étend alors immédiatement : ce n’est pas plus difficile que de passer des systèmes différentiels autonomes aux systèmes non autonomes. Du point de vue des flots, notons que si c est la trajectoire telle que  c0 (s) = X s, c(s) et c(t) = x, on a

 ˜ ϕX s (t, x) = t + s, c(t + s) .

Si la variété M est compacte, on a une version affaiblie (il n’y a plus de groupe à un paramètre de difféomorphismes) mais très utile du théorème 3.39. Théorème 3.42. Soit X un champ de vecteurs dépendant du temps sur une variété compacte M . On suppose X défini sur I =]α, β[×M (on convient que −∞ ≤ α < β ≤ +∞). Alors :

126

Introduction aux variétés différentielles

a) les trajectoires de X sont définies pour tout t ∈ I ; b) si s 7→ Fs (t, x) est la position à l’instant t + s de la trajectoire qui passe par x à l’instant t, alors x 7→ Fs (t, x) est pour tout s ∈]α − t, β − t[ un difféomorphisme de M . c) Inversement, soit s 7→ Gs un chemin de difféomorphismes de M (autrement dit, (s, x) 7→ Gs (x) est une application lisse de J × M dans M et x 7→ Gs (x) est un difféomorphisme pour tout s ∈ J). On suppose que 0 ∈ J et que G0 = IdM . Alors Y (t, x) =

 d Gs G−1 t (x) ds s=t

est un champ de vecteurs sur M dépendant du temps, dont s 7→ Gs (x) est la trajectoire qui passe par x à l’instant 0. Démonstration. a) Il suffit de reprendre l’argument du théorème 3.39, qui n’utilisait nulle part le fait que l’équation différentielle considérée était alors autonome. b) Soit alors ϕs le flot de (1, X) sur I × M . On a  ϕs (t, x) = s + t, Fs (t, x) . En lisant sur la composante en M la propriété de groupe à un paramètre, on obtient  Fs1 +s2 (t, x) = Fs1 t + s2 , Fs2 (t, x) . On voit en particulier que pour t ∈]α, β[ et s ∈]α − t, β − t[ fixés, x 7→ Fs (t, x) est un difféomorphisme ayant pour inverse x 7→ F−s (s + t, x). c) Réciproquement, soient s 7→ Gs un chemin lisse de difféomorphismes, et Y (t, x) =

 d Gs G−1 t (x) ds |s=t

le champ dépendant du temps associé. Alors  d Y t, Gt (x) = Gs (x)|s=t , ds ce qui montre que la courbe t 7→ Gt (x) est une trajectoire du champ Y . C’est donc d’après l’hypothèse la trajectoire qui passe par x à l’instant 0. Ainsi, de même qu’un champ de vecteurs engendre un groupe à un paramètre de difféomorphismes, un champ de vecteurs dépendant du temps engendre une famille à un paramètre de difféomorphismes. Cela justifie la définition suivante : Définition 3.43. Le champ de vecteurs dépendant du temps défini dans 3.42 s’appelle le générateur infinitésimal de la famille de difféomorphismes s 7→ Gs .

3 − Du local au global

127

La construction de familles de difféomorphismes à partir de leur générateur infinitésimal est un outil très efficace, appelé méthode du chemin. A titre d’exemple, nous allons en tirer une démonstration du résultat suivant (prouvé aussi dans l’exercice 11 du chapitre 1. Pour d’autres applications de la méthode du chemin, voir l’exercice 17 du chapitre 5 et l’exercice 19 du chapitre 7. Théorème 3.44 (lemme de Morse). Soit f : U → R une application lisse définie sur un ouvert de Rn , et soit a ∈ U un point critique non dégénéré (voir la définition 3.31). Alors il existe des ouverts V et W contenant a et contenus dans U , et un difféomorphisme ϕ de W sur V tel que ϕ(a) = a et X  2 f ϕ(x) − f (a) = ∂ij f (a)xi xj . i,j

Démonstration. On peut toujours supposer que a = 0 et f (a) = 0. Une double application du lemme de Hadamard permet de mettre f sous la forme X

f (x) =

hij (x)xi xj ,

1≤i,j≤n 2 avec hij = hji et hij (0) = ∂ij f (0), les fonctions hij étant lisses. Dans une boule de centre 0 contenue dans U on pose, pour t ∈ [0, 1],

X

ft (x) =

hij (tx)(xi − ai )(xj − aj ).

1≤i,j≤n

Ainsi, f1 = f , alors que f0 est le modèle local cherché. Nous allons montrer qu’il existe un chemin de difféomorphismes t 7→ ϕt , tel que ft ◦ ϕt = f0

et ϕ0 = Id.

Soit ft0 (x) la dérivée partielle par rapport à t de la fonction (t, x) 7→ ft (x). En dérivant par rapport à t la relation précédente, on voit que le générateur infinitésimal X de ϕt vérifie  ft0 ϕt (x) + (dft )ϕt (x) · Xϕt (x) (t) = 0. Il faut donc trouver un champ dépendant du temps tel que ft0 (y) + (dft )y · Xy (t) = ft0 (y) +

X

∂k ft (y)X k (t, y) = 0.

k

La difficulté vient de ce que (dft )0 = 0. Mais sachant que ft0 (y) =

X

∂k hij (ty)y k y i y j ,

k,i,j

et ∂k ft (y) =

X i,j

thij (ty)y i y j + 2

X i

hki (ty)y i ,

128

Introduction aux variétés différentielles

on est assuré de trouvé un tel champ si ses coordonnées X k sont solutions du système linéaire  X X X ∂k hij (ty)y k y j = 0. (1 ≤ i ≤ n) 2hki (ty) + t ∂k hij (ty)y j X k (t, y) + k

j

k,j

Comme 0 est un point critique non dégénéré, le déterminant de la matrice  hki (0) 1≤k,i≤n est non nul. Il en sera donc de même du déterminant du système linéaire que nous venons d’écrire si y est assez proche de 0, disons si kyk < r. Pour être assuré que le champ dépendant du temps ainsi obtenu est le générateur infinitésimal d’un chemin de difféomorphismes défini jusqu’au temps 1, on emploie un procédé maintes fois éprouvé dans ce chapitre : on le multiplie par une fonction plateau à support dans B(0, r) et valant 1 sur B(0, r/2). Remarque. En particulier, la forme réduite obtenue montre que les points critiques non dégénérés sont isolés.

3.8. Variétés de dimension un Nous allons utiliser le théorème de plongement vu dans ce chapitre pour montrer le résultat suivant : Théorème 3.45. Une variété connexe et dénombrable à l’infini de dimension 1 est difféomorphe à S 1 si elle est compacte, à R si elle n’est pas compacte. La démonstration de ce résultat tout à fait “intuitif” est assez délicate. D’après le théorème 3.7, une telle variété C admet un plongement dans un espace Rn (on pourrait même dire dans R3 en utilisant le théorème 3.8, mais cela ne servirait strictement à rien). On part d’un tel plongement. Donnons quelques préliminaires sur les paramétrisations des courbes. Définition 3.46. Soit ϕ :]a, b[→ C une paramétrisation d’une sous-variété de dimension 1 d’un espace euclidien. On dit que ϕ est une paramétrisation par longueur d’arc si pour tout t de ]a, b[ le vecteur vitesse ϕ0 (t) est de norme 1. De telles paramétrisations existent toujours, et on a unicité, à changement de sens et d’origine près. Plus précisément : Lemme 3.47. Soit ψ : J → C une paramétrisation de C. Il existe alors une paramétrisation par longueur d’arc de même image ψ(J). De plus, si ϕ1 : I1 → C et ϕ2 : I2 → C sont deux telles paramétrisations, il existe un c tel que ϕ2 (t) = ϕ1 (c + t) ou ϕ2 (t) = ϕ1 (c − t). Démonstration. On choisit un to ∈ J et on pose Z t kψ 0 (u)kdu. S(t) = to

3 − Du local au global

129

La fonction S est lisse et sa dérivée est partout non nulle. Si I = S(J), la fonction ψ ◦ S −1 : I → C donne une paramétrisation par longueur d’arc. Soient maintenant ϕ1 et ϕ2 deux paramétrisations d’image ψ(J), définies sur des intervalles ouverts I1 et I2 . La fonction ϕ−1 1 ◦ ϕ2 est un difféomorphisme de I2 sur I1 . De plus, en dérivant la relation ϕ2 = ϕ1 ◦ (ϕ−1 1 ◦ ϕ2 ), −1 0 0 on voit que |ϕ−1 1 ◦ ϕ2 ) (t)| = 1, donc que la dérivée (ϕ1 ◦ ϕ2 ) (t)| est une constante égale à 1 ou −1.

Démonstration du théorème. Soit ϕ :]a, b[7→ C une paramétrisation par longueur d’arc. On peut la supposer maximale (éventuellement a = −∞ ou b = −∞). Nous allons voir que ϕ est surjective en montrant que son image ϕ(]a, b[) est ouverte et fermée dans C. D’abord ϕ(]a, b[) est ouverte car ϕ :]a, b[→ C est un difféomorphisme local. Soit maintenant x ∈ ϕ(]a, b[) \ ϕ(]a, b[). On a x = limn7→+∞ ϕ(tn ), où (tn ) est une suite de points de ]a, b[. Après extraction d’une sous-suite, on peut supposer que (tn ) converge. La limite est soit un point de ]a, b[, soit a, soit b. Le premier cas est exclus, puisque nous avons supposé que x n’appartient pas à l’image de ϕ. Supposons par exemple que la limite est b, et soit ψ :] − , [→ C une paramétrisation par longueur d’arc d’un voisinage de x dans C, telle que ψ(0) = x. Alors ϕ(tn ) ∈ ψ(J) pour n assez grand. Plus précisément, on a ϕ(tn ) = ψ(ηn ), pour un unique ηn qui tend vers 0 quand n tend vers l’infini. D’après le lemme,  ϕ(t) = ψ(ηn ± t − tn ) . Pour n assez grand, le membre de droite fournit un prolongement de ϕ au-delà de b, contrairement à l’hypothèse de maximalité. Si ϕ est injective, on a une immersion injective d’un intervalle ]a, b[ dans E, dont l’image est une sous-variété. Une telle immersion est un plongement (nous laissons au lecteur ce dernier point, qui n’est pas tout à fait évident), et réalise un difféomorphisme entre ]a, b[ et C, ce qui prouve que C est difféomorphe à R. Supposons maintenant que ϕ ne soit pas injective, et soient t1 et t2 tels que ϕ( t1 ) = ϕ( t2 ). Après translation du paramètre t, on peut supposer que t1 = 0 et t2 = c > 0. Les vecteurs ϕ0 (0) et ϕ0 (c) sont deux vecteurs de norme 1 tangents à C en un même point, donc ϕ0 (0) = ±ϕ0 (c). Le second cas est exclus : le lemme appliqué aux deux paramétrisations ϕ(t) et ϕ(c − t) sur [0, c] donne ϕ(t) = ϕ(c − t), soit en dérivant ϕ0 (t) = −ϕ0 (c − t), puis ϕ0 (c/2) = 0, ce qui est impossible. Donc ϕ0 (0) = ϕ0 (c). Le lemme donne alors ϕ(t) = ϕ(c + t) tant que c + t ∈]a, b[ ; mais si ]a, b[6= R, cette relation donne aussi un prolongement de ϕ au delà de ]a, b[. Donc ]a, b[= R et ϕ est périodique. Soit T sa plus petite période. Si ϕ(t1 ) = ϕ(t2 ), d’après le raisonnement précédent ϕ(t2 − t1 + t) = ϕ(t) quel que soit t, et t2 − t1 est un multiple entier de T . Ainsi, par passage au quotient, ϕ donne une immersion injective de R/Z sur C, donc un plongement. 2 Remarque. On a donc une caractérisation “intrinsèque” très simple des variétés de dimension 1. Par contre leurs plongements dans R3 peuvent être beaucoup plus compliqués que le plongement “standard” t 7→ (cos t, sin t, 0). Ce plongement se prolonge

130

Introduction aux variétés différentielles

en un plongement du disque fermé. Il n’en est pas de même pour le nœud de trèfle  t 7→ (2 + cos 3t) cos 2t, (2 + cos 3t) sin 2t, sin 3t (cette assertion n’a rien d’évident, malgré la figure 3.7).

Figure 3.7 – Nœud de trèfle

Pour un avant-goût de la théorie des nœuds, qui est en pleine explosion aujourd’hui, voir la fin de [Gramain], [Sossinsky] ou [Adams].

3.9. Commentaires A propos des immersions et des plongements La démonstration du théorème de Whitney fait pressentir que les immersions et les plongements d’une variété donnée, une fois qu’ils existent, peuvent être assez nombreux. Par exemple on démontre (cf. [Hirsch], ch. 2) que si M est compacte l’ensemble des immersions d’une variété M dans R2 dim M est un ouvert dense de C ∞ (M, R2 dim M ) ** pour la topologe compacte-ouverte **. D’où la question de la classification de ces immersions. On introduit pour y répondre la notion d’isotopie. Deux immersions f, g de M dans N sont isotopes s’il existe une application lisse H : [0, 1] × M → N telle que H(0, x) = f (x), H(1, x) = g(x), et que l’application partielle x 7→ H(t, x) soit une immersion pour tout t. Il est facile de voir par exemple que deux immersions suffisamment C 1 -proches d’une variété compacte sont isotopes. La classification des immersions à isotopie près est abordée par exemple dans [Adachi]. Bornons-nous à décrire ce qui se passe pour M = S 1 . C’est moins difficile qu’en dimension supérieure, mais déjà intéressant.

3 − Du local au global

131

a) Deux immersions de S 1 dans Rn sont toujours isotopes si n ≥ 3 (nous invitons le lecteur à le démontrer en imitant la preuve du théorème de Whitney). b) Deux immersions f et g de S 1 dans R2 sont isotopes si et seulement si leurs “hodographes” t 7→ f 0 (t)/kf 0 (t)k et t 7→ g 0 (t)/kg 0 (t)k sont homotopes (autrement dit si les tangentes orientées font “le même nombre de tours”). C’est le théorème de Whitney–Grauenstein, montré par exemple dans [Adachi] ou [Berger–Gostiaux], 9.4.8. Si maintenant dans la définition d’une isotopie on remplace immersion par plongement, on montre (ibidem) qu’il y a deux classes d’isotopie de plongement de S 1 dans R2 (le sens trigonométrique et le sens des aiguilles d’une montre). Et si on remplace R2 par R3 , le problème de la classification des isotopies de plongement de S 1 est à peu de choses près le problème de la classification des noeuds évoqué au paragraphe précédent.

Théorie de Morse Nous avons vu dans ce chapitre que le type topologique d’un “sous-niveau” {f ≤ a} d’une fonction lisse sur une variété ne change pas tant qu’on ne franchit pas de niveau critique (c’est à dire contenant un point critique). Que se passe-t-il quand on rencontre un point critique ? Le cas le plus simple est celui où il y a seulement deux points critiques (le nombre minimum sur une variété compacte, une fonction non constante ayant un maximum et un minimum distincts). La réponse est fournie par le théorème de Reeb : S’il existe sur une variété compacte M une fonction admettant deux points critiques, alors M est homéomorphe à une sphère. On ne peut pas conclure que M est difféomorphe à S n (on pressent pourquoi en faisant l’exercice 26, où il s’agit de montrer le théorème de Reeb dans le cas plus facile où les points critiques sont non dégénérés : il est tout à fait évident qu’un homéomorphisme de S n peut se prolonger en un homéomorphisme de la boule unité fermée, mais la propriété correspondante pour les difféomorphismes est fausse). Dans le cas général, si p ∈ M est un point critique non dégénéré (et donc isolé d’après le théorème 3.44), le lemme de Morse permet de contrôler le changement de topologie quand on passe du sous-niveau f ≤ f (p) −  au sous-niveau f ≤ f (p) + , en fonction de l’indice du point critique p, défini comme le nombre de carrés négatifs intervenant dans lemme de Morse (voir [Milnor 2] et [Hirsch] pour des énoncés précis et des dessins suggestifs). On en déduit par exemple les inégalités de Morse faibles (ibidem) : Si f est une fonction sur M n’ayant que des points critiques non dégénérés, et si ck (f ) est le nombre de points critiques d’indice k, on a dim H k (M, R) ≤ ck (f )

132

et

Introduction aux variétés différentielles X

(−1)k ck (f ) =

k

X (−1)k dim H k (M, R). k

Les espaces de cohomologie dim H k (M, R) seront définis au chapitre 7. ** Mais il se trouve que le point de vue des formes différentielles adopté dans le livre rend la démonstration des inégalités de Morse malcommode. Elles sont par contre faciles à montrer avec un peu de topologie algébrique.**

Systèmes dynamiques On entend par là l’étude globale des trajectoires des champs de vecteurs (et plus généralement l’étude des itérés d’un difféomorphisme, qu’il soit obtenu à l’aide d’un flot ou non). Les exercices 6, 7 et 10 traitent de quelques-uns des rares cas où la structure des trajectoires est bien comprise. Un autre exemple “trivial” est celui du champ ∂x + α∂y sur T 2 = R2 /Z2 : si α est rationnel les trajectoires sont toutes des courbes fermées, si α est irrationnel ce sont toutes des sous-variétés strictement immergées et partout denses. Dans le cas général, il est hors de question, même pour un champ de vecteurs sur R2 à coefficients polynômiaux 3 , d’espérer une expression explicite des trajectoires. D’où l’importance d’une étude qualitative : comportement des trajectoires quand t tend vers l’infini, stabilité, existence d’orbites denses, ou périodiques, etc... Le premier à l’avoir vu est sans doute Henri Poincaré, voir par exemple le livre de [Charpentier– Ghys–Lesne]. Pour ces questions, on peut voir aussi [Demazure], [Arnold 1], [Arnold 2] et surtout [Katok–Hasselblatt].

Des fibrés vectoriels, pourquoi ? La justification de la plupart des notions introduites dans ce livre, c’est l’usage qui en est fait dans la suite. Cela ne vaut pas pour les fibrés vectoriels, assez peu utilisés. Le fait que toutes les opérations algébriques sur les espaces vectoriels ont leurs analogues dans le cadre des fibrés vectoriels est utile pour avoir une description commode du fibré tangent (voir par exemple les exercices 20 à 23). Une autre justification vient de l’étude des variétés complexes. Le fait que sur une variété complexe compacte il n’y a pas de fonctions holomorphes autres que les constantes pourrait rendre les mathématicien(ne)s bien malheureux(ses). Mais il existe sur certains fibrés vectoriels holomorphes des sections holomorphes suffisamment nombreuses pour rendre les services que les fonctions lisses rendent dans ce livre. L’exercice 27 donne un exemple de cette situation. La géométrie complexe fait un usage intensif des fibrés holomorphes, voir par exemple [Debarre]. 3. Cet exemple n’est pas donné au hasard : le fait qu’il n’existe alors qu’un nombre fini de trajectoires fermées est un résultat relativement récent (' 1987) et difficile.

3 − Du local au global

133

Connexions Quelques mots sur cette notion à peine abordée dans ce livre. On peut les voir comme une façon commode de faire du calcul différentiel d’ordre supérieur. La différentielle d’un champ de vecteurs ou la différentielle seconde d’une fonction font intervenir le second fibré tangent T (T M ), de manipulation malaisée. On s’en tire avec la notion suivante, qui reprend les propriétés de la dérivée directionnelle dans Rn . Définition 3.48. Une connexion sur une variété M est une application bilinéaire ∇ de C ∞ (T M ) × C ∞ (T M ) dans C ∞ (T M ) ayant les propriétés suivantes. ∇f X Y

= f ∇X Y

∇X f Y

= df (X)Y + f ∇X Y

(X et Y sont des champs de vecteurs, et f une fonction lisse). Le même argument de fonctions plateau que dans le théorème 3.15 montre que, à l’instar des dérivations, les connexions se localisent. On a (∇X Y )|U = ∇X|U Y|U pour tout ouvert de U . La première propriété implique alors que la valeur en m de ∇X Y , pour un champ donné Y , ne dépend que de Xm . La seconde est un avatar de la règle de Leibnitz. La localisation permet de travailler dans un ouvert de carte. Si dans un tel ouvert X=

n X

X i ∂i

et

Y =

i=1

n X

Y i ∂i ,

i=1

il est d’usage définir les coefficients de Darboux–Christoffel par la formule ∇∂j ∂k =

n X

Γijk ∂i .

i=1

Un calcul direct montre alors que ∇X Y

=

n X

Z i ∂i

i=1

avec

Zi

=

n X k=1

∂k Y i X k +

n X

Γijk X j X k .

j,k=1

Il existe toujours des connexions. Par exemple, si M est plongée dans RN , on peut définir une connexion ∇X Y comme suit : si Tm Y est l’application linéaire tangente en m à Y vu comme application de M dans RN , on prend pour ∇X Y la projection orthogonale de Tm Y · Xm sur l’espace tangent en m à M .

134

Introduction aux variétés différentielles

Le mot connexion est dérivé de connexe : une connexion permet d’associer à tout chemin C 1 par morceaux c : [a, b] → M de x à y une application linéaire de Tx M dans Ty M . Voir n’importe quel livre de géométrie riemannienne pour les détails (** l’exemple donné ci-dessus est celui de la connexion de Levi–Civita de la métrique riemannienne induite sur M une métrique euclidienne de RN . Cette métrique euclidienne a été introduite implicitement puisque nous avons parlé de projection orthogonale **).

3.10. Exercices 1. Montrer que si M est une variété lisse compacte, l’ensemble des fonctions lisses est dense dans C 0 (M ) pour la topologie de la convergence uniforme (utiliser le théorème de Stone–Weierstrass). 2*. Un autre théorème de Whitney a) Montrer que tout ouvert de Rn est une réunion dénombrable de boules ouvertes. b) Soit donc F une partie fermée de Rn . On peut donc écrire, pour des points xp et des nombres positifs rp convenables, Rn \ F = ∪p∈N B(xp , rp ). Soit fp une fonction non-négative et lisse, strictement positive sur B(xp , rp ) et à support égal à B(xp , rp ) (on donnera un exemple explicite d’une telle fonction.) Soit n α X α ∂ fp α (x) , où α = Mp = sup αi . 1 n x∈Rn ,|α|≤p ∂x1 · · · ∂xn i=1 Montrer que la fonction f (x) =

X p∈N

1 fp (x) p!Mp

est lisse, et que f −1 (0) = F. (Autrement dit, tout fermé de Rn est l’ensemble des zéros d’une fonction lisse). 3. Soit f une fonction lisse sur R telle que f ( n1 ) = 0 pour tout entier n. (D’après l’exercice précédent, il existe de telles fonctions dont la restriction à tout voisinage de zéro est non identiquement nulle). Montrer que toutes les dérivées de f sont nulles à l’origine. 4. Montrer que l’anneau des germes en 0 de fonctions continues sur Rn n’admet pas de dérivations autres que la dérivation nulle. 5. Montrer que l’anneau des germes en 0 de fonctions lisses n’est pas intègre. Qu’en est-il de l’anneau des germes de fonctions analytiques ?

3 − Du local au global

135

6. Le produit vectoriel vu comme un crochet On se donne sur R3 les champs de vecteurs X = z∂y − y∂z

; Y = x∂z − z∂x

; Z = y∂x − x∂y .

a) Montrer qu’ils sont linéairement indépendants sur R. Quel est leur flot ? Soit E l’espace vectoriel sur R qu’ils engendrent. Montrer que E est stable par le crochet. b) Soit ϕ : E 7→ R donnée par ϕ(aX + bY + cZ) = (a, b, c). Montrer que ϕ est un isomorphisme, et que ϕ([V, W ]) = ϕ(V ) ∧ ϕ(W ), où ∧ désigne le produit vectoriel. c) Quel est le flot de aX + bY + cZ ? 7. Dynamiques Nord–Sud et Nord–Sud sur la sphère On considère la sphère S 2 plongée dans R3 de la façon habituelle. On désigne par iN la projection stéréographique de pôle Nord, et par ht l’homothétie de centre (0, 0, 0) et de rapport et du plan z = 0. a) Montrer que i−1 N ◦ ht ◦ iN se prolonge d’une manière unique en un difféomorphisme gt de S 2 , et que gt ◦ gt0 = gt+t0 . b) Montrer que les seuls points fixes de gt sont les pôles Nord et Sud. Vérifier que pour tout x ∈ S 2 on a lim gt (x) = N

t7→+∞

et

lim gt (x) = S.

t7→−∞

c) Vérifier que le générateur infinitésimal du groupe à un paramètre gt est donné pour tout x ∈ S 2 par la projection orthogonale sur Tx S 2 du vecteur (0, 0, 1). d) * En s’inspirant de la construction faite en a), donner un exemple de champ de vecteurs sur S 2 ayant un seul zéro, et dessiner ses trajectoires. 8. Soient X et Y deux champs de vecteurs sur une variété, ϕ et ψ leurs flots. Montrer que ϕs et ψt commutent quels que soient s et t assez petits si et seulement si [X, Y ] = 0. 9. Soit X un champ de vecteurs sur une variété tel que [X, Y ] = 0 quel que soit le champ Y. Montrer que X = 0. 10. Donner un exemple de champ de vecteurs sur S 2n−1 qui ne s’annule nulle part. (Remarquer que ( ) n X 2n−1 n 2 S = (z1 , · · · , zn ) ∈ C , |zi | = 1 , i=1

136

Introduction aux variétés différentielles

et utiliser le groupe à un paramètre vt (z) = (eit z1 , · · · , eit zn ).) N.B. On verra plus tard que sur les sphères de dimension paire tout champ de vecteurs a au moins un zéro. 11. Montrer que T S n−1 est difféomorphe à la sous-variété de Cn définie par l’équation n X

zi2 = 1.

i=1

12*. Exemples de variétés parallélisables a) Expliciter trois champs de vecteurs partout indépendants sur S 3 . b) ** Montrer que la variété S 1 × S n est parallélisable. 13. Soient ϕ : M → N et ψ : N → P des difféomorphismes. Montrer que ψ∗ ◦ ϕ∗ = (ψ ◦ ϕ)∗ . 14*. Démontrer le théorème d’inversion locale par la méthode du chemin. Quelle critique peut-on faire à une telle preuve ? 15*. Transitivité du groupe des difféomorphismes a) Montrer que quels que soient les réels positifs r et r0 (avec r0 > r), et les points x et y dans la boule ouverte B(0, r), il existe un difféomorphisme v de Rn tel que v(x) = y et v(z) = z si kzk > r0 (utiliser le flot d’un champ de vecteurs adéquat). b) Soit M une variété. Montrer que tout point x ∈ M admet un voisinage V satisfaisant à la propriété suivante : pour tout y ∈ V, il existe un difféomorphisme j de M tel que j(x) = y (on pourra se ramener à a) en utilisant des cartes convenables). c) Montrer que si M est connexe, le groupe des difféomorphismes opère transitivement sur M. d) Montrer que si dim M > 1, ce groupe est k-transitif quel que soit k, autrement dit que si (x1 , . . . , xk ) et (y1 , . . . , yk ) sont deux k-uples de points deux à deux distincts, il existe un difféomorphisme ϕ de M tel que ϕ(xi ) = yi pour tout i ∈ [1, k]. 16*. Théorème de redressement d’un champ de vecteurs Pn i n a) Soit X = i=1 X ∂i un champ de vecteurs sur un ouvert U de R contenant 1 l’origine. On suppose que X (0) 6= 0. Soit ϕt le flot local de X. Montrer que l’application F : (x1 , . . . , xn ) → ϕx1 (0, x2 , . . . , xn ) est un difféomorphisme local au voisinage de 0.

3 − Du local au global

137

b) Montrer que F∗−1 X = ∂1 . Indication : utiliser la proposition 3.37. c) Soient M une variété lisse, et X un champ de vecteurs sur M . Montrer que pour tout point a tel que Xa 6= 0, il existe une carte (U, ϕ), où U contient a, telle que X|U = ∂1 . ** La classification locale des champs de vecteurs ayant un zéro isolé est loin d’être aussi élémentaire. Elle fait intervenir des conditions arithmétiques sur la différentielle de X au zéro. Voir [Demazure].** 17*. Réduction simultanée d’un système de champs de vecteurs commutant entre eux Soient p champs de vecteurs sur une variété M , notés L1 . . . , Lp , partout indépendants, et tels que ∀i, j [Li , Lj ] = 0. On se propose de démontrer que pour tout m ∈ M , il existe un ouvert U contenant ∂ m et un système de coordonnées locales sur U tel que Li|U = ∂x i si 1 ≤ i ≤ p. L’exercice précédent montre que cette propriété est vraie pour p = 1, et on va procéder par récurrence. a) La propriété étant supposée vraie pour p, soient L1 , . . . , Lp+1 p + 1 champs de vecteurs indépendants et commutant entre eux. Montrer qu’il existe au voisinage de tout point m des coordonnées locales (x, y), où x = (x1 , . . . xp ) et y = (y 1 . . . y n−p ) telles que Li

=

Lp+1

=

∂ ∂xi p X i=1

si 1 ≤ i ≤ p ; n−p

ai (y)

X ∂ ∂ + bj (y) j . i ∂x ∂y j=1

b) En utilisant l’exercice précédent, montrer que l’on peut prendre ce système (x, y) de façon que p X ∂ ∂ Lp+1 = ai (y) i + 1 . ∂x ∂y i=1 c) Conclure, à l’aide d’un changement de coordonnées de la forme ξ i = xi + ϕi (y) (1 ≤ i ≤ p),

η j = y j (1 ≤ j ≤ n − p).

18*. Théorème de Frobenius Un système de p champs de vecteurs L1 , . . . , Lp partout indépendants sur une variété M est dit complètement intégrable si pour tout m ∈ M il existe un ouvert U contenant M et une sous-variété Y de dimension p (dite variété intégrale), contenue dans U , contenant m, et telle que Li (y) ∈ Ty Y pour tout y ∈ Y et pour tout i ∈ [1, p]. (L’adverbe complètement exprime qu’on peut trouver des sous-variétés tangentes au “champ de p-plans” engendré par les Li dont la dimension soit la plus grande possible.)

138

Introduction aux variétés différentielles

On va montrer qu’un système de p vecteurs est complètement intégrable si et seulement si il existe p3 fonctions lisses cijk telle que [Lj , Lk ] =

p X

cijk Li

(F).

i=1

(Cette condition est banale pour p = 1 : le théorème 3.33 dit précisément qu’un champ de vecteurs non nul est un “système” complètement intégrable.) a) Soit L01 . . . , L0p un second système de champs de vecteurs tel que pour tout m ∈ M les vecteurs L0i (m) engendrent le même sous-espace vectoriel que les Li (m) (ce qui fait que ce système est complètement intégrable si et seulement si le premier l’est). Montrer que p X L0i (m) = aji (m)Li (m), j=1

où les aji L01 . . . , L0p

sont des fonctions lisses. En déduire que les systèmes L1 , . . . , Lp et satisfont simultanément à la condition (F).

b) Montrer que la condition est nécessaire. c) Pour montrer que la condition est suffisante, on se ramène à l’exercice précédent, en montrant que si le système L1 , . . . , Lp satisfait à (F), tout point de M est contenu dans un ouvert U sur lequel il existe un système L01 . . . , L0p tel que : 1. les L0i (x) sont indépendants pour tout x ∈ U. 2. L0i =

p X

aki Lk , où aki ∈ C ∞ (U ).

k=1

3. Quels que soient i et j dans [1, p], [L0i , L0j ] = 0. La question étant locale, il suffit de travailler sur un ouvert de Rn . Quitte à effectuer un changement linéaire de variable, on peut supposer que Li (0) = ∂i quel que soit i ∈ [1, p]. Si n X Li (x) = aji (x)∂j , i=1

il existe donc un ouvert contenant 0 où la matrice  aji (x) 1≤i,j≤p est inversible. Soit (bji ) la matrice inverse, et soit L0i =

p X

bji Li .

j=1

c1) Montrer que

L0i (x) = ∂i +

X k>p

cki (x)∂k .

3 − Du local au global

139

c2) En utilisant (F), montrer que [L0i , L0j ] = 0. 19*. Géométrie des systèmes complètement intégrables Soit M une variété munie d’un système complétement intégrable. On dira que deux point x, y ∈ M sont équivalents s’il existe une suite finie Y1 , . . . , Yk de sous-variétés intégrales telles que x ∈ Y1 , y ∈ Yk et Yi ∩ Yi+1 6= ∅ pour 1 ≤ i ≤ k − 1. Montrer que les classes d’équivalence sont des sous-variétés strictement immergées. N.B. Ces classes d’équivalence s’appellent les intégrales maximales du système. 20. Fibré normal a) Soit f une immersion, pas nécessairement injective, d’une variété M dans un espace euclidien E. Montrer que l’ensemble des couples (x, v) de M × E tels que v soit orthogonal à Tx f (Tx M ) est un fibré vectoriel sur M de rang dim E − dim M (la projection est bien sûr la restriction de pr1 ). Ce fibré s’appelle le fibré normal, comme dans le cas des sous-variétés. b) Montrer que le fibré normal à S n vu comme l’ensemble des vecteurs de norme 1 dans un espace euclidien de dimension n + 1 est trivialisable. c) Même question pour une sous-variété de X de Rn de la forme f −1 (0), où f est une submersion de Rn dans Rp . 21*. Fibré tautologique a) On définit un fibré vectoriel de rang 1 sur P n R, dit fibré tautologique, et noté γn , comme suit. L’espace total ξ est la partie de P n R×Rn+1 formée des couples ([x], v) tels que v appartient à la droite définie par [x], la projection est la restriction de pr1 . Il revient au même de dire que, si x = (x0 , · · · , xn ) est un système de coordonnées homogènes de [x] ∈ P n R, l’espace total est caractérisé par les équations xi v j − xj v i = 0

(0 ≤ i < j ≤ n)

(comparer à la première question de l’exercice 17 du chapitre 2. b) Montrer que pour n = 1 l’espace total est difféomorphe à la variété des droites affines du plan, et que la projection consiste à associer à chaque droite sa direction (non orientée ! !). c) ** Montrer que γn n’est pas trivialisable. 22*. Quelques constructions de fibrés vectoriels a) Produit cartésien. Si ξ1 = (E1 , p1 , B1 ) et ξ2 = (E2 , p2 , B2 ) sont deux fibrés vectoriels, montrer qu’il en est de même de (E2 × E2 , p1 × p2 , B1 × B2 ), chaque fibre (p1 × p2 )−1 (b1 , b2 ) = (E1 )b1 × (E2 )b2

140

Introduction aux variétés différentielles

étant munie de la stucture vectorielle produit. Ce fibré se note ξ1 × ξ2 . b) Image réciproque. Si ξ = (E, p, B) est un fibré vectoriel et f : B 0 → B une application lisse, E 0 = {(b0 , e) ∈ B 0 × E, f (b0 ) = p(e)}, muni de la restriction de la première projection, est l’espace total d’un fibré vectoriel sur B 0 , noté f ∗ ξ. La restriction de la deuxième projection donne un morphisme de fibrés. Exemple idiot mais important : si M est une sous-variété de Rn , ou plus généralement si f : M → Rn est une immersion, l’image réciproque de T Rn par f est le fibré trivial M × Rn . c) Somme directe, ou somme de Whitney. Si ξ1 = (E1 , p1 , B) et ξ2 = (E2 , p2 , B) sont deux fibrés vectoriels de même base B, c’est le fibré ∆∗ (ξ1 × ξ2 ), où ∆ : B → B × B est l’application diagonale. Il est noté ξ1 ⊕ ξ2 . Exemple : la somme de Whitney du fibré tangent et du fibré normal à une sousvariété de Rn est le fibré trivial. 23**. Fibré tangent à P n R a) On identifie T S n à l’ensemble des (x, v) ∈ Rn+1 × Rn+1 tels que kxk = 1 et hx, vi = 0. Montrer que T P n R s’identifie au quotient de T S n obtenu en identifiant (x, v) et (−x, −v), et que l’application de passage au quotient est un morphisme de fibrés vectoriels. b) On définit un fibré de rang n sur P n R, noté γn⊥ , dont l’espace total est {([x], v) ∈ P n R × Rn+1 , hx, vi = 0}. Ainsi, la somme de Whitney γn ⊕ γn⊥ (voir l’exercice 21) est le fibré trivial de rang (n + 1) sur P n R. Montrer que T P n R est isomorphe à Hom(γn , γn⊥ ). 24*. Voisinage tubulaire d’une sous-variété Soit M une sous-variété compacte d’un espace euclidien E, et N (M ) le fibré normal à M . On définit une application f : N (M ) → E en posant f (x, v) = x + v

(pour (x, v) ∈ N (M ) ⊂ M × E, voir l’exercice 20).

a) Montrer que f est étale en (x, 0). b) Pour r > 0, on pose Nr (M ) = {(x, v) ∈ N (M ), kvk < r}. Montrer qu’il existe un  > 0 tel que f soit un difféomorphisme de Nr (M ) sur son image si r <  (s’inspirer de la preuve du lemme 6.18).

3 − Du local au global

141

Figure 3.8 – Voisinage tubulaire

L’image f (Nr (M )) s’appelle alors un voisinage tubulaire de M , et se note Vr (M ). On montrera au passage que si y est dans un voisinage tubulaire, et si y = f (x, v), alors dist(y, M ) = kvk. 25*. Théorème de Reeb : le cas facile Soient M une variété compacte de dimension n et f une fonction lisse sur M à valeurs réelles, admettant exactement deux points critiques, ces points critiques étant non dégénérés. Montrer que M est homéomorphe à S n . Indication : en utilisant les théorèmes 3.40 et 3.44 on décompose M en trois morceaux, dont deux sont homéomorphes au disque fermé Dn , et le troisième à un produit I × S n−1 . On peut recoller ces homéomorphismes et obtenir un homéomorphisme de M sur S n en remarquant que tout homéomorphisme de S n−1 peut se prolonger en un homéomorphisme de Dn . 26. Un lemme technique utile a) Montrer que dans un espace euclidien, l’ouvert B(0, 1) \ {0} est difféomorphe à B(0, 1) \ B(0, r) (avec r < 1 bien sûr !). b) Montrer que l’on peut imposer à tel difféomorphisme d’être égal à l’indentité sur la couronne X = {x, r0 < kxk < 1, quel que soit r0 ∈]0, r[. c) Soit M une variété, et p1 , . . . , pr des points distincts. Montrer qu’il existe des ouverts U1 , . . . , Ur disjoints tels que pi ∈ Ui pour tout et que M \ {p1 , . . . , pr } soit difféomorphe à M \ ∪1≤i≤r U i . 27*. Une petite dose de géométrie complexe a) Montrer que le fibré tautologique sur P n C, c’est-à-dire le fibré en droites complexes défini de la même façon que le fibré tautologique sur P n R, est un fibré vectoriel holomorphe (autrement dit que les changements de trivialisations sont holomorphes). b) Montrer que ce fibré n’admet pas de sections holomorphes autres que la section nulle.

142

Introduction aux variétés différentielles

c) Montrer que son dual complexe admet n + 1 sections linéairement indépendantes. 28*. Un supplément à la sous-section 3.3.2 Dans l’anneau FxM des germes en x de fonctions lisses, on introduit l’idéal mx des germes nuls en x et l’idéal m2x engendré par les sommes finies k X

gi hi ,

i=1

où les gi et les hi sont dans mx . Montrer que le cotangent Tx M ∗ est naturellement (au sens de 3.3.2) isomorphe à mx /m2x (utiliser le lemme de Hadamard).

Chapitre 4 Autour des groupes de Lie

4.1. Introduction La notion de groupe fut dégagée vers 1830 par Evariste Galois dans ses travaux sur les équations algébriques. Il s’agissait au départ de groupes finis. Une quarantaine d’années plus tard, en étudiant – inspiré par les travaux de Galois – les propriétés d’invariance non plus d’équations algébriques, mais d’équations différentielles ou aux dérivées partielles, le mathématicien norvégien Sophus Lie mettait d’autres types de groupes en évidence. On donnait jadis à ces groupes le nom délicieux de “groupes finis et continus”, ce qui siginifie dans le langage d’aujourd’hui que ce sont à la fois des groupes et des variétés topologiques de dimension finie. En fait, les très nombreux exemples trouvés étaient tous des variétés lisses, et les opérations de groupe des applications lisses : il s’agissait de ce qu’on appelle aujourd’hui des groupes de Lie. Il fut assez vite conjecturé, mais démontré seulement en 1950 (la preuve occupe un livre entier, [Montgomery–Zippin]) que toute variété topologique munie d’une loi de groupe continue est un groupe de Lie. Il n’est donc pas étonnant que la plupart des groupes qui interviennent en géométrie ou en physique soient des groupes de Lie. Les exemples que nous allons voir sont tous des sous-groupes d’un groupe linéaire Gl(n, R). Inversement on démontre que tout groupe de Lie est localement isomorphe à un sous-groupe d’un groupe linéaire. La théorie générale n’en garde pas moins toute sa pertinence : c’est elle qui permet d’aboutir au résultat que nous venons de citer, qui est loin d’être évident. Et même au niveau élémentaire où nous nous plaçons, elle met en lumière le phénomène essentiel qui intervient, à savoir le lien entre les propriétés du groupe et celles d’une structure algébrique très particulière sur l’espace tangent à l’élément neutre. Ce dernier s’identifie naturellement à l’espace vectoriel des champs de vecteurs invariants à gauche, qui est stable par le crochet vu au chapitre précédent. La structure algébrique ainsi obtenue, appelée algèbre de Lie, rend très bien compte des propriétés du groupe.

144

Introduction aux variétés différentielles

Dans le sens groupe–algèbre, tout se passe à merveille. L’algèbre de Lie d’un groupe commutatif est commutative, celle d’un sous-groupe est une sous-algèbre de l’algèbre de Lie du groupe de départ, l’application linéaire tangente à un morphisme de groupes de Lie donne un morphisme d’algèbre de Lie. Dans le sens algèbre–groupe, les choses vont moins bien. L’algèbre de Lie d’un groupe de Lie ne dépend en fait que des propriétés du groupe au voisinage de l’élément neutre. Deux groupes ayant la même composante neutre ont même algèbre de Lie, ainsi que deux groupes dont l’un est un revêtement de l’autre. Il y a des exemples de cette situation dès la dimension 1 : les groupes (R, +) (simplement connexe), SO(2) ' S 1 (connexe et non simplement connexe), O(2) (dont la composante neutre est SO(2)) ont la même algèbre de Lie. Pour qui trouverait cet exemple trop simple, en voici un autre. Les groupes SU (2) (simplement connexe car homéomorphe à S 3 ), SO(3) (connexe mais non simplement connexe, car c’est un quotient d’ordre 2 de SU (2), voir l’exercice 5) et O(3) (dont la composante neutre est SO(3)) ont la même algèbre de Lie, à savoir R3 muni du produit vectoriel. Ce chapitre expose les rudiments de la théorie, avec de nombreux exemples. L’existence et les propriétés de l’algèbre de Lie d’un groupe de Lie viennent des propriétés du flot et du crochet vues au chapitre précédent. Nous donnons aussi quelques compléments de topologie permettant de comprendre les questions qui se posent au cours du passage algèbre–groupe. Nous terminons par la notion importante d’espace homogène. Au niveau algébrique, c’est un ensemble E sur lequel un groupe G agit transitivement (pour éviter toute ambigüité, on devrait parler d’espace G-homogène). Il y a alors une bijection de E sur le quotient de G par le sous-groupe d’isotropie Gx d’un point x, c’est-à-dire le sous-groupe des g tels que g ·x = x ; si on change de point, ce sous-groupe est remplacé par un conjugué. Si G est un groupe de Lie et si Gx est fermé dans G, on a sur E une structure de variété pour laquelle G agit par difféomorphismes. Cela fournit un moyen commode de voir un bon nombre d’objets géométriques comme des variétés. Un exemple important et typique est celui des sous-espaces vectoriels de dimension donnée d’un espace vectoriel de dimension finie (grassmanniennes). Pour une étude historique et épistémologique du point de vue originel de Sophus Lie, voir [Merker]. L’exemple élémentaire mais instructif de l’équation de Riccati est traité dans [Berger], 6.8.7.

4.2. Champs invariants à gauche Définition 4.1. Un groupe de Lie est un groupe G muni d’une structure de variété lisse telle que les applications (g, h) → gh

de G × G dans G

et g → g −1 soient lisses.

de G dans G

4 − Autour des groupes de Lie

145

Il revient au même bien sûr de supposer que l’application (g, h) → gh−1

de G × G dans G

est lisse. Exemples a) Le groupe additif Rn est un groupe de Lie. b) Le groupe linéaire Gl(n, R) vectoriel Rn est un groupe de Lie : c’est un ouvert de End(Rn ), donc une variété de dimension n2 , et la lissité des opérations de groupe se voit sur les formules explicites (c’est l’une des très rares situations où la formule explicite donnant l’inverse d’une matrice sert à quelque chose !). c) Si G et H sont deux groupes de Lie, G×H, muni de la structure de groupe produit et de la structure de variété produit, est un groupe de Lie. d) Le cercle S 1 , vu comme le groupe multiplicatif des complexes de module 1, est un groupe de Lie. Le groupe de Lie produit (S 1 )n s’appelle le tore de dimension n (par analogie avec le cas n = 2). Nous verrons que c’est, à isomorphisme près, le seul groupe de Lie compact connexe abélien de dimension n. e) D’après la section 1.5 et la proposition 2.8 le groupe orthogonal O(n) est un groupe de Lie. La même proposition et l’exercice 4 du chapitre 2 montrent que U (n) et SU (n) sont des groupes de Lie. f) Le groupe A(n, R) des automorphismes affines de Rn , c’est-à-dire des transformations x → Ax + b, où A ∈ Gl(n, R) est un groupe de Lie. En effet, A(n) s’identifie à Gl(n, R) × Rn muni de la loi de composition (A, b) × (A0 , b0 ) = (AA0 , Ab0 + b). En particulier, (A, b)−1 = (A−1 , −A−1 b). Il est commode de voir A(n, R) comme le sous-groupe de Gl(n + 1, R) formé des matrices   A b . 0···0 1 g) Citons encore le groupe de Heisenberg H (voir l’exercice 11 pour une justification de ce nom) formé des matrices   1 x z 0 1 y  0 0 1 et le groupe de Galilée G de la mécanique classique. L’action d’un élément de G sur l’espace temps paramétré par (x, t) ∈ R3 × R est définie par (A, v, b, τ ) · (x, t) = (Ax + vt + b, t + τ ),

où A ∈ SO(3), v, b ∈ R3 , τ ∈ R

146

Introduction aux variétés différentielles

(v comme vitesse !). D’une façon analogue à sous-groupe de Gl(5, R) formé des matrices  A b 0 0 0 1 0 0 0 0

f), G peut être considéré comme le  c τ . 1

h) Donnons enfin l’exemple du groupe de Lorentz O(3, 1) des automorphismes de la forme quadratique x2 + y 2 + z 2 − t 2 (voir l’exercice 19 du chapitre 1 pour une justification), qui intervient en relativité restreinte. Définitions 4.2. a) Un morphisme entre deux groupes de Lie G et H est une application f : G → H qui est à la fois un morphisme de groupes et une application lisse. b) Les groupes de Lie G et H seront dits isomorphes si f est à la fois un isomorphisme de groupes et un difféomorphisme. c) Un sous-groupe de Lie de G est une sous-variété qui est aussi un sous-groupe. Exemples a) Bien entendu, O(n) est un sous-groupe de Lie de Gl(n, R). Le groupe SO(n) (dit groupe spécial orthogonal ) des tranformations orthogonales de déterminant 1 est un sous-groupe de Lie de O(n), car c’est un sous-groupe et une partie ouverte de SO(n) : on a une partition O(n) = SO(n) ∪ O− (n) où O− (n) = {A ∈ O(n), det(A) = −1}. b) La composante connexe de l’élément neutre d’un groupe de Lie G est un sousgroupe de Lie de G (de même dimension puisqu’elle est ouverte dans G ; c’est un sous-groupe d’après la proposition 4.30 que nous verrons plus loin). On l’appelle la composante neutre de G et on la note Go . On verra par exemple que O(n)o = SO(n). A tout élément g d’un groupe de Lie G, on associe les translations à droite et à gauche, notées respectivement Rg et Lg , définies par Rg · x = xg

et

Lg · x = gx.

Un mot sur ces notations : L comme “left” et R comme “right”, un hasard malheureux faisant que les mots “gauche” et “groupe” ont la même initiale en français ! En vertu de l’associativité de la loi de groupe, on a Lg ◦ Lh = Lgh

et

Rg ◦ Rh = Rhg .

En particulier, Rg et Lg sont des difféomorphismes de G. De plus, toujours à cause de l’associativité, Rg et Lh commutent, puisque h(xg) = (hx)g !

4 − Autour des groupes de Lie

147

D’après la section 3.4, si X est un champ de vecteurs sur G, on peut définir pour tout g ∈ G les champs Lg∗ X et Rg∗ X. Définition 4.3. Un champ de vecteurs X sur un groupe de Lie G est invariant à gauche (resp. à droite) si ∀g ∈ G, Lg∗ X = X

(resp.

Rg∗ X = X).

Nous désignerons par I le difféomorphisme x 7→ x−1 de G. Proposition 4.4. Les champs invariants (à gauche ou à droite) ont les propriétés suivantes : 1. la somme et le crochet de deux champs invariants à gauche (resp. à droite) sont invariants à gauche (resp. à droite) ; 2. l’image par I d’un champ invariant à gauche (resp. à droite) est invariant à droite (resp. à gauche) ; 3. Si X est invariant à gauche (resp. à droite), il en est de même de Rg∗ X (resp. Lg∗ X). Démonstration. La première propriété est une conséquence directe de la proposition 3.23. Pour la deuxième, il suffit de remarquer que la relation (gx)−1 = x−1 g −1 s’écrit I ◦ Lg = Rg−1 ◦ I. Enfin, les translations à droite commutant avec les translations à gauche, si X est invariant à gauche, on a Lh∗ (Rg∗ X) = Rg∗ (Lh∗ X) = Rg∗ X. Reste à s’assurer de l’existence de champs invariants à gauche. C’est chose facile, grâce au résultat suivant. Proposition 4.5. Si G est un groupe de Lie, l’application X 7→ Xe est un isomorphisme entre l’espace vectoriel des champs de vecteurs invariants à gauche sur G et l’espace tangent Te G. Démonstration. Si un champ de vecteurs X sur G est invariant à gauche, nécessairement Xg = Te Lg · Xe , ce qui montre l’injectivité. Inversement, un vecteur v ∈ Te G étant donné, il faut vérifier que l’application de G dans T G donnée par g → Te Lg · v

148

Introduction aux variétés différentielles

est un champ de vecteurs (qui sera alors invariant à gauche par construction). Il suffit de vérifier que cette application définit une dérivation. Pour f ∈ C ∞ (G), désignons par Lv f la fonction g → Tg f · (Te Lg · v) . Il est clair que Lv (f g) = (Lv f )g + f (Lv g), et il reste à montrer que la fonction Lv f est lisse. Soit c :] − , [7→ G une courbe lisse telle que c(0) = e et c0 (0) = v. Alors, d’après le théorème des fonctions composées, Lv f (g) =

d f (gc(t))|t=0 . dt

Mais la fonction (t, g) 7→ f (gc(t)) étant lisse sur ] − , [×G, il en est de même de sa dérivée partielle par rapport à t Corollaire 4.6. Tout groupe de Lie est une variété parallélisable. Démonstration. Il suffit de prendre les champs de vecteurs associés par la proposition précédente à une base de Te G, et d’appliquer la proposition 3.28. En particulier, tout champ de vecteurs sur G peut s’écrire comme combinaison linéaire (à coefficients dans C ∞ (G)) de champs invariants à gauche (ou à droite). Examinons maintenant les trajectoires d’un champ de vecteurs invariant à gauche. Définition 4.7. Un sous-groupe à un paramètre d’un groupe de Lie G est un morphisme de (R, +) dans G, autrement dit une application lisse h de R dans G telle que h(t + s) = h(t)h(s) quels que soient t, s ∈ R. Exemples a) Si A ∈ Mn (R), alors t 7→ exp tA est un sous-groupe à un paramètre de Gl(n, R) d’après le lemme 1.27. Si A est antisymétrique (resp. à trace nulle) on obtient des sous-groupes à un paramètre de O(n) (resp. Sl(n, R)). b) En fait, si G est un sous-groupe de Lie de Gl(n, R) et φ un morphisme continu de (R, +) dans G, alors φ est un sous-groupe à un paramètre de G, et il existe un unique A ∈ TI G ⊂ End(Rn ) tel que φ(t) = exp(tA). En effet nous savons d’après le théorème 1.30 que φ(t) = exp(tA) pour un A de End(Rn ). Alors t 7→ φ(t) est une courbe lisse contenue dans G, et A = φ0 (0) ∈ TI G. Un sous-groupe à un paramètre de G étant donné, on peut lui associer le groupe à un paramètre de difféomorphismes de G défini par φ(t, x) = xh(t). Autrement dit, φt est la translation à droite Rh(t) .

4 − Autour des groupes de Lie

149

Théorème 4.8. Si h est un sous-groupe à un paramètre d’un groupe de Lie G, le générateur infinitésimal de φ(t, x) = xh(t) est un champ de vecteurs invariant à gauche. Inversement, le flot φ d’un champ de vecteurs X invariant à gauche sur G est défini sur R × G, et il existe un unique sous-groupe à un paramètre hX tel que φt (g) = ghX (t) quels que soient t ∈ R et g ∈ G. De plus, hX (t) = φt (e). Démonstration. Soit X est le générateur infinitésimal de φt . D’après la proposition 3.37, le flot de Lg∗ X est Lg ◦ φt ◦ (Lg )−1 . Mais Lg ◦ φt ◦ (Lg )−1 (x) = gφt (g −1 x) = gg −1 xh(t) = φt (x) , ce qui prouve que Lg∗ X = X. Inversement, si X est invariant à gauche et si φt est son flot, le même argument montre que φt (g) = gφt (e). Le domaine de définition de φ contient donc un ouvert de la forme ] − , [×G. De la relation  φt+t0 = φt ◦ φt0 pour |t|, |t0 | < , 2 on tire que dans les mêmes conditions φt (e)φt0 (e) = φt+t0 (e). Posant hX (t) = φt (e), le même argument que celui du théorème 3.39 permet alors de prolonger hX en un morphisme de R dans G, et donc φ à R × G tout entier.

4.3. L’algèbre de Lie d’un groupe de Lie 4.3.1. Propriétés de base ; représentation adjointe Pour un groupe de Lie, nous venons de voir qu’il revient au même de se donner — un champ de vecteur invariant à gauche ; — un vecteur de l’espace tangent en l’élément neutre ; — un sous-groupe à un paramètre. En particulier, toute opération algébrique définie sur l’un de ces ensembles, comme ici le crochet pour les champs de vecteurs invariants à gauche, se transporte aux deux autres. Définition 4.9. Une algèbre de Lie sur un corps K est un espace vectoriel L sur K, muni d’une application bilinéaire de L × L dans L, appelée le crochet et notée [, ], telle que

150

Introduction aux variétés différentielles

a) ∀X ∈ L, [X, X] = 0. b) ∀X, Y, Z ∈ L, [[X, [Y, Z]] + [Y, [Z, X]] + [Z, [X, Y ]] = 0 (identité de Jacobi). Exemples a) N’importe quel espace vectoriel muni du crochet nul est une algèbre de Lie. C’est le seul cas (du moins en caractéristique différente de 2) où une algèbre de Lie est commutative, le calcul de [X + Y, X + Y ] montrant que [X, Y ] + [Y, X] = 0. b) Les résultats de la section 3.6 se reformulent en disant que pour toute variété lisse M , l’espace vectoriel C ∞ (T M ) muni du crochet est une algèbre de Lie (de dimension infinie, puisque C ∞ (M ) l’est déjà). c) D’après la proposition 4.4, les champs de vecteurs invariants à gauche (ou à droite) sur un groupe de Lie forment une algèbre de Lie de dimension finie. Définition 4.10. Un morphisme d’algèbres de Lie L et L0 sur un même corps K est une application linéaire f de L dans L0 telle que ∀X, Y ∈ L, f ([X, Y ]) = [f (X), f (Y )]. Si f est inversible, il est clair que f −1 est aussi un morphisme. On dit alors que f est un isomorphisme d’algèbres de Lie. Exemple. Toujours d’après la proposition 4.4, I∗ est isomorphisme entre l’algèbre de Lie des champs invariants à gauche sur G et celle des champs invariants à droite. Par transport de structure, l’espace tangent à l’élément neutre d’un groupe de Lie est muni d’une structure d’algèbre de Lie. Définition 4.11. L’algèbre de Lie d’un groupe de Lie G, notée G, est Te G muni du crochet ci-dessus. Dans la suite, nous utiliserons librement l’identification entre Te G et les champs invariants à gauche. Remarque. Un groupe de Lie et sa composante neutre ont même algèbre de Lie, puisque Te G = Te Go . Définition 4.12. Etant donné un groupe de Lie G d’algèbre de Lie G, l’application qui à X ∈ G associe la valeur au temps 1 du groupe à un paramètre associé à X s’appelle l’application exponentielle, et se note exp. Si par exemple G = Gl(n, R), Te Gl(n, R) = End(Rn ), et X ∈ End(Rn ) = G donne naissance au champ dont la valeur en A est AX (avec les identifications d’usage quand on travaille avec des ouverts de Rn ). L’exponentielle s’obtient en intégrant l’équation différentielle A0 (t) = A(t)X

avec la condition initiale A(0) = I.

On retrouve l’exponentielle des matrices vue au chapitre 1. Il est immédiat mais quelque peu pédestre de vérifier que dans ce cas [A, B] = AB − BA. Nous en verrons bientôt une démonstration plus conceptuelle. Revenant au cas général, on vérifie facilement que les principales propiétés de l’exponentielle des matrices subsistent.

4 − Autour des groupes de Lie

151

Proposition 4.13. L’exponentielle est une application lisse de G dans G, et un difféomorphisme local d’un voisinage de 0 ∈ G sur un voisinage de e ∈ G. Démonstration. Le fait que exp est lisse vient de la lissité des solutions d’une famille d’équations différentielles dépendant de façon lisse d’un paramètre (ici l’espace de paramètres est G !). D’après la définition même de exp, on a d exp tX|t=0 = X. dt La différentielle de exp en 0 est donc l’identité, et on applique le théorème d’inversion locale, Nous avons vu que si X ∈ C ∞ (T G) est invariant à gauche, il en de même de Rg∗ X. La question se pose d’interpréter cette propriété en termes de vecteurs tangents à e et en termes de sous-groupes à un paramètre. Proposition 4.14. On a (Rg∗ X)e =

 d −1 g exp tXg |t=0 . dt

Démonstration. Le flot de X est donné par φt (x) = x exp tX, et d’après la proposition 3.37 celui de Rg∗ X par  Rg ◦ φt ◦ Rg−1 (x) = xg −1 exp tXg. Le sous-groupe à un paramètre de G associé à Rg∗ X est donc t → g −1 exp tXg. Nous poserons Ad g · X = Rg−1 ∗ X

 e

=

d −1 g exp tXg|t=0 . dt

Alors, pour X, Y ∈ G on a Ad g · [X, Y ] = [Ad g · X, Ad g · Y ]. De plus Ad g1 g2 = Ad g1 ◦ Ad g2 . (C’est cette relation qui explique le choix de Rg−1 plutôt que de Rg ). Autrement dit, Ad est un morphisme de G dans le groupe des automorphismes de l’algèbre de Lie G. Définition 4.15. L’application Ad s’appelle la représentation adjointe de G. Quand on fait du calcul différentiel sur un groupe de Lie, il est très commode de tout ramener à l’élément neutre, et la représentation adjointe est faite pour cela.

152

Introduction aux variétés différentielles

Proposition 4.16. Pour X, Y ∈ G, on a d Ad(exp tX).Y|t=0 = [X, Y ]. dt En particulier, si G est commutatif, le crochet est identiquement nul. Démonstration. Ce résultat est un cas particulier du théorème 3.38. Exemple. Nous avons vu que Te G s’identifie à End(Rn ), et exp à l’exponentielle des endomorphismes. Alors Ad g · A = et [B, A] =

 d g exp tAg −1 |t=0 = gAg −1 . dt

d ((exp tB)A(exp −tB))|t=0 = BA − AB. dt

4.3.2. Des groupes aux algèbres Nous sommes maintenant en mesure d’énoncer l’un des résultats de base de la théorie, qui fait espérer l’existence d’un dictionnaire entre les propriétés des groupes de Lie et celles de leurs algèbres de Lie. Théorème 4.17. Soient G et H deux groupes de Lie, et f : G → H un morphisme. Alors Te f : G → H est un morphisme d’algèbres de Lie. De plus, si f est un isomorphisme, Te f est un isomorphisme. Démonstration. Le point de départ est la remarque – évidente – que l’image par f d’un sous-groupe à un paramètre t 7→ h(t) de G est un sous-groupe à un paramètre de H. Donc si Y ∈ Te G, il existe un unique Z ∈ Te H tel que f (exp tY ) = exp tZ et en prenant la dérivée par rapport à t des deux membres pour t = 0 on voit que Z = Te f · Y. Maintenant, pour g ∈ G fixé, f (g exp tY g −1 ) = f (g)(exp tZ)f (g −1 ). D’après la définition même de Ad, on a aussi  f (g exp tY g −1 ) = f (exp t Ad g · Y ) . En prenant la dérivée en t = 0 des deux membres de l’égalité  f (exp t Ad g · Y ) = f (g)(exp tZ)f (g −1 ) on trouve Te f (Ad g · Y ) = Ad f (g) · (Te f · Y ). Il suffit maintenant d’écrire cette égalité pour g = exp tY , et de prendre la dérivée en t = 0 tout en appliquant la proposition précédente. Enfin, si f est un isomorphisme, Te f est bijective.

4 − Autour des groupes de Lie

153

Remarque. Si G = H, et si f est la conjugaison par un élément g de G, Te f = Adg. Exemple : déterminant et trace Considérons le morphisme det : Gl(n, R) 7→ R∗ . On a Te det = tr (voir la soussection 1.2.2). D’autre part, il résulte de la preuve du théorème 4.17 que le crochet de l’algèbre de Lie d’un groupe commutatif (R∗ en l’occurence) est le crochet nul. On déduit donc de ce théorème que pour A, B ∈ End(Rn ) tr[A, B] = 0

ou encore

tr(AB) = tr(BA).

Ce résultat est bien connu, mais l’argument ci-dessus en donne une raison conceptuelle. Remarque. L’exemple de Gl(n, R) permet de se rendre compte que l’application exponentielle n’a aucune raison d’être un morphisme de groupes, ni d’être injective ou surjective. Elle est surjective pour les groupes de Lie compacts et connexes. La preuve générale la plus simple utilise de la géométrie riemannienne (cf. [Spivak] ou [Gallot–Hulin–Lafontaine], p. 100), c’est pourquoi nous ne la donnons pas ici. Voir l’exercice 7 pour différents exemples et contre-exemples. Une autre application du théorème 4.17 est le résultat suivant : Corollaire 4.18. Si H est un sous-groupe de Lie de G, l’algèbre de Lie de H est une sous-algèbre de Lie de celle de G. Démonstration. C’est immédiat : si j est l’injection naturelle de Te H = H dans Te G = G, toujours d’après 4.17 j[X, Y ] = [jX, jY ].

4.3.3. Des algèbres aux groupes L’utilisation des algèbres de Lie permet de montrer le résultat suivant, qui est une belle généralisation du théorème 1.30 : Théorème 4.19. Tout morphisme continu d’un groupe de Lie dans un autre est nécessairement lisse. En particulier, un groupe topologique a au plus une structure de groupe de Lie. Démonstration. C’est une conséquence des trois résultats suivants, qui ont leur importance en eux-mêmes. Proposition 4.20. Si h est un morphisme continu de R dans un groupe de Lie G (autrement dit un sous-groupe à un paramètre de G), il existe un X ∈ G et un seul tel que h(t) = exp tX. Démonstration. Le fait que exp soit étale en 0 permet de reprendre les arguments de 1.30 tels que. Lemme 4.21. Soit (X1 , · · · , Xn ) une base de G. Alors l’application de Rn dans G donnée par (t1 , · · · , tn ) → (exp t1 X1 ) · · · (exp tn Xn ) est un difféomorphisme local au voisinage de 0.

154

Introduction aux variétés différentielles

Démonstration. C’est une application lisse, et l’image par la différentielle en 0 du i-ième vecteur de la base canonique de Rn est évidemment Xi . Lemme 4.22. Soit f : G → H un morphisme de groupes. Alors 1. pour que f soit lisse, il suffit qu’il le soit au voisinage de l’élément neutre de la source ; 2. pour que f , supposé lisse, soit un difféomorphisme local (resp. une immersion, une submersion), il suffit que sa différentielle en l’élément neutre soit un isomorphisme (resp. une injection, une surjection). Démonstration. Nous ne nous servirons dans l’immédiat que de la première de ces deux propriétés, mais nous les avons regroupées en raison de la similitude de leurs preuves. Il suffit d’exprimer le fait que f est un morphisme sous la forme f (gh) = Lf (g) f (h). Cela montre que si f est lisse sur un ouvert U contenant e, elle l’est aussi sur gU quel que soit g, donc sur tout le groupe. La seconde propriété s’obtient de la même façon, puisque sous les hypothèse faites f est déjà un difféomorphisme local (resp. une immersion, une submersion) au voisinage de e ∈ G. Fin de la preuve du théorème 4.19. Soit X1 , · · · , Xn une base de G. Pour chaque i ∈ [1, n], l’application t → f (exp tXi ) est un sous-groupe à un paramètre de H, et il existe un Yi ∈ H tel que f (exp tXi ) = exp tYi quel que soit t. Par conséquent, f ((exp t1 X1 ) · · · (exp tn Xn ))

= f (exp t1 X1 ) · · · f (exp tn Xn ) =

(exp t1 Y1 ) · · · (exp tn Yn ).

Posant φ(t1 , · · · , tn ) = (exp t1 X1 ) · · · (exp tn Xn ), cela signifie que f ◦ φ est lisse. D’après le premier lemme, f est alors lisse au voisinage de e, donc partout d’après le second. La question essentielle qui se pose maintenant est de remonter des algèbres de Lie aux groupes de Lie. Plus précisément : a) une algèbre de Lie G donnée est-elle l’algèbre de Lie d’un groupe de Lie ? b) une sous-algèbre H de l’algèbre de Lie G de G étant donnée, existe-t-il un sousgroupe de Lie H de G dont l’algèbre de Lie soit H ? c) deux groupes de Lie G1 et G2 étant donnés, ainsi qu’un morphisme d’algèbres de Lie φ : G1 7→ G2 , existe-t-il un morphisme de groupes F : G1 7→ G2 tel que Te F = φ ?

4 − Autour des groupes de Lie

155

La réponse à la question a) est positive. Elle est connue sous le nom de troisième théorème de Lie. La preuve en est longue et difficile. La question c) peut en principe se ramener à b) : si F existe, son graphe sera un sous-groupe de Lie de G1 × G2 dont l’algèbre de Lie sera le graphe de φ. D’autre part, F étant continue, son graphe sera fermé. Et là les choses se gâtent : il y a des sous-algèbres de Lie qui ne peuvent être l’algèbre de Lie d’un sous-groupe fermé. La réponse aux questions b) et c) est donc en général négative. Contre-exemples. Pour b), il suffit de prendre G1 = G2 = S 1 , et le morphisme (d’algèbres de Lie commutatives !) x 7→ αx de R dans R, où α ∈ / Z. Les morphismes de S 1 étant de la forme t 7→ tk , où k ∈ Z (voir l’exercice 8), il est impossible de remonter φ en un morphisme de S 1 . Pour a), on prend G = S 1 × S 1 et pour H une droite de pente irrationnelle α dans R2 . Comme le sous-groupe à un paramètre x → (eix , eiαx ) est tangent à H en l’élément neutre, le seul candidat possible pour H est l’image de ce sous-groupe à un paramètre, qui n’est pas une sous-variété comme nous l’avons vu dans la section 1.5, mais seulement une sous-variété strictement immergée. Cet exemple est typique de ce qui se passe en général. Les résultats de la fin de cette section se seront pas utilisés dans la suite. Théorème 4.23. Soit G un groupe de Lie et soit H une sous-algèbre de Lie de l’algèbre de Lie G de G. Il existe un groupe de Lie H et une immersion injective stricte de H dans G dont l’image est le sous-groupe de G engendré par exp H. Pour une preuve, voir par exemple [Godement], 6.49. Remarque. Cette propriété justifie la terminologie employée dans le cas où l’image de H n’est pas un sous-groupe de Lie. La donnée d’une immersion injective de H dans G est appelée sous-groupe de Lie immergé ou encore de sous-groupe intégral. Cette dernière terminologie se justifie par le fait que ces groupes s’obtiennent comme sous-variété intégrale du système de champs de vecteurs donné par leur algèbre de Lie. On peut tirer de ce résultat une réponse partielle (et optimale au vu des contreexemples que nous venons de voir) à la question de savoir si l’on peut “remonter” aux groupes les morphismes d’algèbres de Lie. Corollaire 4.24. Soient G et H deux groupes de Lie, et f : G → H un morphisme d’algèbres de Lie. Alors il existe des voisinages U et V des éléments neutres de G et H, et une application lisse f de U dans V telle que a) Te F = f ; b) si x1 , x2 et x1 x2 sont dans U , alors F (x1 )F (x2 ) = F (x1 x2 ). De plus le germe de f en e est déterminé de façon unique par ces propriétés. Démonstration. Le graphe de F est une sous-algèbre de Lie de G × H, à laquelle on applique la première partie du théorème 4.23. Soit Y une sous-variété intégrale

156

Introduction aux variétés différentielles

passant par l’élément neutre de G × H. Quitte à restreindre Y , on peut supposer que c’est un graphe : en effet, la projection sur G, restreinte à Y , a pour différentielle en e la projection du graphe de f sur G, qui est un isomorphisme. Cette projection  est donc localement inversible, et l’inverse est de la forme x 7→ x, F (x) , où F est une application lisse d’un ouvert U de G contenant e dans un ouvert analogue V de H. Toujours d’après le théorème 4.23, si x1 et x2 sont dans U , le produit  (x1 , F (x1 )(x2 , F (x2 ) = x1 x2 , F (x1 )F (x2 ) est dans Y , et comme Y est le graphe de F , on a bien F (x1 x2 ) = F (x1 )F (x2 ). L’unicité du germe de F vient de l’unicité du germe de la variété intégrale du graphe de f . Remarque. Si G est simplement connexe, tout morphisme d’algèbres de Lie de G dans l’algèbre de Lie H d’un groupe de Lie H se relève en un morphisme de G dans H (voir [Stillwell], 9.6 ; à noter que l’auteur suppose également que H est simplement connexe, mais ne s’en sert pas). Les difficultés que nous venons de rencontrer justifient quelques compléments de topologie.

4.4. Digression sur les groupes topologiques Un groupe topologique est un groupe muni d’une topologie pour laquelle la multiplication et l’inverse sont continues. En particulier, les translations à droite et à gauche sont des homéomorphismes, ainsi que l’application inverse. Pour deux parties A et B du groupe, on pose AB

=

{ab , a ∈ a , b ∈ B}

n

=

{a1 a2 · · · an , ai ∈ A}

−1

=

{a−1 , a ∈ A}.

A A

Alors, si U ⊂ G est ouvert, AU et U A sont toujours ouverts : ce sont visiblement des réunions d’ouverts. De plus, la continuité de la multiplication et de l’inverse s’expriment de la façon suivante : Lemme 4.25. Pour tout ouvert U contenant e, il existe un ouvert V contenant e tel que V 2 ⊂ U , et un ouvert W contenant e tel que W −1 ⊂ U. En particulier, les ouverts symétriques (tels que U = U −1 ) forment une base de voisinages de e Par conséquent : Théorème 4.26. Pour un groupe topologique G, les conditions suivantes sont équivalentes : a) G est séparé. b) L’ensemble {e} réduit à l’élément neutre est fermé. c) Pour tout g ∈ G, {g} est fermé.

4 − Autour des groupes de Lie

157

Démonstration. Il est clair que a) implique b). De plus, les translations étant des homéomorphismes, les propriétés b) et c) sont équivalentes, et il suffit, pour prouver que ii implique c), de séparer l’élément neutre d’un g 6= e. Soit donc V un ouvert contenant e mais pas g. En vertu de la continuité de la multiplication, il existe un ouvert W contenant e tel que W · W ⊂ V , ouvert que l’on peut supposer symétrique en utilisant la continuité de x 7→ x−1 . Alors W et g · W sont deux ouverts disjoints contenant e et g respectivement. Pour étudier les sous-groupes d’un groupe topologique, il est utile de reprendre la même démarche qu’en algèbre, c’est-à-dire de faire opérer le sous-groupe sur le groupe. Rappelons que G opère sur lui-même à gauche et à droite (au moyen des translations à gauche et à droite respectivement), et que ces actions sont transitives. Les actions d’un sous-groupe H ⊂ G ne le sont plus dès que H 6= G. On introduit alors la relation d’équivalence xRy



∃h ∈ H

⇔ x

−1

tel que

y = Rh x

y ∈ H.

Les classes d’équivalence sont de la forme gH ; ce sont les orbites de l’action par translation à droite de H sur G. On les appelle aussi classes à gauche de G modulo H, ce qui est naturel puisque chacune d’elles est de la forme Lg H. L’ensemble quotient est noté G/H (G est écrit à gauche et H à droite, pour rappeler la situation que nous venons de décrire). Les translatés à gauche de deux éléments équivalents sont équivalents, donc les translations à gauche passent au quotient. Si l’on continue à noter Lg les transformations de G/H ainsi obtenues, on a encore Lg1 ◦ Lg2 = Lg1 g2 . Autrement dit, G opère à gauche sur G/H. Cette action est transitive. En effet, si x, y ∈ G/H sont représentés par x, y ∈ G, on a y = yx−1 x

et par suite

y = Lyx−1 x.

Notons enfin que Lg laisse fixe la classe de l’élément neutre (ce qui revient à dire au niveau du groupe que H est globalement invariant) si et seulement si g ∈ H. Exemple. Prenons pour G le groupe SO(n + 1) et pour H le sous-groupe formé des matrices   1 0···0 0     ..  A  . 0 où A ∈ SO(n). Alors g et g 0 sont équivalents modulo H si et seulement les matrices qui les représentent ont même première colonne. G/H est en bijection avec S n , et l’action de G sur G/H est tout simplement l’action habituelle de SO(n + 1) sur S n (comparer à l’exercice 14 du chapitre 2. Ainsi, S n s’identifie à SO(n + 1)/SO(n) (il

158

Introduction aux variétés différentielles

est sous-entendu que la réalisation de SO(n) comme sous-groupe de SO(n + 1) est celle décrite ci-dessus). Si maintenant on étudie la situation du point de vue topologique, on munit G/H de la topologie quotient : si p : G → G/H est l’application canonique, U ⊂ G/H est ouvert si et seulement si p−1 (U ) est ouvert dans G. Alors toute application continue de G dans un espace topologique X qui est constante sur les classes d’équivalence passe au quotient en une application continue de G/H dans X. On a en particulier une bijection continue de SO(n + 1)/SO(n) sur S n , qui est un homéomorphisme puisque ces deux espaces sont compacts. Quand nous saurons (à la fin du chapitre) faire de SO(n + 1)/SO(n) une variété lisse, nous montrerons que cette bijection est un difféomorphisme. Théorème 4.27. Soit G un groupe topologique et H un sous-groupe. Alors : a) l’application p : G → G/H est ouverte ; b) pour que G/H soit séparé, il faut et suffit que H soit un sous-groupe fermé de G ; c) si H est ouvert, G/H est muni de la topologie discrète. En particulier, tout sousgroupe ouvert d’un groupe topologique est fermé. Démonstration. a) Si U est ouvert, il en est de même de U H. Mais p−1 (p(U )) = U H. b) Si G/H est séparé, tout point est fermé, donc les classes d’équivalence sont des fermés de G. Supposons inversement H fermé. Soient x, y deux points distincts de G/H, et x, y ∈ G tels que p(x) = x et p(y) = y. Alors x et y ne sont pas équivalents : x n’appartient pas au fermé yH. Il existe un ouvert U contenant e tel que U x ∩ yH = ∅, et un ouvert V contenant e tel que V 2 ⊂ U . On a V 2 xH ∩ yH = ∅

et par suite

V xH ∩ V yH = ∅.

Alors p(V xH) et p(V yH) contiennent respectivement x et y, sont ouverts d’après a), et disjoints par construction. c) Si H est ouvert, toute classe d’équivalence est ouverte, et les points de G/H sont ouverts d’après a). Exemple. Comme nous l’avons vu, l’espace SO(n + 1)/SO(n) est homéomorphe à S n , l’homéomorphisme étant donné par l’application de SO(n + 1) dans S n qui à une matrice orthogonale associe sa première colonne. On en déduit le résultat cidessous. Il peut bien sûr se montrer de façon élémentaire, en utilisant la forme réduite des matrices orthogonales. Mais la méthode employée, qui se généralise à d’autres situations, mérite de retenir l’attention.

4 − Autour des groupes de Lie

159

Théorème 4.28. Pour tout n, le groupe SO(n) est connexe. On procède par récurrence sur n. D’abord SO(1) est le groupe à un élément, et SO(2) ' S 1 . La récurrence est mise en œuvre en appliquant le lemme suivant, important en lui-même. Lemme 4.29. Soit H un sous-groupe d’un groupe topologique G. Si G/H et H sont connexes, G l’est aussi. Démonstration. Il suffit de vérifier que toute application continue f de G dans un ensemble discret à deux éléments D est constante. D’abord, H étant connexe, toutes les classes d’équivalence de G modulo H le sont, donc f est constante sur les classes d’équivalence, et passe au quotient en une application continue f : G/H → D. Mais G/H étant connexe, f est constante, ainsi que f = f ◦ p. Remarque. On peut montrer sans peine suivant la même idée que l’espace total d’une fibration est connexe dès que la base et la fibre le sont. En fait, ce lemme n’est qu’un cas particulier de ce dernier résultat : nous verrons que p : G → G/H est une fibration. L’énoncé suivant, par contre, est spécifique aux groupes. Proposition 4.30. Soit V un ouvert connexe symétrique (V −1 = V ) contenant e et G0 la composante connexe de l’élément neutre de G. Alors n G0 = ∪∞ n=1 V ,

et G0 est un sous-groupe distingué de G. n Démonstration. Tout d’abord, ∪∞ est un sous-groupe de G, ouvert puisque c’est n=1 V une réunion d’ouverts, donc fermé d’après le théorème 4.27. C’est aussi une partie connexe de G : en effet, V n est l’image du connexe n fois

z }| { V × ···V

par l’application continue (g1 , g2 , . . . , gn ) → g1 g2 . . . gn

de Gn dans G. On a donc une réunion de connexes dont l’intersection contient e. n Finalement, ∪∞ n=1 V , est ouvert, fermé et connexe, c’est donc la composante connexe de G. De plus, quel que soit g ∈ G, le conjugué gG0 g −1 de Go est connexe et contient e (c’est un sous-groupe !), donc est inclus dans G0 . Corollaire 4.31. Si G est un groupe de Lie, G0 est engendré par exp G. En particulier, G0 est dénombrable à l’infini. Démonstration. On applique ce qui précède à V = exp U , où U ⊂ G est un ouvert symétrique contenant 0 sur lequel exp est un difféomorphisme. Donnons maintenant quelques informations sur les sous-groupes discrets des groupes topologiques et des groupes de Lie.

160

Introduction aux variétés différentielles

Définition 4.32. Un sous-groupe Γ d’un groupe topologique G est discret si la topologie induite par G sur Γ est la topologie discrète. Commençons par une propriété élémentaire. Proposition 4.33. Dans un groupe topologique séparé, tout sous-groupe discret est fermé. Démonstration. Soit Γ un sous-groupe discret de G, et x ∈ Γ \ Γ. Pour tout ouvert symétrique contenant e, l’ouvert xV rencontre Γ. Soit γ ∈ xV ∩Γ. D’après l’hypothèse de séparation, il existe un ouvert symétrique W contenant e, tel que γ ∈ / xW . Mais xW contient lui aussi un γ 0 de Γ. Alors γ −1 γ 0 ∈ V 2 . Mais γ 6= γ 0 , et Γ est discret : cela est impossible pour un bon choix de V . Pour en dire un peu plus, il est naturel de supposer le groupe ambient connexe : sinon, en prenant le produit d’un groupe par un autre muni de la topologie discrète, on peut réaliser n’importe quel groupe comme sous-groupe discret d’un groupe de Lie. Proposition 4.34. Soit G un groupe connexe, et Γ un sous-groupe distingué et discret. Alors Γ est inclus dans le centre de G. Démonstration. Pour γ in Γ fixé, l’application x 7→ xγx−1 envoie G dans Γ puisque Γ est distingué. C’est une application continue, donc son image est connexe. Comme elle est aussi discrète, elle est réduite à un point. En prenant x = e, on voit que ce point est γ. De tels groupes jouent un rôle important quand on considère les revêtements de groupes topologiques. Nous ne parlerons ici (un peu) que des revêtements de groupes de Lie, laissant les généralisations (faciles) au lecteur. Définition 4.35. Un revêtement de groupes de Lie est un morphisme de groupes p : G → H qui est un revêtement des variétés sous-jacentes. Leur caractérisation est très simple. Théorème 4.36. Soit Γ un sous-groupe distingué et discret d’un groupe de Lie G. Alors il existe sur le quotient G/Γ une unique structure de groupe de Lie telle que l’application canonique π : G → G/Γ soit un revêtement de groupes de Lie. Inversement, soit p : G → H un morphisme de groupes de Lie tel que Te p soit un isomorphisme. Alors p est un revêtement, le noyau p−1 (e) est un sous-groupe distingué et discret, et p donne par passage au quotient un isomorphisme de groupes de Lie entre G/p−1 (e) et H. Démonstration. L’action de Γ = p−1 (e) par translations (disons à droite) est évidemment libre, elle est aussi propre : si A et B sont deux compacts de G, l’ensemble des γ ∈ Γ tels que γ(A) rencontre B est égal à Γ ∩ AB −1 . C’est l’intersection d’un compact avec une partie discrète, donc un ensemble fini. D’après le théorème 2.38, le quotient G/Γ admet une unique structure de variété telle que π : G → G/Γ soit un revêtement.

4 − Autour des groupes de Lie

161

Par ailleurs, π est un morphisme de groupe car Γ est distingué. Reste à vérifier que G/Γ est un groupe de Lie. Il suffit de remarquer que l’action de Γ × Γ sur G × G  obtenue en posant (γ, γ 0 )(x, y) = γ(x), γ 0 (y) est encore propre et libre. L’application (x, y) 7→ π(xy) donne par passage au quotient une application lisse qui est justement la multiplication dans G/Γ. Inversement, si p : G → H est morphisme tel que Te p soit inversible, d’après le lemme 4.22 p est un difféomorphisme local. Il en résulte que p−1 (e) est discret, il est fermé parce que c’est un sous-groupe, d’après la proposition 4.33. Il est distingué parce que p est un morphisme de groupes. Soit U un ouvert contenant l‘élément neutre de G tel que p|U soit un difféomorphisme sur son image V et tel que U · U ∩ p−1 (e) = {e}. Alors p−1 (V ) est la réunion disjointe des γ · U quand γ parcourt p−1 (e), et la restriction de p à chacun d’eux est un difféomorphisme. Pour tout h ∈ H, p−1 hV jouit d’une propriété analogue, ce qui montre que p est un revêtement. Soit π : G → G/p−1 (e) le revêtement obtenu dans la première partie du théorème. Il existe alors une application p : G/p−1 (e) → H telle que p = p ◦ π. Comme π et p sont des difféomorphismes locaux, p aussi. Par ailleurs, pour des raisons algébriques, p est un isomorphisme de groupes. C’est donc bien un isomorphisme de groupes de Lie. Remarques a) Le fait que dans cette situation p−1 (e) soit abélien et même contenu dans le centre n’a pas servi. Mais cette propriété a son importance, elle est liée au fait que le groupe fondamental d’un groupe de Lie est abélien (voir l’exercice 18). b) Le début de la démonstration n’utilise pas que Γ soit distingué. On en déduit que si Γ est un sous-groupe discret d’un groupe de Lie G, il existe sur le quotient G/Γ une unique structure de variété telle que π : G → G/Γ soit un revêtement. On peut en principe construire ainsi une foule de variétés. Mais il est en général très difficile de construire des sous-groupes discrets “assez gros” (c’est-à-dire par exemple tels que G/Γ soit compact) d’un groupe de Lie donné. Pour un exemple d’une telle construction avec G = Sl(2, R), voir [Godement], 1.5. c) Des exemples de revêtements sont donnés dans les exercices 5 et 9. Ce théorème ôte tout espoir de caractériser un groupe de Lie, même connexe, par son algèbre de Lie. On peut cependant préciser le “troisième théorème de Lie” (appelé aussi théorème de Cartan) de la façon suivante. Théorème 4.37. Soit G une algèbre de Lie de dimension finie. Il existe, à isomorphisme près, un unique groupe de Lie simplement connexe G dont G est l’algèbre de Lie. De plus, tout groupe de Lie connexe d’algèbre de Lie G est isomorphe au quotient de G par un sous-groupe distingué et discret. Pour la preuve, qui utilise de longs développements de la théorie, voir par exemple [Postnikov].

162

Introduction aux variétés différentielles

4.5. Groupes de Lie commutatifs 4.5.1. Un théorème de structure Nous allons maintenant voir un exemple simple, mais important, où l’on peut décrire à l’aide des techniques ci-dessus tous les groupes de Lie connexes d’algèbre de Lie donnée. Théorème 4.38. L’algèbre de Lie G d’un groupe de Lie commutatif est abélienne. Inversement, un groupe de Lie connexe dont l’algèbre de Lie est abélienne est commutatif. Plus précisément, un tel groupe est isomorphe au quotient de son algèbre de Lie (vue comme groupe additif ) par un sous-groupe discret. Démonstration. Si G est commutatif, en particulier g exp tXg −1 = exp tX quels que soient g ∈ G et X ∈ G, et en dérivant par rapport à t il vient pour t = 0 : Ad g · X = X. En écrivant cette relation pour g = exp tY et en redérivant par rapport à t, on trouve que [X, Y ] = 0. Inversement, on a le Lemme 4.39. Si deux éléments X et Y de l’algèbre de Lie d’un groupe G commutent, alors exp X et exp Y commutent, et exp(X + Y ) = (exp X)(exp Y ). Démonstration. Il suffit de “remonter” le raisonnement précédent. Posant f (t) = Ad exp tX, on voit d’abord que d f (t) · Y|t=0 = 0, dt puis que d d d f (t) · Y|t=u = f (t + u) · Y|u=0 = f (u) · f (t) · Y|t=0 = 0. dt dt dt Ainsi, Ad exp tX · Y = Y pour tout t, ce qui veut dire que les sous-groupes à un paramètre s 7→ exp sY et s→ 7 exp tX exp sY exp −tX ont même générateur infinitésimal, et donc sont égaux. Pour prouver la deuxième assertion, il suffit de remarquer que dans ces conditions, t 7→ (exp tX)(exp tY ) est encore un sous-groupe à un paramètre. On a donc (exp tX)(exp tY ) = exp tZ , où Z =

d (exp tX)(exp tY )t=0 = X + Y. dt

Fin de la preuve. Nous venons de voir que exp est un morphisme du groupe additif de G dans G. C’est un difféomorphisme local en 0, donc partout d’après le lemme 4.22. Par conséquent, exp G est un sous-groupe ouvert de G0 , donc fermé d’après le théorème 4.27, et égal à G tout entier puisque G est connexe. De plus, exp est un revêtement d’après l’exercice 4. D’après le théorème 4.36, G est donc isomorphe, en tant que groupe de Lie, au quotient de G par le sous-groupe discret Ker(exp).

4 − Autour des groupes de Lie

163

Reste à déterminer la structure des sous-groupes discrets d’un espace vectoriel réel. Théorème 4.40. Les sous-groupes discrets d’un espace vectoriel réel de dimension finie sont les sous-groupes engendrés en tant que groupes additifs par k vecteurs indépendants. Démonstration. Montrons d’abord que si v1 , . . . , vk sont k vecteurs indépendants, l’ensemble Γ des combinaisons linéaires à coefficients entiers des vi est discret dans l’espace vectoriel E. Il suffit de vérifier que pour tout compact K de E, K ∩ Γ est fini. On complète les vi en une base de E. Soit N la norme sup associée à cette base. Comme toutes les normes sur un espace vectoriel de dimension Pk finie sont équivalentes, Il existe un C > 0 tel que K ⊂ BN (0, C). Alors, si γ = i=1 pi vi est dans Γ, on a |pi | ≤ C pour tout i, et donc card(Γ ∩ K) ≤ (2C + 1)n , si n est la dimension de E. La réciproque se montre par récurrence sur n. Soit Γ un sous-groupe discret. Tout voisinage compact de 0 ne contient qu’un nombre fini d’éléments de Γ. Si n = 1 et Γ 6= {0}, il existe alors un v ∈ Γ non nul et de valeur absolue minimale, qu’on peut supposer positif. Pour x ∈ Γ, on écrit x = nv + r

avec

n ∈ Z , 0 ≤ r < v.

Alors r = x − nv ∈ Γ, ce qui n’est possible que si r = 0. Supposons maintenant le résultat vrai pour n, et montrons qu’il est vrai pour n + 1. Comme Γ est discret, il contient, s’il n’est pas réduit à {0}, un élément non nul v0 de norme minimale. Alors la distance de Γ \ Zv0 à la droite Rv0 est strictement positive. Sinon il existerait une suite (wk ) de points de Γ \ Zv0 et une suite λk de réels telles que lim kwk − λk v0 k = 0. k→∞

On écrit λk = [λk ] + µk , avec [λk ] ∈ Z et |µk | < 1/2, et on en tire que lim k(wk − [λk ]v0 ) − µk v0 k = 0.

k→∞

Alors pour k assez grand l’élément wk − [λk ]v0 ) de Γ \ Zv0 a une norme strictement inférieure à celle de v0 , ce qui est contraire à l’hypothèse. Si p désigne l’application de passage au quotient de E dans E/Rv0 , le sous-groupe p(Γ) de E/Rv0 est alors discret. D’après l’hypothèse de récurrence il existe des vecteurs f1 , . . . , fk de E/Rv0 tels que k M p(Γ) = Zfi . i=1

Soient v1 , . . . , vk ∈ Γ tels que p(vi ) = fi . Alors, si x ∈ Γ, on a p(x) =

k X

n i fi ,

avec

ni ∈ Z

i=1

et par suite x−

k X i=1

ni vi ∈ Re ∩ Γ = Zv0 .

164

Introduction aux variétés différentielles

Définitions 4.41. a) L’entier k, qui ne dépend pas du choix des vi puisque c’est la dimension de l’espace vectoriel engendré par Γ, est le rang de Γ. b) Un sous-groupe discret de rang maximum d’un espace vectoriel s’appelle un réseau. L’utilisation simultanée des deux théorèmes ci-dessus donne le résultat suivant : Corollaire 4.42. Tout groupe de Lie commutatif connexe est isomorphe à Rp ×(S 1 )q , et à (S 1 )q s’il est compact. En souvenir de la dimension 2, il est d’usage d’appeler tores les groupes de Lie compacts connexes commutatifs, et de noter T q le tore de dimension q. Remarque. L’étude métrique des réseaux est un problème arithmétique profond. Voir [Martinet].

4.5.2. Vers les courbes elliptiques Soit P ∈ C[X, Y, T ] un polynôme homogène de degré 3, et E ⊂ P 2 C l’ensemble des points du plan projectif complexe dont les coordonnées homogènes vérifient P (x, y, t) = 0. D’aprés la sous-section 2.6.2, si les dérivées partielles de P ne s’annulent pas simultanément en dehors de l’origine, E est une sous-variété. On dit que E est une cubique lisse. On peut se ramener, moyennant des techniques algébriques qu’il n’y a pas lieu de développer ici, au cas où P (X, Y, T ) = Y 2 T − X 3 − pXT 2 − qT 3

(cubique de Weierstrass).

Alors E est une variété si et seulement si les trois racines du polynôme X 3 +pX +q sont distinctes ; de plus on vérifie directement que E est connexe par arcs, donc connexe. De plus, on peut munir E d’une structure de groupe, de la façon suivante. On choisit un point O une fois pour toutes. Pour deux points A et B de E, si R est le troisième point d’intersection de la droite projective AB avec E (si A = B, on prend la tangente en A), A + B est le troisième point d’intersection de la droite OR avec C. Il est clair que c’est une loi commutative d’élément neutre O, et que cette loi est lisse. Il est plus délicat (c’est un joli argument de géométrie algébrique classique expliqué dans [Hellegouarch], p. 196–198) de voir que cette loi est associative. Ainsi, d’après le corollaire 4.42, E est difféomorphe, en tant que variété réelle, à un tore de dimension 2 (une autre preuve de ce résultat est traitée dans exercice 8 du chapitre 8). ** En fait, en utilisant la remarque qui suit la définition de l’espace projectif complexe (voir la section 2.5), on voit que E est une variété complexe de dimension 1 et que la loi de composition que nous venons de définir est holomorphe. En adaptant les arguments de cette section au cas complexe, on voit que E est C-difféomorphe à C/Γ, où Γ est un résau de dimension 2. Réciproquement, à l’aide de la fonction ℘Γ attachée au réseau Γ (fonction elliptique de Weierstrass), on construit un C-difféomorphisme de C/Γ sur une cubique de Weierstrass (voir [Hellegouarch], p. 83–88). Une telle courbe est appelée courbe elliptique parce qu’elle peut être paramétrée par des fonctions elliptiques. **

4 − Autour des groupes de Lie

165

Notons aussi, bien que nous n’ayions pas eu besoin de cette propriété, qu’un groupe de Lie complexe compact et connexe est commutatif (voir l’exercice 18). On tombe ainsi sur le monde des tores complexes, c’est-à-dire des variétés complexes Cn /Γ, où Γ est un réseau de dimension 2n. C’est aussi monde très riche (voir par exemple [Debarre]).

4.6. Espaces homogènes Nous avons vu que si G est un groupe topologique et H ⊂ G un sous-groupe fermé, l’espace quotient G/H des classes à gauche de G modulo H est un espace topologique séparé, et que les translations à gauche de G passent au quotient en donnant une action à gauche transitive de G sur G/H. Si on suppose de plus que G est un groupe de Lie, on peut dire beaucoup plus. Notons d’abord que H est automatiquement un sous-groupe de Lie, en vertu du résultat suivant, que nous admettrons (voir par exemple [Mneimé–Testard]). Théorème 4.43 (de Cartan–von Neumann, admis). Tout sous-groupe fermé d’un groupe de Lie est un sous-groupe de Lie. Exemple. Le groupe des automorphisme d’une algèbre de Lie G de dimension finie est un groupe de Lie : c’est évidemment un sous-groupe fermé de Gl(G). Remarque. Ce résultat nous dispense apparemment de démontrer que SO(n), U (n), SU (n), sont des groupes de Lie, puisque ce sont des sous-groupes fermés du groupe linéaire réel ou complexe. Il ne nous dispense pas de déterminer l’algèbre de Lie si nous voulons en savoir plus sur le groupe étudié (ne fût-ce que sa dimension). Théorème 4.44. Si H est un sous-groupe fermé d’un groupe de Lie G, il existe sur l’espace quotient G/H une unique structure de variété lisse telle que l’application de passage au quotient p : G → G/H soit une submersion. L’idée, comme toujours avec les variétés, est de se laisser guider par l’algèbre linéaire, et plus précisément ici par le fait que l’espace vectoriel quotient G/H est isomorphe à un supplémentaire de H dans G. Lemme 4.45. Soit M ⊂ G un supplémentaire de H. Alors il existe des ouverts U ⊂ M et V ⊂ H, contenant 0, tels que l’application f définie par f (X, Y ) = (exp X)(exp Y ) soit un difféomorphisme de U × V sur son image dans G. Démonstration. C’est immédiat d’après le théorème d’inversion locale, la différentielle de f en 0 étant l’application M (X, Y ) → X + Y de G dans M H.

166

Introduction aux variétés différentielles

Lemme 4.46. Avec les mêmes hypothèses, il existe un ouvert U contenant 0 dans M tel que pour tout g ∈ G, l’application φg donnée X → p(g exp X) soit un homéomorphisme de U sur son image. Démonstration. Il suffit d’étudier le cas g = e. Choisissons U, V comme dans le lemme précédent, avec la condition supplémentaire que, si W = f (U × V ), W 3 est encore contenu dans un ouvert auquel ce lemme s’applique. Alors si X, X 0 ont même image par φ, on a exp X 0 = exp Xh avec h ∈ H ∩ W 2, et en appliquant le lemme 4.45 à W 3 , on voit que X = X 0 et h = e. De plus, φ est ouverte, car si U 0 est un sous-ouvert de U , alors f (U 0 × V ) est ouvert dans G, et donc son image par p l’est aussi d’après le théorème 4.27. Mais φ(U 0 ) = p(f (U 0 × V )).

2

Démonstration du théorème. Choisissons un ouvert U contenant 0 dans M comme dans le lemme précédent. Ce lemme dit précisément que G/H est une variété C 0 de cartes (p(g exp U ), φ−1 g ). Si nous voulons que p soit une submersion pour une structure C ∞ , il faut que les φg soient des difféomorphismes. Cela donne l’unicité de la structure lisse, et pour montrer son existence, il suffit de vérifier la condition de compatibilité. Soient g et g 0 tels que T = p(g exp U ) ∩ p(g 0 exp U ) 6= ∅. Un x ∈ T s’écrit d’une façon unique sous la forme p(g exp X) ou p(g 0 exp X 0 ), et −1 nous devons vérifier que l’application X 7→ X 0 de φ−1 g (T ) dans φg 0 (T ) est lisse. Pour −1 X0 ∈ φg (T ), il existe un (unique) h ∈ H tel que g exp X0 h = g 0 exp X00 . La translation à droite Rh est un difféomorphisme, et on peut donc trouver des sousouverts W1 et W10 de g exp W et g 0 exp W respectivement, contenant respectivement g exp X0 et g 0 exp X00 , tels que Rh W1 = W10 . Mais si X est tel que g exp X ∈ W1 , le lemme 4.45 et le théorème des fonctions composées nous disent que g exp Xh s’écrit g 0 exp X 0 exp Y , l’application X 7→ X 0 étant lisse, et d’autre part p(g exp X) = p(g exp Xh) = p(g 0 exp X 0 exp Y ) = p(g 0 exp X 0 ). Corollaire 4.47. Sous les mêmes hypothèses : a) p admet des sections locales, autrement dit pour tout x ∈ G/H il existe un ouvert U contenant x et une application lisse σ:U →G

telle que

p ◦ σ = Id|U ;

b) en particulier, p est une fibration de fibre type H ;

4 − Autour des groupes de Lie

167

c) Si X est une variété et f une application de G/H dans X, alors f est lisse si et seulement si f ◦ p : G 7→ X est lisse. Démonstration. D’après la preuve qui précède, et avec les mêmes notations, l’application σ : p(g exp U ) 7→ G qui à x ∈ g exp U associe g exp φ−1 g (x), (ou moins formellement, qui à p(g exp X) associe g exp X) est une section lisse au dessus de p(exp U ). Dans ces conditions, on obtient un difféomorphisme explicite entre p−1 (p(exp U )) et p(exp(U ) × H, donné par  −1  h(g) = p(g), g σ(p(g)) . Enfin, si f : G/H 7→ X est telle que f ◦ p soit lisse, et si U est un ouvert de G/H au dessus duquel p admet une section, f|U = f|U ◦ (p ◦ σ|U ) = (f|U ◦ p) ◦ σ|U est bien lisse. Ce que nous venons de voir est un exemple de la situation suivante : Définition 4.48. Une action à gauche d’un groupe de Lie G sur une variété lisse X est une application lisse (g, x) → g ·x de G×X dans X telle que g1 ·(g2 ·x) = (g1 g2 )·x. On a ici une action de G sur G/H donnée par g · x = p(gg 0 ) si x = p(g 0 ). Il est clair que le résultat ne dépend pas de g 0 et la lissité se voit comme dans le corollaire 4.47 en utilisant une section locale. Les propriétés vues en 2.7.1 pour les groupes discrets ont leurs analogues. La définition d’une action libre ou effective est la même, pour une action propre on remplace dans la définition 2.34 fini par compact. Une notion nouvelle apparaît, celle d’action presque effective, ce qui signifie que le sous-groupe Gid = {g ∈ G, ∀x ∈ Xg · x = x} est un sous-groupe discret de G. Dans la pratique, quand on travaille avec des sousgroupes de groupes linéaires, on préfère travailler avec des actions presque effectives plutôt que de passer au quotient (par exemple, la plupart des actions considérées dans les exercices sont seulement presque effectives). Nous allons voir maintenant que toute variété lisse sur laquelle un groupe de Lie opère transitivement est de la forme décrite dans le théorème 4.44. Théorème 4.49. Soit X une variété munie d’une action lisse et transitive d’un groupe de Lie G ayant un nombre fini de composantes connexes. Pour a ∈ X, le stabilisateur Ga = {g ∈ G , g · a = a} de a est un sous-groupe de Lie, et l’application F : g → g · a passe au quotient en un difféomorphisme de G/Ga sur X.

168

Introduction aux variétés différentielles

Lemme 4.50. F est une submersion. Démonstration. Du fait que les applications x 7→ g · x sont des difféomorphismes de X, le rang r de F est constant. Posons n = dim G, p = dim X. D’après le théorème du rang constant (voir l’exercice 10 du chapitre 1), il existe pour tout g ∈ G un ouvert U de G contenant g, un ouvert V de X contenant g · a, et des difféomorphismes φ, ψ de U et V sur des ouverts de Rn et Rp respectivement tels que  ψ ◦ F ◦ φ−1 (u1 , · · · , un ) = (u1 , · · · , ur , 0, · · · , 0). Cette formule montre que F (U ) est une sous-variété de X de dimension p − r, donc une partie négligeable de X si r < p. Mais les ouverts U forment un recouvrement de G, dont on peut extraire un sous-recouvrement dénombrable (voir la section 2.8). Donc F (G) est une partie négligeable de X. Comme d’autre part F (G) = X en raison de la transitivité, on aboutit à une contradiction. Preuve du théorème. D’après le lemme, Ga = F −1 (a) est une sous-variété de dimension n − p (notons que l’utilisation du théorème du rang constant rend inutile l’utilisation du résultat général sur les sous-groupes fermés des groupes de Lie). Si h ∈ Ga , on a F (gh) = gh · a = g · (h · a) = g · a = F (g), donc F passe au quotient, et donne une application lisse f de G/Ga dans X d’après la partie c) du corollaire 4.47. Comme Tg F = Tp(g) f ◦ Tg p, on voit que f est une submersion, donc un difféomorphisme local pour des raisons de dimension, et enfin du difféomorphisme puisque c’est une bijection. 2 Remarque. Si b est un autre point de X, et si g ∈ G est tel que g · a = b, alors la conjugaison h → ghg −1 donne un isomorphisme entre Ga et Gb , et aussi par passages aux quotients un difféomorphisme de G/Ga sur G/Gb . Définition 4.51. On appelle espace homogène différentiel (ce dernier adjectif sera le plus souvent omis) de groupe G (mention facultative) une variété lisse sur laquelle un groupe de Lie G opère transitivement. Il est important de noter qu’il peut très bien exister plusieurs actions transitives sur la même variété. C’est le cas par exemple pour les sphères de dimension impaire (pour plus de précisions, voir l’exercice 13). Exemple : grassmanniennes La p-grassmannienne d’un espace vectoriel E, notée Gp (E), est l’ensemble de ses sousespaces vectoriels de dimension p. Si E = Rn , on écrit Gn,p . Il est clair que l’action naturelle de Gl(n, R) sur Rn donne une action transitive sur Gn,p . Le sous-groupe

4 − Autour des groupes de Lie

169

Tn,p formé des applications linéaires qui laissent stablent le plan P0 engendré par les p premiers vecteurs de la base canonique est donné par les matrices de la forme   A B 0 C où A et C sont des matrices inversibles d’ordres respectifs p et n − p, et B une matrice à p lignes et n − p colonnes. Ainsi, Gn,p est en bijection avec Gl(n, R)/Tn,p , et en hérite une structure de variété lisse. On peut aussi munir Rn du produit scalaire naturel et faire opérer le groupe orthogonal sur Gn,p . L’action est toujours transitive, puisque tout système orthonormé de vecteurs peut être complété en une base orthonormée. Un g ∈ O(n) qui laisse P0 stable laisse aussi stable P0⊥ , et est donc de la forme   A 0 , 0 C où A ∈ O(p) et C ∈ O(n − p). Ainsi, Gn,p apparaît également comme l’espace homogène O(n)/O(p) × O(n − p). Le lecteur est invité à vérifier à l’aide du théorème 4.44 que ces deux représentations donnent la même structure de variété. Au passage, il est utile de noter que Gn,1 = P n−1 R et que dim Gn,p = p(n − p).

4.7. Commentaires Mesure de Haar Nous verrons dans les exercices du chapitre 6 une propriété élémentaire (et importante) des groupes de Lie : l’existence d’une mesure invariante par translation. Cette mesure, appelée mesure de Haar, existe pour tout groupe localement compact, mais le cas des groupes de Lie est sensiblement plus facile à traiter.

Structure analytique Contrairement à ce qui se passe pour les variétés, on dispose sur un groupe de Lie, avec l’exponentielle et son inverse locale, d’une paramètrisation et d’une carte privilégiées. Il est donc naturel de chercher à exprimer la multiplication dans cette carte. La formule de Campbell–Hausdorff assure que exp X exp Y = exp H(X, Y ), où H : G × G → G est analytique au voisinage de 0. De plus, c’est la somme d’une série de monômes de Lie, c’est-à-dire d’expressions faisant intervenir uniquement des crochets itérés de X et Y . On a 1 1 1 H(X, Y ) = X + Y + [X, Y ] + [X, [X, Y ]] + [Y, [Y, Y ]] + ... 2 12 12 En particulier, au voisinage de l’élément neutre, la multiplication est donnée par le crochet. On trouvera une preuve astucieuse et (relativement) simple au chapitre 7 de [Stillwell].

170

Introduction aux variétés différentielles

Quelques mots sur la classification Pour aller plus loin, une étude approfondie des algèbres de Lie est nécessaire. Par exemple, le résultat annoncé dans l’introduction, suivant lequel tout groupe de Lie est localement isomorphe à un sous-groupe du groupe linéaire, s’obtient en combinant le résultat analogue sur les algèbres de Lie (théorème d’Ado, voir [Postnikov]) et le troisième théorème de Lie. Mais il existe des groupes de Lie qui ne sont isomorphes à aucun sous-groupe d’un groupe linéaire : c’est le cas du revêtement universel de Sl(2, R). Pour les détails, voir [Doubrovine–Novikov–Fomenko] (tome 2, chap. I, §3). C’est de la belle géométrie. Ce revêtement universel est aussi traité d’une façon très détaillée dans [Godement], 2.7. L’un des aboutissements de la théorie est la classification des algèbres de Lie simples (c’est-à-dire sans idéal non trivial), d’où l’on déduit entre autres la classification des groupes compacts presque simples (c’est-à-dire sans sous-groupe distingué non discret). Modulo des revêtements finis, ou des quotients par un groupe fini, on obtient la liste suivante : SO(n) n 6= 4; SU (n) ; Sp(n) (ce dernier groupe est défini dans le corrigé de l’exercice 13), et cinq groupes dits exceptionnels (voir [Onishschik–Vinberg]). On trouvera dans [Berger] une démonstration purement géométrique de la simplicité de SO(n) pour n = 3 ou n > 4, et dans le chapitre 6 de [Stillwell] une preuve élémentaire de la simplicité des algèbres de Lie correspondantes. Pour la non simplicité de SO(4), voir la dernière question de l’exercice 5.

Groupes de Lie “infinis” Le groupe des difféomorphismes d’une variété compacte, le groupe des difféomorphismes préservant une forme volume ou une forme symplectique sont parfois appelés “groupes de Lie infinis”, infini voulant dire ici de dimension infinie. Mais de sérieuses difficultés se présentent. Par exemple les difféomorphismes C k forment certes un groupe. Mais le simple examen de la preuve de la proposition 1.43 montre que la multiplication est différentiable pour une norme C k−1 seulement. Ce problème se voit déjà au niveau des champs de vecteurs, puisque le crochet de deux champs C k n’est que C k−1 . Dans le cas lisse, pour avoir une bonne notion de différentiabilité de la loi de composition, il faut sortir du cadre des espaces normés (voir [Hamilton], p. 148 pour une description détaillée). Ainsi, même si par exemple la caractérisation des sous-groupes à un paramètre vue dans la section 1.6 est valable dans le cadre banachique, cela n’est d’aucun secours. Un champ de vecteurs X sur une variété compacte M donnant naissance à un groupe à un paramètre de difféomorphismes, il tentant néanmoins de dire que le groupe Diff(M ) des difféomorphismes lisses de M est un groupe de Lie, son algèbre de Lie étant C ∞ (T M ). Après tout, C ∞ (T M ) est bel et bien une algèbre de Lie, et on peut définir l’exponentielle comme dans le cas classique, en posant exp X = φX 1 . Mais même pour la variété compacte la plus simple qui soit, le cercle S 1 , il existe des difféomorphismes arbitrairement proches de l’identité qui ne sont pas la valeur au temps

4 − Autour des groupes de Lie

171

1 d’un flot (pour un exemple, voir [Pressley–Segal], 3.3). L’application exponentielle n’est donc pas un difféomorphisme local en 0, ce qui est très gênant. Cela n’empêche pas les groupes des difféomorphismes des variétés d’être très activement étudié, mais c’est une autre histoire. Pour deux aspects très différents de l’étude de Diff(S 1 ), voir [Hector–Hirsch] (pour l’aspect “systèmes dynamiques”) et [Pressley–Segal] (pour l’aspect “représentations”).

4.8. Exercices 1. Le groupe du plan artinien 1 a) Montrer que les matrices de la forme  cosh t sinh t

 sinh t cosh t

forment un groupe de Lie isomorphe à R. b) Montrer que ce groupe est la composante neutre du groupe O(1, 1) des matrices qui conservent la forme quadratique x2 − y 2 , et que O(1, 1) a quatre composantes connexes. 2. Le corps des quaternions a) Montrer que les matrices complexes de la forme   u −v v u forment un sous-anneau de M2 (C) dont tout élément non nul est inversible, donc un corps. Ce corps s’appelle le corps des quaternions et se note H. b) Il est traditionnel (et commode) de poser      0 −1 i 0 0 I= ; J= ; K= 1 0 0 −i i

 i . 0

En désignant par E la matrice unité (2, 2), montrer que tout quaternion q s’écrit d’une manière unique sous la forme aE + bI + cJ + dK, où a, b, c, d sont réels, et que I 2 = J 2 = K 2 = −E, IJ = −JI = K, JK = −KJ = I, KI = −IK = J. c) On écrit désormais les quaternions sous cette dernière forme. On remplace alors E, I, J et K par les minuscules correspondantes. Le sous-ensemble RE de H est un sous-anneau isomorphe à R , et on l’identifiera à R. On on pose q = aE − bI − cJ − dK. 1. On appelle ainsi le plan muni de la forme quadratique x2 − y 2 .

172

Introduction aux variétés différentielles

Vérifier que qq = qq = (a2 + b2 + c2 + d2 ), (ce qui redémontre que tout élément non nul de H est inversible), et que q1 q2 = q2 q1 . On vérifiera aussi que le centre de H (c’est-à-dire l’ensemble des éléments de H qui commutent avec tout autre) est égal à R. On pose Re(q) = a, Im(q) = bI +cJ +dK. Un quaternion est dit réel si Im(q) = 0, (ce qui équivaut à q = q), imaginaire pur, ou plus brièvement pur si Re(q) = 0 (ce qui équivaut à q + q = 0). √ d) On pose enfin kqk = qq. C’est une norme sur H vu comme R-espace vectoriel d’après c). Montrer que kq1 q2 k = kq1 kkq2 k. 3. Le groupe multiplicatif des quaternions a) Montrer que le groupe multiplicatif H∗ de H est un groupe de Lie. b) Pour tout quaternion q, on pose exp(q) =

∞ X

q n /n!.

n=0

Montrer que le second membre est une série normalement convergente, et que si q et q 0 commutent, on a exp(q + q 0 ) = (exp(q))(exp(q 0 )) c) Montrer que tout sous-groupe à un paramètre du groupe multiplicatif H∗ est de la forme t → exp(tq). En déduire que l’algèbre de Lie de H∗ est H muni de sa structure d’espace vectoriel sur R et du crochet [q, q 0 ] = qq 0 − q 0 q. d) Montrer que le groupe multiplicatif des quaternions de norme 1 est isomorphe à SU (2). Enoncer et démontrer le résultat correspondant au niveau des algèbres de Lie. 4. Montrer qu’un morphisme étale de groupes de Lie est un revêtement. 5*. Quaternions et rotations a) On identifie R3 (en tant qu’espace vectoriel) aux quaternions purs. Si s est un quaternion de norme 1 et h un quaternion pur, on pose ρ(s) · h = shs. Montrer que ρ(s).h est encore un quaternion pur, et que l’application linéaire ρ(s) est dans O(3).

4 − Autour des groupes de Lie

173

b) Montrer que ρ(s) ∈ SO(3) (utiliser un argument de connexité). c) Montrer que ρ(s)ρ(s0 ) = ρ(ss0 ). Calculer la différentielle de ρ en e, et en déduire que ρ est un difféomorphisme local. d) Montrer que ρ est surjective, et que Ker(ρ) = ±e. En déduire que SO(3) est isomorphe à S 3 / ± e, ou encore à SU (2)/ ± I. e) Montrer que l’axe de la rotation ρ(s) est donné par la partie pure du quaternion s. Pour déterminer l’angle on procède comme suit : e1) Montrer que deux rotations conjuguées ont même angle. e2) Montrer que pour tout quaternion pur t de norme 1, il existe un quaternion q de norme 1 tel que qtq = i (utiliser la question d)). e3) Tout quaternion s de norme 1 s’écrit d’une façon unique sous la forme αe + βt, où t est un quaternion pur de norme 1, α et β étant des réels tels que α2 +β 2 = 1. Montrer que l’angle de la rotation ρ(s) ne dépend que de α et β et le calculer. e4) Application numérique : soient R1 et R2 les rotations d’angle 2π/3 d’axes respectifs (1, 1, 1) et (1, 1, −1). Déterminer la rotation R1 ◦ R2 . a) On considère de même l’application ρ1 de S 3 × S 3 dans Gl(R4 ) définie par ρ1 (s, t).q = sqt. En imitant ce qui précède, montrer que ρ1 est un morphisme surjectif de groupes de Lie de S 3 ×S 3 sur SO(4), et en déduire que SO(4) est isomorphe à S 3 ×S 3 /±I.

6. Idéaux et sous-groupes distingués Soit G un groupe de Lie et H un sous-groupe de Lie distingué de G. Montrer, en s’inspirant de la preuve du théorème 4.17, que l’algèbre de Lie H de H est un idéal de l’algèbre de lie G de G. Montrer qu’inversement, un sous-groupe de Lie connexe dont l’algèbre de Lie est un idéal est distingué. 7. Exemples d’exponentielles a) Vérifier que exp est surjective pour les groupes suivants : Gl(n, C) ; SO(n) ; U (n) ; le groupe des transformations affines x → ax + b de la droite réelle telles que a > 0. b) Montrer que le sous-ensemble N ⊂ Gl(3, R) des matrices de la forme   1 x z 0 1 y  0 0 1

174

Introduction aux variétés différentielles

est un sous-groupe de Lie, pour lequel l’application exponentielle est un difféomorphisme. c) Montrer que si A ∈ Sl(2, R), on a tr(A2 ) ≥ −2 (utiliser le théorème de Hamilton–Cayley). En déduire que pour Sl(2, R) l’exponentielle n’est pas surjective, et déterminer son image. 8. Montrer que tout morphisme de S 1 vu comme l’ensemble des complexes de module 1 est de la forme t 7→ tk , où k ∈ Z. 9. Comparaison entre SL(2, R) et le groupe de Lorentz en dimension 3 a) Montrer que sur l’espace vectoriel Sym(2) des matrices symétrique s d’ordre 2, le déterminant définit une forme quadratique de type (1, 2). b) Pour A ∈ Sl(2, R), et M ∈ S on pose ρ(A) · M = t AM A. Montrer que ρ définit un morphisme de Sl(2, R) dans O(1, 2). c) Montrer que Ker ρ = {±Id}, et que ρ est un revêtement. En déduire l’isomorphisme Sl(2, R)/{±I} ' SOo (1, 2). d*) Donner une autre démonstration de cet isomorphisme en utilisant l’exercice 16 du chapitre 2. 10*. Soit N le groupe de la question b) de l’exercice 6. Montrer que le sous-groupe NZ de N formé par matrices à coefficients entiers est discret, et que la variété N/NZ est compacte. 11*. Combien le groupe pseudo-orthogonal O(p, q) a-t-il de composantes connexes ? Indication : faire opérer O(p, q) sur la sous-variété de Rp+q d’équation −x21 − · · · − x2p + x2p+1 + · · · + x2p+q = 1. 12. Revêtement universel du groupe unitaire a) Soit ˜ (n) = {(A, t) ∈ U (n) × R, det(A) = e2iπt }. U ˜ (n) de la première projection est un revêtement de Montrer que la restriction à U groupes de Lie, de base U (n), et de noyau est I × Z. ˜ (n) est isomorphe à SU (n) × R. b) Montrer que U ˜ (n) est le revêtement universel de (Cela montre, d’après l’exercice suivant, que U U (n)).

4 − Autour des groupes de Lie

175

13. Quelques espaces homogènes a) Montrer les homéomorphismes suivants : S 2n+1 ' U (n + 1)/U (n) ' SU (n + 1)/SU (n). En déduire que les groupes SU (n) et U (n) sont connexes quel que soit n. b) Montrer que SU (n) est simplement connexe. c) Montrer que l’ensemble des matrices de la forme   det(A) 0 · · · 0   0   ,  .. A   . 0 où A ∈ O(n) forment un sous-groupe de SO(n + 1) isomorphe à O(n). Notant abusivement O(n) ce sous-groupe, établir l’homéomorphisme SO(n + 1)/O(n) ' P n R. d) Avec des notations analogues que l’on expliquera, établir l’homéomorphisme SU (n + 1)/U (n) ' P n C. e) Montrer que tous ces homéomorphismes sont des difféomorphismes. 14*. Orbites de l’action d’un groupe compact Soit G un groupe de Lie compact agissant différentiablement sur une variété lisse M. Montrer que les orbites de G (c’est-à-dire les parties de M de la forme G · x, où x ∈ M est fixé) sont des sous-variétés de M (indication : utiliser le théorème du rang constant et le théorème 4.49). On prend pour G le stabilisateur d’un point pour l’action naturelle de SO(n + 1) sur P n R. A quelles variétés les orbites de G dans P n R sont-elles difféomorphes ? Même question en remplaçant P n R par P n C et SO(n + 1) par SU (n + 1). 15. Montrer que sur l’espace vectoriel des polynômes, les opérateurs linéaires P 7→ P 0

P 7→ XP

et

Id

engendrent une algèbre de Lie isomorphe à celle du groupe de Heisenberg vu au début de ce chapitre (il s’agit là, sous une forme à peine simplifiée, la relation de commutation satisfaite par les opérateurs position – multiplication par x – et impulsion – dérivée – en mécanique quantique).

176

Introduction aux variétés différentielles

16*. Variété des matrices de rang donné Etudier les orbites de l’action de Gl(p, R) × Gl(q, R) sur Mp,q (R) donnée par (P, Q).M = P M Q−1 17*. ** Un groupe de Lie complexe est une variété analytique complexe (voir la section 2.5) munie d’une structure de groupe telle que l’application (g, h) 7→ gh−1 soit analytique complexe (c’est le cas de Gl(n, C) et Sl(n, C), mais absolument pas celui de U (n) ou SU (n) !). Montrer que tout groupe de Lie complexe compact et connexe est commutatif (utiliser la représentation adjointe). ** 18*. Revêtement universel d’un groupe de Lie ˜ → G un revêtement universel de G, et e˜ Soit G un groupe de Lie connexe, p : G ˜ un point de G tel que p(˜ e) = e. En appliquant le théorème de monodromie 2.45 à ˜ G ˜ dans G, montrer sur l’on a sur G ˜ une (unique) l’application (x, y) 7→ p(x)p(y) de G× structure de groupe de Lie d’élément neutre e˜ pour laquelle p est un morphisme. En déduire que le groupe fondamental d’un groupe de Lie est abélien.

Chapitre 5 Formes différentielles

5.1. Introduction 5.1.1. Des formes différentielles, pourquoi ? Existe-t-il une théorie de l’intégration sur les variétés et pour commencer sur les sousvariétés de dimension p de l’espace euclidien ? On peut partir de ce que l’on appelait autrefois l’intégrale curviligne, c’est-à-dire la circulation d’un champ de vecteurs V le long d’une courbe. Celle-ci est définie classiquement comme l’intégrale Z

b

hVc(t) , c0 (t)idt.

a n

Ici, c = [a, b] → R est une paramétrisation de la courbe (en fait d’un morceau de la courbe puisque nous avons restreint le paramétrage à un intervalle [a, b]) et h, i un produit scalaire euclidien sur Rn . Le remplacement des vecteurs Vc(t) par des formes linéaires αc(t) a l’avantage de ne plus faire intervenir de produit scalaire. On peut alors intégrer, sur des courbes d’une variété X quelconque, les “champs de formes linéaires” x 7→ αx , où αx est pour tout x ∈ X une forme linéaire sur le tangent Tx X, en posant Z Z b  α= αc(t) c0 (t) dt. c

a

Il nous faudra bien sûr préciser la régularité des αx par rapport à x. Cette question sera résolue de la même façon que pour les champs de vecteurs. Le passage aux sous-variétés de dimension p > 1 se fait en deux temps. Pour x fixé, c’est à dire du point de vue infinitésimal, on est ramené à un problème algébrique : définir un élément de volume pour tous les espaces vectoriels de dimension p (les différents espaces tangents possibles) d’un espace vectoriel de dimension n (en l’occurrence Rn ' Tx Rn ou Tx X, si X est la variété de dimension n ambiante). Sachant que le

178

Introduction aux variétés différentielles

volume des pavés en dimension n se calcule à l’aide de déterminants, et que les déterminants sont des formes n-linéaires alternées, on est amené à introduire des formes p-linéaires alternées, qui généralisent à la fois les formes linéaires et les déterminants. Ensuite, la dépendance par rapport à x se règle comme pour p = 1.

5.1.2. Résumé Les préliminaires algébriques (formes multilinéaires alternées) sont traités dans la section 5.2. On traite ensuite assez longuement, dans les quatre sections suivantes, les formes différentielles sur les ouverts de Rn . Ce sont des objets plus faciles à manipuler que les champs de vecteurs : toute application lisse φ : U → V (peu importent les dimensions des espaces où vivent U et V ) permet de “tirer en arrière” (on dit pull-back en anglais, mais hélas image réciproque en français) les formes différentielles sur V . La tirée en arrière d’une fonction f (forme de degré 0) est tout simplement f ◦ φ, et l’extension aux formes se fait sans peine en utilisant l’application linéaire tangente à φ. Mais le principal intérêt des formes différentielles est l’existence d’un opérateur linéaire d naturel (c’est à dire commutant avec les tirées en arrière d’applications lisses, l’énoncé précis est la proposition 5.22) qui associe à toute forme de degré p une forme de degré p + 1. Cet opérateur est la généralisation de la différentielle des fonctions (cas où p = 0). Il permet par exemple de donner une présentation unifiée du gradient, du rotationnel et de la divergence, et des propriétés algébriques de ces opérateurs. On en déduit dans la section 5.8 une écriture remarquablement concise des équations de Maxwell, sous une forme qui se généralise à d’autres situations physiques (voir par exemple [Atiyah]). La propriété fondamentale de cet opérateur est la nullité de d2 . C’est une générali2 2 sation du fait que ∂ij = ∂ji pour les fonctions lisses. Une question fondamentale est l’existence d’une réciproque à cette propriété. Par exemple si une forme de degré 1 vérifie dα = 0, existe-t-il une fonction telle que α = df ? D’après le lemme de Poincaré (voir la section 5.6) la réponse est oui (et pour tous les degrés) sur les ouverts difféomorphes à Rn . Elle est non en général. Un contre-exemple fondamental est cesur R2 \ {0}. Cela correspond au fait qu’il n’existe pas de lui de la forme xdy−ydx x2 +y 2 détermination continue de l’argument d’un nombre complexe. Notons enfin que, grâce au fait que d commute avec les images réciproques, et en particulier avec les images réciproques par difféomorphismes, la transcription de toutes ces propriétés aux variétés se fait sans douleur. Le lecteur laissé sur sa faim par cette introduction longue et néanmoins incomplète est fortement incité à lire l’introduction (au moins) de [Whitney]. Une autre belle référence, pour les motivations physiques, est [Misner–Thorne–Wheeler].

5 − Formes différentielles

179

5.2. Algèbre multilinéaire 5.2.1. Algèbre tensorielle Soit E un espace vectoriel sur un corps K. L’espace dual L(E, K) = E ∗ est l’espace vectoriel des applications K-linéaires de E dans K, appelées aussi formes linéaires. Supposons E de dimension finie n, et soit (ei )1≤i≤n une base. Si v=

n X

v i ei

i=1

est la décomposition d’un vecteur dans cette base, on note ei∗ la forme linéaire v 7→ v i , qui à tout vecteur associe sa i-ième coordonnée. Alors, si α ∈ E ∗ , on a α(v) =

n X

i

v α(ei ) =

i=1

n X

α(ei )ei∗ (v)

i=1

quel que soit v. Autrement dit la forme linéaire α apparaît comme la combinaison linéaire n X α(ei )ei∗ . α= i=1

En particulier, (e )1≤i≤n est une base de E ∗ , appelée base duale de (ei )1≤i≤n . i∗

Nous employons la convention d’Einstein. Quand on indexe une famille de vecteurs ou de champs de vecteurs, on écrit l’indice en bas. Un bon moyen mnémotechnique est de penser aux champs ∂i . Quand on indexe des formes, on place l’indice en haut, qu’il s’agisse de formes proprement dites comme les ei∗ , ou de leurs valeurs sur un vecteur comme les nombres v i . Quand on décompose un vecteur (resp. une forme) dans une base, on place les indices des coefficients en position supérieure (resp. inférieure) comme nous venons de le faire. Les physiciens en profitent pour convenir qu’une expression où un même indice figure à la fois en position supérieure et inférieure est une somme par rapport à cet indice. Nous n’omettrons jamais pour notre part les signes de sommation, tout en adoptant la convention ci-dessus pour l’emplacement des indices. Cet usage permet de rappeler brièvement à quel type d’être mathématique, vecteur ou forme, on a affaire. Définition 5.1. On appelle forme k-linéaire sur E toute application k fois

z }| { L : E × ···E → K telle que les applications partielles xr → L(x1 , . . . , xk ) soient des formes linéaires sur E. La somme de deux formes k-linéaires, le produit d’une forme k-linéaire par un nombre sont clairement des formes k-linéaires.

180

Introduction aux variétés différentielles

De plus, si on exprime les vecteurs (xr )1≤r≤k par rapport à une base (er )1≤r≤k donnée, on voit que L est déterminée par la donnée des nk nombres L(ei1 , ei2 , . . . , eik ) donc que les formes k-linéaires constituent un espace vectoriel de dimension nk . Définition 5.2. Le produit tensoriel d’une forme k-linéaire f et d’une forme llinéaire g est la forme (k + l)-linéaire donnée par  f ⊗ g (v1 , . . . , vk+l ) = f (v1 , . . . , vk )g(vk+1 , . . . , vk+l ).

Par exemple, si α et β sont deux formes linéaires, (α ⊗ β)(u, v) = α(u)β(v), ce qui montre au passage que α⊗β 6= β⊗α dès que α et β ne sont pas proportionnelles. La formule de définition montre que ⊗ définit quels que soient k et l une application bilinéaire de Lk (E, K) × Ll (E, K) dans Lk+l (E, K), et que l’on a toujours f ⊗ (g ⊗ h) = (f ⊗ g) ⊗ h, la valeur des deux membres pour le système (x1 , . . . , xk+l+m ) étant f (x1 , . . . , xk )g(xk+1 , . . . , xk+l )h(xk+l+1 , . . . , xk+l+m ). Une base de E et la base duale de E ∗ étant données, cette propriété d’associativité permet d’introduire les nk produits tensoriels ei1 ∗ ⊗ · · · ⊗ eip ∗ . Si k vecteurs xi s’écrivent xi =

n X

ξij ej

j=1

alors (ei1 ∗ ⊗ · · · ⊗ eik ∗ )(x1 , . . . , xk ) = ξ1i1 ξ2i2 . . . ξkik . Ainsi, comme dans le cas plus simple de E ∗ = L(E, K), les ei1 ∗ ⊗ · · · ⊗ eik ∗ forment une base de Lk (E, K). Nous appellerons donc aussi cet espace la puissance tensorielle Nk ∗ k-ième de E ∗ , et le noterons E . Définition 5.3. On appelle algèbre tensorielle de E ∗ , et l’on désigne par T (E ∗ ), la somme directe ∞ O k M E∗ i=0

munie du produit obtenu en prolongeant ⊗ par linéarité. C’est une algèbre associative. ** Le lecteur algébriste vérifiera à titre d’exercice la propriété suivante, dite “universelle”, qui caractérise T (E ∗ ) : toute application linéaire de E ∗ dans une algèbre associative A se prolonge d’une manière unique en un morphisme d’algèbres de T (E ∗ ) dans A. **

5 − Formes différentielles

181

5.2.2. Algèbre extérieure Définition 5.4. Une forme k-linéaire f sera dite alternée si pour toute permutation σ de [1, k] on a f (x1 , . . . , xk ) = (σ)f (xσ(1) , . . . , xσ(k) ), où l’on a désigné par (σ) la signature de σ. L’entier k est le degré de f . Exemple. Toute forme linéaire est alternée. Une 2-forme f est alternée si et seulement si f (x, y) = −f (y, x) quels que soient x, y ∈ E. Il revient au même de dire (si K n’est pas de caractéristique 2, par exemple si K = R ou C, ce que nous supposerons désormais) que f (x, x) = 0 quel que soit x. En effet, dans ce cas f (x + y, x + y) = 0 = f (x, x) + f (x, y) + f (y, x) + f (y, y) = f (x, y) + f (y, x). En utilisant le fait que toute permutation est un produit de transposition, on en déduit la propriété importante suivante. Proposition 5.5. a) Une forme k-linéaire est alternée si et seulement si f (x1 , . . . , xk ) = 0

dès que deux des xi sont égaux.

b) Si les vecteurs x1 , . . . , xk sont linéairement dépendants, f (x1 , . . . , xk ) = 0

pour toute k-forme alternée f .

Démonstration. a) est une conséquence directe de ce qui précède. Pour b), notons que si les xi ne sont pas tous nuls l’un au moins est combinaison linéaire des autres. Quitte à effectuer une permutation entre les variables (f est alternée !) on peut supposer que c’est x1 . Alors k X x1 = λ i xi i=2

donc f (x1 , . . . , xk ) =

k X

λi f (xi , x2 , . . . , xi , . . . xk ) = 0.

i=2

L’espace vectoriel des formes k-linéaires alternées est noté 1 O

E∗ =

1 ^

E∗ = E∗

et on convient que 0 O

E∗ =

0 ^

E ∗ = K.

Vk

E ∗ . On a

182

Introduction aux variétés différentielles

Un cas important Vn ∗ est celui où k = dim E : la théorie des déterminants dit exactement que dim E = 1, et plus précisément que 1 ξ1 f (x1 , . . . , xn ) = ... 1 ξn

... .. . ...

ξ1 n .. f (e , . . . , e ). 1 n . n ξn

Plus généralement Proposition 5.6. Si f ∈

Vk

E ∗ et si (ei )1≤i≤n est une base de E, on a

i1 ξ1 X .. f (x1 , . . . , xk ) = . 1≤i1