225 41 10MB
English; French Pages 626 [642] Year 2019
414
ASTÉRISQUE
XXXXXXXXXXFIRSTPAGEXXXXXXXXXX
2019
SÉMINAIRE BOURBAKI VOLUME 2017/2018 EXPOSÉS 1136–1150
SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE
Astérisque est un périodique de la Société Mathématique de France. Numéro 414
Comité de rédaction Marie-Claude Arnaud
Fanny Kassel
Christophe Breuil
Alexandru Oancea
Damien Calaque
Nicolas Ressayre
Philippe Eyssidieux
Sylvia Serfaty
Nicolas Burq (dir.) Diffusion Maison de la SMF Case 916 - Luminy 13288 Marseille Cedex 9 France [email protected]
AMS P.O. Box 6248 Providence RI 02940 USA http://www.ams.org
Tarifs Vente au numéro: 80 e ($ 120) Abonnement Europe: 665 e, hors Europe: 718 e ($ 1 077) Des conditions spéciales sont accordées aux membres de la SMF. Secrétariat Astérisque Société Mathématique de France Institut Henri Poincaré, 11, rue Pierre et Marie Curie 75231 Paris Cedex 05, France Fax: (33) 01 40 46 90 96 [email protected]
•
http://smf.emath.fr/
© Société Mathématique de France 2019 Tous droits réservés (article L 122–4 du Code de la propriété intellectuelle). Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’éditeur est illicite. Cette représentation ou reproduction par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par les articles L 335–2 et suivants du CPI.
ISSN: 0303-1179 (print) 2492-5926 (electronic) ISBN 978-2-85629-915-9 doi:10.24033/ast.1095 Directeur de la publication: Stéphane Seuret
414
ASTÉRISQUE 2019
SÉMINAIRE BOURBAKI VOLUME 2017/2018 EXPOSÉS 1136–1150
SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE
Association des collaborateurs de Nicolas Bourbaki. Institut Henri Poincaré 11 rue Pierre-et-Marie-Curie 75231 Paris Cedex 05, France. URL : http://www.bourbaki.ens.fr
Mots-clefs et classification mathématique par sujets (2000) Exposé no 1136. — Groupes de difféomorphismes, programme de Zimmer, réseaux des groupes de Lie simples, systèmes dynamiques — 22E40, 37C85, 37C40, 53C24. Exposé no 1137. — Groupes réductifs finis, groupes finis de type de Lie, variétés de DeligneLusztig, théorie de Deligne-Lusztig, équivalences dérivées, équivalences splendides, groupes finis, représentations modulaires — 20C20, 20C33, 20G05, 20G40, 18E30. Exposé no 1138. — Sous-groupes discrets des groupes de Lie, sous-groupes Anosov, géométrie des espaces symétriques et des immeubles affines — 22E40, 37B05, 20H10, 53C35, 51E24, 22F30, 37D40, 57S30. Exposé no 1139. — Systèmes de Coxeter, algèbres de Hecke, polynômes de Kazhdan-Lusztig, théorie de Hodge — 20C08, 20F55. Exposé no 1140. — Conjectures de Gan-Gross-Prasad, conjecture d’Ichino-Ikeda, périodes, formule des traces relative, endoscopie, correspondance thêta — 11F70, 11F67, 11F27. Exposé no 1141. — Sommes exponentielles, sommes de Kloosterman, équirépartition, faisceaux `-adiques, faisceaux pervers, monodromie, transformation de Fourier — 11T24, 11L05, 11G25, 14F05, 14F20. Exposé no 1142. — Convolution de Bernoulli, mesure auto-similaire, dimension, entropie, convolution — 28A80, 42A85. Exposé no 1143. — Limite de champ moyen, points vortex, équations de Navier-Stokes, méthode d’entropie relative, loi des grands nombres à échelle exponentielle — 35Q30, 60F99, 82C22. Exposé no 1144. — Matroïdes, anneau de Chow, variétés toriques, relations de Hodge-Riemann, cohomologie d’intersection — 05A99, 05E99, 14F43, 14F99, 14M25, 14T05. Exposé no 1145. — Analyse semi-classique, mesures semi-classiques, systèmes complètement intégrables, contrôle, observabilité, spectre du Laplacien, seconde micro-localisation — 35P20, 35J10, 35S15, 58J50. Exposé no 1146. — Mesure, capacité, Abel, Chebyshev, Robinson — 11B05. Exposé no 1147. — Condition de stabilité, espace de modules, wall-crossing, variété symplectique holomorphe — 14D20, 14E05, 14J28. Exposé no 1148. — Monge-Ampère, existence, unicité, régularité — 35J96, 35B65, 35J60. Exposé no 1149. — Applications harmoniques, variétés de Hadamard, plongements quasi-isométriques, courbure pincée, théorème d’Eells-Sampson, conjecture de Schoen, barrières sous-harmoniques — 53C43 ; 31B05, 31B25, 31B35, 53C24, 53C35, 58E20. Exposé no 1150. — p-adic Hodge theory, Galois representation, perfectoid space — 14G20, 11F80, 14G22.
SÉMINAIRE BOURBAKI VOLUME 2017/2018 EXPOSÉS 1136-1150
Résumé. — Ce 70e volume du Séminaire Bourbaki contient les textes des quinze exposés de survol présentés pendant l’année 2017/2018 : programme de Zimmer, variétés de Deligne-Lusztig, groupes convexes-cocompacts, bimodules de Soergel, conjectures de Gan-Gross-Prasad, sommes exponentielles, convolutions de Bernoulli, équations de Navier-Stokes, combinatoire des matroïdes, dynamique de l’équation de Schrödinger, distribution asymptotique des valeurs propres de Frobenius, conditions de stabilité en géométrie birationnelle, équation de Monge-Ampère, applications harmoniques en courbure négative, courbe de Fargues-Fontaine. Abstract (Séminaire Bourbaki, volume 2017/2018, exposés 1136–1150) This 70th volume of the Bourbaki Seminar gathers the texts of the fifteen survey lectures delivered during the year 2017/2018. Among the topics addressed the reader will find the Zimmer program, Deligne-Lusztig varieties, cocompact-convex groups, Soergel bimodules, the Gan-Gross-Prasad conjectures, exponential sums, Bernoulli convolutions, the Navier-Stokes equations, the combinatorics of matroids, the dynamics of the Schrödinger equation, the asymptotic distribution of Frobenius eigenvalues, stability conditions in birational geometry, the Monge-Ampère equation, harmonic maps in negative curvature, and the Fargues-Fontaine curve.
© Astérisque 414, SMF 2019
TABLE DES MATIÈRES
Résumés des exposés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
vii
OCTOBRE 2017 1136 1137 1138 1139
Serge CANTAT — Progrès récents concernant le programme de Zimmer (d’après A. Brown, D. Fisher et S. Hurtado) . . . . . . . . . .
1
Olivier DUDAS — Splendeur des variétés de Deligne-Lusztig (d’après Deligne-Lusztig, Broué, Rickard, Bonnafé-Dat-Rouquier) .
49
Olivier GUICHARD — Groupes convexes-cocompacts en rang supérieur (d’après Labourie, Kapovich, Leeb, Porti,...) . . . . . . . . .
95
Simon RICHE — La théorie de Hodge des bimodules de Soergel (d’après Soergel et Elias-Williamson) . . . . . . . . . . . . . . . . . . . . . . . . . . .
125
JANVIER 2018 1140
1141 1142 1143
Raphaël BEUZART-PLESSIS — Progrès récents sur les conjectures de Gan-Gross-Prasad (d’après Jacquet-Rallis, Waldspurger, W. Zhang, etc.) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
167
Javier FRESÁN — Équirépartition de sommes exponentielles (Travaux de Katz) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
205
Sébastien GOUËZEL — Méthodes entropiques pour les convolutions de Bernoulli (d’après Hochman, Shmerkin, Breuillard, Varjú) . .
251
Laure SAINT-RAYMOND — Des points vortex aux équations de Navier-Stokes (d’après P.-E. Jabin et Z. Wang) . . . . . . . . . . . . . . . .
289
MARS 2018 1144
1145 1146
Antoine CHAMBERT-LOIR — Relations de Hodge-Riemann et combinatoire des matroïdes (d’après K. Adiprasito, J. Huh et E. Katz) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
309
Gabriel RIVIÈRE — Dynamique de l’équation de Schrödinger sur le disque (d’après N. Anantharaman, M. Léautaud et F. Macià) . .
339
Jean-Pierre SERRE — Distribution asymptotique des valeurs propres des endomorphismes de Frobenius (d’après Abel, Chebyshev, Robinson,...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
379
JUIN 2018 1147
François CHARLES — Conditions de stabilité et géométrie birationnelle (d’après Bridgeland, Bayer-Macrì,...) . . . . . . . . . . . . .
427
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
vi
TABLE DES MATIÈRES
1148
Alessio FIGALLI — On the Monge-Ampère equation . . . . . . . . . . . . .
477
1149
François GUÉRITAUD — Applications harmoniques en courbure négative (d’après Benoist, Hulin, Lemm, Markovic,...) . . . . . . . . .
505
Matthew MORROW — The Fargues-Fontaine curve and diamonds (d’après Fargues, Fontaine, and Scholze) . . . . . . . . . . . . . . . . . . . . . . .
533
1150
ASTÉRISQUE 414
RÉSUMÉS DES EXPOSÉS
vii
Serge CANTAT — Progrès récents concernant le programme de Zimmer (d’après A. Brown, D. Fisher et S. Hurtado) Soit Γ un réseau d’un groupe de Lie simple G, par exemple le réseau SLn (Z) du groupe SLn (R). Lorsque le rang de G est supérieur ou égal à 2, les théorèmes de rigidité de Mostow et Margulis imposent des contraintes fortes aux représentations linéaires de Γ de dimension finie. Le programme de Zimmer demande ce qui persiste de ces contraintes pour les actions par difféomorphismes. Par exemple, Γ peut-il agir fidèlement sur une variété compacte de dimension strictement inférieure au rang de G ? Je décrirai quelques résultats récents qui permettent de répondre partiellement à cette question. Olivier DUDAS — Splendeur des variétés de Deligne-Lusztig (d’après Deligne-Lusztig, Broué, Rickard, Bonnafé-Dat-Rouquier) Les travaux fondateurs de Deligne et Lusztig en 1976 ont permis la construction et l’étude des représentations complexes des groupes réductifs finis (tels que GLn (q) et Sp2n (q)), à partir de la cohomologie de certaines variétés algébriques désormais connues sous le nom de « variétés de Deligne-Lusztig ». Dans cet exposé nous tâcherons d’expliquer comment ces constructions s’adaptent parfaitement au cas des représentations dites modulaires (à coefficients dans un corps de caractéristique positive). Nous l’illustrerons en détaillant les travaux récents de Bonnafé-Rouquier (2003) et Bonnafé-Dat-Rouquier (2017) sur la construction d’équivalences splendides entre blocs de représentations, équivalences prédites par Broué vingt-cinq ans auparavant. Olivier GUICHARD — Groupes convexes-cocompacts en rang supérieur (d’après Labourie, Kapovich, Leeb, Porti,...) Les groupes convexes-cocompacts constituent un objet central en géométrie hyperbolique et plus généralement en courbure strictement négative. En 2005, Labourie a introduit la notion de sous-groupe « Anosov » qui s’est imposée progressivement comme la bonne généralisation des groupes convexes-cocompacts, particulièrement suite aux travaux de Kapovich, Leeb et Porti. Cet exposé passera en revue les différentes caractérisations de ces groupes, insistera sur le parallèle (ou non) avec la courbure négative et donnera leurs propriétés fondamentales (stabilité structurelle, non distorsion, etc.). Simon RICHE — La théorie de Hodge des bimodules de Soergel (d’après Soergel et EliasWilliamson) Les bimodules de Soergel sont certains bimodules sur des algèbres de polynômes, associés à des groupes de Coxeter, et introduits par Soergel dans les années 90 dans le cadre de son étude de la catégorie O des algèbres de Lie semisimples complexes. Bien que leur définition soit algébrique et assez élémentaire, certaines de leurs propriétés cruciales n’étaient connues jusqu’à présent que dans le cas des groupes de Coxeter cristallographiques, où on peut interpréter ces bimodules comme la cohomologie d’intersection équivariante de variétés de Schubert. Dans des travaux récents Elias et Williamson ont démontré ces propriétés en toute généralité en montrant que ces bimodules possèdent des propriétés « de type Hodge », même quand ils ne peuvent pas s’interpréter en termes de cohomologie d’intersection. Ces travaux impliquent la positivité des polynômes de Kazhdan-Lusztig et fournissent une preuve algébrique de la conjecture de Kazhdan-Lusztig.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
viii
RÉSUMÉS DES EXPOSÉS
Raphaël BEUZART-PLESSIS — Progrès récents sur les conjectures de Gan-Gross-Prasad (d’après Jacquet-Rallis, Waldspurger, W. Zhang, etc.) Les conjectures de Gan-Gross-Prasad ont deux aspects : localement elles décrivent de façon explicite certaines lois de branchements entre représentations de groupes de Lie réels ou p-adiques, globalement elles portent sur certaines périodes de formes automorphes et en particulier sur la question de leur (non-)annulation. Ces prédictions, qui font intervenir des invariants arithmétiques (facteurs epsilon locaux et valeurs de fonctions L automorphes en leurs centres de symétrie respectivement), ont été récemment démontrées dans un nombre significatif de cas par des méthodes variées (formules des traces relatives locales et globales, correspondance thêta,...). Après avoir formulé précisément ces conjectures ainsi qu’un raffinement dû à Ichino-Ikeda, on donnera dans cet exposé un panorama des développements récents sur le sujet. Javier FRESÁN — Équirépartition de sommes exponentielles (Travaux de Katz) De nombreuses sommes exponentielles sur les corps finis, par exemple les sommes de Gauss ou les sommes de Kloosterman, s’obtiennent comme transformée de Fourier de la fonction trace d’un faisceau `-adique sur un groupe algébrique commutatif par rapport à un caractère. L’exposé portera sur l’équirépartition de ces sommes lorsque le faisceau est fixe mais que l’on fait varier le caractère. Dans le cas du groupe additif, on sait grâce à Deligne que l’équirépartition est gouvernée par la monodromie. Récemment, Katz a résolu la variante multiplicative de cette question dans un travail où les idées tannakiennes jouent un rôle essentiel. Sébastien GOUËZEL — Méthodes entropiques pour les convolutions de Bernoulli (d’après Hochman, Shmerkin, Breuillard, Varjú) P n La convolution de Bernoulli de paramètre λ ∈ [1/2, 1[ est la loi de λ ξn , où les ξn forment une suite de variables de Bernoulli non biaisées. On conjecture depuis les travaux fondateurs d’Erdős et Kahane que cette mesure réelle est absolument continue par rapport à la mesure de Lebesgue lorsque λ n’est pas l’inverse d’un nombre de Pisot. Cette question, malgré son apparente simplicité, est extrêmement délicate et encore ouverte. Elle a motivé au fil du temps le développement de différentes techniques qui ont ensuite pu être appliquées dans des contextes beaucoup plus généraux. Cet exposé sera consacré à la méthode entropique, introduite récemment par Hochman, qui fait le lien avec le monde de la combinatoire additive et a permis des développements spectaculaires. Laure SAINT-RAYMOND — Des points vortex aux équations de Navier-Stokes (d’après P.-E. Jabin et Z. Wang) Pour N grand, on s’attend à ce que la dynamique stochastique de N points vortex donne une bonne approximation des équations de Navier-Stokes pour les fluides incompressibles visqueux en 2 dimensions d’espace. Jabin et Wang ont montré que la méthode d’entropie relative permet de quantifier cette convergence et la propagation du chaos qui y est associée. La principale difficulté est que l’interaction des vortex, donnée par la loi de Biot-Savart, est très singulière. Le contrôle de ce terme nécessite donc d’établir une variante de la loi des grands nombres à l’échelle exponentielle, basée sur des arguments combinatoires fins.
ASTÉRISQUE 414
RÉSUMÉS DES EXPOSÉS
ix
Antoine CHAMBERT-LOIR — Relations de Hodge-Riemann et combinatoire des matroïdes (d’après K. Adiprasito, J. Huh et E. Katz) Les matroïdes finis sont des structures combinatoires qui expriment la notion d’indépendance linéaire. En 1964, G.-C. Rota conjectura que les coefficients du « polynôme caractéristique » d’un matroïde M , polynôme dont les coefficients énumèrent ses sous-ensembles de rang donné, forment une suite log-concave. K. Adiprasito, J. Huh et E. Katz viennent de démontrer cette conjecture par des méthodes qui, bien qu’entièrement combinatoires, sont inspirées par la géométrie algébrique. À partir de l’éventail de Bergman du matroïde M , ils définissent en effet un « anneau de Chow » gradué A(M ) pour lequel ils établissent des analogues de la dualité de Poincaré, du théorème de Lefschetz difficile et des relations de Hodge-Riemann. Les inégalités de log-concavité recherchées sont alors analogues aux inégalités de Khovanskii-Teissier. Gabriel RIVIÈRE — Dynamique de l’équation de Schrödinger sur le disque (d’après N. Anantharaman, M. Léautaud et F. Macià) Dans une série de travaux récents, Anantharaman, Fermanian-Kammerer, Léautaud et Macià ont développé des outils d’analyse semi-classique afin d’étudier la dynamique en temps long de l’équation de Schrödinger lorsque l’hamiltonien sous-jacent est complètement intégrable. Leur stratégie se fonde sur des méthodes de seconde microlocalisation le long de sous-variétés invariantes du flot hamiltonien. Notre objectif est d’exposer ces nouvelles approches dans le cas du tore et du disque. Jean-Pierre SERRE — Distribution asymptotique des valeurs propres des endomorphismes de Frobenius (d’après Abel, Chebyshev, Robinson,...) Les polynômes caractéristiques des Frobenius conduisent à des polynômes unitaires P ∈ Z[X] dont les racines (xi ) appartiennent à un intervalle I de la forme [−2q 1/2 , 2q 1/2 ]. La moyenne µP des mesures de Dirac δxi est une mesure sur I. Quelles sont les limites des µP quand P varie (I restant fixe) ? Nous répondrons partiellement à ces questions ; les démonstrations sont basées sur un théorème de R. M. Robinson (1964), lui-même lié à des constructions d’Abel (1826) et de Chebyshev (1854). François CHARLES — Conditions de stabilité et géométrie birationnelle (d’après Bridgeland, Bayer-Macrì,...) Nous décrivons quelques aspects de la notion de condition de stabilité, en général et dans le cas particulier de la catégorie dérivée des faisceaux cohérents sur une surface. Nous en tirons quelques applications à la géométrie birationnelle de certaines variétés symplectiques holomorphes. Alessio FIGALLI — On the Monge-Ampère equation The Monge-Ampère equation is a nonlinear PDE arising in several problems in the areas of analysis and geometry, such as the prescribed Gaussian curvature equation, affine geometry, optimal transportation, etc. In this talk I will first give a general overview of the classical theory, and then I will discuss some of the most recent and important developments on this beautiful topic.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
x
RÉSUMÉS DES EXPOSÉS
François GUÉRITAUD — Applications harmoniques en courbure négative (d’après Benoist, Hulin, Lemm, Markovic,...) Benoist et Hulin ont récemment montré que tout plongement quasi-isométrique f : X → Y d’une variété de Hadamard à courbure pincée dans une autre est à distance bornée d’une unique application harmonique. Le cas X = Y = H2 (conjecture de Schoen) avait été résolu par Markovic. On expose l’histoire de la question et les grandes lignes de la démonstration. Matthew MORROW — The Fargues-Fontaine curve and diamonds (d’après Fargues, Fontaine, and Scholze) The titular “curve” was introduced by Fargues and Fontaine in 2009 in order to reinterpret certain aspects of p-adic Hodge theory from a geometric perspective, in particular the (semi-)linear algebra appearing in the theory. From the point of view of Scholze’s perfectoid spaces and diamonds, the curve admits a beautiful interpretation: it classifies the untilts of a fixed perfectoid, in the sense of Scholze’s tilting correspondence. In this exposé we will present an overview of the curve, its role in p-adic Hodge theory, and its relation to diamonds.
ASTÉRISQUE 414
Séminaire BOURBAKI 70e année, 2017–2018, no 1136, p. 1 à 48 doi:10.24033/ast.1080
Octobre 2017
PROGRÈS RÉCENTS CONCERNANT LE PROGRAMME DE ZIMMER [d’après A. Brown, D. Fisher et S. Hurtado] par Serge CANTAT
1. LE PROGRAMME DE ZIMMER 1.1. Réseaux des groupes de Lie 1.1.1. — Soit G un groupe de Lie connexe dont l’algèbre de Lie g est simple (de dimension > 1) et le centre est fini. La représentation adjointe Ad : G → GL(g) est obtenue en dérivant l’action de G sur lui-même par conjugaison ; son noyau est le centre de G. Le rang réel rg(G) est la dimension maximale d’un sous-groupe de Lie A ⊂ G tel que Ad(A) soit diagonalisable (sur R). Par exemple, le rang réel des groupes SLn+1 (R), SLn+1 (C) et Sp2n (R) est égal à n ; celui de SOp,q (R) est le minimum de p et q. Nous noterons volG une mesure de Haar sur G. Un réseau de G est un sous-groupe discret Γ ⊂ G tel que la mesure de Haar du quotient G/Γ est finie ; il est uniforme si G/Γ est compact. Par exemple, SLn+1 (Z) est un réseau non uniforme de SLn+1 (R). Lorsque rg(G) ≥ 2, les réseaux héritent de nombreuses propriétés du groupe G. Gregory Margulis montre ainsi que les réseaux sont presque simples : leurs sousgroupes distingués sont ou bien d’indice fini, ou bien finis et contenus dans le centre de G. Il établit aussi un théorème de rigidité décrivant les représentations linéaires des réseaux en fonction de celles de G. Pour l’énoncer nous supposerons que G est algébriquement simplement connexe, c’est-à-dire que tout morphisme d’algèbres de Lie g → slm (R) s’étend en un homomorphisme de groupes de Lie G → SLm (R) ; cette hypothèse n’est pas essentielle car on s’y ramène en remplaçant G par un revêtement fini. Théorème 1.1 (super-rigidité de Margulis, [51, 56]). — Soit G un groupe de Lie connexe et algébriquement simplement connexe, dont l’algèbre de Lie est simple, le centre est fini et le rang est ≥ 2. Soient Γ un réseau de G et ϕ : Γ → GLm (R)
© Astérisque 414, SMF 2019
2
S. CANTAT
un homomorphisme. Il existe alors un sous-groupe Γ0 ⊂ Γ d’indice fini, un homomorphisme de groupes de Lie ϕˆ : G → GLm (R), un sous-groupe compact C ⊂ GLm (R) qui centralise ϕ(G), ˆ et un homomorphisme ψ : Γ → C tels que ϕ(γ) = ϕ(γ)ψ(γ) ˆ pour tout élément γ de Γ0 . Si ϕ(Γ) n’est pas borné et si son adhérence de Zariski est simple, le groupe C est réduit à l’identité. À l’opposé, considérons un homomorphisme ϕ : Γ → GLm (C) et supposons que l’adhérence de ϕ(Γ) pour la topologie usuelle soit un groupe compact et simple. Il existe alors un automorphisme σ du corps (C, +, ×) tel que σ(ϕ(Γ)) soit discret, et un homomorphisme de groupes de Lie ϕˆ : G → GLm (C) tel que σ(ϕ(γ)) = ϕ(γ) ˆ pour tous les éléments γ d’un sous-groupe d’indice fini de Γ. 1.1.2. — Ces énoncés montrent que les représentations linéaires de Γ se déduisent de celles de G ; en particulier, la dimension minimale d’une représentation linéaire Γ → GLm (C) dont le noyau est fini coïncide avec la dimension minimale d’une représentation non triviale de G. Après avoir étendu le théorème de Margulis en un théorème de rigidité pour des cocycles (voir le § 6.1), Robert Zimmer demanda si cette dernière propriété avait un analogue non linéaire, c’est-à-dire pour les actions de Γ par difféomorphismes sur des variétés compactes. (1) Avant de formuler l’une des questions de Zimmer, considérons l’exemple d’une action C ∞ et fidèle de SLn+1 (R) sur une variété compacte connexe M de dimension d. Notons K le sous-groupe compact SOn+1 (R). La moyenne d’une métrique riemannienne s0 sous l’action de K produit une métrique riemannienne s sur M qui est K-invariante. Soient x un point de M et Kx son stabilisateur ; on a dim(K) ≤ dim(Kx ) + d. Par ailleurs, la différentielle (1)
D : k ∈ Kx 7→ Dkx ∈ GL(Tx M )
détermine un homomorphisme injectif car toute isométrie de (M, s) qui fixe x est uniquement déterminée par sa différentielle en x. L’image de D est contenue dans le groupe orthogonal pour la métrique euclidienne sx et celui-ci est de dimension d(d − 1)/2. Ainsi, dim(K) = n(n + 1)/2 ≤ d + d(d − 1)/2 et donc n ≤ d. Cet argument montre qu’il n’existe pas d’action fidèle du groupe SLn+1 (R) en dimension d < n, et cette borne est optimale car SLn+1 (R) agit sur l’espace (1)
Tout groupe dénombrable agit fidèlement sur une surface de Riemann connexe non compacte. Considérons en effet l’action homographique standard du groupe modulaire PSL2 (Z) sur le demiplan de Poincaré H. Soit F un sous-groupe libre d’indice fini dans PSL2 (Z) ; le quotient Σ = H/F est une surface de Riemann de type fini. Soit Ω un groupe dénombrable. Il existe alors un sous-groupe distingué F0 ⊂ F tel que Ω se plonge dans F/F0 (voir [48], § V.10). Le quotient H/F0 est une surface de Riemann Σ0 , munie d’un revêtement galoisien Σ0 → Σ dont le groupe d’automorphismes est isomorphe à F/F0 ; le groupe Ω agit donc fidèlement par difféomorphismes holomorphes sur Σ0 .
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
3
projectif Pn (R) et la sphère Sn . Plus généralement, on démontre que les actions fidèles d’un groupe de Lie simple G ne peuvent apparaître en dimension < rg(G). La question suivante peut être tirée des conjectures de Zimmer et illustre bien ces dernières. Elle demande si le résultat précédent s’étend aux réseaux : un réseau Γ de G peut-il agir fidèlement sur une variété compacte de dimension < rg(G) par difféomorphismes ? Aaron Brown, David Fisher et Sebastian Hurtado viennent d’y répondre pour les réseaux uniformes. 1.2. Un énoncé Le but principal de cet exposé est donc de présenter le théorème suivant, issu de [11]. Théorème A. — Soit G un groupe de Lie connexe dont l’algèbre de Lie est simple et le centre est fini. Soient Γ un réseau uniforme de G et M une variété compacte. S’il existe un homomorphisme α : Γ → Diff ∞ (M ) d’image infinie, alors dim(M ) ≥ rg(G). Si, en plus, α(Γ) préserve une forme volume et rg(G) ≥ 2, alors dim(M ) ≥ rg(G) + 1. L’action de SLn+1 (R) sur Pn (R) montre que l’inégalité dim(M ) ≥ rg(G) est optimale dans le cas des réseaux de SLn+1 (R). Ce théorème suppose Γ uniforme : cette hypothèse technique devrait être supprimée dans un avenir proche (voir le §11.2). Nous verrons que le théorème A reste valable pour des actions de classe C 2 ; l’hypothèse de régularité C ∞ est là pour simplifier un passage technique de la démonstration. La méthode de Brown, Fisher et Hurtado repose sur la théorie de Pesin en systèmes dynamiques et nécessite donc au minimum une régularité C 1+α avec α ∈ R∗+ . Il se pourrait toutefois que le théorème A reste valable pour des actions par homéomorphismes. Par exemple, Dave Witte-Morris montre que tout homomorphisme d’un sous-groupe d’indice fini de SL(3, Z) vers le groupe des homéomorphismes du cercle S1 a une image finie, et Étienne Ghys étend ce résultat aux homomorphismes des réseaux des groupes de Lie simples de rang ≥ 2 vers le groupe Diff 1 (S1 ) (voir [30, 31, 67]). Le théorème A est une version simplifiée des résultats principaux de [11]. Nous verrons au paragraphe 2.4 quelle est la dimension critique optimale qui est maintenant conjecturée en fonction du groupe de Lie G. D’autres énoncés issus de [11] seront décrits aux paragraphes 2.5 et 11.3. 1.3. Groupes de difféomorphismes Zimmer demande ce qu’il advient des théorèmes de rigidité pour les actions par difféomorphismes et, comme nous le verrons, offre des outils pour aborder ce problème. Plus généralement, il s’agit de déterminer les propriétés des groupes de Lie
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
4
S. CANTAT
classiques et de leurs sous-groupes de type fini qui sont partagées par les groupes de difféomorphismes des variétés compactes. Illustrons ceci par deux exemples. L’alternative de Tits affirme qu’un sous-groupe Λ de GLm (C) qui ne contient pas de groupe libre non abélien contient automatiquement un sous-groupe d’indice fini qui est résoluble ; ainsi, ou bien Λ contient un groupe libre non abélien, ou bien Λ contient un sous-groupe d’indice fini qui préserve un drapeau complet dans Cm . Les groupes de difféomorphismes ne satisfont pas à cette alternative. Par exemple, le groupe de Thompson F ⊂ Homeo([0, 1]) se plonge dans le groupe des difféomorphismes du cercle [32], ne contient pas de groupe libre non abélien [8], mais ne satisfait aucune loi et ne contient donc pas de sous-groupe résoluble d’indice fini [8]. Margulis démontre cependant le théorème suivant, qui peut être perçu comme une alternative de Tits dans laquelle le drapeau invariant est remplacé par une mesure de probabilité : soit Λ un sous-groupe de Homeo(S1 ) ; ou bien Λ contient un groupe libre non abélien, ou bien Λ préserve une mesure de probabilité sur S1 (voir [31, 52]). Considérons maintenant le théorème de Burnside. Soit Λ un groupe d’exposant borné, c’est-à-dire qu’il existe un entier q > 0 tel que l’ordre de tout élément de Λ divise q. Si Λ se plonge dans un groupe linéaire GLm (C), alors Λ est fini [16]. Sebastian Hurtado, Nancy Guelman et Isabelle Liousse ont obtenu la même conclusion si Λ se plonge dans le groupe des difféomorphismes d’une surface compacte préservant l’aire (voir [34, 37]). Nous renvoyons le lecteur à [15], [22, 23] et [31] pour des articles de synthèse concernant ce type de problèmes. 1.4. Actions analytiques et plan du texte Avant d’expliquer la structure de ce texte, étudions un cas simple : celui des actions analytiques de SLn+1 (Z) en petite dimension (voir [29, 31, 67] et [19]). 1.4.1. Germes de difféomorphismes. — Soit Γ un réseau de SLn+1 (R), avec n ≥ 2. Pour tout entier m ≥ 1, notons Diff ω (Rm ; 0) le groupe des germes de difféomorphismes analytiques de Rm fixant l’origine. Montrons que, si m ≤ n, tout homomorphisme α : Γ → Diff ω (Rm ; 0) a une image finie. Tout d’abord, le théorème de super-rigidité de Margulis entraîne que l’homomorphisme « partie linéaire » (2)
γ ∈ Γ 7→ Dα(γ)0 ∈ GLm (R)
a une image finie ; notons Γ0 son noyau. C’est un réseau de SLn+1 (R), donc tout homomorphisme de Γ0 vers un groupe abélien ou résoluble a une image finie. Mais le groupe des jets d’ordre k de difféomorphismes qui sont tangents à l’identité est un groupe résoluble sans torsion. Donc le développement de Taylor des éléments de α(Γ0 ) est trivial à tout ordre ; l’action étant analytique, α(Γ0 ) = {Id} et α(Γ) est fini.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
5
1.4.2. Actions sur le cercle. — Montrons que tout homomorphisme d’un sous-groupe d’indice fini Γ de SLn+1 (Z) vers le groupe des difféomorphismes analytiques Diff ω (S1 ) a une image finie si n ≥ 2. Il suffit de considérer le cas n = 2. En remplaçant Γ par un sous-groupe d’indice ≤ 2, nous pouvons supposer que Γ préserve l’orientation de S1 . Nous noterons Ei,j le sousgroupe de SL3 (R) constitué des matrices élémentaires Id + tδi,j , t ∈ R, et U le groupe des matrices triangulaires supérieures unipotentes. Soit ΓU l’intersection de Γ avec U . C’est un groupe moyennable, donc son action sur le cercle préserve une mesure de probabilité µ. Si f est un homéomorphisme de S1 = R/Z qui préserve l’orientation, et si f˜: R → R est un relevé de f au revêtement universel, la fonction t 7→ f˜(t) − t est 1-périodique ; elle passe au quotient en une fonction sur le cercle, et le nombre de rotation de f se trouve être égal à Z (3) rot(f ) = f˜(t) − t dµ(t) (modulo 1). R/Z
Puisque µ est invariante sous l’action de ΓU , on en déduit que le nombre de rotation est un homomorphisme en restriction à ΓU (voir [31]). Il s’annule sur le groupe dérivé Γ0U de ΓU , qui est un sous-groupe cyclique d’indice fini dans Γ ∩ E1,3 . L’ensemble F des points fixes de Γ0U est donc un ensemble non vide, et fini car l’action est analytique ; tout sous-groupe d’indice fini de Γ0U a exactement les mêmes points fixes ; et le support de µ est contenu dans F . Puisque ΓU centralise Γ0U , un sous-groupe d’indice fini de ΓU fixe F point par point. Considérons maintenant le groupe Γ∩E2,1 : il commute à Γ0U , donc préserve aussi F , si bien qu’il existe un sous-groupe d’indice fini de Γ ∩ E2,1 dont l’ensemble des points fixes coïncide avec F . Puisque E2,1 et E3,1 commutent, un sous-groupe d’indice fini de Γ ∩ E3,1 fixe aussi F . Nous avons donc construit des sous-groupes d’indices finis dans ΓU , Γ ∩ E2,1 et Γ ∩ E3,1 qui ont un point fixe commun. Ces groupes engendrent un sous-groupe d’indice fini Γ0 ⊂ Γ fixant un point : le paragraphe 1.4.1 montre que son image dans Diff ω (S1 ) est finie, ce qui conclut la preuve. 1.4.3. Actions sur la sphère. — Considérons maintenant un sous-groupe Ω d’indice fini dans le produit semi-direct SL3 (Z) n Z3 , l’action de SL3 (Z) sur Z3 étant induite par l’action usuelle de SL3 (R) sur R3 . Fixons un homomorphisme α de ce groupe vers celui des difféomorphismes analytiques de la sphère S2 qui préservent l’orientation. Soit Λ l’intersection de Ω avec le facteur abélien Z3 . Soit f un élément non trivial de α(Λ). Puisque la caractéristique d’Euler de S2 n’est pas nulle, l’ensemble Fix(f ) des points fixes de f n’est pas vide ; il est invariant sous l’action de Λ. Si Fix(f ) comporte un point singulier ou un point isolé, un sous-groupe d’indice fini de Λ fixe ce point. Sinon, Fix(f ) est une union finie de courbes lisses homéomorphes à des cercles. Soit D l’une des composantes connexes de S2 \ Fix(f ) homéomorphe à un disque. Soit g un
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
6
S. CANTAT
élément de α(Λ) fixant D. Par le théorème du point fixe de Brouwer, g fixe un point x ∈ D, tandis que f n’en a pas dans D ; l’orbite de x par f s’accumule donc sur le bord de B (théorème de translation plane de Brouwer, [35]) et est constituée de points fixes de g. Donc f et g ont un point fixe commun. On montre ainsi que Λ contient un sous-groupe d’indice fini dont l’ensemble des points fixes est non vide. Quitte à changer Ω en un sous-groupe d’indice fini, nous pouvons donc supposer que Fix(Λ) 6= ∅ et que Λ est distingué ; alors Fix(Λ) est invariant sous l’action de Ω. À nouveau, ou bien Ω a une orbite finie, ou bien Fix(Λ) est une union finie et disjointe de courbes analytiques lisses homéomorphes à des cercles ; le paragraphe 1.4.2 conduit alors à la même conclusion : Ω a une orbite finie. Par le paragraphe 1.4.1, α(Ω ∩ SL3 (Z)) est fini. En utilisant les différentes copies de SL3 (Z) n Z3 qui sont contenues dans SL4 (Z), nous obtenons : si Γ est un sous-groupe d’indice fini de SLn+1 (Z) avec n ≥ 3, tout homomorphisme de Γ vers Diff ω (S2 ) a une image finie. 1.4.4. Plan. — La partie 2 introduit les notations relatives au groupe de Lie G et au réseau Γ ⊂ G ; quelques rappels sur les actions de G en petite dimension permettent alors de préciser les conjectures de Zimmer. Nous nous attelons ensuite à la démonstration du théorème A et du théorème B, qui sera énoncé au paragraphe 2.5. On se donne donc un homomorphisme α : Γ → Diff k (M ) où M est une variété compacte et k est > 1. Les arguments des paragraphes 1.4.1 à 1.4.3 sont propres aux actions analytiques. Surtout, ils utilisent de manière cruciale l’existence de sousgroupes nilpotents et de paires de sous-groupes commutants dans le réseau SLn+1 (Z). Cette structure algébrique est induite par celle de SLn+1 (R), mais n’apparaît pas dans tous les réseaux, notamment dans ceux qui sont uniformes. On considère alors la suspension de l’action de Γ sur M . Elle fournit une variété compacte Mα , une fibration π : Mα → G/Γ dont la fibre est difféomorphe à M , et une action de G sur Mα qui permute les fibres de π : l’action induite dans la base est l’action par translations de G sur G/Γ et l’action de Γ sur la fibre π −1 (eG Γ) est l’action initiale de Γ sur M . C’est maintenant le groupe G qui agit, ce qui permet d’utiliser toute la structure algébrique de ses sous-groupes. Ce faisant, la variété M a été remplacée par Mα , dont la dimension est bien plus grande ; mais la dynamique dans G/Γ peut être analysée à l’aide des théorèmes de Marina Ratner. Nous distinguerons alors deux régimes, suivant la croissance des dérivées des difféomorphismes α(γ) pour γ dans la boule de rayon n du graphe de Cayley de Γ. Lorsque cette croissance est rapide (nous parlerons d’action vigoureuse), nous construirons une mesure de probabilité G-invariante µ sur Mα et un élément g ∈ G qui a un exposant de Lyapounoff non nul le long des fibres de π pour la mesure µ ; cette construction est obtenue en trois temps, qui correspondent au théorème 7.2 et
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
7
aux propositions 8.2 et 8.7. C’est l’un des points clé de la démonstration, qui nécessite une combinaison astucieuse des théorèmes de Ratner et de la formule d’entropie de François Ledrappier et Lai-Sang Young. Le théorème de super-rigidité de Zimmer pour les cocycles conduit alors à une contradiction, formulée dans la proposition 8.9. Les parties 3 à 8 montrent donc que la croissance des dérivées est lente ! Dans ce régime, la propriété (T) renforcée de Lafforgue permet de construire une métrique riemannienne lisse et Γ-invariante sur M . Le groupe d’isométries d’une telle métrique étant un groupe de Lie compact, la conclusion proviendra du théorème de superrigidité de Margulis et de la théorie de Lie. Ceci est expliqué dans les sections 9 et 10. Les systèmes dynamiques, notamment la dynamique dans les espaces homogènes et la théorie ergodique des difféomorphismes, seront donc au centre de la preuve.
2. LE GROUPE DE LIE ET SES ACTIONS 2.1. Le groupe de Lie G 2.1.1. — Dans la suite G désignera un groupe de Lie réel connexe et à centre fini dont l’algèbre de Lie g est simple. L’image de Ad : G → GL(g) est une composante connexe d’un sous-groupe algébrique de SL(g) localement isomorphe à G. Une sous-algèbre h ⊂ g est diagonalisable s’il existe une base de g dans laquelle ad(h) est formée de matrices diagonales. Soit a une sous-algèbre abélienne diagonalisable de dimension maximale ; toutes les sous-algèbres de ce type sont en fait conjuguées à a ; leur dimension est le rang de G, noté rg(G). L’image de a par l’application exponentielle sera notée A. Le groupe A est donc un sous-groupe fermé et connexe de G dont l’action adjointe est diagonalisable, et qui est maximal pour ces propriétés. Nous dirons que a est le sous-espace de Cartan de g et que A est le tore (déployé maximal) de G ; le groupe A est isomorphe à (R∗+ )rg(G) . 2.1.2. — L’algèbre a agit sur g par l’application adjointe. Cette action est diagonalisable et les valeurs propres déterminent des formes linéaires L : a → R ; celles qui sont non nulles forment l’ensemble Φ des racines de G (la terminologie exacte est « racines restreintes »). L’algèbre de Lie g est alors décomposée en la somme directe M (4) g = g0 ⊕ gL L∈Φ L
où g désigne l’espace propre associé à la valeur propre L. Les noyaux des racines découpent l’algèbre a en un nombre fini de cônes convexes saillants. Fixons l’un de ces cônes fermés ∆. Les racines qui prennent des valeurs ≥ 0
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
8
S. CANTAT
sur ∆ forment l’ensemble des racines positives Φ+ et ∆ est la chambre de Weyl associée à Φ+ . Nous noterons A+ l’image de la chambre ∆ par l’application exponentielle. La L sous-algèbre résoluble p = g0 ⊕ L∈Φ+ gL est la sous-algèbre parabolique minimale ; le normalisateur de p dans G est le sous-groupe parabolique minimal. Un sous-groupe est parabolique s’il contient un conjugué de ce sous-groupe parabolique minimal. À conjugaison près, il existe un unique sous-groupe compact maximal K ⊂ G. Si K est convenablement choisi, alors G = KA+ K : tout élément g de G est un produit g = kg ag kg0 avec (kg , ag , kg0 ) ∈ K × A+ × K et ag est uniquement déterminé par g. Le groupe K sera ainsi fixé : l’égalité G = KA+ K est la décomposition de Cartan et l’application g 7→ ag est la projection de Cartan. Remarque 2.1. — Quitte à changer G en un groupe isogène, on peut toujours supposer que c’est un sous-groupe algébrique de GLm (C) invariant par l’involution Θ(X) = (t X)−1 , que A est formé de matrices diagonales, et que K est la composante connexe de l’intersection entre G et le groupe unitaire. Exemple 2.2. — Lorsque G = SLn+1 (R), le choix naturel pour a ⊂ sln+1 (R) consiste à prendre l’algèbre des matrices diagonales de taille n + 1 à trace nulle ; le tore A ⊂ G est alors le groupe des matrices diagonales à coefficients > 0. En notant ti les coefficients diagonaux, a peut être identifiée à l’ensemble des (ti ) ∈ Rn+1 tels que t1 + . . . + tn+1 = 0. Notons Li : a → R la forme linéaire Li (t) = ti . Pour 1 ≤ i 6= j ≤ n + 1, notons Ei,j le groupe formé des matrices élémentaires Ei,j (s) ayant des coefficients diagonaux égaux à 1 et un unique autre coefficient non nul, égal à s, situé en position (i, j). Le groupe A normalise Ei,j : si a est un élément de A dont les coefficients diagonaux sont notés ai , alors aEi,j (s)a−1 = Ei,j (ai s/aj ). Cette remarque traduit l’égalité entre l’ensemble Φ des racines et l’ensemble des différences Li −Lj , pour i 6= j. Comme chambre de Weyl, on peut prendre ∆ = {(ti )1≤i≤n+1 ; t1 ≥ t2 ≥ · · · ≥ tn+1 } ; A+ est alors le sous-ensemble des matrices diagonales dont les coefficients diagonaux satisfont les inégalités a1 ≥ a2 ≥ · · · ≥ an+1 > 0. Comme compact maximal, on peut alors choisir K = On+1 (R). 2.2. Mesure de Haar et ergodicité Si H est un groupe topologique localement compact, volH désignera une mesure de Haar (invariante à droite). Dans la suite, Γ sera un réseau de G et nous choisirons volG pour que volG (G/Γ) = 1. La mesure induite par volG sur G/Γ est donc une mesure de probabilité qui sera notée vol. Puisque G est simple, elle est invariante sous l’action de G par translations à gauche sur G/Γ. Le théorème d’ergodicité de Moore stipule que l’action d’un sous-groupe F de G par translations à gauche sur G/Γ est ergodique pour la mesure vol dès que F n’est
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
9
pas relativement compact ; ceci signifie que les parties mesurables et F -invariantes ont une mesure nulle ou totale (voir le chapitre 2 de [72]). Exemple 2.3. — Soit Γ un réseau uniforme de PSL2 (R). Le quotient PSL2 (R)/Γ s’identifie au fibré tangent unitaire de la surface hyperbolique Σ obtenue par quotient du disque de Poincaré sous l’action de Γ. Les sous-groupes formés des matrices ! ! ! t e 0 1 t 1 0 (5) gt = , ht+ = , et ht− = 0 1 t 1 0 e−t correspondent aux flots géodésique, horocyclique supérieur et horocyclique inférieur : tous trois agissent ergodiquement sur le fibré tangent unitaire de Σ (voir [28] et [72]). 2.3. Quelques actions de G et Γ 2.3.1. — À toute représentation linéaire ρ : G → GL(V ) sur un espace vectoriel réel de dimension finie est associée une action de G par difféomorphismes sur l’espace projectif P(V ). Ceci montre que G et ses sous-groupes agissent (analytiquement, et même algébriquement) sur une variété compacte de dimension dim(V ) − 1. Plus généralement, si P est un sous-groupe parabolique de G, G agit sur la variété compacte G/P . 2.3.2. — Supposons en outre que le réseau Γ préserve un réseau Λ de V . Alors Γ agit par difféomorphismes analytiques sur le tore V /Λ, qui est de dimension dim(V ) ; cette action préserve la mesure de Lebesgue sur V /Λ car ρ(G) ⊂ SL(V ). Dans l’exemple du paragraphe 2.3.1, l’entropie topologique de tout élément g ∈ G sur P(V ) est nulle, tandis qu’ici Γ contient des éléments qui ont une entropie positive dans V /Λ (prendre un élément non trivial dont un conjugué est dans le tore A, [60]). Cet exemple de base peut être modifié comme suit. L’origine 0 ∈ V détermine un point fixe o ∈ V /Λ sous l’action de Γ, qui peut être éclaté : ceci remplace V /Λ par une variété compacte à bord, ce dernier correspondant à l’ensemble des demi-droites tangentes à V /Λ au point o. Il est possible d’éclater plusieurs points fixes (par exemple après avoir remplacé Γ par le sous-groupe d’indice fini préservant les points de torsion d’ordre m de V /Λ) et de recoller des composantes de bord entre elles pour obtenir des variétés compactes sans bord (voir le § 3.1 de [20]). On peut aussi assurer que Γ préserve une forme volume après éclatement (voir le § 4 de [38]). Ces modifications changent la topologie de la variété mais pas sa dimension. 2.4. Conjectures 2.4.1. Actions homogènes. — Un homomorphisme Γ → H est presque injectif si son noyau est fini. Une action de Γ sur une variété M est presque fidèle si l’homomorphisme
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
10
S. CANTAT
Type
Algèbre de Lie
Rang réel
rep(G)
hom(G)
hom(Gc )
minhom
minvol
An , n ≥ 1
sln+1 (C)
n
2n + 2
2n
2n
2n
2n
Bn , n ≥ 2
so2n+1 (C)
n
4n + 2 (a )
4n − 2
2n
2n
2n
Cn , n ≥ 3
sp2n (C)
n
4n
4n − 2
4n − 4
4n − 4
4n − 4
Dn , n ≥ 4
so2n (C)
n
4n
4n − 4
2n − 1
2n − 1
2n − 1
E6
e6 (C)
6
54
32
26
26
26
E7
e7 (C)
7
112
54
54
54
54
E8
e8 (C)
8
496
114
112
112
112
F4
f4 (C)
4
52
30
16
16
16
G2
g2 (C)
2
14
10
6
6
6
Table 1. Groupes de Lie complexes classiques. – (a ) Pour B2 , i.e. so5 (C), on a rep(G) = 8.
correspondant Γ → Diff(M ) est presque injectif. Lorsque rg(G) ≥ 2, les réseaux sont presque simples, donc tout homomorphisme d’image infinie est presque injectif. Soit N une variété connexe compacte. Si N est munie d’une action presque fidèle du groupe G et est de dimension minimale pour cette propriété, alors V est homogène sous l’action de G (voir [64]). Si H est un groupe de Lie, nous noterons donc hom(H) la dimension minimale d’un quotient compact de H par un sous-groupe fermé de codimension strictement positive. Lorsque H est presque simple un tel sous-groupe maximal est parabolique (voir [6, 55, 57, 66]). Ces dimensions peuvent donc être calculées pour tous les groupes simples : nous les fournissons dans les tables 1 à 3 (voir [50, 64]). Nous dirons qu’une action de Γ sur N est homogène si N est une variété homogène sous l’action d’un groupe de Lie H et l’action de Γ sur N provient de celle de H via un homomorphisme ρ : Γ → H. Nous noterons homdim(Γ) le minimum des dimensions des variétés connexes et compactes qui supportent une action homogène et presque fidèle de Γ. Pour calculer homdim(Γ), il convient de déterminer les groupes de Lie H dans lesquels Γ se plonge presque et pour lesquels hom(H) est minimal. Conjecture 2.4. — Soit G un groupe de Lie connexe, dont l’algèbre de Lie est simple et le rang est ≥ 2. Soit Γ un réseau de G. Si M est une variété compacte de dimension strictement inférieure à homdim(Γ), tout homomorphisme de Γ vers le groupe des difféomorphismes de M a une image finie. Cette conjecture, inspirée de [11, 23], est une version renforcée des conjectures initiales de Zimmer. Pour obtenir une conjecture qui dépend seulement du groupe de Lie ambiant, on utilise le lemme suivant.
ASTÉRISQUE 414
(1136)
Type
Algèbre de Lie
11
PROGRAMME DE ZIMMER
Rang réel
rep(G)
hom(G)
hom(Gc )
minhom
minvol
An , n ≥ 1
sln+1 (R)
n
n+1
n
2n
n
n+1
”
slm (H), 2m = n + 1
m−1
2n + 2 (a )
2n − 2
2n
2n − 2
2n
”
sup,q , p + q = n + 1
min(p, q)
4n + 4 (b )
2n − 1
2n
2n − 1
2n
Bn , n ≥ 2
sop,q , p + q = 2n + 1
min(p, q)
2n + 1
2n − 1
2n
2n − 1
2n
Cn , n ≥ 3
sp2n (R)
n
2n
2n − 1
4n − 4
2n − 1
2n
”
sp2p,2q , p + q = n
min(p, q)
4n
4n − 5
4n − 4
4n − 5
4n − 4
”
sp4,4
2
16
10
12
10
12
Dn , n ≥ 4
sop,q , p + q = 2n
min(p, q)
2n
2n − 2
2n − 1
2n − 2
2n − 1
”
son (H)
bn/2c
4n (c )
4n − 7
2n − 1
2n − 1
2n − 1
a
Table 2. Groupes de Lie réels classiques non compacts. – ( ) Pour sl2 (H), rep(G) = 6. (b ) Pour sup,q et n = p + q − 1 = 2 ou 3, rep(G) = 6. (c ) Pour son (H) avec n = 2 (resp. 3) on a rep(G) = 6 (resp. 8).
Lemme 2.5. — Soit G un groupe de Lie réel simple de rang ≥ 2. Pour tout réseau Γ de G on a homdim(Γ) ≥ min (hom(G), hom(Gc )) ≥ rg(G) où Gc désigne un groupe de Lie compact dont l’algèbre de Lie complexifiée est isomorphe à la complexification de celle de G. L’inégalité de gauche découle du théorème de super-rigidité de Margulis. L’inégalité hom(G) ≥ rg(G) résulte du fait suivant, qui peut être établi avec l’argument donné plus bas pour le lemme 8.8 : si h est une sous-algèbre stricte de g qui contient a, alors codim(h) ≥ dim(a). L’inégalité hom(Gc ) ≥ rg(G) s’obtient de la même manière en considérant la complexification de l’algèbre de Lie de Gc . Dans la suite, nous noterons minhom(G) l’entier min (hom(G), hom(Gc )) apparaissant dans le lemme 2.5. La conjecture suivante est donc légèrement plus faible que la précédente. Conjecture 2.6. — Soit G un groupe de Lie connexe, dont l’algèbre de Lie est simple et le rang est ≥ 2. Si M est une variété compacte de dimension < minhom(G), aucun réseau de G ne s’injecte dans Diff(M ). Tables. — Les tables 1 à 3 listent les entiers rg(G), hom(G) et hom(Gc ) pour tous les groupes de Lie réels presque simples. L’entier minhom(G) est le minimum de hom(G) et hom(Gc ). L’entier rep(G) est la dimension minimale d’une représentation non triviale de l’algèbre g. L’entier minvol est le minimum de rep(G) et hom(Gc ) : il concerne les actions de réseaux préservant une forme volume. Par construction, la liste ne dépend donc que de l’algèbre g.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
12
S. CANTAT
Type
Algèbre de Lie
Rang réel
rep(G)
hom(G)
hom(Gc )
minhom
minvol
E6
e6(6)
6
27
16
26
16
26
”
e6(2)
4
27
21
26
21
26
”
e6(−14)
2
27
21
26
21
26
”
e6(−26)
2
27
16
26
16
26
E7
e7(7)
7
56
27
54
27
54
”
e7(−5)
4
56
33
54
33
54
”
e7(−25)
3
56
27
54
27
54
E8
e8(8)
8
248
57
112
57
112
”
e8(−24)
4
248
57
112
57
112
F4
f4(4)
4
26
15
16
15
16
"
f4(−20)
1
26
15
16
15
16
G2
g2(2)
2
7
5
6
5
6
Table 3. Groupes de Lie réels exceptionnels non compacts.
La première table concerne les groupes de Lie complexes (vus comme groupes de Lie réels), la deuxième les groupes réels classiques, et la dernière les groupes réels exceptionnels. 2.4.2. Actions préservant le volume. — Si G est un groupe de Lie réel non compact dont l’algèbre de Lie est simple, et si M = G/P est un quotient de G par un sousgroupe parabolique de codimension > 0, il n’existe pas de forme volume G-invariante sur M . Si l’on s’intéresse aux actions qui préservent une forme volume, on peut donc mettre ces exemples de côté. Deux entiers peuvent alors être introduits. Le premier est l’entier hom(Gc ) introduit après le lemme 2.5. Le second est le minimum rep(G) des dimensions des espaces vectoriels V pour lesquels il existe une représentation linéaire ρ : G → GL(V ) presque fidèle ; en effet, s’il existait en plus un réseau Λ ⊂ V préservé par ρ(Γ) alors Γ agirait sur V /Λ en préservant le volume. Le minimum de ces deux entiers sera noté minvol(G). Conjecture 2.7. — Soit G un groupe de Lie connexe, d’algèbre de Lie simple et de rang ≥ 2. Soit M une variété compacte munie d’une forme volume ω. Si dim(M ) < minvol(G), aucun réseau de G ne s’injecte dans Diff(M, ω). Exemple 2.8. — Le groupe SLn+1 (C) × SUn+1 est isotypique, car la complexification de SUn+1 est SLn+1 (C). Le théorème de Borel-Harder permet alors de construire des réseaux uniformes et irréductibles Γ0 ⊂ SLn+1 (C) × SUn+1 (voir [69], Cor. 18.7.4). Ce réseau est le graphe d’un homomorphisme ρ : Γ → SUn+1 où Γ est un réseau uniforme de SLn+1 (C). L’action de SUn+1 sur l’espace projectif Pn (C) préserve la métrique de Fubini-Study ; l’homomorphisme ρ fournit donc une action isométrique
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
13
de Γ (donc préservant le volume) en dimension 2n. De même, SOn (H) et SO2n (R) ont la même complexification SO2n (C) ; il existe donc des actions isométriques de réseaux uniformes Γ ⊂ SOn (H) sur la sphère unité S2n−1 . Remarque 2.9. — Les conjectures précédentes ont été formulées sans préciser la régularité des difféomorphismes car elles sont déjà intéressantes pour les difféomorphismes analytiques et sont susceptibles d’être satisfaites pour les actions par homéomorphismes. 2.5. But Notre but principal est de démontrer le théorème A, qui répond positivement aux conjectures 2.6 et 2.7 lorsque G = SLn+1 (R) et Γ est uniforme. Les résultats de [11] sont plus généraux et incluent notamment le théorème suivant. Théorème B. — Soit Γ un réseau uniforme de Sp2n (R) (resp. SOn,n (R) ou SOn,n+1 (R)), avec n ≥ 2. Soit M une variété compacte munie d’une forme volume ω. Si dim(M ) < 2n − 1 (resp. 2n − 2, resp. 2n − 1), tout homomorphisme de Γ dans Diff 2 (M ) a une image finie. Si dim(M ) < 2n (resp. 2n − 1, resp. 2n), tout homomorphisme de Γ dans Diff 2 (M, ω) a une image finie. Les conjectures 2.6 et 2.7 sont donc satisfaites pour les réseaux uniformes des formes déployées des groupes classiques. Le paragraphe 8.5 explique succinctement la stratégie qui permet d’adapter la démonstration du théorème A pour obtenir le théorème B. Pour les actions sur les surfaces compactes, d’autres techniques permettent d’analyser les actions de réseaux non uniformes : le théorème C du paragraphe 11.3 fait la synthèse des résultats obtenus dans ce cadre.
3. SUSPENSION ET EXPOSANT DE LYAPOUNOFF MAXIMAL À partir de maintenant, G est un groupe de Lie connexe et à centre fini dont l’algèbre de Lie g est simple ; a ⊂ g est un sous-espace de Cartan, A = exp(a) est le tore associé, et K ⊂ G est un sous-groupe compact maximal tel que G = KA+ K. On fixe un réseau uniforme Γ de G et une action de Γ par difféomorphismes de classe C k sur une variété connexe compacte M de dimension d, avec k > 1. On note α : Γ → Diff k (M ) l’homomorphisme correspondant. Lorsque le rang de G est égal à 1, les théorèmes A et B sont soit évidents soit vides. L’hypothèse rg(G) ≥ 2 apparaîtra donc souvent dans la suite.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
14
S. CANTAT
3.1. Suspension La variété G × M est munie d’une action de G par translations à gauche, définie par h · (g, m) = (hg, m) pour tout h ∈ G. Elle est aussi munie d’une action diagonale de Γ définie par (γ, (g, m)) 7→ (gγ −1 , α(γ)(m)) pour tout γ ∈ Γ. Ces deux actions commutent, et par passage au quotient nous obtenons – une variété quotient Mα = (G × M )/Γ, qui est munie d’une projection sur le premier facteur notée π : Mα → G/Γ ; – une action de G sur Mα obtenue par passage au quotient de l’action h · (g, m) = (hg, m). L’action G × Mα → Mα est la suspension de l’action de Γ sur M ; nous noterons αG : G → Diff k (Mα ) l’homomorphisme associé. La projection π entrelace l’action de G sur Mα avec celle par translations à gauche sur G/Γ : (6)
π(αG (g)(x)) = gπ(x).
L’action de G sur Mα contient celle de Γ sur M : pour tout γ ∈ Γ et tout m ∈ M , αG (γ)(eG , m) = (eG , α(γ)(m)) dans Mα ; autrement dit, la fibre π −1 (eG ) = M est Γ-invariante, et l’action de Γ sur cette fibre est donnée par α. Les orbites de G dans Mα forment un feuilletage G , transverse aux fibres de π, dont l’holonomie est donnée par l’action de Γ sur la fibre M = π −1 (eG ). La projection π induit un revêtement de chaque feuille de ce feuilletage vers la base G/Γ. Le groupe G sera muni d’une métrique riemannienne invariante à droite, et invariante à gauche par son sous-groupe compact maximal K ; elle détermine une distance dG sur G et une métrique riemannienne r sur G/Γ. Nous munirons Mα d’une métrique riemannienne s telle que π∗ (s) soit égale à r et les fibres de π soient orthogonales aux feuilles de G . Remarque 3.1. — Supposons que α : Γ → Diff k (M ) s’étende en un homomorphisme α ˆ : G → Diff k (M ). C’est le cas lorsque M = Pn (R), G = SLn+1 (R) et l’action de Γ est induite par celle de G sur Pn (R) par transformations projectives. Soit Ψ : G × M → G×M le difféomorphisme défini par Ψ(g, m) = (g, α ˆ (g)m). Alors Ψ(gγ −1 , α(γ)(m)) = (gγ −1 , α ˆ (g)m), si bien que Ψ entrelace l’action de Γ sur G × M avec celle de Γ par translations à droite sur le seul facteur G. Ainsi, Ψ induit un difféomorphisme de Mα vers G/Γ×M qui conjugue l’action de G sur Mα à l’action diagonale de G sur G/Γ×M . 3.2. Cocycle et exposant maximal Soit (X, X , µ) un espace mesuré, X étant la tribu et µ une mesure de probabilité. Soit G × X → X une action mesurable de G sur X. Un cocycle à valeurs dans un
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
15
groupe topologique H est une application mesurable D : G × X → H telle que la relation de cocycle (7)
D(g 0 g, x) = D(g 0 , gx)D(g, x)
soit satisfaite pour tout couple (g 0 , g) ∈ G × G en presque tout point x ∈ X. Supposons que H soit le groupe GL(V ), où V est un R-espace vectoriel de dimension finie. Soit k · k une norme sur V ; elle définit une norme d’opérateurs sur End(V ) que nous noterons aussi k · k. La dilatation (logarithmique) est alors définie par (8)
Dil(g, x) = log kD(g, x)k.
Elle est sous-additive, au sens où Dil(g 0 g, x) ≤ Dil(g 0 , g(x)) + Dil(g, x). Soit g un élément de G qui préserve la mesure µ. Supposons que x 7→ Dil(g, x) appartienne à L1 (X, µ) et appliquons le théorème ergodique sous-additif de Kingman ([65]) : pour µ-presque tout x, la suite n1 Dil(g n , x) converge vers une limite λ+ (g, µ)(x) ∈ R ∪ {−∞} ; de plus, Z Z 1 Dil(g n , x) dµ(x) (9) λ+ (g, µ)(x) dµ(x) = inf n≥1 n X X et si cet infimum est distinct de −∞ la convergence a également lieu dans L1 (X, µ). Le nombre λ+ (g, µ)(x) est l’exposant de Lyapounoff maximal de g, pour D, au point x. La fonction λ+ (g, µ) est g-invariante : lorsque µ est ergodique, cette fonction est constante et égale à l’infimum des moyennes des fonctions n1 Dil(g n , ·). Remarque 3.2. — Soit (k · kx )x∈X une famille de normes sur V pour laquelle il existe une constante c > 0 telle que c−1 k · k ≤ k · kx ≤ c k · k en tout point x de X. On peut alors modifier la définition de Dil(h, x) en calculant la norme de D(h, x) en tant qu’opérateur linéaire de (V, k · kx ) vers (V, k · kh(x) ). Ceci ne change ni la convergence de la suite n1 Dil(hn , x), ni sa valeur limite. 3.3. Semi-continuité de l’exposant de Lyapounoff maximal dans les fibres Rappelons que d désigne la dimension de M . Soit T π Mα le sous-fibré de T Mα formé des espaces tangents aux fibres de π. Fixons une trivialisation mesurable η : T π Mα → Mα × V , avec V = Rd , et une norme k · k sur V . Nous supposerons qu’il existe une constante c > 0 telle que (10)
c−1 k · k ≤ k · kx ≤ c k · k
vis-à-vis des normes k · kx de V qui sont issues, via la trivialisation η, de la métrique riemannienne de Mα . Considérons le cocycle Dπ : G × Mα → GL(V ) donné par la différentielle des éléments de G le long des fibres de π, vues dans la trivialisation que nous venons de fixer. En calculant les fonctions de dilatation (11)
Dil(g, x) = log k Dπ (αG (g), x) kx
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
16
S. CANTAT
à l’aide des normes k · kx (comme dans la remarque 3.2), nous obtenons : (i) les fonctions de dilatation Dil(g, x) sont continues sur G × Mα ; (ii) pour toute partie compacte C de G, Dil(g, x) est uniformément majorée sur l’ensemble C × Mα . L’hypothèse d’intégrabilité Dil(g, ·) ∈ L1 (Mα , µ) est donc satisfaite pour tout g ∈ G et toute mesure de probabilité g-invariante µ sur Mα . L’exposant de Lyapounoff maximal associé sera noté λπ+ (g, µ)(x) et sera appelé exposant de Lyapounoff vertical maximal. R Puisque Dil(g, x) est continue par rapport à x, les fonctions µ 7→ n1 X Dil(g n , x) dµ sont continues pour la topologie faible-? ; le lemme suivant en découle. R Lemme 3.3. — Pour tout g ∈ G, la fonction µ 7→ Mα λπ+ (g, µ) dµ est semicontinue supérieurement sur l’ensemble convexe compact des mesures de probabilité g-invariantes. 3.4. Moyennes et positivité de l’exposant de Lyapounoff Si ν est une mesure de probabilité sur G et µ est une mesure de probabilité sur Mα , nous noterons ν ? µ la convolution Z (12) ν?µ= αG (g)∗ (µ) dν(g). G
Soit B un sous-groupe fermé de G. Une suite croissante de compacts Fm ⊂ B qui recouvrent B et satisfait (13)
volB (Fm 4 gFm ) =0 m→∞ volB (Fm ) lim
pour tout g dans B sera appelée une suite de Følner ; une telle suite existe si et seulement si le groupe B est moyennable (voir [3], Annexe G). La suite de mesures 1 m de probabilité volBF(F volB associée à une telle suite (Fm ) sera également dite « de m) Følner ». Lemme 3.4. — Soient B un sous-groupe fermé de G et νm une suite de mesures de probabilité sur B à supports compacts. Soient g un élément de G et µ une mesure de probabilité g-invariante sur Mα . Si B centralise g, alors (1) les mesures νm ? µ sont αG (g)-invariantes ; (2) pour tout m, λπ+ (g, νm ? µ) = λπ+ (g, µ) ; (3) si νm ?µ converge vers une mesure µ0 , alors g préserve µ0 et λπ+ (g, µ0 ) ≥ λπ+ (g, µ). En outre, si νm est une suite de Følner, toute limite faible µ0 de νm ? µ est invariante sous l’action de B sur Mα .
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
17
L’assertion (1) résulte de αG (g)∗ µ = µ et de gf = f g pour tout f ∈ B. L’assertion (2) découle de la relation de cocycle Dil(g n , f (x)) = Dil(g n , x) + E(x) avec un terme d’erreur E(x) qui est majoré indépendamment de n par (14)
sup
sup max(Dil(f, x), Dil(f −1 , x))
f ∈Support(νm ) x∈X
lorsque f ∈ Support(νm ). L’assertion (3) suit des deux premières et du lemme 3.3.
4. FORMES DE LYAPOUNOFF ET VARIÉTÉS INSTABLES Soit A un groupe abélien isomorphe à Rr (ou à Zr ) ; on munit A d’une norme euclidienne notée |·|. On note A∨ l’espace des formes linéaires A → R. Soit A×N → N une action différentiable de A sur une variété compacte N . La variété N est munie d’une métrique riemannienne ; kv k désignera la norme du vecteur tangent v ∈ Tx N et |Jac(g)x | la valeur absolue du déterminant jacobien de g∗ : Tx N → Tg(x) N . Soit µ une mesure de probabilité sur N qui est A-invariante ; rappelons que µ est ergodique si tout ensemble mesurable A-invariant est de mesure nulle ou totale. Certains éléments de A peuvent donc agir de manière non ergodique. 4.1. Le théorème d’Oseledets Si l’on fixe (convenablement) une trivialisation mesurable du fibré tangent à N , les différentielles des éléments de A forment alors un cocycle (intégrable) à valeurs dans GLdN (R), avec dN = dim(N ). Le théorème d’Oseledets peut être appliqué à ce cocycle, et conduit au théorème suivant (voir [36] et [13, 17, 39]). Théorème 4.1. — Soit µ une mesure de probabilité sur N qui est A-invariante et ergodique. Il existe un ensemble Λ ⊂ N , un entier k ≥ 0, des formes linéaires distinctes λi : A → R, 1 ≤ i ≤ k, et une décomposition en somme directe Tx N = Lk i=1 Ei (x) pour tout point x ∈ Λ tels que (1) Λ est mesurable, A-invariant, et de mesure totale ; (2) les sous-espaces Ei (x) dépendent mesurablement de x et sont A-invariants : a∗ Ei (x) = Ei (a(x)) pour tout a ∈ A et tout 1 ≤ i ≤ k ; en particulier, leurs dimensions dim(Ei ) ne dépendent pas de x ; (3) pour tout x ∈ Λ, pour tout vecteur tangent vi ∈ Ei (x) non nul, lim
|a|→+∞
1 (log ka∗ (v) k −λi (a)) = 0; |a|
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
18
S. CANTAT
(4) pour tout x ∈ Λ 1 lim |a|→+∞ |a|
log |Jac(a)(x)| −
k X
! dim(Ei )λi (a)
= 0.
i=1
Les formes linéaires λi sont les formes de Lyapounoff de A ; la dimension dim(Ei ) est la multiplicité de λi . L’assertion (3) montre que le maximum des λi (a) coïncide avec l’exposant de Lyapounoff maximal de a pour le cocycle donné par la différentielle (voir le § 3.2). Lorsque µ n’est pas ergodique, ce théorème reste valable mais pour des formes de Lyapounoff et des multiplicités qui dépendent de x : λi (resp. dim(Ei )) est alors une fonction de Λ vers A∨ (resp. vers N∗ ) ; on note λi (a)(x) (resp. dim(Ei )(x)) ses valeurs. Lorsque A = exp(a) est le tore de G et N = Mα , on peut aussi appliquer le théorème d’Oseledets au cocycle Dπ (a, x) donné par la différentielle de αG (a) restreinte au sous-fibré T π Mα . Les formes de Lyapounoff obtenues seront dites verticales ; nous les noterons λπi : elles forment un sous-ensemble des formes de Lyapounoff de A × Mα → Mα . Puisque π : Mα → G/Γ entrelace l’action de A sur Mα et celle sur G/Γ par translations, les autres formes de Lyapounoff proviennent de l’action de A sur G/Γ ; comme nous le verrons dans l’exemple 4.2 et la preuve de la proposition 8.7, ces formes sont les éléments de Φ ∪ {0}, Φ étant l’ensemble des racines (restreintes, voir le § 2.1).
4.2. Chambres de Lyapounoff Soit λi : A → R une forme de Lyapounoff non nulle (pour une mesure A-invariante ergodique µ fixée sur N ). Le noyau de λi détermine un hyperplan Hi de A ; lorsque a ∈ A traverse cet hyperplan, le signe de λi (a) change. Si λi et λj sont deux formes de Lyapounoff distinctes, le noyau de λi − λj est un hyperplan Hi,j ; lorsque a ∈ A traverse cet hyperplan, c’est l’ordre des exposants qui change : l’inégalité λi (a) > λj (a) S S devient λj (a) > λi (a). Les composantes connexes de A \ ( i Hi ∪ i,j Hi,j ) seront appelées chambres de Lyapounoff de A. Si a et b sont dans la même chambre, les nombres λl (a) et λl (b) sont ordonnés de la même façon, et ont les mêmes signes. À chaque élément a ∈ A est associée une permutation σa de {1, . . . , k} pour laquelle λσa (1) (a) ≥ λσa (2) (a) ≥ · · · ≥ λσa (k) (a) ; l’application a 7→ σa est constante dans les chambres de Lyapounoff, et les inégalités λσa (i) (a) ≥ λσa (i+1) (a) y sont strictes. Le plus grand indice j pour lequel λσa (j) (a) > 0 sera noté ua (ou ua (x) si µ n’est pas ergodique) ; ua (x) désigne donc le nombre d’exposants strictement positifs en x pour a.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
19
4.3. Les variétés stables et instables La théorie de Pesin montre que, pour chaque élément a de A, pour (µ-presque) tout x ∈ Λ, et pour tout i ≤ ua (x), l’ensemble ß ™ 1 (15) Wi (a; x) = y ∈ N ; lim log distN (a−n (x), a−n (y)) ≤ −λσa (i) (a) n→+∞ n est une variété immergée, de dimension égale à la somme des multiplicités dim(Eσa (j) ) où j décrit l’ensemble des indices pour lesquels λσa (j) (a) ≥ λσa (i) (a). Les variétés Wi (a; x) sont définies µ-presque partout, sont lisses, et sont deux à deux disjointes : Wi (a; x) ∩ Wi (a; y) = ∅ sauf si Wi (a; x) = Wi (a; y). Ce sont les variétés instables de a ; la variété Wua (x) (a; x) est la variété instable maximale en x. Les Wi (a; x) forment une sorte de « lamination » d’une partie de N de mesure totale. Comme (16)
Wi (a; x) ⊂ Wi+1 (a; x),
les Wi (a; y) pour y ∈ Wi+1 (a; x) ∩ Λ forment un feuilletage de Wi+1 (a; x). Exemple 4.2. — Considérons le groupe G = SLn+1 (R), avec les notations de l’exemple 2.2. Soit Γ ⊂ G un réseau uniforme. Le groupe G agit par translations à gauche sur G/Γ. Chaque groupe élémentaire Ei,j détermine ainsi un champ de vecteurs Xi,j sur G/Γ. Le groupe diagonal A normalise chacun des Ei,j et préserve donc les champs associés : a∗ (Xi,j ) = (Li − Lj )(a)Xi,j pour tout a ∈ A. Les formes de Lyapounoff non nulles coïncident donc avec les racines. Pour décrire les variétés instables, prenons n = 2 et fixons un élément a ∈ A dont les coefficients diagonaux vérifient a1 /a3 > a1 /a2 > a2 /a3 > 1. Alors W1 (a; x) est l’orbite de x sous E1,3 , W2 (a; x) est l’orbite de x sous l’action du groupe à 2 paramètres engendré par E1,2 et E1,3 , et W3 (a; x) par celle du groupe (non commutatif) formé des matrices triangulaires supérieures avec des 1 sur la diagonale. On notera que le champ de plan déterminé par X1,2 et X2,3 n’est pas intégrable. Plus généralement, si a = exp(u) avec u un élément intérieur à la chambre de Weyl ∆ ⊂ a, les variétés instables maximales de a dans G/Γ sont données par les orbites du groupe connexe dont l’algèbre de Lie est engendrée par les gL avec L ∈ Φ+ .
5. LA FORMULE DE LEDRAPPIER-YOUNG 5.1. Entropie Soit (X, X , µ) une espace mesuré, X désignant la tribu et µ une mesure de probabilité. Si f est une transformation mesurable de (X, X ) qui préserve µ, l’entropie moyenne de f par rapport à µ sera notée hµ (f ). Lorsque (X, dist) est un
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
20
S. CANTAT
espace métrique compact, X est la tribu des boréliens, et f est continue, le théorème de Mikael Brin et Anatole Katok permet de définir l’entropie de la façon suivante. Pour x ∈ X, la boule dynamique Bn (x; ) est l’ensemble des points y de X tels que la distance entre f j (x) et f j (y) est majorée par pour tous les temps 0 ≤ j ≤ n − 1. Alors Å ã 1 lim − log µ(Bn (x; )) (17) hµ (f ; x) = lim →0 n→+∞ n R existe pour µ-presque tout x et hµ (f ) est égale à X hµ (f ; x) dµ(x). Pour définir hµ (f ) dans le cas général, considérons une partition P de X en une famille dénombrable d’ensembles mesurables ; si x ∈ X, notons P (x) l’atome de P contenant x. Les transformations f j transportent P vers de nouvelles partitions (f j )∗ P ; la partition engendrée par les n partitions (f j )∗ P , 0 ≤ j ≤ n, est alors notée Pn . Andrei Kolmogorov remarque alors que la limite 1 X (18) hµ (f ; P ) = lim −µ(Q) log(µ(Q)) n→+∞ n Q ∈Pn
existe et définit hµ (f ) comme le maximum des hµ (f ; P ). Par le théorème de Claude Shannon, Brockway McMillan, et Leo Breiman, hµ (f ; P ) est aussi égale à la valeur limite moyenne de − n1 log µ(Pn (x)). Le lecteur pourra consulter [49] pour ces résultats. Nous utiliserons les propriétés suivantes de hµ (f ), dans lesquelles f désigne une bijection bimesurable de (X, X ) préservant µ. 1. Pour tout n ∈ Z, hµ (f n ) = |n|hµ (f n ) ; en particulier, l’entropie de f coïncide avec celle de la bijection réciproque f −1 . 2. Si π : (X, X ) → (Y, Y ) est une application mesurable et si g est une transformation mesurable de Y qui préserve π∗ µ et vérifie π ◦ f = g ◦ π, alors hµ (f ) ≥ hπ∗ µ (g). 5.2. La formule Soit f un difféomorphisme de classe C k d’une variété riemannienne compacte N , avec k > 1. Soit µ une mesure de probabilité borélienne sur N qui est f -invariante. Supposons dans un premier temps que µ est ergodique, et appliquons le paragraphe 4 au groupe A = f Z . Nous noterons λi les exposants de Lyapounoff de f , ordonnés de manière décroissante, et Wi (x) les variétés instables associées. Fixons un indice i avec λi > 0. Soit ξ une partition mesurable de N subordonnée aux variétés Wi (x) (voir [61]) : µ-presque tout point x appartient à un atome ξ(x) de la partition ξ, cet atome ξ(x) est contenu dans Wi (x), et c’est un voisinage ouvert de x dans Wi (x). La mesure µ peut alors être désintégrée suivant la partition ξ. Ceci
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
21
fournit, pour presque tout x, une mesure de probabilité µξ(x) supportée par ξ(x), de sorte que – pour tout ensemble borélien B ⊂ N , la fonction x 7→ µξ(x) (ξ(x) ∩ B) est mesurable ; R R R – pour toute fonction continue ϕ, N ϕ dµ = N ξ(x) ϕ dµξ(x) dµ(x). Les µξ(x) sont les conditionnelles de µ (voir [61, 44, 42]). La dimension de µξ(x) au point x est définie par la formule (19)
log µξ(x) (Bi (x, ρ)) , ρ→0 log(ρ)
δi (x) = lim
où Bi (x, ρ) désigne la boule de rayon ρ dans ξ(x) pour la métrique riemannienne de Wi (x) induite par celle de N . Ledrappier et Young montrent que cette limite existe en presque tout point x, est constante le long des orbites de f , et ne dépend pas du choix de la partition ξ subordonnée à Wi . De plus, δi (x) est égale à l’infimum des dimensions de Hausdorff des ensembles Z ⊂ ξ(x) pour lesquels µξ(x) (Z) > 0 (voir [70]). La différence (20)
γi (x) = δi (x) − δi−1 (x)
(avec δ0 (x) = 0 par définition) peut alors être interprétée comme la dimension de Hausdorff de µ dans Wi (x) transversalement au feuilletage fourni par les Wi−1 (y) ; en particulier, on montre que γi (x) ≤ dim(Ei (x)).
(21)
Puisque µ est ergodique, les dimensions δi , γi , et dim(Ei ) ne dépendent pas de x. Sans l’ergodicité, le nombre u(x) d’exposants > 0, les valeurs λi (x), et les multiplicités dim(Ei (x)) peuvent varier avec x ; de même, δi (x) et γi (x) dépendent de x. Théorème 5.1 (Ledrappier-Young, [10, 45, 46]). — Soit f un difféomorphisme de classe C k , k > 1, d’une variété compacte N . Soit µ une mesure de probabilité borélienne f -invariante sur N . L’entropie de f vis-à-vis de la mesure µ vérifie (22)
hµ (f ) =
Z u(x) X
γi (x)λi (x) dµ(x).
X i=1
Ainsi (23)
hµ (f ) ≤
Z u(x) X
dim(Ei (x))λi (x) dµ(x)
X i=1
et il y a égalité si, et seulement si les conditionnelles de µ le long des variétés instables Wu(x) (x) sont absolument continues par rapport à la mesure de Lebesgue.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
22
S. CANTAT
Précisons la dernière assertion. La théorie de Pesin fournit des paramétrages locaux des variétés instables Wi (x) par des boules centrées à l’origine dans Rdi , avec di = dim(Wi (x)). On note voli,x l’image de la mesure de Lebesgue par ces paramétrages, que l’on restreint aux atomes ξ(x). (2) On note alors Jacu (f −n ; y) le jacobien de f −n : Wu(x) (x) → Wu(f −n (x)) (x) en un point y de la variété instable locale maximale ; ce jacobien est le rapport, calculé en y, entre les formes volumes (f −n )∗ volu(x),f −n (x) et volu(x),x le long de Wu(x) (x). On définit alors (24)
∞ Y Jacu (f −1 ; f −n (x)) Jacu (f −n ; x) ∆(x, y) = = lim . u −1 Jac (f ; f −n (y)) n→+∞ Jacu (f −n ; y) n=0
Si les mesures conditionnelles de µ le long des variétés instables Wu(x) (x) sont absolument continues par rapport à la mesure de Lebesgue, Ledrappier et Young montrent que les densités τx telles que µξ(x) = τx volu(x),x sont déterminées par la relation τx (y) (25) = ∆(x, y) τx (x) et par la condition µξ(x) (ξ(x)) = 1. Remarque 5.2. — L’égalité (22) est la formule de Ledrappier-Young. L’inégalité (23) est l’inégalité de Margulis-Ruelle ([62]). La formule de Pesin correspond au cas d’égalité lorsque les conditionnelles de µ le long des variétés instables maximales Wu(x) (x) sont absolument continues par rapport à la mesure de Lebesgue (voir [58, 44]). Remarque 5.3. — Lorsque l’on étudie la dynamique d’un groupe abélien A = Rr de rang r ≥ 2 vis-à-vis d’une mesure de probabilité A-invariante, la formule de Ledrappier et Young peut être employée simultanément pour tous les éléments d’une même chambre de Lyapounoff. Huyi Hu en déduit que l’entropie a 7→ hµ (a) est sousadditive, et linéaire dans chaque chambre : hµ (ab) ≤ hµ (a)+hµ (b) avec égalité lorsque a et b appartiennent à la même chambre (voir [36]). Nous n’aurons pas besoin de ce résultat ici. 5.3. Dimension maximale, et invariance supplémentaire 5.3.1. — Ajoutons deux hypothèses supplémentaires. Voici la première : (i) un groupe de Lie connexe H agit librement sur N par difféomorphismes, et les variétés instables Wu(x) (x) de f sont des orbites de H. (2)
Ici, je passe sous silence le choix précis des paramétrages. Il s’agit des paramétrages données par la théorie de Pesin dans les « boîtes de Pesin ». Les variétés instables que nous emploierons seront naturellement paramétrées par les orbites d’un groupe de Lie agissant sur N .
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
23
Soit volH une forme volume sur H invariante par translations à gauche ; cette forme est unique à multiplication près par un réel 6= 0. La variété Wu(x) (x) s’identifie à l’orbite Hx de x et on la munit de la forme volx obtenue par image de volH via l’application h ∈ H 7→ hx ∈ Wu(x) (x). La seconde hypothèse est : (ii) le jacobien de f : Wu(x) (x) → Wu(f (x)) (f (x)) par rapport aux formes volx et volf (x) est constant. Avec ces choix, la fonction ∆(x, y) est constante dans chaque variété Wu(x) (x). S’il y a égalité dans l’inégalité de Margulis-Ruelle pour µ, les mesures µξ(x) sont alors égales à (volx (ξ(x)))−1 (volx )|ξ(x) . En ce cas, µ est invariante sous l’action de H. L’égalité dans l’inégalité de Margulis-Ruelle conduit donc à l’invariance de µ par le groupe H. Remarque 5.4. — Lorsque f normalise le groupe H, (ii) résulte de (i) : en effet, la conjugaison par f détermine un automorphisme cf du groupe H ; c∗f volH est invariante par translations à gauche, et est donc un multiple de volH . 5.3.2. — Pour illustrer cet argument, reprenons l’exemple 2.3 des flots géodésiques et horocycliques sur PSL2 (R)/Γ. Le flot géodésique correspond à l’action par translations à gauche du groupe diagonal A ⊂ PSL2 (R) ; ce groupe est isomorphe à son algèbre de Lie a = R, via l’application exponentielle t 7→ g t (voir (5)). Supposons t > 0. Les orbites du flot horocyclique supérieur fournissent un feuilletage A-invariant. C’est le feuilletage instable, associé à la forme de Lyapounoff L1,2 , i.e. à t 7→ 2t, tandis que le flot horocyclique inférieur donne le feuilletage stable, avec la forme de Lyapounoff opposée. Les orbites de A correspondent à la forme de Lyapounoff nulle. Considérons maintenant une mesure de probabilité µ qui est invariante et ergodique sous l’action de g t , avec t > 0 fixé. Supposons que µ est également invariante sous l’action du flot hs+ , s ∈ R. Cette invariance assure que les conditionnelles de µ le long du feuilletage instable de g t sont absolument continues par rapport à la mesure de Lebesgue : il y a donc égalité dans l’inégalité de Margulis-Ruelle, c’est-à-dire que l’entropie de g t pour µ est égale au produit de l’exposant (ici 2t) par la dimension des variétés instables (ici 1). Puisque hµ (g −t ) = hµ (g t ) et puisque l’exposant de Lyapounoff positif de g −t est aussi égal à 2t, la formule de Ledrappier-Young montre que la dimension des conditionnelles de µ le long des courbes instables de g −t est égale à 1. Il y a donc encore égalité dans l’inégalité de Margulis-Ruelle, mais maintenant pour g −t et le feuilletage en orbites du flot hs− . Du paragraphe 5.3.1 on déduit que µ est hs− -invariante. Finalement, µ est invariante sous l’action de PSL2 (R) et coïncide donc avec la mesure de Haar sur PSL2 (R)/Γ. Nous renvoyons à [53, 68] pour une présentation détaillée de cette idée.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
24
S. CANTAT
6. THÉORÈMES DE SUPER-RIGIDITÉ POUR LES COCYCLES 6.1. Théorème de super-rigidité de Zimmer Soit (X, X ) un espace mesurable ; il est standard s’il est isomorphe à un espace métrique compact muni de sa tribu des boréliens. Soit µ une mesure de probabilité sur X. Soient G × X → X une action mesurable de G sur X et D : G × X → H un cocycle à valeurs dans un groupe topologique H. À un tel cocycle est associée une action mesurable de G sur X × H, définie par (26)
g(x, y) = (gx, D(g, x)y)
pour tout (x, y) ∈ X × H. Deux cocycles D et D0 sont équivalents s’il existe une application mesurable ϕ : X → H telle que D0 (g, x) = ϕ(gx)−1 D(g, x)ϕ(x) ; l’application (x, y) 7→ (x, ϕ(x)y) conjugue alors l’action de G sur X × H déterminée par D0 à celle déterminée par D. Si ρ : G → H est un homomorphisme de groupes, alors Dρ (g, x) = ρ(g) définit un cocycle indépendant de x. Si D est équivalent à un tel cocycle Dρ , l’action de G sur X × H associée à D est conjuguée à l’action diagonale (x, y) 7→ (gx, ρ(g)y). Soient H1 et H2 deux sous-groupes de H dont les éléments commutent : h1 h2 = h2 h1 pour tout (h1 , h2 ) ∈ H1 × H2 . Si D1 et D2 sont des cocycles à valeurs dans H1 et H2 , leur produit est encore un cocycle. Le théorème suivant est démontré dans [72] et [24]. L’exposé de Hillel Furstenberg à ce séminaire [27] offre une introduction remarquable à cette extension du théorème de super-rigidité de Margulis et à ses applications (voir aussi [21]). Théorème 6.1 (super-rigidité des cocycles de Zimmer). — Soit G un groupe de Lie presque simple, connexe et algébriquement simplement connexe dont le rang est ≥ 2. Soit G × X → X une action de G sur un espace mesurable standard qui préserve une mesure de probabilité µ ergodique. Soit D : G × X → H un cocycle à valeurs dans un groupe algébrique linéaire réel. Il existe alors un homomorphisme de groupes de Lie ρ : G → H, un sous-groupe compact C de H qui centralise ρ(G), un cocycle mesurable R : G × X → C et une application mesurable σ : X → H tels que D(g, x) = σ(gx)−1 Dρ (g)R(g, x)σ(x) pour tout g et pour µ-presque tout x. Si G n’est pas algébriquement simplement connexe, la conclusion reste valable après passage à un revêtement fini de G. En laissant de côté ce problème de revêtement fini, nous pouvons dire que tout cocycle à valeurs dans GLm (R) est équivalent au cocycle Dρ associé à un homomorphisme analytique ρ : G → GLm (R), modulo un
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
25
bruit résiduel qui est confiné dans un cocycle mesurable à valeurs dans un groupe compact. 6.2. Applications Reprenons le contexte et les notations du paragraphe 3.3, et appliquons le théorème de Zimmer au cocycle vertical Dπ , sur la suspension Mα . Pour cela, on suppose qu’il existe une mesure de probabilité µ sur Mα qui est G-invariante et ergodique. Si tout homomorphisme de G vers GLd (R) est trivial, alors Dπ est équivalent à un cocycle à valeurs dans un groupe compact : il existe une application mesurable σ : Mα → GLd (R) et un groupe compact C ⊂ GLd (R) tels que (27)
Dπ (g, x) ∈ σ(αG (g)(x))−1 Cσ(x)
pour tout g et presque tout x. L’exposant de Lyapounoff vertical maximal par rapport à µ est donc nul pour tout élément g ∈ G. Pour s’en convaincre, choisissons > 0 suffisamment petit pour que l’ensemble Y = {y ∈ X| ≤ k σ(y) k ≤ −1 } soit de mesure strictement positive. Par ergodicité de µ, pour presque tout x, il existe une suite d’entiers ni tendant vers l’infini telle que αG (g ni )(x) appartienne toujours à Y . Comme (28)
Dπ (g ni , x) ∈ σ(αG (g ni )(x))−1 Cσ(x)
on déduit que la dilatation moyenne n1i Dil(g ni , x) tend vers 0, et ceci montre que l’exposant maximal est nul. Ainsi, tous les exposants de Lyapounoff verticaux sont nuls. Par exemple, si G = SLn+1 (R) et d ≤ n, tout homomorphisme de G vers GLd (R) est trivial, donc les exposants de Lyapounoff des éléments de G vis-à-vis des mesures G-invariantes sont nuls. Cet argument fournit, plus généralement, le corollaire suivant. Corollaire 6.2 ([27, 21, 72]). — Soit G un groupe de Lie presque simple, connexe, et de rang ≥ 2. Soit Γ un réseau de G. Si Γ agit sur une variété compacte M de dimension d en préservant une mesure de probabilité µ ergodique, il existe une représentation linéaire ρ : G → GLd (R) telle que les exposants de Lyapounoff de tout élément γ ∈ Γ vis-à-vis de µ soient donnés par les logarithmes des modules des valeurs propres de ρ(γ). Ce corollaire supporte évidemment les conjectures 2.6 et 2.7, avec deux bémols cependant : pour l’appliquer, il faut d’abord construire une mesure G-invariante ; l’application σ du théorème 6.1 est seulement mesurable (a priori, log k σ(x)k n’est pas intégrable vis-à-vis de µ). Par exemple, si Γ agit en préservant une forme volume sur M , et si toute représentation de G dans GLd (R) est triviale, le théorème de Zimmer permet de construire une « métrique riemannienne mesurable » sur M qui
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
26
S. CANTAT
est Γ-invariante ; mais les fluctuations de cette métrique par rapport à une métrique lisse ne sont pas contrôlées. Si cette métrique invariante était lisse, la conjecture 2.7 serait démontrée (voir l’argument du paragraphe 10.4). Remarque 6.3. — La conclusion du théorème 6.1 peut éventuellement être renforcée en présence d’une structure géométrique invariante supplémentaire. Considérons par exemple un réseau Γ de SLn+1 (R), n ≥ 2, qui agit sur une variété compacte M en préservant une forme volume et une connexion affine. Si dim(M ) ≤ n, alors Γ préserve une métrique riemannienne, et l’action transite en fait par celle d’un quotient fini de Γ. Si dim(M ) = n + 1 et l’action est fidèle, alors M est difféomorphe à Rn+1/ Zn+1 et l’action de Γ est conjuguée à l’action standard d’un sous-groupe de SLn+1 (Z) d’indice fini (voir [33, 71, 72, 73]).
7. CROISSANCE DES DÉRIVÉES ET EXPOSANTS 7.1. Actions anémiques et vigoureuses Soit H un groupe topologique muni d’une partie symétrique et compacte S ⊂ H qui engendre H. Notons B(n) l’ensemble des éléments de H qui s’écrivent comme produit d’au plus n éléments de S, et notons ` : H → N la longueur définie par (29)
`(g) = min{n | g ∈ B(n)}.
L’ensemble B(n) est donc la boule de rayon n centrée en l’élément neutre eH pour la longueur `. Soit N une variété riemannienne compacte. Soit β : H → Diff 1 (N ) un homomorphisme. Nous noterons kDβ(h)kN le maximum de la norme des différentielles Dβ(h)x : Tx N → Tβ(h)(x) N , calculées à l’aide de la métrique riemannienne fixée sur N . Nous dirons que l’action H ×N → N définie par β est anémique si, pour tout > 0, il existe une constante C > 0 telle que pour tout h ∈ H on ait (30)
kDβ(h) kN ≤ C exp(`(h)).
Si F ≤ T N est un sous-fibré, l’action est anémique le long de F si la majoration précédente est satisfaite pour les normes des dérivées (Dβ(h)x )|Fx restreintes aux sous-espaces Fx . Une action est vigoureuse si elle n’est pas anémique. Ces notions ne dépendent pas du choix de la métrique sur N , ni de la partie génératrice S (symétrique et compacte). Appliquons ces notions au groupe de Lie connexe G et au réseau uniforme Γ. Rappelons que G est muni d’une distance riemannienne dG invariante à droite et biinvariante sous l’action du sous-groupe compact K. Nous pouvons alors remplacer `(g)
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
27
par dG (g, eG ) sans changer les notions introduites. Identifions le sous-espace de Cartan a = Rn à A par l’application exponentielle ; alors A est un sous-espace géodésique de G sur lequel dG est une métrique euclidienne. Si g = kak 0 est la décomposition de Cartan de g ∈ G, avec a = exp(u) et u dans la chambre de Weyl, la distance dG (g, eG ) est égale à la norme de u pour cette métrique euclidienne modulo un terme d’erreur uniformément borné. En tant que réseau de G, Γ est un groupe de type fini (voir [3], §1.3 quand rg(G) ≥ 2) : il existe une partie finie, symétrique et génératrice S ⊂ Γ. Comme Γ est uniforme, la fonction longueur associée à S est égale à la restriction de dG (·, eG ) à Γ modulo un terme d’erreur borné. Ainsi, l’action de Γ sur M est anémique si et seulement si celle de G sur Mα est anémique le long du fibré tangent aux fibres de π : Mα → G/Γ. 7.2. Vigueur et exposants Théorème 7.1. — Soit G×N → N une action C 1 de G sur une variété compacte N . Si l’action est vigoureuse il existe une mesure de probabilité µ sur N qui est A-invariante et possède une forme de Lyapounoff non nulle : il existe b ∈ A tel que λ+ (b, µ) > 0. Nous désignerons par T 1 N le fibré unitaire tangent de N ; un élément v de T 1 N est donc la donnée d’une paire (x, v) où x appartient à N , v appartient à Tx N , et kvk = 1. v Si g est un difféomorphisme de N , et v ∈ T 1 N , on définit (g)1∗ v = kgg∗∗ vk . La dilatation logarithmique de g en v est définie par Å ã kg∗ vk (31) dil(g, v) = log k vk pour tout v ∈ T N ; c’est donc log kg∗ vk si v est unitaire. Si ν est une mesure de probabilité sur T 1 N , la dilatation moyenne de g est définie par Z (32) dil(g, ν) = dil(g, v) dν(v). T 1N
Si νn converge vers ν en topologie faible-? et gn converge vers g en topologie C 1 , alors dil(gn , νn ) converge vers dil(g, ν). Démonstration. — Quitte à moyenner la métrique riemannienne de N sous l’action du groupe compact K, nous pouvons supposer qu’elle est K-invariante. Une suite gn ∈ G tend vers l’infini si et seulement si sa partie diagonale an dans la décomposition de Cartan gn = kn an kn0 tend aussi vers l’infini. Puisque l’action est vigoureuse, il existe un réel > 0, une suite de vecteurs unitaires vn ∈ T 1 N et une suite d’éléments an ∈ A tels que (an ) tende vers l’infini dans A et (33)
k(an )∗ vn k ≥ exp(2dG (eG , an )).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
28
S. CANTAT
Écrivons an = exp(tn un ) avec un ∈ a et tn ∈ R+ choisis pour que dG (eG , an ) = tn . Posons ensuite sn = btn c et bn = exp(un ). Alors (bn ) est une suite bornée et (34)
k(bsnn )∗ vn k ≥ exp(sn ).
En extrayant une sous-suite, nous pouvons supposer, et nous supposerons, que la suite (bn ) converge vers un élément b de A. La moyenne le long de l’orbite de vn sous l’action de bn pour les temps 0 ≤ j < sn détermine une mesure de probabilité νn sur T 1 N : si ϕ : T 1 N → R est continue, Z sn −1 1 X (35) ϕ dνn = ϕ((bjn )1∗ vn ). sn j=0 T 1N L’inégalité (34) entraîne alors dil(bn , νn ) ≥ car
(36)
dil(bn , νn ) =
sn −1 1 X dil(bn , (bjn )1∗ vn ) sn j=0
=
sY n −1 1 k(bj+1 n )∗ vn k log j sn j=0 k(bn )∗ vn k
=
1 k(bsnn )∗ vn k . log sn kvn k
Soit ν une limite faible de la suite νn . Puisque les difféomorphismes bn tendent vers b, on constate facilement que ν est une mesure de probabilité b-invariante pour laquelle dil(b, ν) ≥ . Il existe donc une composante b-ergodique de ν (toujours notée ν) qui vérifie la même inégalité. Soit µb la projection de ν sur N ; c’est une mesure de probabilité b-invariante et ergodique. Le théorème ergodique de Birkhoff peut être appliqué à ν : pour ν-presque tout vecteur unitaire w, nous obtenons Z ≤ dil(b, v) dν(v) T 1N
(37)
n−1 1X dil(b, (bj )1∗ w) n→+∞ n j=0
= lim
1 log kbn∗ wk. n Il existe donc un exposant de Lyapounoff strictement positif pour µb . On moyenne alors µb à l’aide d’une suite de Følner dans A ; la mesure µ obtenue est A-invariante et vérifie λ+ (b, µ) > 0 (la démonstration est semblable à celle du lemme 3.4) . = lim
n→+∞
La même démonstration, appliquée aux exposants de Lyapounoff le long des fibres de la projection π : Mα → G/Γ, fournit l’énoncé suivant.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
29
Théorème 7.2. — Si l’action de Γ sur M est vigoureuse, il existe une mesure de probabilité µ sur Mα qui est A-invariante et un élément b ∈ A tels que l’exposant de Lyapounoff maximal de b le long des fibres de π soit strictement positif : λπ+ (b, µ) > 0.
8. MOYENNES ET INVARIANCE 8.1. Théorèmes de Ratner et Shah 8.1.1. Sous-groupes unipotents. — Un élément g ∈ G est unipotent si l’endomorphisme Ad(g) − Id de g est nilpotent ; un sous-groupe U est unipotent si tous ses éléments le sont. Soit U un sous-groupe fermé de G qui est connexe, simplement connexe et unipotent, et soit u son algèbre de Lie (par le théorème d’Engel, U est nilpotent). Soit b = (b1 , . . . , bs ) une base de u. Chaque élément v de u s’écrit Ps donc v = i=1 αi (v)bi ; la base est dite triangulaire si αk ([bi , bj ]) = 0 dès que k ≤ max{i, j}, et régulière s’il existe une permutation des vecteurs bi qui fournisse une base triangulaire. Exemple 8.1. — Les matrices triangulaires supérieures avec des 0 sur la diagonale forment une sous-algèbre un+1 de sln+1 (R). La famille de matrices élémentaires (38)
(e1,2 , e2,3 , . . . , en,n+1 , e1,3 , e2,4 , . . . , en−1,n+1 , . . . , e1,n , e2,n+1 , e1,n+1 )
définit une base triangulaire de un . Le groupe Un+1 ⊂ SLn+1 (R) associé est celui des matrices triangulaires supérieures avec des 1 sur la diagonale. Fixons une base régulière b de u. L’application exponentielle exp : u → U est alors polynomiale en les coordonnées. Si m = (m1 , . . . , ms ) est un élément de [0, +∞[s , l’ensemble (39)
Fm = {exp(ts bs ) · · · exp(t1 b1 ) ; 0 ≤ ti ≤ mi , pour tout 1 ≤ i ≤ s}
est un compact de U et lorsque les réels mi tendent simultanément vers +∞, les Fm forment une suite de Følner pour U . Nous noterons νm les mesures associées (§ 3.4) : (40)
νm =
1Fm volU . volU (Fm )
8.1.2. Ensembles et mesures algébriques. — Un sous-ensemble fermé Z ⊂ G/Γ est algébrique s’il existe un sous-groupe fermé F de G et un point z de Z tels que F z = Z ; autrement dit, Z est une orbite fermée de F : c’est le quotient de F par F ∩ (zΓz −1 ). Supposons de plus que le sous-groupe discret F ∩ (zΓz −1 ) soit un réseau de F ; c’est automatique lorsque G/Γ est compact, car F z est fermée, donc compacte. Il existe alors une unique mesure de probabilité F -invariante portée par l’ensemble
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
30
S. CANTAT
algébrique Z ; elle est induite par une mesure de Haar de F . Les mesures ainsi construites sont dites algébriques. 8.1.3. Les théorèmes. — Soient Γ un réseau dans le groupe de Lie connexe G, et U un sous-groupe unipotent de G. Les théorèmes de Ratner et Shah dont nous ferons usage sont les quatre énoncés (a), (b), (c) et (d) qui suivent ; ils concernent tous l’action de U par translations à gauche sur G/Γ (voir [28] et [68] pour une introduction). (a) L’adhérence U x de toute orbite de U est algébrique. Plus précisément, pour tout x ∈ G/Γ il existe un sous-groupe fermé F ⊂ G tel que xΓx−1 soit un réseau de F et U x = F x. (b) Toute mesure de probabilité U -invariante et ergodique est algébrique. Ainsi, à tout x ∈ G/Γ est associée une mesure de probabilité mU x : c’est l’unique mesure algébrique dont le support est U x. Si µ est une mesure de probabilité sur G/Γ, nous noterons U ? µ la mesure définie par Z (41) U ?µ= mU x dµ(x). G/Γ
Soit b = de [63].
(bi )si=1
une base régulière de u. La propriété suivante est le corollaire 1.3
(c) Si les s coordonnées de la suite mn = (mi,n ) ∈ [0, +∞[s tendent simultanément vers +∞, la suite de mesures de probabilité νmn ? δx converge vers la mesure algébrique mU x ; donc νmn ? µ converge vers U ? µ pour toute mesure de probabilité µ sur G/Γ. L’énoncé (d) utilise les précédents pour fournir des invariances automatiques. Comme au paragraphe 2.1, a désigne le sous-espace de Cartan de g, L est une racine, et GL est le sous-groupe connexe normalisé par A = exp(a) dont l’algèbre de Lie est gL . (d) Si µ est une mesure de probabilité qui est invariante sous l’action de A et de GL , alors µ est aussi G−L -invariante. Au paragraphe 5.3.1, nous avons démontré cette assertion lorsque G est PSL2 (R) et A est le groupe diagonal en la déduisant du théorème de Ledrappier-Young. Nous utiliserons également le corollaire suivant, que nous énonçons comme une cinquième propriété. Soit U un sous-groupe unipotent normalisé par A. (e) Soit µ une mesure de probabilité sur G/Γ. Si µ est A-invariante, alors U ? µ est aussi A-invariante ; et si µ est A-ergodique, U ? µ l’est aussi. L’invariance résulte de l’assertion (c). L’ergodicité provient de l’existence d’un élément a de A qui contracte strictement U : l’algèbre de Lie de U est contenue dans la somme des algèbres gL avec L(a) < 0 (voir le corollaire 3.7 de [5]). Si une
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
31
fonction bornée ϕ est A-invariante, elle est a-invariante, donc constante le long des orbites de U ; ϕ(x) coïncide donc avec mU x (ϕ) pour U ? µ-presque tout x. L’ergodicité résulte alors de celle de µ (voir la proposition 5.2 de [11]). 8.2. Moyennes et invariance dans G/Γ Proposition 8.2. — Soit µ une mesure de probabilité sur Mα qui est A-invariante et possède une forme de Lyapounoff verticale non nulle. Si le rang de G est ≥ 2, il existe une mesure de probabilité ν sur Mα qui est A-invariante, est A-ergodique, possède une forme de Lyapounoff verticale non nulle, et se projette sur la mesure de Haar : π∗ ν = vol. Remarque 8.3. — Comme rg(G) ≥ 2, nous sommes dans le cadre de la conjecture de Margulis qui prédit que A préserve très peu de mesures de probabilité dans G/Γ (voir [7, 17, 54]). Certaines idées de ce texte sont d’ailleurs déjà présentes dans [17, 39]. Nous allons montrer la proposition 8.2 pour les actions de G = SL3 (R), avec A le groupe des matrices diagonales à coefficients positifs ; le cas du groupe SLn+1 (R) ne présente pas de difficulté supplémentaire. Le cas général est traité au paragraphe 5.4 de [11]. Remarque 8.4. — À partir de µ, il n’est pas difficile de construire une mesure A-invariante dans Mα dont la projection sur G/Γ soit la mesure vol. En effet, le groupe (de Borel) B des matrices triangulaires supérieures contient A et est moyennable ; il est donc possible de moyenner la mesure µ à l’aide d’une suite de Følner dans B, ce qui fournit une mesure ν. La projection π∗ ν coïncide alors avec vol (propriété (d)). Pour démontrer la proposition, il s’agit maintenant de raffiner cet argument pour que ν conserve un exposant de Lyapounoff vertical strictement positif. 8.2.1. Première moyenne. — Comme dans les exemples 2.2 et 4.2, nous notons a = R2 l’algèbre de Lie de A, Li ∈ a∨ les formes linéaires définies par Li (a) = ti , et Ei,j ⊂ G les sous-groupes élémentaires. Remplaçons µ par l’une de ses composantes ergodiques, encore notée µ, possédant une forme de Lyapounoff verticale non nulle ; soit λπ une telle forme : c’est un élément de a∨ \ {0}. Quitte à permuter les indices (i.e. à faire agir le groupe de Weyl de G), nous pouvons supposer que λπ n’est pas proportionnelle à la forme L2 − L3 . Soit a un élément de A dont les termes diagonaux sont exp(−2t), exp(t), exp(t). Alors a et E2,3 commutent, et quitte à choisir t du bon signe λπ (a) > 0. On moyenne alors µ sous l’action de E2,3 sur Mα à l’aide d’une suite de Følner dans E2,3 , ce qui donne une mesure de probabilité µ0 à la limite. Le lemme 3.4 montre que µ0 est a-invariante et vérifie λπ+ (a, µ0 ) > 0. Par construction, µ0 est aussi E2,3 -invariante. De plus, dans G/Γ, la projection π∗ µ0 est à la fois E2,3 , A-invariante,
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
32
S. CANTAT
et A-ergodique ; en effet, π∗ µ était A-invariante, et l’on peut appliquer la propriété (e) puisque A normalise E2,3 . On déduit alors de (d) que π∗ µ0 est à la fois A, E2,3 , et E3,2 -invariante. On moyenne ensuite µ0 sous l’action de A sur Mα à l’aide d’une suite de Følner de A afin d’obtenir une mesure µ1 à la limite. La projection de µ1 sur G/Γ est égale à π∗ µ0 et conserve donc les propriétés d’invariance sous A, E2,3 , et E3,2 . De plus, µ1 est A-invariante et λπ+ (a, µ1 ) > 0 grâce au lemme 3.4 car A et a commutent. 8.2.2. Seconde moyenne. — Supposons pour simplifier que µ1 est A-ergodique (voir la remarque 8.5 ci-dessous). Les formes de Lyapounoff λπi pour µ1 sont des formes linéaires sur a ; l’une d’entre elles, à nouveau notée λπ , fournit l’exposant maximal de a : λπ (a) = λπ+ (a; µ1 ) > 0. Supposons dans un premier temps que λπ n’est pas proportionnelle à la forme linéaire L1 − L2 . Soit u un élément de a tel que L1 (u) − L2 (u) = 0, c’est-à-dire que u = (t, t, −2t). Soit b = exp(u). Alors E1,2 commute à b et λπ (b) > 0 si le signe de t est convenablement choisi. Moyennons µ1 par rapport à E1,2 pour obtenir une mesure limite µ01 , puis par rapport à A pour obtenir une mesure limite µ2 . Par le lemme 3.4 et la propriété (e), µ2 est A-invariante, elle vérifie λπ+ (b; µ2 ) > 0, et sa projection π∗ µ2 dans G/Γ est invariante par A et par E1,2 ; la propriété (d) montre donc que π∗ µ2 est invariante par E2,1 . Ce faisant, on perd a priori l’invariance par E2,3 qui était satisfaite par π∗ µ1 . Mais comme E1,2 commute à E3,2 la mesure π∗ µ01 reste E3,2 -invariante ; et comme A normalise E3,2 , la mesure π∗ µ2 est invariante par A, par E3,2 et par E2,3 (propriétés (e) et (d)). Finalement, π∗ µ2 est invariante sous l’action de toutes les matrices de SL3 (R) dont les coefficients a1,3 et a3,1 sont nuls. Puisque ces matrices engendrent SL3 (R), la mesure π∗ µ2 est G-invariante et coïncide avec la mesure vol. Soit ν une composante A-ergodique de µ2 ayant un exposant de Lyapounoff maximal λπ+ non nul. Puisque la mesure vol est A-ergodique (théorème de Moore), la projection π∗ ν coïncide avec vol ; donc ν vérifie chacune des conclusions de la proposition. Il se pourrait toutefois que la forme de Lyapounoff λπ soit proportionnelle à L1 −L2 . Dans ce cas, on fait jouer à E1,3 le rôle qui était dévolu à E1,2 en considérant un élément b ∈ A qui commute à E1,3 et vérifie λπ (b) > 0 (b est de la forme exp(u) avec u = (t, −2t, t)). On moyenne alors successivement le long des orbites de E1,3 et de A : la mesure µ2 ainsi construite est invariante par A et vérifie λπ+ (b; µ2 ) > 0. Sa projection π∗ µ2 est invariante par E1,3 , par E2,3 car E1,3 et E2,3 commutent, et par A car A normalise ces deux groupes. Elle est donc aussi invariante par E3,2 et E2,1 , donc par G. Ceci termine la preuve.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
33
Remarque 8.5. — Nous avons fait une hypothèse simplificatrice en supposant que µ1 est A-ergodique. Le même raisonnement s’applique sans cette hypothèse en définissant différemment la forme de Lyapounoff λπ . On décompose µ1 en R composantes ergodiques µ1,x : µ1 = Mα µ1,x dµ1 (x). Chaque composante fournit une forme de Lyapounoff maximale λπx pour a, et l’on définit λπ comme la moyenne R λπ = Mα λπx dµ1 (x) (voir le lemme 3.4 de [11]). La preuve s’adapte alors mot pour mot. Exemple 8.6. — Considérons l’action projective de G = SLn+1 (R) sur Pn (R) : si g appartient à G, α ˆ (g) désignera la transformation linéaire projective associée. Restreignons cette action au réseau Γ ⊂ G et construisons la suspension Mα . D’après la remarque 3.1, l’application ψ : (g, m) 7→ (g, α ˆ (g)(m)) induit un difféomorphisme 0 n de Mα sur Mα = G/Γ × P (R) qui conjugue l’action de G sur Mα à l’action diagonale de G sur Mα0 . Notons A le tore formé des matrices diagonales positives. Soient µ une mesure de probabilité A-invariante et ergodique sur Mα et µ0 son image par ψ : c’est une mesure invariante et ergodique pour l’action diagonale de A. Les points fixes de α ˆ (A) sont les n + 1 points pi ayant une seule coordonnée homogène non nulle ; et toute mesure de probabilité α ˆ (A)-invariante et ergodique est une masse de Dirac en l’un de ces points. Ainsi, la projection de µ0 sur Pn (R) est l’une de ces masses de Dirac. Si π∗ µ = vol, comme c’est le cas pour la mesure construite dans la proposition 8.2, alors µ0 = vol ⊗ δp où p est l’un des pi . Ainsi, µ est l’image de vol par l’application g ∈ G/Γ 7→ (g, α ˆ (g)−1 (p)) ∈ Mα . 8.3. Invariance dans Mα Proposition 8.7. — Soit ν une mesure de probabilité A-invariante et ergodique sur Mα , dont la projection sur G/Γ est la mesure de Haar. Si dim(M ) < rg(G), ou si dim(M ) ≤ rg(G) et Γ préserve une forme volume sur M , alors ν est G-invariante. Lemme 8.8. — Soient g une algèbre de Lie réelle simple et u un élément non nul d’un sous-espace de Cartan a ⊂ g. Soit Φu ⊂ Φ l’ensemble des racines L telles que L(u) 6= 0. La sous-algèbre de g engendrée par les espaces propres gL pour L ∈ Φu coïncide avec g. Démonstration du lemme. — Notons h cette sous-algèbre. Si v appartient à a, alors 0 [v, gL ] ⊂ gL pour toute racine, donc [v, h] ⊂ h. Si L0 ∈ Φ et L0 (u) = 0, alors [gL , gL ] ⊂ 0 0 gL +L et (L0 + L)(u) = L(u) 6= 0 pour tout L ∈ Φu , donc [gL , h] ⊂ h. Ainsi, h est un idéal de g, non nul car toutes les racines ne peuvent s’annuler en u ; donc h = g par simplicité de g. Démonstration. — Notons λπi , 1 ≤ i ≤ l, les formes de Lyapounoff verticales de la mesure ergodique ν. Le sous-espace de a∨ engendré par les λπi est contenu dans un
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
34
S. CANTAT
hyperplan : ceci est évident lorsque dim(M ) < rg(G) car l ≤ dim(M ), et cela reste valable lorsque dim(M ) = rg(G) et Γ préserve le volume puisque dans ce cas la somme des λπi , comptées avec leurs multiplicités, est égale à 0 (théorème 4.1, assertion (4)). Nous pouvons donc fixer un élément non nul u ∈ a en lequel les λπi s’annulent toutes. Soit a = exp(u) ∈ A. L’action de A sur G/Γ préserve la mesure vol, cette mesure est ergodique, et les − formes de Lyapounoff non nulles sont les racines L ∈ Φ. Soit Φ+ u (resp. Φu ) l’ensemble des racines prenant une valeur strictement positive (resp. négative) en u. Les espaces instables de a dans G/Γ sont fournis par les champs de vecteurs gL , L ∈ Φ+ u . La formule de Pesin pour l’entropie hvol (a) s’écrit alors X (42) hvol (a) = dim(gL )L(u). L∈Φ+ u
Le groupe G agit aussi sur Mα . Fixons une racine L ∈ Φ. Les orbites de G = exp(gL ) dans Mα sont permutées par l’action de αG (a) et sont contenues dans les feuilles du feuilletage G transverse aux fibres de π (voir le § 3.1). L’exposant de Lyapounoff de αG (a) le long de ces orbites est égal à L(u) ; en effet, π est équivariante et π∗ réalise une isométrie de Tx G vers Tπ(x) G/Γ, donc l’exposant calculé dans Mα est égal à celui de la translation par a le long des orbites de GL dans G/Γ. Les racines L ∈ Φ sont donc aussi des formes de Lyapounoff pour ν et les espaces stables ou instables correspondants sont tangents aux orbites des groupes GL dans Mα . Puisque λπi (u) = 0 pour tout 1 ≤ i ≤ l, les fibres de π : Mα → G/Γ ne contribuent pas à la formule de Ledrappier et Young. L’inégalité de Margulis-Ruelle pour ν est donc Z X dim(gL )L(u) dν(x) hν (αG (a)) ≤ L
Mα
(43) =
L∈Φ+ u
X
dim(gL )L(u).
L∈Φ+ u
Mais π entrelace les actions sur Mα et G/Γ, et π∗ ν est la mesure de Haar de G/Γ. Donc (44)
hvol (a) ≤ hν (αG (a)).
Les relations (42), (43) et (44) montrent ainsi que l’inégalité de Margulis-Ruelle est en fait une égalité pour la mesure ν. Du théorème de Ledrappier et Young et du paragraphe 5.3.1, on déduit que ν est absolument continue par rapport à la mesure de Lebesgue le long des variétés instables de αG (a), puis qu’elle est invariante sous l’action des groupes GL , pour L dans Φ+ u . En changeant u en son opposé, et a en son inverse, ν est aussi invariante sous l’action des groupes GL pour L dans Φ− u . Le lemme 8.8 montre donc que ν est invariante sous l’action de G tout entier.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
35
8.4. L’action de Γ est anémique Proposition 8.9. — Si dim(M ) < rg(G), ou si dim(M ) = rg(G) ≥ 2 et Γ préserve une forme volume, l’action de Γ sur M est anémique. Nous utiliserons que toute représentation linéaire ρ : G → GLd (R) est triviale quand d ≤ rg(G). En effet, ρ(G) est contenue dans SLd (R) car g est simple et G est connexe ; d’autre part, l’invariance de la décomposition de Jordan montre que l’image ρ(A) du tore maximal déployé est constituée d’éléments semi-simples (voir [4], § 1.4) : c’est donc un sous-groupe diagonalisable de SLd (R), ce qui entraîne dim(A) = rg(G) ≤ d − 1. Démonstration. — Si l’action est vigoureuse, le théorème 7.2 fournit une mesure µ sur Mα qui est A-invariante et possède une forme de Lyapounoff verticale non nulle ; la proposition 8.2 permet de supposer que µ est ergodique et que sa projection π∗ µ coïncide avec la mesure vol. La proposition 8.7 montre que µ est G-invariante ; on peut donc lui appliquer le théorème de super-rigidité de Zimmer pour le cocycle Dπ qui est déterminé par les différentielles le long des fibres de π : Mα → G/Γ. Puisque dim(M ) ≤ rg(G), toute représentation linéaire G → GLd (R) est triviale. D’après le corollaire 6.2, les exposants de µ devraient être nuls, en contradiction avec sa construction. 8.5. Invariance dans Mα : énoncé général et applications Nous recommandons de sauter ce paragraphe en première lecture, car il n’est pas nécessaire à la démonstration du théorème A. Il s’agit d’esquisser l’ingrédient supplémentaire montrant que l’action de Γ sur Mα est anémique sous les hypothèses du théorème B. 8.5.1. — Rappelons que Φ ⊂ a∨ est l’ensemble des racines. Si L appartient à Φ, [L] désignera l’ensemble Φ ∩ (R+ L), et g[L] désignera l’algèbre de Lie engendrée par 0 les gL , L0 décrivant [L]. Nous noterons G[L] ⊂ G le sous-groupe connexe dont l’algèbre de Lie est g[L] ; l’application exponentielle est un difféomorphisme g[L] → G[L] . Théorème 8.10. — Soit ν une mesure de probabilité sur Mα qui est A-invariante et ergodique, et vérifie π∗ ν = vol. Soit L0 une racine. Si aucune forme de Lyapounoff verticale de ν n’appartient à [L0 ], la mesure ν est G[L0 ] -invariante. Ce théorème est obtenu par Aaron Brown, Federico Rodriguez Hertz et Zhiren Wang dans [12] (proposition 5.1). Pour l’appliquer, plaçons-nous sous les hypothèses du théorème B, en supposant que G = Sp2n (R) et que dim(M ) = d < hom(G) = 2n−1. Soit ν une mesure de probabilité qui vérifie les hypothèses de la proposition 8.7 (donc aussi celles du théorème 8.10).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
36
S. CANTAT
Soit Φ0 ⊂ Φ l’ensemble des racines L telles que [L] ne contienne aucune des formes de Lyapounoff verticales. Dans sp2n (R) deux racines positivement proportionnelles sont égales, donc [L] = {L} pour tout L ∈ Φ et Φ \ Φ0 contient au plus d racines. Soit h ⊂ g la sous-algèbre engendrée par a et les espaces radiciels g[L] , pour L ∈ Φ0 . Alors h est ad(a)-invariante, et sa codimension est majorée par d ; donc h = g : en effet, l’inégalité d < hom(G) signifie que toute sous-algèbre de codimension ≤ d coïncide avec g. Le théorème 8.10 montre alors que µ est invariante sous l’action des sous-groupes G[L] pour tout L dans Φ0 . Comme h = g, la mesure µ est G-invariante. Le théorème 8.10 entraîne donc une version renforcée de la proposition 8.7 dans laquelle G = Sp2n (R) et dim(M ) < 2n − 1. La proposition 8.9 devient : Soit Γ un réseau uniforme de Sp2n (R) agissant par difféomorphismes C k sur une variété compacte M , avec k > 1. Si dim(M ) < 2n − 1, ou si dim(M ) = 2n − 1 et Γ préserve une forme volume, l’action de Γ sur M est anémique. Un argument analogue s’applique aux groupes orthogonaux déployés. 8.5.2. — Revenons au théorème 8.10. Si b appartient à A et x appartient à Mα , on note Wbins (x) la variété instable ins maximale de x pour le difféomorphisme αG (b). Si L appartient à a∨ , W[L] (x) désignera ins l’intersection des Wb (x) lorsque b décrit l’ensemble des éléments b = exp(v) ∈ A avec L(v) > 0. Lorsqu’aucune forme de Lyapounoff verticale n’appartient à [L], ins W[L] (x) est l’orbite de G[L] passant par x ; c’est une feuille du feuilletage G [L] ⊂ G donné par l’action de G[L] sur Mα . Soient L une racine, u un élément de a avec L(u) > 0, et a = exp(u) ∈ A. La projection π entrelace l’action sur Mα avec celle par translations sur G/Γ. Dans cette situation, la formule d’Abramov-Rohlin décompose hν (αG (a)) en la somme de l’entropie dans la base, c’est-à-dire hvol (a) car π∗ ν = vol, et d’une entropie dans les fibres. Une formule du même type est démontrée dans [14], mais pour une version ins de l’entropie relative aux variétés instables ; en particulier, cette entropie hµ (a | W[L] ) vérifie l’inégalité (45)
ins hµ (αG (a) | W[L] ) ≥ hvol (a | g[L] )
où hvol (a | g[L] ) est l’entropie de la mesure vol relative au feuilletage en les orbites de G[L] dans G/Γ. L’hypothèse centrale du théorème 8.10 stipule que [L0 ] ne contient pas de forme ins de Lyapounoff verticale ; les variétés instables W[L (x) sont donc les feuilles de G [L0 ] . 0] Comme dans la preuve de la proposition 8.7, on obtient alors X 0 ins (46) hµ (αG (a)|G [L0 ] ) = hµ (αG (a)|W[L ) = hvol (a|g[L0 ] ) = dim(gL )L0 (u). 0] L0 ∈[L0 ]
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
37
C’est un cas d’égalité dans l’inégalité de Margulis-Ruelle, mais pour des entropies relatives à des feuilletages invariants ; l’argument de Ledrappier s’applique à nouveau et montre que ν est G[L0 ] -invariante. La stratégie est donc la même que précédemment : l’invariance est obtenue par la caractérisation du cas d’égalité dans l’inégalité de Margulis-Ruelle. C’est donc dorénavant un argument classique (voir [53, 43, 2, 17, 18]). L’ingrédient nouveau que nous n’avons pas présenté est la notion d’entropie feuilletée et la formule de type Abramov-Rohlin qui conduit à l’inégalité (45). Exemple 8.11. — Poursuivons l’exemple 8.6, avec n = 2 pour simplifier et µ la mesure correspondant au point p = [0 : 0 : 1]. L’action du groupe diagonal A en coordonnées locales est [x : y : 1] 7→ [a1 /a3 x : a2 /a3 y : 1]. La racine L = L1 − L3 est à la fois une forme de Lyapounoff pour l’action de A dans la base G/Γ, et pour le cocycle vertical Dπ . L’hypothèse du théorème 8.10 n’est donc pas satisfaite par L. Les variétés ins instables W[L] (z) sont des plans R2 alors que GL est de dimension 1. Désintégrons µ par rapport à une partition subordonnée à ces variétés instables : un cacul explicite simple montre que les conditionnelles de µ sont des mesures unidimensionelles qui, ins dans chaque W[L] (z) = R2 , sont confinées dans une droite transverse aux orbites L de G et aux fibres de la projection π. Ces conditionnelles ont donc une entropie feuilletée hµ (αG (a)|G [L0 ] ) qui est nulle et les deux premières égalités dans (46) tombent en défaut.
9. LA PROPRIÉTÉ (T) RENFORCÉE Soit H un groupe topologique engendré par une partie symétrique compacte S ⊂ H. Comme dans le paragraphe 7.1, nous notons ` la longueur associée à S, et B(n) ⊂ H la boule de rayon n pour `. Soit π : H → B(X) une représentation linéaire continue de H à valeurs dans les opérateurs linéaires continus d’un espace de Hilbert X. L’espace des vecteurs invariants sera noté X π . Nous dirons que π est τ -modérée, pour τ > 0, si (47)
kπ(h)k ≤ exp(τ `(h))
dès que `(h) est suffisamment grand. Si m est une mesure à support compact et de masse totale finie dans H, on définit l’opérateur continu Z (48) π(m) = π(h) dm(h). H
Une projection de X sur un sous-espace fermé Y est un opérateur linéaire continu P : X → X tel que P ◦ P = P et P (X) = Y .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
38
S. CANTAT
Par définition, H a la propriété (T) renforcée s’il existe deux constantes τ > 0 et χ > 0 et une suite de mesures (signées) (mn ) sur H avec mn (H) = 1 et Support(mn ) ⊂ B(n) pour tout n, telles que l’assertion suivante soit satisfaite : pour toute représentation linéaire π : H → B(X) sur un espace de Hilbert X qui est τ -modérée, il existe une projection P de X sur X π telle que (49)
kπ(mn ) − P k ≤ exp(−χn)
dès que n est suffisamment grand. Remarque 9.1. — Il s’agit en fait de la propriété (T) renforcée pour la classe d’espaces de Banach réduite à celle des espaces de Hilbert. Cette notion ne dépend pas du choix initial de la partie génératrice compacte S (mais les constantes τ et χ en dépendent). La propriété (T) renforcée entraîne la propriété (T) de Kazhdan. En effet, si π est une représentation unitaire, elle est τ -modérée pour tout τ ≥ 0. Si π possède presque des vecteurs invariants, on choisit n tel que kπ(mn ) − P k ≤ 1/3, puis un vecteur unitaire u qui est déplacé d’au plus 1/3 par B(n). Alors P (u) est un vecteur non nul invariant. Théorème 9.2. — Soit G un groupe de Lie semi-simple connexe sans facteur de rang ≤ 1. Soit Γ un réseau uniforme de G. Alors G et Γ vérifient la propriété (T) renforcée. Ce théorème est dû à Vincent Lafforgue, Tim de Laat et Mikael de la Salle (voir [41, 40], et [47] pour d’autres corps locaux). Considérons le cas du groupe G = SL3 (R) et notons K le sous-groupe SO3 (R) ; il sera muni d’une mesure de Haar volK de masse totale égale à 1. Étant donnés une représentation τ -modérée π : G → B(X), où X est un espace de Hilbert, et un élément g de G, posons ZZ (50) Aπ (g) = π(kgl) dvolK (k)dvolK (l). K×K
Pour obtenir le théorème 9.2, Lafforgue montre qu’il existe une projection P sur X π telle que Aπ (gn ) converge vers P exponentiellement vite lorsque gn → ∞. Ensuite, si G est un groupe de Lie presque simple et connexe qui contient une copie R de SL3 (R), on montre que la projection P obtenue à l’aide de R est en fait une projection sur l’espace des vecteurs π(G)-invariants (phénomène de Mautner). Ainsi, pour un tel groupe G, on peut supposer que les mesures mn qui apparaissent dans l’équation (49) sont des mesures positives (donc de probabilité). Une analyse similaire du groupe Sp4 (R) permet d’obtenir la même propriété pour tous les groupes de Lie simples de rang ≥ 2 (voir [40]) ; cette propriété est également valable pour leurs réseaux uniformes (voir [41]).
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
39
10. MÉTRIQUE INVARIANTE ET CONCLUSION 10.1. Métriques riemanniennes et espaces de Sobolev Les métriques riemanniennes sur une variété N sont les sections s du fibré Sym2 (T ∗ N ) telles que s(u, u) > 0 pour tout vecteur tangent u 6= 0. Notons J k (Sym2 (T ∗ N )) le fibré des k-jets de sections de Sym2 (T ∗ N ). Chaque section globale de Sym2 (T ∗ N ) de classe C k fournit une section globale continue de J k (Sym2 (T ∗ N )), ce qui donne une inclusion linéaire (51)
C
k
(Sym2 (T ∗ N )) → C 0 (J k (Sym2 (T ∗ N )));
la symétrie ∂x ∂y f = ∂y ∂x f des dérivées partielles d’une fonction régulière montre que cette inclusion n’est pas surjective quand k ≥ 2. Fixons une métrique riemannienne s sur N et une forme volume ω. La métrique s induit des métriques sur les fibrés Sym2 (T ∗ N ) et J k (Sym2 (T ∗ N )), que nous noterons toutes k · k pour simplifier. Si σ est une section de J k (Sym2 (T ∗ N )), sa norme Lp est ÅZ ã1/p (52) kσkp = kσ(x)kp dω(x) . N
Par définition, l’espace de Sobolev W k,p (N, Sym2 (T ∗ N )) est la complétion de 2 C k (Sym (T ∗ N )) pour la norme qui est obtenue en composant le plongement (51) avec la norme Lp . C’est un espace de Hilbert lorsque p = 2. Par le théorème de plongement de Sobolev ([1], chapitre 5), les éléments de W k,p (N, Sym2 (T ∗ N )) fournissent des métriques riemanniennes de classe C r dès que (53)
k>r+
dim(N ) . p
Ainsi, lorsque N est une surface, les éléments de W k,2 (N, Sym2 (T ∗ N )) fournissent des métriques riemanniennes de classe C k−2 (avec une régularité höldérienne des dérivées d’ordre k − 2). 10.2. Majoration des dérivées d’ordre supérieur Si f est un difféomorphisme de N , kD(j) f ks désignera le maximum des normes des j-premières dérivées de f , mesurées à l’aide de la métrique s. Reprenons la notion introduite au paragraphe 7.1, mais modifions-la pour tenir compte des dérivées d’ordre supérieur. Le groupe H est donc muni d’une partie génératrice S qui est symétrique et compacte, et ` est la fonction de longueur associée à S. Nous dirons que l’action de H sur N est k-anémique si, pour tout > 0, il existe une constante C > 0 telle que (54)
kD(j) hks ≤ C exp(`(h))
pour tout h ∈ H.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
40
S. CANTAT
Lemme 10.1. — L’action de H sur M est anémique si, et seulement si elle est k-anémique pour tout k ≥ 1. Ceci est démontré dans [25] (lemme 6.4 et annexe B). Le cas où M est de dimension 1 permet d’illustrer le phénomène principal. Supposons donc que H agit de manière anémique en dimension 1. Notons x une coordonnée locale, et calculons la dérivée seconde d’un produit de difféomorphismes h = h1 ◦ · · · ◦ hl ∈ H de longueur `(h) = l, chaque hi étant dans S. En notant Fj = h1 ◦ · · · ◦ hj et Gj = hj ◦ · · · ◦ hl , nous obtenons 0
h00 = (h01 ◦ G2 × (G2 )0 ) (55)
= h001 ◦ G2 × (G02 )2 + F10 ◦ G2 × (G2 )00 = h001 ◦ G2 × (G02 )2 + F10 ◦ G2 × h002 ◦ G3 × (G03 )2 + (F2 )0 ◦ G3 × (G3 )00
si bien que (56)
kh00 k ≤ C 4 `(h) max (kg 00 k) exp(2`(h)) g∈S
car `(Fj ) + `(Gj+1 ) = `(h) = l pour tout j. Le calcul est analogue pour les dérivées supérieures. 10.3. Métrique invariante Théorème 10.2. — Soit Γ un réseau uniforme d’un groupe de Lie connexe presque simple de rang ≥ 2. Soit Γ × M → M une action anémique et de classe C ∞ sur une variété compacte. Alors Γ préserve une métrique riemannienne sur M . La démonstration s’applique à tout groupe Γ qui possède la propriété (T) renforcée, si l’on sait en plus que les mesures mn apparaissant dans la convergence (49) sont positives. Comme on l’a vu à la fin du paragraphe 9, c’est le cas pour les réseaux. (3) Démonstration — Fixons un entier k > 2 + dim(M )/2. Comme l’action de Γ est de classe C ∞ , Γ agit linéairement sur W k,2 (M, Sym2 (T ∗ M )). Puisqu’elle est anémique, elle est k-anémique : pour tout > 0, il existe une constante C > 0 telle que (57)
kD(k) γk ≤ C exp(`(γ))
pour tout γ ∈ Γ. Ainsi, la représentation π de Γ sur l’espace W k,2 (M, Sym2 (T ∗ M )) est à croissance -modérée pour tout > 0. Notons (τ, χ) les constantes apparaissant dans la propriété (T) renforcée pour Γ, et choisissons < τ . Par le théorème 9.2 et les quelques lignes qui lui succèdent, il existe une suite de mesures de probabilité (mn ) (3)
En fait, le vocabulaire relatif à la propriété (T) renforcée n’est pas encore stable ; dans certains contextes, notamment celui de cet exposé, il serait plus naturel d’intégrer la positivité des mesures mn à la définition.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
41
sur Γ telle que π(mn ) converge vers une projection P dont l’image est constituée de sections de Sym2 (T ∗ M ) qui sont Γ-invariantes. Partant de la métrique riemannienne s, on voit que Z (58) P (s) = lim π(mn )(s) = lim γ∗ (s) dmn (γ) n→+∞
n→+∞
Γ
est une limite de métriques riemanniennes. C’est donc une section de Sym2 (T ∗ M ) qui, par le théorème de plongement de Sobolev, est de classe C 2 et qui est partout positive ou nulle : ∀u ∈ T ∗ M, P (s)(u, u) ≥ 0. Il reste à montrer que P (s)(u, u) > 0 si u 6= 0. Pour cela, on utilise la convergence exponentiellement rapide. On choisit n0 tel que kP − π(mn )k ≤ exp(−χn) pour tout n ≥ n0 . L’action étant anémique, il existe C1 tel que kD(1) γks ≤ C1 exp(χn/3) pour tout γ ∈ B(n) ⊂ Γ. Alors, pour tout vecteur unitaire u tangent à M Z (59) π(mn )(s)(u, u) = s(Dγ(u), Dγ(u)) dmn (γ) ≥ C12 exp(−2χn/3). Γ
Ceci entraîne P (s)(u, u) > 0 en prenant n suffisamment grand (car 2/3 < 1).
10.4. Démonstration des théorèmes A et B Considérons un homomorphisme α : Γ → Diff ∞ (M ), avec dim(M ) ≤ rg(G) − 1 et rg(G) ≥ 2. D’après la proposition 8.9, l’action de Γ sur M est anémique. Le théorème 10.2 fournit donc une métrique riemannienne Γ-invariante s0 sur M . Nous obtenons donc un homomorphisme de Γ vers le groupe Isom(M, s0 ) des isométries de M . C’est un groupe de Lie compact, agissant différentiablement sur M . Puisque dim(M ) ≤ rg(G) − 1 < minhom(G) (par le lemme 2.5), ceci montre que α(Γ) est fini. Le cas des actions préservant une forme volume s’obtient de la même façon en remarquant que rg(G) < minvol(G). Le théorème B aussi, en admettant les résultats esquissés au paragraphe 8.5.
11. COMPLÉMENTS 11.1. Régularité Nous avons supposé que l’action était de classe C ∞ . Dans les théorèmes A et B, il suffit en fait que l’action soit de classe C 2 . Cela permet d’appliquer la théorie de Pesin, car elle nécessite simplement k > 1. Le changement principal apparaît en appliquant le théorème de plongement de Sobolev ; pour un choix optimal, il faut travailler avec les espaces de Banach W k,p (M, Sym2 (T ∗ M )), pour p 6= 2, ce qui nécessite donc une version de la propriété (T) renforcée valable pour des espaces de Banach (voir [11, 40]). Les métriques riemanniennes invariantes produites par le théorème 10.2 sont alors
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
42
S. CANTAT
höldériennes, au lieu d’être de classe C 2 . Pour montrer que Isom(M, s0 ) est un groupe de Lie, Brown, Fisher et Hurtado font ensuite appel à la résolution de la conjecture d’Hilbert-Smith pour les homéomorphismes lipschitziens. 11.2. Réseaux non uniformes Les théorèmes A et B devraient aussi être valables pour les réseaux non uniformes. Deux difficultés apparaissent. D’une part, la propriété (T) renforcée n’est pas encore établie pour les réseaux non uniformes ; des travaux en cours de Mikael de la Salle devraient résoudre ce problème. D’autre part, G/Γ n’est pas compacte, ce qui complique l’étude dynamique ; Brown, Fisher et Hurtado semblent toutefois en mesure de traiter le cas du réseau SLn+1 (Z). 11.3. Le cas des surfaces Les théorèmes de Ghys et Witte-Morris répondent positivement aux conjectures de Zimmer pour les actions C 1 sur le cercle, que le réseau soit uniforme ou non. Pour les actions sur les surfaces, les résultats de [9, 11, 12, 13, 14] viennent compléter des énoncés antérieurs de Leonid Polterovich [59] et de John Franks et Michael Handel [26]. Théorème C. — Soit S une surface compacte. Soit G un groupe de Lie connexe, dont l’algèbre de Lie g est simple et le centre est fini, et soit Γ un réseau de G. Supposons que le rang de G est ≥ 2 et que g n’est isomorphe à aucune des algèbres sl3 (R), sl3 (C) et sl3 (H). Alors tout homomorphisme de Γ dans Diff 2 (S) a une image finie. Malheureusement, l’arsenal employé actuellement pour obtenir un résultat aussi complet dépasse largement les techniques décrites dans cet exposé. Remerciements. — Je remercie Bachir Bekka, Aaron Brown, Antoine ChambertLoir, David Fisher, Sébastien Gouëzel, Vincent Guirardel, Sebastian Hurtado, Martin Liebeck, Ludovic Marquis, François Maucourant, Mihai Păun, Federico RodriguezHertz et Dave Witte-Morris d’avoir répondu à mes sollicitations et d’avoir relu des versions préliminaires de ce texte, qui n’aurait pas vu le jour sans leur aide. La démonstration du théorème A présentée ici résulte de mes échanges avec Sebastian Hurtado : un grand merci pour ses explications enthousiastes.
RÉFÉRENCES [1] R. A. Adams & J. J. F. Fournier – Sobolev spaces, 2e éd., Pure and Applied Mathematics, vol. 140, Elsevier/Academic Press, 2003.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
43
[2] A. Avila & M. Viana – Extremal Lyapunov exponents : an invariance principle and applications, Invent. math. 181 (2010), no 1, p. 115–189. [3] B. Bekka, P. de la Harpe & A. Valette – Kazhdan’s property (T), New Mathematical Monographs, vol. 11, Cambridge Univ. Press, 2008. [4] A. Borel – Linear algebraic groups, 2e éd., Graduate Texts in Math., vol. 126, Springer, 1991. [5] A. Borel & J. Tits – éléments unipotents et sous-groupes paraboliques de groupes réductifs. I, Invent. math. 12 (1971), p. 95–104. [6] N. Bourbaki – éléments de mathématique. Fasc. XXXVIII : Groupes et algèbres de Lie. Chapitre VII : Sous-algèbres de Cartan, éléments réguliers. Chapitre VIII : Algèbres de Lie semi-simples déployées, Actualités Scientifiques et Industrielles, No. 1364. Hermann, 1975. [7] E. Breuillard – équidistribution des orbites toriques sur les espaces homogènes (d’après M. Einsiedler, E. Lindenstrauss, Ph. Michel, A. Venkatesh), Séminaire Bourbaki, vol. 2008/2009, exposé no 1008, Astérisque (2010), no 332, p. 305–339. [8] M. G. Brin & C. C. Squier – Groups of piecewise linear homeomorphisms of the real line, Invent. math. 79 (1985), no 3, p. 485–498. [9] A. Brown – Smooth ergodic theory of Zd -actions part 2 : entropy formulas for rank 1 systems, prépublication arXiv:1610.09997. [10] , Smoothness of stable holonomies inside center-stable manifolds and the C 2 hypothesis in Pugh-Shub and Ledrappier-Young theory, prépublication arXiv:1608.05886. [11] A. Brown, D. Fisher & S. Hurtado – Zimmer conjecture : sub exponential growth, measure rigidity, and strong property (T), prépublication arXiv:1608.04995. [12] A. Brown, F. Rodriguez Hertz & Z. Wang – Invariant measures and measurable projective factors for actions of higher-rank lattices on manifolds, prépublication arXiv:1609.05565. , Smooth ergodic theory of Zd -actions part 1 : Lyapunov [13] exponents, dynamical charts, and coarse lyapunov exponents, prépublication arXiv:1610.09997. [14] , Smooth ergodic theory of Zd -actions part 3 : product structure of entropy, prépublication arXiv:1610.09997. [15] S. Cantat – The Cremona group, in Algebraic geometry : Salt Lake City 2015, Proc. Sympos. Pure Math., vol. 97, Amer. Math. Soc., 2018, p. 101–142. [16] C. W. Curtis & I. Reiner – Representation theory of finite groups and associative algebras, Pure and Applied Mathematics, Vol. XI, Interscience Publishers, 1962.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
44
S. CANTAT
[17] M. Einsiedler, A. Katok & E. Lindenstrauss – Invariant measures and the set of exceptions to Littlewood’s conjecture, Ann. of Math. 164 (2006), no 2, p. 513–560. [18] A. Eskin & M. Mirzakhani – Invariant and stationary measures for the SL(2, R) action on moduli space, Publ. Math. Inst. Hautes Études Sci. 127 (2018), p. 95–324. [19] B. Farb & P. Shalen – Real-analytic actions of lattices, Invent. math. 135 (1999), no 2, p. 273–296. [20] , Lattice actions, 3-manifolds and homology, Topology 39 (2000), no 3, p. 573–587. [21] R. Feres – Dynamical systems and semisimple groups : an introduction, Cambridge Tracts in Mathematics, vol. 126, Cambridge Univ. Press, 1998. [22] D. Fisher – Local rigidity of group actions : past, present, future, in Dynamics, ergodic theory, and geometry, Math. Sci. Res. Inst. Publ., vol. 54, Cambridge Univ. Press, 2007, p. 45–97. [23] , Groups acting on manifolds : around the Zimmer program, in Geometry, rigidity, and group actions, Chicago Lectures in Math., Univ. Chicago Press, 2011, p. 72–157. [24] D. Fisher & G. A. Margulis – Local rigidity for cocycles, in Surveys in differential geometry, Vol. VIII (Boston, MA, 2002), Surv. Differ. Geom., vol. 8, Int. Press, 2003, p. 191–234. [25] , Almost isometric actions, property (T), and local rigidity, Invent. math. 162 (2005), no 1, p. 19–80. [26] J. Franks & M. Handel – Distortion elements in group actions on surfaces, Duke Math. J. 131 (2006), no 3, p. 441–468. [27] H. Furstenberg – Rigidity and cocycles for ergodic actions of semisimple Lie groups (after G. A. Margulis and R. Zimmer), in Bourbaki Seminar, Vol. 1979/80, Lecture Notes in Math., vol. 842, Springer, 1981, p. 273–292. [28] E. Ghys – Dynamique des flots unipotents sur les espaces homogènes, Séminaire Bourbaki, vol. 1991/1992, exposé no 747, Astérisque 206 (1992), p. 93–136. , Sur les groupes engendrés par des difféomorphismes proches de l’identité, [29] Bol. Soc. Brasil. Mat. 24 (1993), no 2, p. 137–178. [30] , Actions de réseaux sur le cercle, Invent. math. 137 (1999), no 1, p. 199– 231. [31] , Groups acting on the circle, Enseign. Math. 47 (2001), nos 3-4, p. 329– 407. [32] E. Ghys & V. Sergiescu – Sur un groupe remarquable de difféomorphismes du cercle, Comment. Math. Helv. 62 (1987), no 2, p. 185–239.
ASTÉRISQUE 414
(1136)
PROGRAMME DE ZIMMER
45
[33] E. R. Goetze – Connection preserving actions of connected and discrete Lie groups, J. Differential Geom. 40 (1994), no 3, p. 595–620. [34] N. Guelman & I. Liousse – Burnside problem for measure preserving groups and for 2-groups of toral homeomorphisms, Geom. Dedicata 168 (2014), p. 387– 396. [35] L. Guillou – Théorème de translation plane de Brouwer et généralisations du théorème de Poincaré-Birkhoff, Topology 33 (1994), no 2, p. 331–351. [36] H. Y. Hu – Some ergodic properties of commuting diffeomorphisms, Ergodic Theory Dynam. Systems 13 (1993), no 1, p. 73–100. [37] S. Hurtado – The Burnside problem for Diff vol (S2 ), prépublication arXiv:1607.04603. [38] A. Katok & J. W. Lewis – Global rigidity results for lattice actions on tori and new examples of volume-preserving actions, Israel J. Math. 93 (1996), p. 253–280. [39] A. Katok & R. J. Spatzier – Invariant measures for higher-rank hyperbolic abelian actions, Ergodic Theory Dynam. Systems 16 (1996), no 4, p. 751–778. [40] T. de Laat & M. de la Salle – Strong property (T) for higher-rank simple Lie groups, Proc. Lond. Math. Soc. 111 (2015), no 4, p. 936–966. [41] V. Lafforgue – Un renforcement de la propriété (T), Duke Math. J. 143 (2008), no 3, p. 559–602. [42] F. Ledrappier – Propriétés ergodiques des mesures de Sinaï, Publ. Math. IHÉS (1984), no 59, p. 163–188. [43] , Positivity of the exponent for stationary sequences of matrices, in Lyapunov exponents (Bremen, 1984), Lecture Notes in Math., vol. 1186, Springer, 1986, p. 56–73. [44] F. Ledrappier & J.-M. Strelcyn – A proof of the estimation from below in Pesin’s entropy formula, Ergodic Theory Dynam. Systems 2 (1982), no 2, p. 203– 219. [45] F. Ledrappier & L.-S. Young – The metric entropy of diffeomorphisms. I. Characterization of measures satisfying Pesin’s entropy formula, Ann. of Math. 122 (1985), no 3, p. 509–539. , The metric entropy of diffeomorphisms. II. Relations between entropy, [46] exponents and dimension, Ann. of Math. 122 (1985), no 3, p. 540–574. [47] B. Liao – Strong Banach property (T) for simple algebraic groups of higher rank, J. Topol. Anal. 6 (2014), no 1, p. 75–105. [48] R. C. Lyndon & P. E. Schupp – Combinatorial group theory, Classics in Mathematics, Springer, 2001. [49] R. Mañé – Ergodic theory and differentiable dynamics, Ergebn. Math. Grenzg., vol. 8, Springer, 1987.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
46
S. CANTAT
[50] L. N. Mann – Gaps in the dimensions of transformation groups, Illinois J. Math. 10 (1966), p. 532–546. [51] G. A. Margulis – Discrete subgroups of semisimple Lie groups, Ergebn. Math. Grenzg., vol. 17, Springer, 1991. [52]
, Free subgroups of the homeomorphism group of the circle, C. R. Acad. Sci. Paris Sér. I Math. 331 (2000), no 9, p. 669–674.
[53] G. A. Margulis & G. M. Tomanov – Invariant measures for actions of unipotent groups over local fields on homogeneous spaces, Invent. math. 116 (1994), nos 1-3, p. 347–392. [54] F. Maucourant – A nonhomogeneous orbit closure of a diagonal subgroup, Ann. of Math. 171 (2010), no 1, p. 557–570. [55] G. D. Mostow – On maximal subgroups of real Lie groups, Ann. of Math. 74 (1961), p. 503–517. [56] P. Pansu – Sous-groupes discrets des groupes de Lie : rigidité, arithméticité, Séminaire Bourbaki, vol. 1993/1994, exposé no 778, Astérisque 227 (1995), p. 69– 105. [57] D. I. Panyushev & E. B. Vinberg – The work of Vladimir Morozov on Lie algebras, Transform. Groups 15 (2010), no 4, p. 1001–1013. [58] Y. B. Pesin – Characteristic Ljapunov exponents, and smooth ergodic theory, Russian Math. Surveys 32 (1977), no 4, p. 55–114. [59] L. Polterovich – Growth of maps, distortion in groups and symplectic geometry, Invent. math. 150 (2002), no 3, p. 655–686. [60] G. Prasad & M. S. Raghunathan – Cartan subgroups and lattices in semisimple groups, Ann. of Math. 96 (1972), p. 296–317. [61] V. A. Rohlin – Lectures on the entropy theory of transformations with invariant measure, Uspehi Mat. Nauk 22 (1967), no 5 (137), p. 3–56. [62] D. Ruelle – An inequality for the entropy of differentiable maps, Bol. Soc. Brasil. Mat. 9 (1978), no 1, p. 83–87. [63] N. A. Shah – Limit distributions of polynomial trajectories on homogeneous spaces, Duke Math. J. 75 (1994), no 3, p. 711–732. [64] G. Stuck – Low-dimensional actions of semisimple groups, Israel J. Math. 76 (1991), nos 1-2, p. 27–71. [65] M. Viana – Lectures on Lyapunov exponents, Cambridge Studies in Advanced Math., vol. 145, Cambridge Univ. Press, 2014. [66] D. Witte – Cocompact subgroups of semisimple Lie groups, in Lie algebra and related topics (Madison, WI, 1988), Contemp. Math., vol. 110, Amer. Math. Soc., 1990, p. 309–313.
ASTÉRISQUE 414
(1136)
[67]
PROGRAMME DE ZIMMER
47
, Arithmetic groups of higher Q-rank cannot act on 1-manifolds, Proc. Amer. Math. Soc. 122 (1994), no 2, p. 333–340.
[68] D. Witte Morris – Ratner’s theorems on unipotent flows, Chicago Lectures in Mathematics, University of Chicago Press, 2005. [69]
, Introduction to arithmetic groups, Deductive Press, 2015.
[70] L. S. Young – Dimension, entropy and Lyapunov exponents, Ergodic Theory Dynam. Systems 2 (1982), no 1, p. 109–124. [71] A. Zeghib – Sur les actions affines des groupes discrets, Ann. Inst. Fourier 47 (1997), no 2, p. 641–685. [72] R. J. Zimmer – Ergodic theory and semisimple groups, Monographs in Math., vol. 81, Birkhäuser, 1984. [73]
, On connection-preserving actions of discrete linear groups, Ergodic Theory Dynam. Systems 6 (1986), no 4, p. 639–644.
Serge CANTAT Université de Rennes I Campus de Beaulieu Bâtiment 22–23 F–35042 Rennes cedex E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1137, p. 49 à 94 doi:10.24033/ast.1081
Octobre 2017
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG [d’après Deligne-Lusztig, Broué, Rickard, Bonnafé-Dat-Rouquier] par Olivier DUDAS
INTRODUCTION Étant donné un espace vectoriel V sur un corps parfait, la décomposition de Jordan permet de ramener l’étude d’un automorphisme φ ∈ GL(V ) à l’étude de sa partie semi-simple et d’une famille d’endomorphismes unipotents agissant sur les espaces caractéristiques de φ, donc généralement plus petits que l’espace vectoriel ambiant V . Cette décomposition s’étend naturellement aux groupes orthogonaux SO(V ) et symplectiques Sp(V ), et plus généralement à des groupes algébriques linéaires. C’est un théorème de réduction particulièrement utile dans l’étude de la structure des groupes classiques et de leurs classes de conjugaison. Le but de cet exposé est d’étudier une forme similaire de cette décomposition pour les représentations linéaires de groupes finis comme GL(V ), SO(V ) et Sp(V ) lorsque le corps de base est fini. La décomposition des représentations est mixte ; elle fait intervenir à la fois : – des éléments semi-simples du groupe fini considéré (ou plutôt d’un groupe dual) ; – des représentations linéaires dites unipotentes de groupes finis plus petits, obtenus à partir des centralisateurs de ces éléments semi-simples. Dans un premier temps, nous expliquerons comment les travaux de DeligneLusztig [15], Lusztig [20] et Broué-Michel [11] permettent de décomposer les représentations d’un groupe réductif fini G selon certains éléments semi-simples d’un groupe dual G∗ M Rep(G) = Reps (G). s∈G∗
Nous montrerons ensuite comment, sous certaines conditions sur l’élément s, chaque sous-catégorie de représentations Reps (G) est « équivalente » à celle des
© Astérisque 414, SMF 2019
50
O. DUDAS
représentations unipotentes du groupe CG∗ (s) Reps (G) ≈ UniRep(CG∗ (s)). Plusieurs types d’équivalences seront étudiées selon le contexte. Pour les représentations à coefficients dans un corps algébriquement clos de caractéristique zéro (comme C ou une clôture algébrique de Q` ) on obtient une bijection entre caractères irréductibles faisant office de paramétrage des représentations irréductibles. En caractéristique positive, on s’intéressera à des équivalences entre les catégories abéliennes de représentations et leurs catégories homotopiques, préservant à la fois le nombre de représentations irréductibles, mais aussi leurs propriétés homologiques (groupes d’extensions). Ces équivalences, conjecturées par Broué [7] en 1988, s’obtiennent à partir de l’étude précise de la cohomologie de certaines variétés introduites par Deligne-Lusztig [15] en 1976. Les travaux de Bonnafé-Rouquier [4] en 2003, puis de Bonnafé-Dat-Rouquier [3] en 2017, donnent la forme la plus précise de ces équivalences, dites splendides, et nous invitent ainsi à admirer la splendeur des variétés de Deligne-Lusztig. Résumé Avant de rentrer dans le vif du sujet, nous donnons quelques notations et résultats qui serviront de fil directeur de ces notes. 1. Groupes réductifs finis. — La classe des groupes finis qui nous intéressera est celle des groupes réductifs finis. Comme leur nom l’indique, ce sont des groupes algébriques réductifs connexes définis sur un corps fini Fq . Parmi ces groupes, on trouve les groupes classiques tels que GLn (q), SOn (q) et Sp2n (q), des versions « tordues » comme le groupe unitaire GUn (q) et spécial unitaire SUn (q) mais aussi le groupe de Steinberg 3 D4 (q), ainsi que des groupes exceptionnels de type E6 , E7 , E8 , F4 et G2 . Ces groupes jouent un rôle prédominant dans la théorie des groupes finis puisque la grande majorité des groupes quasi-simples sont des groupes réductifs finis. La nature géométrique de ces groupes permet d’utiliser les outils usuels de géométrie algébrique pour étudier leur structure, mais aussi pour construire leurs représentations. 2. Représentations. — Étant donné un groupe réductif fini G sur un corps fini Fq , on étudiera les représentations linéaires de G en caractéristique transverse. Ce sont des k-espaces vectoriels de dimension finie munis d’une action linéaire de G, avec la condition supplémentaire que la caractéristique ` ≥ 0 de k ne divise pas q (donc différente de la caractéristique de Fq ). On travaillera toujours sous l’hypothèse que k est assez grand de sorte que l’algèbre kG soit déployée, afin d’éluder tout problème de rationalité des représentations. Les représentations de G à coefficients dans k sont
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
51
de manière équivalente des représentations de l’algèbre de groupe kG, et la catégorie abélienne qu’elles forment sera notée kG-mod. Lorsque k est un corps de caractéristique zéro, la catégorie kG-mod est semi-simple : toute représentation de G est somme directe de représentations irréductibles, et sa classe d’isomorphisme est déterminée par un invariant numérique, son caractère. En revanche, lorsque la caractéristique de k divise l’ordre de G ces invariants numériques ne suffisent plus. D’une part, d’autres classes de représentations entrent en jeu, comme les représentations projectives, et d’autre part des invariants homologiques sont nécessaires pour caractériser kG-mod (comme les extensions entre représentations). Enfin, puisque l’algèbre kG n’est pas quelconque mais associée à un groupe fini G, d’autres invariants provenant des `-sous-groupes de G sont à prendre en compte. L’étude des représentations de G et plus généralement de ses blocs se fera par l’intermédiaire de la catégorie abélienne kG-mod et de ses facteurs indécomposables, ainsi que des groupes de défaut associés à ces facteurs. Cette terminologie sera rappelée au §3.1. 3. Des équivalences de catégories. — La décomposition de Jordan de la catégorie kG-mod s’obtient en deux étapes. La première consiste en une décomposition M kG-mod ' kGe(s) -mod (s)∈G∗ /∼ ss,`0
où (s) varie parmi les classes de conjugaison d’éléments semi-simples et `-réguliers de G∗ . Ici, G∗ correspond à un dual de Langlands (1) de G ; par exemple G∗ ' PGLn (q) lorsque G = SLn (q). L’élément e(s) associé est un idempotent central de kG, permettant de couper l’algèbre kG et la catégorie kG-mod en une somme directe. Lorsque s = 1, la catégorie kGe(1) -mod est appelée la catégorie des représentations unipotentes du groupe réductif fini G. La seconde partie de la décomposition de Jordan s’avère la plus difficile : elle consiste à montrer que chaque sous-catégorie kGe(s) -mod est une catégorie de représentations unipotentes pour le groupe CG∗ (s). Nous énonçons ici un cas particulier, conséquence des travaux de Broué [7], Bonnafé-Rouquier [4] et BonnaféDat-Rouquier [3]. Théorème. — Supposons que CG∗ (s) = L∗ est un sous-groupe de Levi de G∗ , dual d’un sous-groupe de Levi L de G. Alors il existe une équivalence de catégories (1)
La présence d’un groupe dual peut paraître étrange à première vue. La construction et le paramétrage des représentations de G se fait à partir d’un procédé d’induction des caractères de tores maximaux (voir §1.2). Ces caractères correspondent naturellement à des cocaractères du tore dual dont les valeurs produisent des éléments semi-simples de G∗ .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
52
O. DUDAS
abéliennes kGe(s) -mod ' kLe(1) -mod. Cette équivalence induit une bijection entre les blocs qui préserve les groupes de défaut. 4. Variétés de Deligne-Lusztig et leur cohomologie. — La nature géométrique des groupes réductifs finis a permis à Deligne et Lusztig d’en construire des représentations (en caractéristique zéro) dans la cohomologie de certaines variétés algébriques [15]. Ces méthodes s’adaptent parfaitement au cadre modulaire (en caractéristique positive) en remplaçant les groupes de cohomologie `-adique par des complexes de cohomologie définis à quasi-isomorphisme ou à équivalence d’homotopie près. Lorsque le groupe CG∗ (s) = L∗ est un sous-groupe de Levi de G∗ , dual d’un sousgroupe de Levi L de G, on peut lui associer une variété de Deligne-Lusztig dont le complexe de cohomologie induit un foncteur Db (kGe(s) -mod) −→ Db (kLe(1) -mod). Ce n’est pas encore l’équivalence espérée puisqu’a priori ce foncteur envoie des représentations sur des complexes de représentations. Dans l’article [7] où il énonce sa conjecture, Broué donne un critère géométrique précis sur les variétés de DeligneLusztig pour que le foncteur précédent provienne en fait d’un foncteur exact kGe(s) -mod −→ kLe(1) -mod. Les résultats de Lusztig lorsque k = Q` suffisent alors pour montrer que ce foncteur est une équivalence. La contribution majeure de Bonnafé-Rouquier [4] à ce problème consiste à vérifier le critère géométrique de Broué, par une analyse fine de la géométrie des variétés de Deligne-Lusztig, de leur compactification et de certains revêtements abéliens. Nous expliquerons au §2 comment leur travail trouve son inspiration dans l’article originel de Deligne-Lusztig paru presque 30 ans plus tôt. Néanmoins, une équivalence abstraite entre (des facteurs indécomposables d’) algèbres de groupes n’est pas satisfaisante du point de vue des représentations des groupes finis. Il manque des informations « locales », notamment sur les groupes de défaut des blocs, permettant d’expliquer les coïncidences numériques entre les valeurs des caractères de G dans la série (s) et des caractères unipotents de CG∗ (s). Ces coïncidences pourraient être le reflet d’une équivalence splendide entre les catégories homotopiques de modules de `-permutation associées aux algèbres kGe(s) et kCG∗ (s)e(1) . Une fois de plus, c’est le complexe de cohomologie qui fournit cette équivalence dans le cas où CG∗ (s) est un sous-groupe de Levi : en poursuivant les
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
53
travaux de Rickard [23], Bonnafé-Dat-Rouquier montrent dans [3] que l’on dispose en fait d’une famille d’équivalences ∼
kCG (Q)e(s) -mod −→ kCL (Q)e(1) -mod associées aux `-sous-groupes Q de L et à leurs centralisateurs dans L et G. Les ingrédients de la preuve de ce résultat seront donnés au §3. Nous discuterons aussi d’une généralisation au §4.
Applications La décomposition de Jordan splendide est un formidable théorème de réduction pour étudier les représentations modulaires des groupes finis. Elle permet de ramener l’étude des blocs d’un groupe réductif fini à l’étude des blocs dits isolés qui sont des blocs très proches d’être unipotents. Parmi les problèmes majeurs qu’elle a aidé à résoudre, notons : – la conjecture du défaut abélien de Broué [6, Conj. 3.3] qui prédit que deux blocs de groupes finis sont dérivé-équivalents dès que leurs groupes de défaut sont abéliens et isomorphes. Cette conjecture est démontrée pour les groupes linéaires par Chuang-Rouquier [13] ; – un sens de la conjecture de hauteur zéro de Brauer, qui prédit que tous les caractères d’un bloc de défaut abélien sont de hauteur zéro, démontrée par Kessar-Malle [18]. De nombreuses autres conjectures sur les groupes finis, appelées conjectures de comptage ou conjectures local-global (2), reposent sur des réductions aux groupes finis simples. Les experts s’accordent pour dire que le cas des groupes réductifs finis serait sans espoir sans la décomposition de Jordan splendide.
Remerciements Je tiens à remercier chaleureusement Cédric Bonnafé, Jean-François Dat, Léo Dreyfus-Schmidt, Gunter Malle et Raphaël Rouquier pour leurs nombreuses et précieuses remarques sur une version préliminaire de ce texte. Ce travail a bénéficié du soutien de la bourse ANR-16-CE40-0010-01 de l’Agence Nationale de la Recherche.
(2)
Comme les conjectures d’Alperin, d’Alperin-Mckay ou de Dade (voir [21]).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
54
O. DUDAS
1. DÉCOMPOSITION DE JORDAN DES CARACTÈRES 1.1. Décompositions de Jordan 1.1.1. Classes de conjugaison. — La décomposition de Jordan est un classique des cours d’algèbre : étant donné un espace vectoriel de dimension finie V sur un corps parfait F, tout endomorphisme φ de V se décompose de manière unique en la somme φ = φs +φn d’un endomorphisme semi-simple φs et d’un endomorphisme nilpotent φn qui commutent. Si φ est inversible, on peut réécrire cette décomposition de manière multiplicative en φ = φs ◦ φu où φu = IdV + φ−1 s ◦ φn est un automorphisme dit unipotent. Cette décomposition se généralise naturellement au cas d’un groupe algébrique linéaire G défini sur F. Tout élément g ∈ G(F) s’écrit de manière unique g = su avec s semi-simple, u unipotent et su = us (voir par exemple [29, §2.4]). On peut donc voir u comme un élément du centralisateur de s dans G(F), que l’on notera CG(F) (s). On en déduit un paramétrage des classes de conjugaison du groupe G(F) en terme de paires formées d’une classe de conjugaison semi-simple (s) de G(F) et d’une classe unipotente de CG(F) (s). 1.1.2. Caractères irréductibles. — Lorsque F = Fq est un corps fini à q éléments, les caractères irréductibles (complexes) du groupe fini G(Fq ) sont en même nombre que ses classes de conjugaison, même s’il n’existe en général aucune bijection canonique entre les deux. Néanmoins, dans le cas où G est un groupe réductif connexe, les travaux de Deligne-Lusztig [15] et Lusztig [20] montrent qu’il existe au niveau des caractères irréductibles une décomposition similaire à la décomposition de Jordan des classes de conjugaison, à ceci près qu’elle fait intervenir le dual de Langlands G∗ de G. Chaque caractère irréductible de G(Fq ) est paramétré par une classe de conjugaison semi-simple (s) de G∗ (Fq ) et un caractère unipotent de CG∗ (Fq ) (s). Cette décomposition provient de la construction géométrique des caractères due à Deligne-Lusztig, construction que nous rappelons dans la section suivante. 1.2. Séries rationnelles 1.2.1. Notations. — Désormais nous supposons que G est un groupe réductif connexe défini sur Fq . Cette structure rationnelle se traduit par la donnée d’un endomorphisme de Frobenius F : G −→ G tel que GF = G(Fq ). Les groupes classiques GLn (q), SOn (q), Sp2n (q) s’obtiennent par exemple de cette façon. Par abus de notation, nous identifierons souvent G avec ses points sur une clôture algébrique Fq . Le groupe fini GF sera noté G. Plus généralement, pour tout sous-groupe fermé H ⊂ G de G stable par F , nous noterons H = HF le groupe fini associé. Les éléments semi-simples (resp. unipotents) de H seront notés Hss (resp. Huni ).
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
55
Pour simplifier certains énoncés, nous supposerons de plus que le centre de G est connexe ; sous cette hypothèse, les centralisateurs d’éléments semi-simples de G∗ sont à leur tour connexes. Deux éléments semi-simples de G∗ conjugués dans G∗ (conjugaison dite géométrique) sont alors aussi conjugués dans G∗ (conjugaison rationnelle). Cela permettra d’éviter certaines subtilités entre les différentes versions de la décomposition de Jordan. Nous considérerons dans un premier temps le cas des caractères irréductibles ordinaires du groupe fini G. Ce sont les caractères des représentations irréductibles complexes, ou plus généralement définies sur un corps de caractéristique zéro « assez gros ». Pour des raisons géométriques, nous travaillerons avec des représentations linéaires de G définies sur une extension finie K ⊃ Q` du corps des nombres `-adiques contenant toutes les racines de l’unité d’ordre |G|, avec ` - q. Sous cette hypothèse, une représentation irréductible de G à coefficients dans K reste irréductible après extension des scalaires à un corps quelconque contenant K. On notera IrrK G l’ensemble des caractères irréductibles de G ; dans le cas particulier où G est abélien (par exemple un tore), toutes les représentations irréductibles sont de dimension 1, et leurs caractères sont donc exactement les morphismes de groupes G −→ K × . 1.2.2. Variétés de Deligne-Lusztig. — Les travaux de Deligne-Lusztig et Lusztig sur les représentations de G (voir en particulier les exposés de Serre [27] et Cartier [12]) sont centrés sur la construction des représentations irréductibles dans la cohomologie de certaines variétés algébriques désormais appelées variétés de Deligne-Lusztig. Étant donnés un sous-groupe parabolique P de G de radical unipotent U et un complément de Levi F -stable L de P, ces variétés sont définies par YU
{g ∈ G | g −1 F (g) ∈ U · F (U)}/U
π
XP
{g ∈ G | g −1 F (g) ∈ P · F (P)}/P
où π est le morphisme induit par le quotient G/U G/P. Le groupe fini G agit par multiplication à gauche sur ces variétés, et π est équivariant pour cette action ; le groupe fini L agit librement par multiplication à droite sur YU et l’application π : YU −→ XP s’identifie au quotient par cette action. Autrement dit, π est un L-torseur étale de XP . Les faisceaux que l’on considérera sur XP seront des systèmes locaux associés aux représentations de L via ce revêtement. 1.2.3. Caractères de Deligne-Lusztig. — Commençons par le cas où P = B est un sous-groupe de Borel de G et L = T un tore maximal F -stable. Via le revêtement π : YU −→ XB , chaque caractère irréductible θ : T −→ K × définit un système local (G-équivariant) Kθ sur XB (on rappelle que T = TF est le groupe fini des
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
56
O. DUDAS
points rationnels de T). Le i-ème groupe de cohomologie étale de ce faisceau, noté H i (XB , Kθ ), est un K-espace vectoriel de dimension finie muni d’une action linéaire de G. C’est donc une représentation de G, dont le caractère sera noté [H i (XB , Kθ )]. On peut alors former le caractère virtuel de G suivant : X G (−1)i [H i (XB , Kθ )] (1) RT⊂B (θ) = i≥0
appelé caractère de Deligne-Lusztig. D’après [15, Cor. 4.3] cette somme alternée ne dépend en fait pas du choix de B, mais seulement de T, même si les groupes de cohomologie individuels varient en général avec B (nous discuterons de ce problème G plus loin, à la section 4.2). On pourra donc noter plus simplement RT (θ) ce caractère virtuel. 1.2.4. Séries rationnelles. — Fixons un dual de Langlands G∗ de G. En suivant [15, §5] on peut associer un élément semi-simple de G∗ à chaque paire (T, θ). Cet élément semi-simple dépend de certains choix non canoniques, mais pas sa classe de conjugaison. On dira que deux paires (T, θ) et (T0 , θ0 ) appartiennent à la même série rationnelle et on notera (T, θ) ∼G (T0 , θ0 ) (ou simplement (T, θ) ∼ (T0 , θ0 ) s’il n’y a pas d’ambiguïté) si les éléments semi-simples associés sont conjugués dans G∗ (ou dans G∗ puisque le centre de G est supposé connexe). Étant donnée une classe semisimple (s) de G∗ , on écrira (T, θ) ∼G s (ou simplement (T, θ) ∼ s) pour signifier G que (T, θ) est dans la série rationnelle associée à (s). Via les caractères RT (θ), la notion de série se transporte aux caractères irréductibles de G. Pour une classe semisimple (s) de G∗ on pose G E (G, (s)) = χ ∈ IrrK G | ∃ (T, θ) ∼ s tel que hRT (θ); χiG 6= 0 . Les deux premières propriétés de ces séries sont démontrées par Deligne-Lusztig dans leur article d’origine [15]. Engendrement. — Tout caractère irréductible de G apparaît comme constituant d’au G moins un caractère de Deligne-Lusztig RT (θ) (voir [15, Cor. 7.7]). Disjonction. — Soit B (resp. B0 ) un sous-groupe de Borel contenant un tore maximal F -stable T (resp. T0 ). Si un caractère irréductible apparaît à la fois dans H i (XB , Kθ ) et H j (XB0 , Kθ0 ) pour certains entiers i et j, alors les paires (T, θ) et (T0 , θ0 ) appartiennent à la même série rationnelle (voir [15, Thm. 6.2]). On en déduit que les séries E (G, (s)) forment une partition de l’ensemble des caractères irréductibles de G : G (2) IrrK G = E (G, (s)). (s)∈G∗ ss /∼
ASTÉRISQUE 414
(1137)
57
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
La série E (G, (1)) joue un rôle particulier. Ses éléments sont appelés les caractères G unipotents. Par définition ce sont les caractères qui apparaissent dans RT (1), ou de manière équivalente, dans la cohomologie des variétés XB à coefficients dans le système local constant. Le nombre de caractères unipotents ne dépend que du groupe de Weyl W de G et de l’action de F sur W , et pas du corps sur lequel on travaille. Ces caractères ont été classifiés par Lusztig dans une série d’articles culminant en la monographie [20], et leurs propriétés de généricité (indépendance de q) ont été notamment étudiées par Broué, Malle et Michel (voir [10]). 1.2.5. Décomposition de Jordan des caractères. — La décomposition de Jordan des caractères irréductibles de G est la donnée d’une bijection (3)
E (G, (s))
∼
←→ E (CG∗ (s), (1)) C
∗ (s)
G qui, étendue par linéarité, envoie un caractère de Deligne-Lusztig RT (θ) sur RTG (1) ∗ pour toute paire (T, θ) ∼ s (à un signe global près). Cette bijection provient de la classification des caractères irréductibles de G et CG∗ (s), laquelle a été obtenue par G Lusztig à partir de l’étude approfondie des caractères RT (θ) (voir [20, Thm. 4.23]). À ce titre, elle satisfait de nombreuses propriétés, mais néanmoins il n’existe à l’heure actuelle aucun moyen de la définir directement, hormis dans le cas particulier que nous allons détailler.
Supposons que CG∗ (s) est un sous-groupe de Levi de G∗ . C’est le dual de Langlands d’un sous-groupe de Levi F -stable L de G. Puisque l’ensemble des caractères unipotents ne dépend que du groupe de Weyl muni de l’action de F (d’après la classification de Lusztig, voir [20, §4]), on peut identifier les caractères unipotents de CG∗ (s) avec ceux de L (en préservant les degrés). La décomposition de 1:1 Jordan nous donne alors une bijection E (G, (s)) ←→ E (L, (1)), qui dans ce cas peut se définir directement à partir de la cohomologie des variétés de Deligne-Lusztig. Étant donnés un sous-groupe parabolique P = LU de G dont L est un complément de Levi F -stable, et un caractère irréductible χ de L, on peut former comme précédemment le caractère virtuel X G (4) RL⊂P (χ) = (−1)i [H i (XP , Fχ )] i≥0
où Fχ est le système local associé à χ via le revêtement YU −→ XP . On peut voir G comme un équivalent de l’induction entre les caractères de L et l’application RL⊂P de G, adapté au cas des groupes réductifs finis. Théorème 1.1 (Lusztig). — Soit L un sous-groupe de Levi F -stable de G et s un élément semi-simple de G∗ . On suppose que CG∗ (s) ⊂ L∗ (en particulier s ∈ L∗ ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
58
O. DUDAS
Pour tout sous-groupe parabolique P de G dont L est un complément de Levi, G l’application RL⊂P induit, à un signe global près, une bijection E (L, (s))
∼
−→ E (G, (s)).
Le résultat de Lusztig est en fait plus précis : si χ est caractère irréductible de L dans la série associée à (s), alors la cohomologie de la variété XP à coefficients dans Fχ est concentrée en un seul degré iP . En particulier, H iP (XP , Fχ ) est une représentation irréductible de G. Nous verrons plus loin que ce degré de cohomologie iP correspond à la dimension de la variété de Deligne-Lusztig XP . Remarque 1.2. — Si CG∗ (s) = L∗ , autrement dit si s est central dans L∗ , alors il existe un caractère linéaire sˆ : L −→ K × tel que la multiplication par sˆ induise une bijection entre E (L, (1)) et E (L, (s)). Par composition on déduit du théorème la bijection ∼ G RL⊂P (ˆ s−) : E (L, (1)) −→ E (G, (s)). Ainsi, l’étude des caractères irréductibles de la série associée à (s) se ramène à l’étude des caractères unipotents de L. Ce type de réduction, ainsi que sa généralisation au cadre modulaire, est à la base de nombreux résultats sur les représentations irréductibles des groupes réductifs finis (voir par exemple les applications mentionnées en introduction). Exemple 1.3. — Le groupe G = GLn (Fq ) est autodual. Les centralisateurs des éléments semi-simples de G sont toujours des sous-groupes de Levi, isomorphes à des produits de groupes linéaires. On obtient la forme de ces centralisateurs (et des groupes finis associés) à partir du polynôme caractéristique des éléments semi-simples considérés. Par exemple, si s ∈ GLn (q) a un polynôme caractéristique de la forme P m , où P est un polynôme irréductible sur Fq de degré d, alors CG (s) ' GLm (q d ). On en déduit que tous les caractères irréductibles de GLn (q) sont décrits par les caractères unipotents de produits de groupes linéaires sur des extensions finies de Fq . 1.3. Regroupement de séries et blocs 1.3.1. Cadre modulaire. — Que se passe-t-il pour les représentations modulaires de G, c’est-à-dire les représentations à coefficients dans un corps de caractéristique ` > 0 ? Les classes d’isomorphismes de représentations irréductibles de G à coefficients dans k, que nous noterons Irrk G sont au même nombre que les classes de conjugaison `-régulières de G. Ce sont les classes des éléments dont l’ordre est premier à `. Si on suppose que ` - q, les éléments unipotents sont automatiquement `-réguliers. De manière analogue à §1.1.1, la décomposition de Jordan permet de paramétrer les classes de conjugaison `-régulières de G par des paires ((s), (u)) où (s) est une classe `-régulière semi-simple de G, et (u) une classe unipotente de CG (s).
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
59
On peut donc s’attendre à un paramétrage analogue des représentations de G modulaires : une représentation irréductible devrait correspondre à une classe semisimple `-régulière (s) de G∗ munie d’une représentation unipotente irréductible de CG∗ (s). Afin d’expliquer cette correspondance dans le cas modulaire et la mettre en parallèle avec les résultats précédents énoncés en caractéristique zéro, il est utile de travailler sur un anneau intermédiaire entre K (caractéristique 0) et k (caractéristique `). Tout au long de cet exposé nous travaillerons en caractéristique transverse (3), c’est-à-dire sous l’hypothèse où ` 6= p. Rappelons que K est une extension finie de Q` . On note O l’anneau des entiers de K sur Z` ; c’est un anneau local dont le corps résiduel k est un corps fini de caractéristique `. Le triplet (K, O , k) est appelé système `-modulaire. On gardera en tête le schéma suivant : KO ` ? Q` `
0PO O
// k O
0P ? Z`
? / / F` .
Comme au §1.2 nous éluderons tous les problèmes de rationalité en supposant que l’extension K est assez grande, de sorte que les algèbres KG et kG soient déployées. Autrement dit, toute représentation irréductible de G sur K (resp. sur k) reste irréductible après extension des scalaires à un corps contenant K (resp. k). Pour mettre en valeur l’anneau sur lequel les représentations seront définies, nous utiliserons souvent le terme de ΛG-module pour désigner une représentation de G à coefficients dans un anneau Λ. On parlera alors de module simple en lieu et place de représentation irréductible. Lorsque deux groupes finis G et H agissent linéairement sur un Λ-module M , avec G agissant à gauche et H à droite, on dira que M est un ΛG-module-ΛH (4). Les ΛG-modules de type fini munis des morphismes linéaires G-équivariants forment une catégorie abélienne que nous noterons ΛG-mod. Lorsque Λ = K, cette catégorie est semi-simple. Autrement dit toute représentation de G à (3)
Le cas de la caractéristique égale – c’est-à-dire pour ` égal à la caractéristique de Fq – est de nature tout à fait différente : par exemple, lorsque G est simple, il n’y a que deux blocs de kG, le bloc principal, et le bloc contenant la représentation de Steinberg (qui est alors simple et projective). Le paramétrage des modules simples dû à Steinberg nécessite d’autres outils, issus pour la plupart des représentations rationnelles du groupe algébrique G. (4) Cette terminologie chère à M. Broué n’est que trop peu utilisée à notre goût, la plupart des auteurs préférant le terme de (ΛG, ΛH)-bimodule, ou de Λ(G × H op )-module.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
60
O. DUDAS
coefficients dans K se décompose en une somme directe de représentations irréductibles. En revanche, lorsque ` divise l’ordre de G et Λ = O ou k alors il existe des représentations indécomposables qui ne sont pas irréductibles. De manière équivalente, certaines suites exactes de ΛG-modules ne sont pas scindées. Pour éliminer ces complications homologiques, on travaille avec le groupe de Grothendieck de la catégorie abélienne ΛG-mod, noté K0 (ΛG-mod). C’est le groupe abélien engendré par les classes d’isomorphismes des ΛG-modules soumises aux relations [N ] = [M ] + [P ] pour toute suite exacte courte 0 → M → N → P → 0. Lorsque Λ est un corps, le groupe K0 (ΛG-mod) est un groupe abélien libre de base les classes des représentations irréductibles (voir [28, §14]). Si Λ = K la classe d’une représentation M dans K0 (KG-mod) est déterminée par son caractère (la trace des éléments de G comme endomorphismes de M ). Par extension nous appellerons souvent caractère la classe d’une représentation dans le groupe de Grothendieck. Nous travaillerons aussi avec une autre catégorie, formée des ΛG-modules projectifs de type fini. Cette catégorie est seulement additive en général, mais on peut tout de même définir son groupe de Grothendieck en remplaçant les suites exactes par les suites exactes scindées. Sauf mention contraire, par le caractère d’un module projectif on entendra sa classe dans ce groupe de Grothendieck. Notons pour finir que tout foncteur exact F : ΛG-mod −→ ΛH-mod entre deux catégories de représentations (par exemple un foncteur d’induction ou de restriction) induit un morphisme de groupes noté [F ] : K0 (ΛG-mod) −→ K0 (ΛH-mod) au niveau des groupes de Grothendieck. 1.3.2. Séries modulaires. — Si θ : T −→ K × est un caractère irréductible de T , ses valeurs sont des racines de l’unité et sont donc dans O × . On en déduit, par passage au quotient, un caractère θ : T −→ k × . Fixons un autre caractère irréductible η de T . Le caractère résiduel η est trivial si et seulement si les valeurs de η sont des racines de l’unité dont l’ordre est une puissance de ` (des `-éléments de K × ). On dit dans ce cas que η est un `-caractère et on note η ∈ Irr` T . De plus, la classe semi-simple (t) de G∗ associée à (T, η) comme au §1.2.4 est aussi formée de `-éléments. On notera G∗ss,` l’ensemble des `-éléments semi-simples de G∗ . Au niveau des représentations G G modulaires de G, cela suggère que les caractères de Deligne-Lusztig RT (θ) et RT (θη) ∗ jouent le même rôle. On peut donc, pour un élément semi-simple s de G fixé, regrouper les séries de la façon suivante : [ (5) E` (G, (s)) := E (G, (st)). t∈CG∗ (s)`,ss
Ici, t parcourt l’ensemble des `-éléments semi-simples de CG∗ (s). Lorsque (s) est une classe `-régulière, on dira que E` (G, (s)) est la série modulaire associée à (s).
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
61
Un point de vue équivalent consiste à considérer les kT -modules projectifs et leur relèvement à K. Notons T`0 l’ensemble des éléments `-réguliers de T (rappelons que ce sont les éléments d’ordre premier à `). Puisque T est abélien, T`0 est un sousgroupe de T d’ordre premier à `, donc inversible dans O . Au caractère irréductible θ : T −→ O × on peut alors associer un idempotent eθ de O T défini par 1 X eθ = θ(t−1 )t ∈ O T. |T`0 | t∈T`0
Au lieu de considérer le KT -module simple Kθ de caractère θ, on peut former le O T -module projectif O T eθ , dont le caractère est donné par X [KT eθ ] = θη. η∈Irr` T ∗
Si s est l’élément semi-simple de G associé à (T, θ) alors les caractères irréductibles G qui apparaissent dans RT ([KT eθ ]) apparaissent dans les caractères de DeligneG Lusztig RT (θη) pour η parcourant l’ensemble des `-caractères de T , et sont donc tous dans E` (G, (s)). Ainsi, le regroupement en séries donné par (5) est le plus G fin des regroupements qui contiennent les images par RT des modules projectifs indécomposables : G E` (G, (s)) = χ ∈ IrrK G | ∃ (T, θ) ∼ s tel que hRT ([KT eθ ]); χiG 6= 0 . Broué et Michel ont utilisé cette observation ainsi que les propriétés de l’application G RT pour montrer que les séries modulaires sont définies sur les entiers [11]. Théorème 1.4 (Broué-Michel). — Les séries modulaires sont des unions de `-blocs. Autrement dit, il existe une famille {e(s) }(s)∈G∗ 0 d’idempotents centraux de O G ss,` vérifiant les propriétés suivantes. (i) L’algèbre de groupe O G se décompose en une somme directe de O -algèbres M OG = O Ge(s) . (s)∈G∗ ss,`0
(ii) Les caractères des représentations irréductibles de l’algèbre KGe(s) sont exactement les éléments de E` (G, (s)). Plus précisément, χ ∈ IrrK G satisfait χ(e(s) ) 6= 0 si et seulement si χ ∈ E` (G, (s)). On peut voir ce résultat comme une version modulaire de la propriété de disjonction des séries énoncée au §1.2.4 : la décomposition donnée en (i) induit (après une éventuelle extension des scalaires) une décomposition de la catégorie des représentations M ΛG-mod = ΛGe(s) -mod (s)∈G∗ /∼ ss,`0
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
62
O. DUDAS
pour n’importe quel anneau Λ parmi K, O et k. L’assertion (ii) assure alors qu’étant donnés deux kG-modules simples S, S 0 dont les classes apparaissent dans des caractères de Deligne-Lusztig associés à des séries modulaires différentes, on a non seulement HomkG (S, S 0 ) = HomkG (S 0 , S) = 0 mais aussi ExtikG (S, S 0 ) = ExtikG (S 0 , S) = 0 pour tout i ∈ Z. Les modules S et S 0 appartiennent à des blocs différents (voir §3.1.3 pour plus de détails sur cette notion). 1.3.3. Décomposition de Jordan modulaire. — Lorsque CG∗ (s) est contenu dans un sous-groupe de Levi F -stable L∗ de G∗ , on peut considérer les idempotents eL (s) et eG (s) associés respectivement aux séries E` (L, (s)) et E` (G, (s)). Le théorème 1.1 G assure alors qu’à un signe global près, l’application d’induction RL⊂P induit une bijection entre E` (L, (s)) et E` (G, (s)), c’est-à-dire entre les caractères des algèbres G KLeL (s) et KGe(s) . Fort de cette observation et d’autres coïncidences numériques, Broué conjecture en 1988 que cette bijection provient d’une équivalence de Morita entre les versions entières de ces algèbres [7, p61-62]. Nous donnons dans un premier temps la version faible de cette conjecture, avant d’en expliquer la version géométrique dans la partie suivante. Conjecture 1.5 (Broué). — Si CG∗ (s) ⊂ L∗ , alors les catégories abéliennes G O LeL (s) -mod et O Ge(s) -mod sont équivalentes. Comme pour les représentations en caractéristique zéro, le cas s = 1 joue un rôle particulier. L’ensemble E` (G, (1)) est une union de blocs dits blocs unipotents possédant des propriétés de généricité étudiées par [10]. Lorsque CG∗ (s) = L∗ , c’està-dire lorsque s est central dans L∗ , le caractère linéaire sˆ donné par le théorème 1.1 ∼ L induit un isomorphisme d’algèbres ΛLeL ˆ(g −1 )g. Par (1) −→ ΛLe(s) défini par g 7→ s composition on en déduit une équivalence G ΛLeL (1) -mod ' ΛGe(s) -mod.
Autrement dit, dans le cas où le centralisateur de s est un sous-groupe de Levi (5) un bloc dans la série associée à (s) est Morita équivalent à un bloc unipotent d’un groupe dual à CG∗ (s). C’est la version modulaire de la décomposition de Jordan.
2. ÉQUIVALENCES DE MORITA Cette partie détaille les travaux de Broué et Bonnafé-Rouquier permettant de démontrer la conjecture 1.5. (5) C’est le cas dès que l’ordre de s ne fait pas intervenir de nombres premiers petits par rapport au rang de G.
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
63
2.1. Énoncé de la conjecture En caractéristique zéro, la construction géométrique des représentations irréductibles de G = G(Fq ) et leur regroupement en séries s’obtient par l’étude de la cohomologie `-adique des variétés de Deligne-Lusztig définies au §1.2.2. En travaillant directement avec des faisceaux à coefficients dans k ⊃ F` , on peut définir une version « caractéristique positive » des caractères de Deligne-Lusztig (1) et (4). Ce point de vue n’est pas satisfaisant : on obtient uniquement des informations de nature numérique sur les représentations. Afin de traiter des problèmes de nature homologique, il est nécessaire de remplacer les groupes de cohomologie individuels et leur somme alternée par un complexe, défini à quasi-isomorphisme près. Le formalisme des catégories dérivées sera particulièrement adapté à ce point de vue. Fixons un sous-groupe parabolique P de G de radical unipotent U. On suppose que P admet un complément de Levi F -stable L. On se trouve alors dans la situation du §1.2.2 et on dispose d’une variété algébrique YU sur laquelle les groupes finis G et L agissent. Étant donné un anneau Λ pris parmi K, O et k, on peut associer à cette variété un complexe de ΛG-modules-ΛL noté RΓ(YU , Λ) tel que H i (RΓ(YU , Λ)) ' H i (YU , Λ). Ce complexe est un représentant d’un objet de la catégorie dérivée bornée Db (ΛG-mod-ΛL) des complexes de ΛG-modules-ΛL. Via ce complexe, on peut définir un foncteur triangulé G
RL⊂P
L
= RΓ(YU , Λ) ⊗ΛL − : Db (ΛL-mod) −→ Db (ΛG-mod)
appelé foncteur d’induction de Deligne-Lusztig. Ce foncteur induit une application G linéaire [RL⊂P ] entre les groupes de Grothendieck de ΛL-mod et ΛG-mod (6) ; dans G le cas où Λ = K ⊃ Q` , cette application s’identifie à RL⊂P définie par (4). On peut donc voir l’application d’induction de Deligne-Lusztig comme le reflet d’un foncteur d’induction au niveau des catégories dérivées. La version géométrique de la conjecture 1.5 énoncée par Broué [7, §3], et démontrée par Bonnafé-Rouquier [4, Thm. B0 ], est donc donnée par : Conjecture 2.1 (Broué). — Soit s ∈ G∗ un élément semi-simple `-régulier de G∗ . On suppose que CG∗ (s) ⊂ L∗ . Alors le foncteur d’induction G
RL⊂P
b G : Db (O LeL (s) -mod) −→ D (O Ge(s) -mod) ∼
G induit une équivalence de Morita O LeL (s) -mod −→ O Ge(s) -mod.
(6)
Le groupe de Grothendieck de la catégorie dérivée bornée (en tant que catégorie triangulée) s’identifie naturellement au groupe de Grothendieck de la catégorie de modules associée (en tant que P P catégorie abélienne). L’image d’un complexe C est donnée par [C] = (−1)i [Ci ] = (−1)i [H i (C)].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
64
O. DUDAS
L’énoncé de cette conjecture nécessite quelques éclaircissements : en considérant les modules (ou représentations) comme des complexes concentrés en degré 0, on dispose d’un plongement pleinement fidèle de la catégorie O Le(s) -mod dans la catégorie dérivée G Db (O Le(s) -mod). En revanche, il n’est pas vrai que l’image par RL⊂P d’un module – i.e., d’un complexe concentré en un seul degré – est concentrée en un seul degré. Pour cela il faut démontrer que le complexe RΓ(YU , O ) lui-même, coupé par la série modulaire de (s), est quasi-isomorphe à un O G-module-O L concentré en un seul degré, et que ce module est projectif lorsqu’on le considère comme module-O L. Le signe donné au théorème 1.1 provient alors du décalage homologique de ce module. 2.2. Du complexe au bimodule Dans l’article [7] où il énonce cette conjecture, Broué propose une stratégie de preuve. Tout d’abord, le complexe RΓ(YU , O ) possède les propriétés de finitude nécessaires pour définir un foncteur au niveau des catégories dérivées de modules. Les `-éléments des groupes finis G et L agissent sans point fixe, et on peut donc trouver un représentant de RΓ(YU , O ) dont les termes sont des O G-modules-O L qui sont de type fini, et projectifs en tant que O G-modules et modules-O L (7) (mais pas forcément pour les deux actions à la fois, nous verrons au §3.1.5 un résultat plus général dû à Rickard). De plus, la variété YU a la même amplitude cohomologique qu’une variété affine (elle est en fait affine dès que q est assez grand, voir [15, Thm. 9.7]) ; autrement dit, on peut choisir un représentant de RΓ(YU , O ) dont les termes non nuls sont concentrés en degrés 0, 1, . . . , dim YU . Pour les mêmes raisons, le complexe de cohomologie à support compact RΓc (YU , O ) peut être représenté par un complexe concentré en degrés dim YU , . . . , 2 dim YU dont les termes sont projectifs de type fini comme O G-modules et comme modules-O L. Les travaux de Deligne-Lusztig [15, §9] suggèrent alors de montrer que le morphisme naturel L RΓc (YU , O )eL (s) −→ RΓ(YU , O )e(s)
(6)
est un isomorphisme. Le seul degré non nul en commun de ces deux complexes est le degré moitié, égal à dim YU = r :
··· 0
0
···
0
Pr
Pr+1
···
P2r
0 ···
··· 0
Q0
Q1
···
Qr
0
···
0
0 ···
Si (6) est un isomorphisme, on en déduit que chacun de ces complexes est isomorphe à un module concentré en degré moitié. Les propriétés de finitude de ces complexes (7)
Il est intéressant de noter que cet argument est déjà présent dans l’article de Deligne-Lusztig !
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
65
(termes projectifs de type fini) se transmettent facilement à ce module, et l’on déduit la conjecture 2.1 de la bijection des caractères donnée au théorème 1.1. Allons encore plus loin : les complexes de modules qui entrent en jeu sont les sections globales de certains faisceaux sur des versions projectives des variétés de Deligne-Lusztig. Rappelons que l’on dispose d’un revêtement étale π : YU −→ XP qui est un L-torseur. Le O L-module projectif O Le(s) donne lieu à un système local sur XP que l’on notera F(s) . Considérons l’adhérence de XP dans la variété projective G/P donnée par XP = {g ∈ G | g −1 F (g) ∈ P · F (P)}/P ainsi que l’inclusion ouverte j : XP ,→ XP . Les complexes RΓc (YU , O )eL (s) et RΓ(YU , O )eL (s) correspondent alors aux sections globales des complexes de faisceaux j! F(s) et Rj∗ F(s) respectivement. Il suffit alors de montrer une version locale de l’isomorphisme (6), à savoir que l’application naturelle (7)
j! F(s) −→ Rj∗ F(s)
est un isomorphisme. Pour finir, Broué montre qu’un O G-module-O L de type fini, projectif à gauche et à droite, induit une équivalence de Morita dès qu’il induit une bijection entre les caractères irréductibles (donc sur K, en caractéristique 0) (voir [7, Th. 0.2]). En appliquant le théorème 1.1, il déduit donc une preuve de la conjecture 2.1 sous l’hypothèse où (7) est un isomorphisme. Le cas particulier où L = T est un tore (et donc P = B est un sous-groupe de Borel) est très instructif : on peut remplacer XB par une compactification lisse de XB dont le complémentaire est une union de diviseurs à croisements normaux. Deligne et Lusztig montrent à l’aide de cette construction que les faisceaux associés à des caractères réguliers de T se ramifient le long de ces diviseurs, ce qui implique que l’application j! F(s) −→ j∗ F(s) est un isomorphisme. Puisque T est d’ordre premier à la caractéristique de Fq , la ramification est modérée et on a en fait un isomorphisme ∼ j! F(s) −→ Rj∗ F(s) . Broué en déduit que la conjecture 2.1 est vraie dans le cas où CG∗ (s) est un tore [7, Thm. 3.3]. Dans le cas général, on ne dispose pas d’une compactification lisse de XP permettant le même genre de calcul de ramification. L’idée de Bonnafé-Rouquier est d’utiliser la transitivité de l’induction de Deligne-Lusztig pour se ramener au cas des tores. Cela nécessite d’une part de montrer que les complexes de cohomologie de variétés de Deligne-Lusztig « suffisent » (résultats d’engendrement de la catégorie dérivée, voir §2.4), et d’autre part d’étendre les résultats de Deligne-Lusztig à des caractères non réguliers donnant des systèmes locaux sur des compactifications partielles de XB . Nous allons détailler leurs travaux dans les sections suivantes.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
66
O. DUDAS
2.3. Ramification 2.3.1. Variétés de Deligne-Lusztig généralisées et leur compactification. — Dans cette partie et la suivante, nous allons nous concentrer sur le cas des variétés de DeligneLusztig YU et XB associées à des sous-groupes de Borel et à leur radical unipotent. Pour définir les compactifications de XB qui vont entrer en jeu, il est commode de changer de point de vue. On fixe désormais un tore maximal F -stable T de G ainsi qu’un sous-groupe de Borel F -stable B de G. Une telle paire (T, B) existe toujours, et elle est unique à conjugaison par G près. On dit que le tore T est quasi-déployé. Dans ce cas, les variétés YU et XB s’identifient aux ensembles finis G/U et G/B respectivement. Si (T0 , B0 ) est une autre paire formée d’un tore maximal F -stable T0 de G contenu dans un sous-groupe de Borel B0 de G (non nécessairement F -stable), alors il existe x ∈ G tel que T0 = x T et B0 = x B. La condition que T0 soit F -stable est équivalente au fait que n = x−1 F (x) appartienne au normalisateur NG (T) de T. Si on note w l’image de n dans W = NG (T)/T, la multiplication à droite par x induit des isomorphismes G-équivariants ∼
YU0 −→ Y(n) := {g ∈ G | g −1 F (g) ∈ UnU}/U, ∼
XB0 −→ X(w) := {g ∈ G | g −1 F (g) ∈ BwB}/B. Via cette description, l’action de T 0 sur YU0 s’identifie à l’action de TwF sur Y(n). L’application naturelle Y(n) −→ X(w) induite par la projection G/U G/B est un TwF -torseur étale. Plus généralement, étant donné un r-uplet n = (n1 , . . . , nr ) d’éléments de NG (T) d’image w = (w1 , . . . , wr ) dans W on peut définir des G-variétés Y(n) et X(w), ainsi qu’un TwF -torseur étale π : Y(n) −→ X(w) où w = w1 · · · wr . Lorsque `(w) = `(w1 ) + · · · + `(wr ) les variétés Y(n) et X(w) sont naturellement isomorphes à Y(n) et X(w) respectivement, avec n = n1 · · · nr . Notons X(w) l’adhérence de X(w) dans G/B ; celle-ci s’obtient explicitement en remplaçant la condition g −1 F (g) ∈ BwB par la condition g −1 F (g) ∈ BwB. C’est une variété projective qui est lisse dès que BwB l’est. Puisque BwB s’écrit comme l’union des cellules de Bruhat BxB pour x ≤ w (on peut prendre cette condition comme définition de l’ordre de Bruhat ≤ sur W ), on obtient G (8) X(w) = X(x). x≤w
Cette définition se généralise au cas des r-uplets w = (w1 , . . . , wr ) d’éléments de W . On peut définir une variété projective X(w) = X(w1 , . . . , wr ) qui est lisse dès que chacune des variétés Bwi B l’est. En particulier, si chaque wi est une réflection simple, la variété X(w) est une compactification lisse de X(w). L’ordre de Bruhat sur W
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
67
s’étend par produit en un ordre sur les r-uplets d’éléments de W de sorte que la décomposition (8) reste valide pour w : G X(x). (9) X(w) = x≤w w jx
Pour x ≤ w on notera : X(x) ,→ X(w) le plongement de la pièce associée à x, ou tout simplement jx s’il n’y a pas d’ambiguïté sur la variété projective ambiante. 2.3.2. Cas régulier. — Rappelons que la stratégie pour montrer que la cohomologie du complexe RΓ(Y, Λ), coupé par la série modulaire associée à (s), est concentrée en degré moitié, consiste à comparer les versions compacte et non compacte de ce w complexe. Cela revient à comparer le faisceau (jx )! F avec le complexe de faisceaux w R(jx )∗ F pour certains x ≤ w et certains systèmes locaux F sur X(x). Le premier résultat dans ce sens est dû à Deligne-Lusztig pour les systèmes locaux associés à des caractères réguliers. Sous l’hypothèse que le centre de G est connexe, un caractère de TwF sera dit régulier si son stabilisateur sous l’action de W wF est trivial (8). Théorème 2.2 (Deligne-Lusztig, [15, Lem. 9.14]). — Fixons une décomposition réduite w = s1 · · · sr de w et posons w = (s1 , . . . , sr ). Soit θ : TwF −→ K × un caractère de TwF et Kθ le système local sur X(w) associé. Si θ est régulier, alors le morphisme naturel w w (jw )! Kθ −→ R(jw )∗ Kθ est un isomorphisme. Pour traiter le cas modulaire, nous travaillerons à coefficients dans un anneau Λ pris parmi K, O et k. On peut alors de manière similaire construire un système local Λθ de rang 1 à partir d’un morphisme de groupes θ : TwF −→ Λ× . Le théorème 2.2 s’étend immédiatement à ce cadre dès que θ est régulier. 2.3.3. Cas trivial. — À l’opposé, considérons le cas d’un caractère trivial : le système local associé sur X(w) et sur toutes les variétés X(x) pour x ≤ w est le système local w constant Λ. Notons j = jw : X(w) ,→ X(w) l’immersion ouverte et i : X(w) \ X(w) ,→ X(w) l’immersion fermée. Pour éviter toute ambiguïté nous noterons ΛX le faisceau constant égal à Λ sur la variété X. La suite exacte de faisceaux sur X(w) 0 −→ j! ΛX(w) −→ ΛX(w) −→ i! ΛX(w)\X(w) −→ 0 permet, en utilisant (9), de montrer par récurrence que ΛX(w) est obtenu par w extensions successives des faisceaux (jx )! ΛX(x) pour x ≤ w. Puisque toutes les variétés considérées sont lisses (et que X(w) \ X(w) est de codimension 1 dans X(w)), (8) Cette condition définit plutôt la propriété d’être en position générale dans le cas d’un groupe réductif quelconque.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
68
O. DUDAS
l’application du foncteur de dualité à la suite exacte précédente fournit le triangle distingué i! ΛX(w)\X(w) [−2] −→ ΛX(w) −→ Rj∗ ΛX(w) w
On en déduit que Rj∗ ΛX(w) peut s’obtenir à partir des faisceaux (jx )! ΛX(x) pour x ≤ w en prenant une succession de cônes, de sommes directes, de facteurs directs et de décalages. De manière plus formelle, on dit que Rj∗ ΛX(w) appartient à la sous-catégorie épaisse des complexes constructibles Dcb (X(w)) engendrée par la w famille (jx )! ΛX(x) x≤w . 2.3.4. Cas général. — Le cœur du travail de Bonnafé-Rouquier est de généraliser ces deux résultats (θ régulier ou θ trivial) à des caractères quelconques de TwF . Une étude plus précise de la ramification des systèmes locaux sur X(w) et ses compactifications partielles est nécessaire. Elle est rendue possible par le recollement de revêtements intermédiaires aux revêtements Y(m) −→ X(x) où m est une suite d’éléments de NG (T) d’images x dans W et x ≤ w. Ces recollements sont obtenus grâce à l’identification de certains quotients des tores TxF . Le lecteur intéressé trouvera plus de détails dans [4, §6-7], ainsi que dans un travail ultérieur de Bonnafé-Rouquier [5] où est donnée une description explicite de la normalisation de Y(n) dans X(w) de manière compatible à (9). Nous nous contenterons d’énoncer le théorème suivant : Théorème 2.3 (Bonnafé-Rouquier). — Soit θ : TwF −→ Λ× . Il existe wθ ≤ w tel que les éléments x de l’intervalle [wθ , w] vérifient les propriétés suivantes : (i) Il existe une surjection naturelle TxF TwF / ker θ, via laquelle on peut définir le système local Λθ sur X(x). w w (ii) Le complexe R(jx )∗ Λθ peut s’obtenir à partir des faisceaux (jy )! Λθ pour y ∈ [wθ , x] en prenant une succession de cônes, de sommes directes, de facteurs directs et de décalages. Puisque X(x) est lisse pour tout x, on déduit par dualité que le résultat reste vrai en échangeant le rôle de Rj∗ et j! . Autrement dit, pour x fixé, les catégories w w épaisses engendrées par R(jy )∗ Λθ y∈[w ,x] et (jy )! Λθ y∈[w ,x] coïncident. Dans θ θ le cas où θ est régulier on a wθ = w et on retrouve le résultat de Deligne-Lusztig (théorème 2.2). Le cas où θ est trivial correspond à wθ = 1. 2.3.5. Conséquences. — Le théorème 2.3 permet de déduire deux résultats fondamentaux dans le travail de Bonnafé-Rouquier, qui sont les ingrédients principaux dans leur preuve de la conjecture 2.1, à savoir : w
w
Support. — (jx )∗ R(jw )∗ Λθ = 0 dès que x ∈ / [wθ , w]. Autrement dit, le support du F w complexe de faisceaux R(jw )∗ Λθ est contenu dans x∈[wθ ,w] X(x). Cette propriété découle directement du théorème précédent.
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
69
Engendrement. — Les complexes de cohomologie RΓ(Y(n), Λ)}n∈NG (T) engendrent la catégorie des complexes parfaits de ΛG-modules, de manière compatible avec les séries modulaires. La démonstration de ce second résultat est donnée dans la section suivante. 2.4. Engendrement de la catégorie dérivée 2.4.1. Complexes parfaits. — Rappelons que tout caractère irréductible de G apparaît comme constituant d’un caractère de Deligne-Lusztig, lequel est donné par la somme alternée des groupes de cohomologie de la variété Y(n) pour un certain n ∈ NG (T). La généralisation de ce résultat au cadre modulaire garantit que tout module projectif indécomposable peut s’obtenir à partir des complexes de cohomologie RΓ(Y(n), Λ) pour n ∈ NG (T) en prenant des successions de sommes directes, facteurs directs, cônes et décalages. Cela s’exprime formellement en l’énoncé du théorème 2.4, obtenu par Bonnafé-Rouquier dans [4, §9]. Les objets de Db (ΛG-mod) possédant de bonnes propriétés de finitude (objects compacts) sont les complexes quasi-isomorphes à des complexes parfaits, à savoir des complexes bornés dont les termes sont des modules projectifs de type fini. On notera ΛG-parf la sous-catégorie pleine de Db (ΛG-mod) formée par ces complexes. Théorème 2.4 (Bonnafé-Rouquier). — La catégorie ΛG-parf est la sous-catégorie épaisse de Db (ΛG-mod) engendrée par les complexes RΓ(Y(n), Λ) pour n variant dans NG (T). Démonstration. — À isomorphisme (non unique) près, la variété Y(n) ne dépend que de la classe de n dans W = NG (T)/T. Il suffit donc de travailler avec un système de représentants {w} ˙ w∈W de W dans NG (T). D’après [15, Prop. 7.5], la représentation régulière de G est combinaison linéaire des caractères des complexes RΓ(Y(w), ˙ Λ) pour w variant dans W . On en déduit que tout ΛG-module projectif indécomposable apparaît dans le caractère d’un certain complexe RΓ(Y(w), ˙ Λ). La tête de ce module projectif, que l’on notera S, est un ΛG-module simple qui vérifie alors (10)
RHomΛG (RΓ(Y(w), ˙ Λ), S) 6= 0.
Le module simple S étant fixé, choisissons w de longueur minimale tel que l’équation (10) soit vérifiée. En particulier, RHomΛG (RΓ(Y(v), ˙ Λ), S) = 0 dès que v < w. En utilisant la dualité de Poincaré, on en déduit que RHomΛG (RΓc (Y(v), ˙ Λ), S ∗ ) = 0 dès que v < w.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
70
O. DUDAS
Via le revêtement Y(v) ˙ −→ X(v), le complexe RΓc (Y(v), ˙ Λ) est quasi-isomorphe au wF wF complexe RΓc (X(v), ΛT ) où ΛT est le système local associé à la représentation régulière de TwF . Puisque tout module Λθ associé au caractère θ : TwF −→ Λ× possède une résolution dont les termes sont des ΛTwF -modules libres, on en déduit que RHomΛG (RΓc (X(v), Λθ ), S ∗ ) = 0
(11)
pour tout v < w et tout caractère θ : TwF −→ Λ× . Par des réductions standard dues à Deligne-Lusztig (voir [15, §1] ainsi que §4.2.1), cette propriété reste vraie pour les variétés X(v) dès que v est une suite d’éléments de W dont le produit vaut v. C’est ici que le théorème 2.3 entre en jeu. Fixons une décomposition réduite w = s1 · · · sr de w et posons w = (s1 , . . . , sr ). Le cône du morphisme naturel w w (jw )! Λθ −→ R(jw )∗ Λθ est un complexe de faisceaux supporté sur le fermé w X(w) \ X(w) et engendré par les faisceaux (jv )! Λθ pour wθ ≤ v ≤ w d’après le théorème 2.3. En prenant les sections globales, on en déduit que le cône du morphisme naturel RΓc (X(w), Λθ ) −→ RΓ(X(w), Λθ ) est engendré par les complexes RΓc (X(v), Λθ ) pour v < w. Par conséquent, la propriété (11) implique que le morphisme naturel RΓc (Y(w), ˙ Λ) −→ RΓ(Y(w), ˙ Λ) induit un isomorphisme ∼
RHomΛG (RΓ(Y(w), ˙ Λ), S ∗ ) −→ RHomΛG (RΓc (Y(w), ˙ Λ), S ∗ ). Puisque RΓ(Y(w), ˙ Λ) et RΓc (Y(w), ˙ Λ) sont des complexes parfaits dont les termes non nuls se trouvent respectivement en degrés 0, . . . , `(w) et `(w), . . . , 2`(w), on en déduit que le complexe RHomΛG (RΓc (Y(w), ˙ Λ), S ∗ ) n’a qu’un seul degré de cohomologie non nul, à savoir le degré `(w). Autrement dit, il existe un représentant de RΓc (Y(w), ˙ Λ) dans lequel PS ∗ n’apparaît qu’en degré `(w). Par dualité de Poincaré, la même assertion est vérifiée pour PS dans le complexe RΓ(Y(w), ˙ Λ). On a donc montré que pour S fixé, la minimalité de w force le module PS à n’apparaître qu’en degré moitié. Ainsi, PS est un facteur direct du cône de RΓ(Y(w), ˙ Λ) vers sa troncation brutale en degrés 0, . . . , `(w) − 1, lequel est un complexe dont les termes font intervenir des modules projectifs indécomposables qui apparaissent déjà dans des complexes RΓ(Y(v), ˙ Λ) pour v de longueur strictement plus petite que w. Puisqu’en outre RΓ(Y(1), Λ) est quasi-isomorphe à un module projectif placé en degré 0, on en déduit le théorème par récurrence. 2.4.2. Engendrement des séries. — Rappelons que l’algèbre O G se décompose en une somme directe de sous-algèbres associées à des séries modulaires E` (G, (s)), chacune étant paramétrée par une classe semi-simple `-régulière (s) de G∗ (voir §1.3.2) : M OG = O Ge(s) . (s)∈G∗ /∼ ss,`0
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
71
Au niveau des représentations sur K (caractéristique zéro), c’est-à-dire des caractères, chaque série correspond aux constituants irréductibles de caractères de DeligneLusztig. Avec les notations de cette section et la précédente, les tores maximaux F -stables de G avec action de F sont remplacés par le tore maximal quasi-déployé T fixé avec action de wF pour un certain w ∈ W . Comme au §1.2.4 on peut donc associer à toute paire (w, θ) formée d’un élément w ∈ W et d’un caractère θ : TwF −→ K × une classe semi-simple (s) de G∗ . On notera alors (w, θ) ∼ s. Avec ces notations on a E (G, (s))
= χ ∈ IrrK G | ∃ (w, θ) ∼ s tel que h[RΓ(X(w), Kθ )]; χiG 6= 0 .
De même, si eθ dénote l’idempotent de O TwF associé à un caractère θ : TwF −→ O × , la série modulaire s’écrit E` (G, (s))
˙ K)eθ ]; χiG 6= 0 . = χ ∈ IrrK G | ∃ (w, θ) ∼ s tel que h[RΓ(Y(w),
Le théorème d’engendrement de la catégorie des complexes parfaits est compatible avec la décomposition en séries et s’énonce en le corollaire suivant (voir [4, Thm. A]) : Corollaire 2.5 (Bonnafé-Rouquier). — Soit s un élément semi-simple `-régulier de G∗ . Les complexes {RΓ(Y(w), ˙ O )eθ | (w, θ) ∼ s} engendrent la catégorie O Ge(s) -parf. P Idée de preuve. — Pour w fixé, on a θ∈IrrO TwF eθ = 1. On déduit donc du théorème 2.4 que les complexes RΓ(Y(w), ˙ O )eθ engendrent O G-parf lorsque w parcourt W et θ parcourt l’ensemble des caractères de TwF à valeurs dans O × . Le corollaire découle alors d’une généralisation du théorème de disjonction des séries de Deligne-Lusztig au cadre modulaire ainsi qu’une application du théorème 1.4. Plus précisément, il est montré au [4, Corollaire 8.5] que si s0 est un autre élément semi-simple `-régulier de G∗ tel que (s0 ) 6= (s) (autrement dit tel que s et s0 ne sont pas conjugués dans G∗ ) alors RHomΛG RΓ(Y(w), ˙ O )eθ , RΓ(Y(w˙ 0 ), O )eθ0 = 0 pour tous (w, θ) ∼ s et (w0 , θ0 ) ∼ s0 . Cela montre que les catégories engendrées par les complexes RΓ(Y(w), ˙ O )eθ dans une série fixée sont deux à deux orthogonales. On conclut en remarquant que le caractère de RΓ(Y(w), ˙ K)eθ fait effectivement intervenir des caractères de E` (G, (s)) uniquement, ce qui a été observé au §1.3.2.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
72
O. DUDAS
2.5. Équivalence de Morita Reprenons maintenant les hypothèses de la conjecture 2.1 : s est un élément semi-simple `-régulier de G∗ dont le centralisateur CG∗ (s) est contenu dans un sousgroupe de Levi F -stable L∗ de G∗ . Fixons un sous-groupe parabolique P de G de complément de Levi L et notons U son radical unipotent. On dispose des variétés π
j
de Deligne-Lusztig YU XP ,→ XP définies aux paragraphes 1.2.2 et 2.2, ainsi que d’un faisceau F(s) sur XP provenant de la représentation O LeL (s) . Les résultats des deux sections précédentes permettent de démontrer le théorème suivant (voir [4, Thm. 11.7]). Théorème 2.6 (Bonnafé-Rouquier). — Sous les hypothèses précédentes, le morphisme naturel j! F(s) −→ Rj∗ F(s) est un isomorphisme (9). De manière équivalente, le théorème traduit le fait que le complexe de faisceaux Rj∗ F(s) est supporté sur l’ouvert XP . En notant i : XP \XP ,→ XP l’immersion fermée cela se réécrit en i∗ Rj∗ F(s) = 0. Idée de preuve. — Une preuve détaillée nécessiterait d’introduire de nombreuses notations qui seraient fatales pour le lecteur arrivé jusqu’ici. Nous prenons donc le parti de ne donner que les idées générales, sachant que la plupart des arguments de réduction détaillés dans [4] sont standard. Puisque le système local Fs provient d’une représentation projective de ΛL, il peut, (L) en vertu du corollaire 2.5, s’obtenir à partir des complexes RΓ(YUL , O )eθ , où UL est le radical d’un sous-groupe de Borel BL de L contenant un tore F -stable T avec (T, θ) ∼ s. Ici, pour insister sur le fait que la variété associée à UL est une variété (L) de Deligne-Lusztig du sous-groupe de Levi L et non de G, nous la noterons YUL . Le sous-groupe de Borel BL de L provient d’un sous-groupe de Borel B de G tel que BL = B ∩ L. Si V est le radical unipotent de B, on a UL = V ∩ L. La transitivité G G L de l’induction de Lusztig, qui s’écrit RT⊂B ' RL⊂P ◦ RT⊂B∩L provient d’un isomorphisme de variétés ∼ (L) YU ×L YV∩L −→ YV . Grâce à cet isomorphisme et à un changement de base, on montre que la condition i∗ Rj∗ F(s) = 0 est impliquée par une condition similaire pour les variétés associées à des sous-groupes de Borel. Plus précisément, on peut définir comme en 2.3.1 une Dans le cas où Z(G) n’est pas connexe, les centralisateurs d’éléments semi-simples de G∗ ne sont pas forcément connexes. Le théorème est en fait démontré dans [4, §11] sous l’hypothèse plus faible que CG∗ (s)◦ ⊂ L. (9)
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
73
compactification lisse X de XB ; l’application naturelle XB −→ XP donnée par la p projection G/B G/P s’étend en un morphisme X −→ XP selon le diagramme suivant : j 0 / o i0 ? _ XB X X \ p−1 (XP ) XP
p
j
/ XP o
i
? _ XP \ XP .
On se ramène alors à montrer que (i0 )∗ R(j 0 )∗ Oθ = 0 où Oθ est le système local de rang 1 associé à θ. Il reste à montrer que l’on se trouve dans les conditions d’application de la condition de support donnée en section 2.3.5. Autrement dit, il faut analyser les différentes variétés de Deligne-Lusztig qui interviennent dans X \ p−1 (XP ). C’est ici qu’interviennent les conditions (T, θ) ∼ s et CG∗ (s) ⊂ L∗ . En identifiant XB avec X(w) comme au §2.3.1 on montre que X \ p−1 (XP ) est union de variétés X(x) w avec x ∈ / [wθ , w]. Puisque (jx )∗ R(j 0 )∗ Oθ = 0 pour tout x ∈ / [wθ , w] cela termine la preuve du théorème. Comme expliqué au §2.2 (voir aussi la preuve de [4, Thm. B]), ce résultat géométrique permet de démontrer la conjecture d’équivalence de Morita prédite par Broué. Théorème 2.7 (Bonnafé-Rouquier). — Soit s ∈ G∗ un élément semi-simple `-régulier de G∗ . On suppose que CG∗ (s) ⊂ L∗ . Alors le foncteur d’induction G
RL⊂P
b G : Db (O LeL (s) -mod) −→ D (O Ge(s) -mod) ∼
G induit une équivalence O LeL (s) -mod −→ O Ge(s) -mod.
3. LA DÉCOMPOSITION DE JORDAN SPLENDIDE G L’équivalence de Morita entre les algèbres ΛLeL (s) et ΛGe(s) ne permet pas d’expliquer toutes les coïncidences numériques entre les caractères des séries rationnelles de L et de G associées à (s). En outre, bien qu’une telle équivalence préserve les propriétés homologiques des représentations (morphismes et extensions), elle ne donne en général aucune information sur la structure supplémentaire donnée par les sous-groupes et notamment les `-sous-groupes de L et G.
Le but de cette section est de montrer que l’équivalence entre (certaines séries de) L et G peut s’enrichir en une famille d’équivalences pour les représentations de CL (Q) et CG (Q) lorsque Q varie parmi les `-sous-groupes de L. On parlera alors d’équivalence
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
74
O. DUDAS
splendide (voir §3.1.4). Ces équivalences ont l’avantage de préserver la structure locale des blocs, notamment leurs groupes de défaut, qui permettent dans le cas des groupes de mesurer l’obstruction d’une algèbre à être semi-simple. Nous commencerons par rappeler le vocabulaire de théorie des représentations qui entrera en jeu, avant de donner la forme « splendide » de la décomposition de Jordan et d’en expliquer la démonstration par Bonnafé-Dat-Rouquier [3]. 3.1. Modules de `-permutation et équivalences splendides Dans cette première section nous supposerons que G et L sont des groupes finis quelconques. Ce choix de notation n’est bien sûr pas anodin et nous reviendrons dès la section suivante aux cas des groupes réductifs finis et de leurs sous-groupes de Levi. 3.1.1. Modules de permutation et `-permutation. — Soit X un ensemble fini muni d’une action du groupe fini G. Le module ΛX – parfois aussi noté Λ[X] – est par définition le Λ-module libre de base les éléments de X. L’action de G par permutation sur la base s’étend par linéarité en une action (linéaire) de G sur ΛX. Cette représentation de G est appelée module de permutation. Chaque orbite de X sous l’action de G fournit par linéarité un sous-module de permutation de ΛX qui en est en fait un facteur direct. On en déduit une décomposition de ΛX selon les orbites sous G, donnée par M M ΛX = Λ[G/StabG (x)] = IndG StabG (x) Λ. x∈X/G
x∈X/G
Réciproquement, pour tout sous-groupe H de G on peut former l’ensemble X = G/H dont le module de permutation est la représentation induite IndG H Λ. La taille de H, ou plutôt de sa `-partie, influe sur les propriétés de cette représentation : si l’ordre de H est inversible dans Λ alors IndG H Λ est un module projectif. À l’opposé, si H contient un `-sous-groupe de Sylow de G alors le module trivial Λ est facteur direct de IndG H Λ. Lorsque Λ = O ou k on dira qu’un ΛG-module est un module de `-permutation si c’est un facteur direct d’un module de permutation. De l’analyse précédente on déduit que les modules de `-permutation sont aussi les facteurs directs de sommes directes de modules induits IndG Q Λ pour Q variant parmi les `-sous-groupes de G. Selon la terminologie de Green, les modules de `-permutation sont donc exactement les modules de source triviale. On notera ΛG-perm la sous-catégorie pleine de ΛG-mod formée de ces modules. C’est aussi la plus petite sous-catégorie additive de ΛG-mod close par facteurs directs qui contient les modules de permutation. Comme dans la section 2, on travaillera plus généralement avec des complexes de modules, et pas seulement avec des représentations. La catégorie intéressante de ce point de vue est la catégorie homotopique Hob (ΛG-perm) des complexes bornés de modules de `-permutation de type fini. Dans cette catégorie, les morphismes se calculent à
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
75
homotopie près. On verra plus loin que la cohomologie des variétés algébriques fournit de nombreux exemples de tels complexes. Par définition, tout module de `-permutation indécomposable M est un facteur direct d’une représentation induite IndG Q Λ pour un certain sous-groupe Q de G. On appelle vortex de M un sous-groupe Q minimal pour cette propriété (10). Un vortex est toujours un `-sous-groupe de G et il est unique à conjugaison sous G près (voir [1, §9]). 3.1.2. Foncteur de Brauer. — On suppose désormais que Λ = O ou k. Étant donné un sous-groupe quelconque Q de G, on peut considérer le sous-ensemble X Q des points fixes de X sous l’action de Q. L’action de G sur X se restreint en une action de NG (Q) sur X Q et on peut former le kNG (Q)-module de permutation k[X Q ]. Le groupe Q agit trivialement sur k[X Q ] et l’on pourra considérer ce module comme un k[NG (Q)/Q]-module de `-permutation. Lorsque Q est un `-sous-groupe de G, le foncteur de Brauer BrQ : ΛG-perm −→ k[NG (Q)/Q]-perm permet d’étendre cette construction de manière fonctorielle sur les modules de `-permutation. Plus précisément, étant donné un module de `-permutation M , on peut considérer le module des coinvariants de kM sous Q, noté (kM )Q = k ⊗kQ M . C’est le plus grand quotient de kM sur lequel Q agit trivialement. On définit alors BrQ (M ) comme l’image des invariants M Q dans les coinvariants (kM )Q . Exemple 3.1. — Considérons à nouveau un ensemble fini X sur lequel G agit. Une base de (ΛX)Q est donnée par la somme des éléments sur chaque Q-orbite de X. Mais si x est un élément de X tel qu’il existe b ∈ Q vérifiant b · x 6= x, alors x + b · x + · · · = (1 + 2b + 3b2 + · · · )(1 − b) · x a une image nulle dans les coinvariants. Notons que ce calcul nécessite que l’ordre de b soit une puissance de `, la caractéristique de k. On retrouve donc bien BrQ (ΛX) = k[X Q ]. Soit R et Q deux `-sous-groupes de G. Les points fixes de G/Q sous R sont les classes gQ telles que R ⊂ g Q. On a donc (G/Q)R = ∅ dès que R n’est pas conjugué à un sous-groupe de Q, et (G/Q)Q = NG (Q)/Q. Au niveau des modules de `-permutation, si M est un module indécomposable de vortex Q, alors BrR (M ) est R facteur direct de BrR (IndG Q Λ) = k[(G/Q) ]. On en déduit que : – BrR (M ) = 0 dès que R n’est pas conjugué à un sous-groupe de Q ; – BrQ (M ) est un facteur direct de k[NG (Q)/Q] ; c’est donc un k[NG (Q)/Q]-module projectif. (10)
Il semblerait que cette terminologie soit peu employée en français, les anglophones utilisant les termes « vertex » et « vertices ».
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
76
O. DUDAS
3.1.3. Blocs et défauts. — On appelle bloc de ΛG un facteur direct indécomposable ∼ de ΛG vu comme ΛG-module-ΛG. Via l’isomorphisme Z(ΛG) −→ EndΛG-mod-ΛG (ΛG), la projection sur ce facteur indécomposable définit un idempotent central b de ΛG. De plus, b est primitif, c’est-à-dire qu’il ne peut s’écrire de manière non triviale comme somme de deux idempotents centraux orthogonaux. On obtient ainsi une correspondance entre idempotents primitifs de Z(ΛG) et blocs de ΛG donnée par b 7−→ ΛGb. On fera souvent l’abus de langage d’appeler « bloc » l’idempotent associé. L’avantage d’une décomposition en blocs ΛG = ΛGb1 ⊕· · ·⊕ΛGbr est qu’elle induit une décomposition de la catégorie des représentations ΛG-mod = ΛGb1 -mod ⊕ · · · ⊕ ΛGbr -mod. Un module indécomposable M « appartient » à un unique bloc : c’est l’unique idempotent central primitif bi tel que bi M 6= 0. Si M et N sont dans deux blocs distincts alors Ext•ΛG (M, N ) = Ext•ΛG (N, M ) = 0. L’étude des représentations de G à coefficients dans Λ se ramène à l’étude des représentations dans chaque bloc. Puisque Z(O G) = (O G)G est une algèbre commutative, libre de rang fini sur O , un anneau complet de valuation discrète, les idempotents de Z(kG) se relèvent de manière unique en des idempotents de Z(O G). De manière équivalente, la décomposition de kG en blocs se relève en la décomposition de O G en blocs. En revanche, puisque KG est semi-simple déployée, les blocs de KG sont des algèbres de matrices, donc Morita équivalentes à K. Chaque bloc de KG contient alors une seule représentation irréductible ; si χ est le caractère de cette représentation, l’idempotent associé au bloc est χ(1) X eχ = χ(g −1 )g. |G| g∈G
Contrairement aux algèbres de dimension finies quelconques, l’algèbre ΛG et ses blocs disposent d’une structure supplémentaire donnée par les `-sous-groupes de G, ainsi que leur centralisateur et leur normalisateur. On parle souvent de structure locale pour désigner ces sous-groupes. Supposons à partir de maintenant que Λ = O ou k. Étant donnés un bloc de ΛG et b l’idempotent associé, un vortex de ΛGb en tant que bimodule est toujours conjugué à un sous-groupe diagonal, de la forme ∆D = {(d, d−1 ) | d ∈ D} ⊂ G × Gop . On appelle le sous-groupe D de G un groupe de défaut du bloc b. Comme le vortex, le défaut d’un bloc est unique à conjugaison près. De manière équivalente, D est le plus grand `-sous-groupe de G tel que Br∆D (ΛGb) 6= 0. Fixons un `-sous-groupe de Sylow P de G. Puisque Br∆P (ΛG) = kCG (P ), il existe des blocs de défaut P . C’est le cas du bloc principal, contenant la représentation
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
77
triviale. À l’opposé, un bloc de défaut trivial est un bloc isomorphe à une algèbre de matrices. De manière générale, on peut voir le défaut comme une obstruction à la semi-simplicité d’un bloc : plus le défaut est grand, plus le bloc est compliqué. Pour terminer cet aperçu rapide de la théorie des blocs et de leurs groupes de défaut il convient d’expliquer l’effet du foncteur de Brauer sur les idempotents. Étant donné un `-sous-groupe Q de G, on peut considérer l’application linéaire brQ : (kG)Q −→ kCG (Q) définie sur la base de kG par brQ (g) = g si g ∈ CG (Q) et brQ (g) = 0 sinon. C’est un morphisme de kNG (Q)-modules et aussi de k-algèbres. Si b est un bloc, alors Br∆Q (ΛGb) = kCG (Q)brQ (b). Par conséquent, son groupe défaut est un `-sousgroupe D de G maximal pour la propriété brD (b) 6= 0. On peut montrer qu’alors brD (b) est un bloc de kNG (D), premier résultat de la théorie de Brauer visant à étudier les blocs de kG via les blocs de kNG (D). La limpidité de l’article d’AlperinBroué [2] ravira très certainement le lecteur intéressé par ce sujet. 3.1.4. Équivalences splendides. — Rappelons dans un premier temps comment construire des équivalences dérivées entre catégories de représentations de (blocs de) groupes finis. Soit G et L deux groupes finis et b et c deux idempotents de blocs de O G et O L. On suppose qu’il existe un complexe C de O Gb-modules-O Lc vérifiant les conditions suivantes. (D1) C est borné et ses termes sont projectifs de type fini comme O Gb-modules et comme modules-O Lc. Autrement dit, les images de C dans Db (O G-mod) et Db (O L-mod) sont des complexes parfaits. (D2) HomDb (OG-mod) (C, C[i]) = 0 pour tout i 6= 0. (D3) L’application naturelle O Lc −→ EndDb (OG-mod) (C) est un isomorphisme. Le foncteur C ⊗OL − induit alors une équivalence ∼
Db (O Lc-mod) −→ Db (O Gb-mod). Plus précisément, la conjonction des conditions (D2) et (D3) assure que le complexe C ∨ ⊗OG C, vu comme complexe de O L-modules-O L, est quasi-isomorphe à O Lc. Le fait que l’algèbre O Gb soit indécomposable permet de montrer, en suivant la preuve de [24, Thm. 2.1], que les mêmes conditions sont satisfaites si on échange les rôles de L et G. Dans le cas où on remplace b et c par des unions de blocs il faut en outre s’assurer que l’équivalence est déjà vérifiée au niveau des caractères ordinaires, c’est-à-dire après extension des scalaires à K. Supposons maintenant que L est un sous-groupe de G. Pour tout sous-groupe Q de L on notera ∆Q = {(q, q −1 ) | q ∈ Q} le sous-groupe diagonal de G × Lop . Puisque CG (Q)×CL (Q)op est un sous-groupe de NG×Lop (∆Q), on peut former, par restriction, un foncteur de Brauer Br∆Q : O G-perm-O L −→ kCG (Q)-perm-kCL (Q)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
78
O. DUDAS
pour tout `-sous-groupe Q de L. Supposons qu’il existe un complexe C de O Gb-modulesO Lc ayant les propriétés suivantes. (S1) C est un complexe borné de modules de `-permutations dont les facteurs indécomposables ont des vortex inclus dans ∆L. (S2) HomDb (kCG (Q)-mod) (Br∆Q (C), Br∆Q (C)[i]) = 0 pour tout i 6= 0 et tout `-sousgroupe Q de L. (S3) L’application naturelle O Lc −→ EndDb (OG-mod) (C) est un isomorphisme. Alors le foncteur C ⊗OL − induit une équivalence ∼
Hob (O Lc-perm) −→ Hob (O Gb-perm) appelée équivalence splendide (11) [24]. De plus, pour tout `-sous-groupe Q de L, le foncteur Br∆Q (C) ⊗kCL (Q) − induit une équivalence dérivée ∼
Db (kCL (Q)brQ (c)-mod) −→ Db (kCG (Q)brQ (b)-mod). On peut donc voir une équivalence splendide comme une famille d’équivalences dérivées locales. Cette fois-ci les conditions (S2) et (S3) assurent que le complexe C ∨ ⊗OG C est homotope à O Lc comme complexe de O L-modules-O L. Historiquement, la notion d’équivalence splendide fut introduite par Rickard dans le cas des blocs principaux, puis généralisée par Harris [17] dans le cadre que nous exposons ici (L un sous-groupe de G). Pour le cas général nous renvoyons le lecteur aux travaux de Linckelmann [19], Puig [22] et Rouquier [25]. Les équivalences dérivées entre blocs donnent lieu à des isométries parfaites au niveau des caractères. Ce sont des bijections (avec signe) satisfaisant certaines propriétés arithmétiques remarquables, définies et étudiées par Broué dans [8]. Dans le cas des équivalences splendides, on obtient plus généralement des familles d’isométries – des isotypies – vérifiant certaines conditions de compatibilité avec les applications de décomposition généralisées. L’existence de telles isométries est souvent un indice de l’existence d’une équivalence dérivée (voire splendide). Nous verrons plus loin que la décomposition de Jordan en est un exemple frappant, et nous en tirerons les conséquences sur l’étude des blocs des groupes réductifs finis. D’autres exemples (pour la plupart encore à l’état de conjectures) sont donnés par la conjecture du défaut abélien de Broué [6, Conj. 3.3] et sa version géométrique pour les groupes réductifs finis [9].
(11)
Cette terminologie introduite par Rickard provient de « SPLit-ENDomorphism two-sided tilting complex of summands of permutation modules Induced from Diagonal subgroups ».
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
79
3.1.5. Complexes de cohomologie. — La difficulté principale pour démontrer l’existence d’une équivalence dérivée ou splendide est d’exhiber un complexe vérifiant les propriétés (D1)–(D3) ou (S1)–(S3). Inspiré par le cas des groupes réductifs finis et suivant une suggestion de Broué, Rickard a étudié dans [23] les propriétés de finitude des complexes de cohomologie des variétés algébriques, ainsi que leur compatibilité avec le foncteur de Brauer. Nous verrons dans la section suivante comment appliquer ses résultats dans le cas des variétés de Deligne-Lusztig. Afin de ne pas confondre les énoncés généraux de cette section avec le cas particulier des groupes réductifs finis, nous travaillerons temporairement avec un groupe fini H agissant sur une variété quasi-projective Y. Nous supposerons que cette variété est définie sur Fq et nous considérerons comme au §2 les faisceaux pour la topologie étale. La construction du complexe de cohomologie RΓ(Y, Λ) s’obtient en considérant par exemple une résolution flasque du faisceau constant Λ puis en appliquant le foncteur sections globales Γ. À quasi-isomorphisme près, cet objet ne dépend pas de la résolution choisie. Rickard montre que l’on peut définir un invariant plus fin, donné par un complexe borné GΓ(Y, Λ) de ΛH-modules de `-permutation, bien défini à équivalence d’homotopie unique près. Une construction similaire est donnée par Rouquier [26], en utilisant une résolution de Godement, tronquée en degré 2 dim Y. Cette résolution d’un faisceau F fait intervenir des termes de la forme Q y∈Y Fy , sur lesquels H agit naturellement ; dans le cas du faisceau constant F = Λ, les modules de permutation Λ[H/StabH (y)] interviennent donc naturellement. En particulier, si les `-éléments de H agissent sans point fixe, alors GΓ(Y, Λ) est isomorphe dans Hob (ΛH-perm) à un complexe dont les termes sont projectifs. On retrouve la propriété que RΓ(Y, Λ) est parfait dans ce cas. Plus généralement, la condition (S1) du §3.1.4 pourra se vérifier sur GΓ(Y, Λ) à partir d’un calcul de points fixes sous H. Une construction similaire permet de définir la version support compact GΓc (Y, Λ). La construction de Rickard est en partie fonctorielle, et de nombreux résultats nécessaires au calcul de RΓ(Y, Λ) se transmettent à GΓ(Y, Λ), à la différence importante près que la dualité de Poincaré n’est pas vérifiée au niveau des catégories homotopique (voir [26, Rem. 2.14]). L’avantage de travailler avec un complexe de modules de permutation est que l’on peut lui appliquer la construction de Brauer de la section 3.1.2. On utilisera tout particulièrement le théorème suivant (voir [23, Thm. 4.2]) : Théorème 3.2 (Rickard). — On suppose que Λ = O ou k. Soit Q un `-sous-groupe de H. Alors l’inclusion YQ ,→ Y induit par restriction un isomorphisme ∼
BrQ (GΓc (Y, O )) −→ GΓc (YQ , k)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
80
O. DUDAS
dans Hob (kNH (Q)-perm). Idée de preuve. — Supposons pour simplifier que Q est un `-sous-groupe de Sylow de H et qu’il est cyclique, isomorphe à Z/`Z. On définit la sous-variété fermée Y` = {y ∈ Y | ` divise l’ordre de StabH (y)}. Avec les hypothèses sur Q, on vérifie facilement que Y` ' H ×NH (Q) YQ . Au niveau des complexes de cohomologie cela se traduit par un isomorphisme (12)
Q GΓc (Y` , Λ) ' IndH NH (Q) GΓc (Y , Λ)
dans Hob (ΛH-perm). Par définition, les `-éléments de H (non triviaux) agissent sans point fixe sur Y \ Y` . Le complexe de cohomologie associé est donc homotope à un complexe dont les termes sont des ΛH-modules projectifs, ce qui implique que son image par le foncteur de Brauer BrQ est nulle. On en déduit que le morphisme de ∼ restriction de Y à Y` induit un isomorphisme BrQ (GΓc (Y, Λ)) −→ BrQ (GΓc (Y` , Λ)) et on conclut en remarquant que d’après (12) on a BrQ (GΓc (Y` , Λ)) ' GΓc (YQ , k) dans Hob (kNH (Q)-perm). Cet argument se généralise à un `-sous-groupe Q quelconque de H en considérant une filtration de Y selon la taille de la `-partie des stabilisateurs sous H. On en déduit facilement le corollaire numérique suivant, généralisant la propriété des actions de `-groupes sur les ensembles finis. Corollaire 3.3. — Soit Q un `-groupe agissant sur Y. Les caractéristiques d’Euler de Y et YQ sont congrues modulo `. Remarque 3.4. — Ce corollaire illustre le pouvoir de la caractéristique positive : si Y a une caractéristique d’Euler non nulle (par exemple si Y est un espace affine), alors Q admet forcément des points fixes sur Y. Plus généralement, si Y −→ X est un morphisme (surjectif) Q-équivariant dont les fibres sont des espaces affines, alors YQ −→ XQ est automatiquement surjectif. En effet, la fibre en tout point fixe x ∈ XQ est un espace affine, donc contient à son tour un point fixe. 3.2. Du local au global Revenons maintenant au cas des groupes réductifs. Lorsque s est un élément semisimple `-régulier de G∗ vérifiant CG∗ (s) ⊂ L∗ et P = LU un sous-groupe parabolique de complément de Levi F -stable L, on veut montrer que l’équivalence de Morita G induite par RL⊂P , c’est-à-dire par le complexe de cohomologie RΓc (YU , Λ), est en fait une équivalence splendide. La construction de Rickard nous donne un complexe de modules de `-permutation RΓc (YU , Λ) dont il faut vérifier qu’il possède les propriétés (S1)–(S3) données en 3.1.4.
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
81
Au vu du théorème 3.2, le point clé est donc de calculer les points fixes de la variété de Deligne-Lusztig YU sous l’action de certains `-groupes. 3.2.1. Points fixes des variétés de Deligne-Lusztig. — Fixons donc pour cette section un sous-groupe parabolique P de G de radical unipotent U possédant un complément de Levi F -stable L. On rappelle que la définition de la variété de Deligne-Lusztig YU est donnée au §1.2.2. Lemme 3.5. — Soit R un `-sous-groupe de G × Lop tel que (YU )R 6= ∅. (i) R est conjugué à un sous-groupe diagonal de G × Lop . Autrement dit, il existe un `-sous-groupe Q de L et x ∈ G tel que R = {(x b, b−1 ) | b ∈ Q}. (ii) L’inclusion CG (Q) ,→ G, suivie de la translation à gauche par x ∈ G induit des isomorphismes ∼ ∼ YCU (Q) −→ (YU )∆Q −→ (YU )R où YCU (Q) désigne la variété de Deligne-Lusztig associée au sous-groupe parabolique CP (Q) de CG (Q) et à sa décomposition de Levi CP (Q) = CL (Q)CU (Q) (12). Idée de preuve. — Le calcul des points fixes sur G étant plus simple que sur G/U, on considère la variété e U = {g ∈ G | g −1 F (g) ∈ F (U)}. Y e U YU dont les L’application quotient G G/U induit un morphisme α : Y fibres sont des espaces affines isomorphes à U ∩ F (U). Grâce à la remarque 3.4 on se e U . Une application standard du ramène donc à un calcul de points fixes sur la variété Y théorème de Lang-Steinberg permet de déterminer la forme de R. De plus, l’inclusion ∼ e U )∆Q où Y e C (Q) est e C (Q) −→ (Y CG (Q) ,→ G induit clairement un isomorphisme Y U U la variété de Deligne-Lusztig modifiée associée au sous-groupe parabolique CP (Q) de CG (Q) et à sa décomposition de Levi CP (Q) = CL (Q)CU (Q), c’est-à-dire définie par e C (Q) = g ∈ CG (Q) | g −1 F (g) ∈ F (CU (Q)) . Y U On déduit alors du diagramme suivant ∼
e C (Q) Y U YCU (Q)
e U )∆Q / (Y / (YU )∆Q
(12)
Notons que les groupes CP (Q) et CG (Q) ne sont pas forcément connexes. La définition des variétés de Deligne-Lusztig donnée au §1.2.2 s’étend néanmoins directement à ce contexte. On trouvera plus de détails dans [16].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
82
O. DUDAS
que YCU (Q) ,→ (YU )∆Q est un isomorphisme. On déduit de ce lemme que le complexe GΓc (YU ) satisfait la condition (S1) des équivalences splendides donnée au §3.1.4. Corollaire 3.6. — Le complexe de cohomologie GΓc (YU , O ) est isomorphe dans Hob (O G-perm-O L) à un complexe dont les termes ont des facteurs indécomposables de vortex diagonaux dans G × Lop . Démonstration. — Soit R un `-sous-groupe de G × Lop qui n’est pas conjugué à un sous-groupe de ∆L. Alors d’après le lemme précédent on a (YU )R = ∅ et ainsi BrR (GΓc (YU , O )) ' GΓc ((YU )R , k) ' 0. Soit C un représentant de GΓc (YU , O ) minimal, c’est-à-dire n’ayant aucun facteur direct homotope à zéro. Supposons par l’absurde qu’il existe un terme Ci de C ainsi qu’un facteur direct indécomposable M de Ci tel que BrR (M ) 6= 0. On supposera aussi que R est maximal pour cette propriété. Autrement dit, si N est un facteur indécomposable d’un terme de C tel que BrR (N ) 6= 0, alors R est un vortex de N . Ainsi BrR (N ) est soit nul, soit un k[NG×Lop (R)/R]-module projectif. On en déduit que BrR (C) est un complexe dont tous les termes sont projectifs ; c’est aussi un complexe acyclique puisque BrR (C) ' BrR (GΓc (YU , O )) ' GΓc ((YU )R , k) ' 0. En prenant pour Ci le terme de plus haut degré tel que BrR (Ci ) 6= 0, on dispose donc d’une surjection BrR (Ci−1 ) BrR (M ) entre modules projectifs. Par [3, Lem. A.1], l’application Ci−1 −→ M est aussi une surjection scindée, ce qui montre ∼ que le complexe (· · · 0 → M −→ M → 0 · · · ) est facteur direct de C et contredit la minimalité de C. 3.2.2. Compatibilité avec les séries. — Le théorème 3.2, combiné avec le calcul de points fixes donné au lemme 3.5, montre que pour tout `-sous-groupe Q de L on a Br∆Q (GΓc (YU , O )) ' GΓc (YCU (Q) , k) dans Hob (kCG (Q)-perm-kCL (Q)). D’autre part, la décomposition de Jordan fait intervenir un facteur direct du complexe de cohomologie GΓc (YU , O ) associé à une classe semi-simple `-régulière (s) de L∗ . Autrement dit, pour vérifier la condition (S2) donnée au §3.1.4 il faut calculer Br∆Q GΓc (YU , O )e(s) ' GΓc (YCU (Q) , k)brQ (e(s) ). Ce problème peut se résoudre en comparant les séries rationnelles de L et de CL (Q). La difficulté technique principale à laquelle il faut faire face vient du fait que même si G et L sont des groupes connexes, les centralisateurs CG (Q) et CL (Q) ne le sont pas forcément. Il convient donc de travailler avec des généralisations de tores, de sousgroupes de Borel, de sous-groupes de Levi, de sous-groupes paraboliques et d’éléments
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
83
semi-simples au cadre des groupes non connexes. Le lecteur intéressé par le cas général trouvera un grand intérêt à la lecture des travaux de Digne-Michel sur ce sujet [16]. Afin de ne pas surcharger les constructions exposées dans ce texte, nous détaillerons uniquement le cas où les centralisateurs de `-sous-groupes sont des sous-groupes de Levi. C’est le cas par exemple dès que ` est bon pour G et qu’il ne divise pas l’ordre du groupe fini Z(G∗ )/Z(G∗ )◦ (13). On notera GQ = CG (Q) et on choisira un sousgroupe de Levi (GQ )∗ de G∗ dual de GQ . Puisque GQ est de même rang que G, une paire (T, θ) formée d’un tore maximal F -stable T de GQ et d’un caractère irréductible de T peut être vue dans une série rationnelle de GQ ou de G. De même, les classes semi-simples de (GQ )∗ donnent lieu à des classes semi-simples de G∗ . On en déduit que deux paires (T, θ) et (T0 , θ0 ) sont rationnellement conjuguées dans G dès qu’elles le sont dans GQ . Enfin, étant donnés un sous-groupe de Levi F -stable L∗ de G∗ et s ∈ (GQ )∗ tel que CG∗ (s) ⊂ L∗ alors C(GQ )∗ (s) ⊂ (GQ )∗ ∩ L∗ , lequel groupe est un sous-groupe de Levi F -stable de (GQ )∗ . Plus généralement, pour un centralisateur CG (Q) quelconque, Bonnafé-DatRouquier associent à une paire (T, θ) formée d’un tore maximal F -stable de CG (Q) et d’un `0 -caractère irréductible θ de T : – un tore maximal T+ de G tel que T ⊂ T+ , – un `0 -caractère irréductible θ+ de T + tel que (θ+ )|T = θ, construits de telle sorte que (T, θ) ∼CG (Q) (T0 , θ0 ) entraîne (T+ , θ+ ) ∼G ((T0 )+ , (θ0 )+ ) (voir [3, §4]). Autrement dit l’application (T, θ) 7−→ (T+ , θ+ ) est compatible avec la conjugaison rationnelle. Dans le cas simplifié où CG (Q) est un sous-groupe de Levi, on a bien sûr T+ = T et θ+ = θ. Si cette construction donnée dans [3] est inductive, et dépend donc d’une filtration de Q, l’application induite sur les séries rationnelles ne dépend que de Q. On la notera simplement iQ . Le résultat de compatibilité des séries s’énonce alors en la proposition suivante, démontrée par Broué-Michel dans le cas où CG (Q) est un sous-groupe de Levi [11] et étendue au cas général par Bonnafé-Dat-Rouquier (voir [3, Thm. 4.14]). Proposition 3.7. — Soit s un élément semi-simple `-régulier de G∗ . Si Q est un `-sous-groupe de G, alors X C (Q) brQ (eG e(t)G . (s) ) = (t)∈i−1 Q ((s))
(13)
Cela donne des conditions assez faibles sur `, qui sont par exemple vérifiées dès que ` est plus grand que le nombre de Coxeter de G. Dans ce cas un `-sous-groupe Q de G est toujours inclus dans un tore F -stable S de G tel que CG (Q) = CG (S).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
84
O. DUDAS
Afin de rester cohérent avec les notations des précédentes sections, nous avons désigné dans cet énoncé les séries rationnelles de CG (Q) par des éléments semi-simples du groupe dual, même lorsque celui n’a pas vraiment de sens. Néanmoins, dans le cas simplifié où CG (Q) = GQ est un sous-groupe de Levi de G, alors (t) ∈ i−1 Q ((s)) si et seulement si t est un élément de (GQ )∗ conjugué à s sous G∗ . 3.2.3. Décomposition de Jordan splendide. — Nous disposons maintenant de tous les ingrédients pour montrer que la décomposition de Jordan est une équivalence splendide. Théorème 3.8 (Bonnafé-Dat-Rouquier). — Soit s ∈ G∗ un élément semi-simple `-régulier de G∗ . On suppose que CG∗ (s) ⊂ L∗ . Alors pour tout sous-groupe parabolique P = LU de complément de Levi F -stable L, le foncteur GΓc (YU , O )eL (s) ⊗− induit une équivalence splendide ∼
b G Hob (O LeL (s) -perm) −→ Ho (O Ge(s) -perm).
Idée de preuve. — Il s’agit de démontrer que le complexe GΓc (YU , O )eL (s) vérifie les propriétés (S1)–(S3) requises pour induire une équivalence splendide. Le corollaire 3.6 permet d’obtenir (S1). D’autre part, les travaux de BonnaféRouquier exposés au §2 entraînent que GΓc (YU , O )eL (s) est quasi-isomorphe à un module M concentré en un seul degré, induisant une équivalence de Morita entre G O LeL (s) et O Ge(s) . Par conséquent, L
O Le(s)
∼
−→ EndOG (M ) ' EndDb (OG-mod) (RΓc (YU , O )eL (s) )
d’où on déduit (S3). Vérifions (S2) pour tout `-sous-groupe diagonal ∆Q de G × Lop . En combinant le théorème 3.2, le calcul de points fixes donné au lemme 3.5 ainsi que la proposition 3.7, on trouve M C (Q) L Br∆Q GΓc (YU , O )eL GΓc (YCU (Q) , k)e(t)L . (s) ' GΓc (YCU (Q) , k)brQ (e(s) ) ' (t)∈i−1 Q ((s)) C (Q)
Posons C(t) = RΓc (YCU (Q) , k)e(t)L (13)
Br∆Q
de sorte que l’on peut écrire M C(t) GΓc (YU , O )eL (s) ' (t)∈i−1 Q ((s))
dans Db (kCG (Q)-mod). Supposons pour simplifier que CG (Q) = GQ et CL (Q) = LQ sont des sous-groupes de Levi de G et L respectivement. Alors un élément t apparaissant dans la somme précédente est un élément semi-simple de (LQ )∗ conjugué à s sous L∗ . Puisque CG∗ (t) ⊂ L∗ on a donc C(GQ )∗ (t) ⊂ (LQ )∗ . Cette condition assure alors que le complexe C(t) est quasi-isomorphe à un module concentré en un
ASTÉRISQUE 414
(1137)
85
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
C (Q)
degré, induisant une équivalence de Morita entre kCL (Q)e(t)L En particulier, le groupe HomDb (kGQ -mod) C(t) , C(t0 ) [i]
C (Q)
et kCG (Q)e(t)G
.
est non nul seulement si (t) = (t0 ) et i = 0. Cette propriété se généralise au cas où les centralisateurs de Q sont quelconques, ce qui termine la vérification de (S2) grâce à la décomposition (13). G L’équivalence de Morita entre les algèbres ΛLeL (s) et ΛGe(s) induit un isomorphisme G entre le centre de ΛLeL (s) et celui de ΛGe(s) , et donc une bijection entre les blocs de ces deux algèbres. La propriété d’être en outre une équivalence splendide donne l’invariance de la structure locale de ces blocs grâce à [22, §19]. G Corollaire 3.9. — Si CG∗ (s) ⊂ L∗ , la bijection entre blocs induite par RL⊂P préserve leurs groupes de défauts.
4. GÉNÉRALISATION Nous discutons dans cette partie d’une généralisation de la décomposition de Jordan au cas où les centralisateurs d’éléments semi-simples de G∗ ne sont pas forcément connexes (c’est le cas dès que le centre Z(G) de G n’est pas connexe, par exemple pour G = SLn ou Sp2n ). Un ingrédient essentiel de la démonstration de la décomposition dans ce cas est un résultat d’indépendance de l’induction de DeligneLusztig par rapport au sous-groupe parabolique considéré (14) ; nous avons pris le parti de détailler les arguments géométriques en lien avec ce résultat (voir §4.2). Une fois de plus, un retour aux sources (i.e. à l’article originel de Deligne-Lusztig [15]) sera très instructif. 4.1. Isolé vs quasi-isolé Nous avons observé à l’exemple 1.3 que tous les centralisateurs d’éléments semisimples de G = GLn (Fq ) sont des sous-groupes de Levi. Lorsqu’on se restreint à G ou G∗ , un tel centralisateur est F -stable et son groupe des points rationnels est isomorphe à un produit de groupes linéaires finis (par rapport à des extensions de Fq ). Par conséquent, on déduit du corollaire 3.9 que tout bloc de O G-mod est isomorphe à un produit de blocs unipotents de groupes linéaires finis. C’est la situation idéale pour réduire un problème aux blocs unipotents. (14)
Ce travail a été le détonateur de l’article [3], dont plusieurs résultats avaient déjà été annoncés en 2003 dans [4].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
86
O. DUDAS
Lorsque G = SLn (Fq ) on aimerait pouvoir disposer d’une telle réduction. Malheureusement, puisque dans ce cas le centre de G n’est pas connexe, il existe des éléments semi-simples de G∗ ' PGLn (Fq ) dont le centralisateur n’est pas un sousgroupe de Levi. On peut même construire des exemples extrêmes : si ζ est une racine primitive n-ième de l’unité et s ∈ G∗ est l’image de la matrice diag(1, ζ, . . . , ζ n−1 ), alors CG∗ (s)◦ est un tore, formé des matrices diagonales, bien que CG∗ (s) ne soit contenu dans aucun sous-groupe de Levi propre de G∗ . Dans le cas d’un groupe G général, on dira qu’un élément semi-simple s ∈ G est quasi-isolé (resp. isolé) si CG∗ (s) (resp. CG∗ (s)◦ ) n’est contenu dans aucun sousgroupe de Levi propre de G∗ . Ces attributs se transfèrent naturellement aux séries rationnelles, aux séries modulaires, ainsi qu’aux blocs : on dira par exemple qu’un bloc b de O G est un bloc isolé s’il apparaît dans une série modulaire isolée c’est-à-dire si l’unique classe semi-simple `-régulière (s) de G∗ telle que be(s) = b est la classe d’un élément isolé de G∗ . On parlera de même de bloc quasi-isolé lorsque s est quasi-isolé. Un bloc isolé est toujours quasi-isolé, mais la réciproque est fausse en général dès que le centre de G n’est pas connexe. Avec cette terminologie, le corollaire 3.9 montre donc que tout bloc de O G est Morita équivalent à un bloc quasi-isolé d’un sous-groupe de Levi L de G. L’étude des blocs d’un groupe réductif fini se réduit donc aux cas des blocs quasi-isolés. Le théorème suivant (voir [3, Thm. 7.7]) donne une réduction supplémentaire au cas isolé, quitte à considérer certaines extensions des sous-groupes de Levi visant à prendre en compte le rôle du groupe fini CG∗ (s)/CG∗ (s)◦ . Théorème 4.1 (Bonnafé-Dat-Rouquier). — Soit s un élément semi-simple `-régulier de G∗ et L∗ le plus petit sous-groupe de Levi F -stable de G∗ contenant CG∗ (s)◦ . Posons N = NG (L, e(s) ). Si N/L est cyclique (15), alors l’action de L sur GΓc (YU , O )e(s) s’étend en une action de N donnant lieu aux équivalences suivantes : Splendide. — le foncteur GΓc (YU , O )e(s) ⊗ON − induit une équivalence splendide ∼
b G Hob (O N eL (s) -perm) −→ Ho (O Ge(s) -perm),
Morita. — le foncteur Hcdim YU (YU , O )e(s) ⊗ON − induit une équivalence de Morita L
O N e(s) -mod
∼
−→ O GeG (s) -mod.
La bijection entre blocs induite par cette équivalence préserve la structure locale, donc en particulier les groupes de défaut. (15)
Le théorème [3, Thm. 7.7] est énoncé sans cette hypothèse supplémentaire, mais l’argument de la démonstration est incomplet. Néanmoins, dans le cas où G est simple, N/L est toujours cyclique sauf si (G, F ) est de type D2n . Il existe alors une unique classe de G∗ -conjugaison (s) telle que N/L ne soit pas cyclique (il est isomorphe à Z/2Z × Z/2Z).
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
87
La difficulté dans la démonstration de ce théorème est que contrairement à L, le groupe fini N n’a pas de raison d’agir sur la variété YU . En effet, un élément n ∈ NG (L) ne normalise pas U en général, et ainsi son action fait intervenir une autre variété de Deligne-Lusztig, associée au groupe parabolique n P. L’idée de Bonnafé-DatRouquier est de montrer que lorsque l’on se restreint à la série modulaire associée à s, les variétés YU et Yn U ont la même cohomologie. Plus précisément, il est donné au corollaire 4.5 des conditions sur les sous-groupes paraboliques P = LU et Q = LV pour que les complexes RΓc (YU , Λ)e(s) et RΓc (YV , Λ)e(s) soient quasi-isomorphes à un décalage près. On en déduit alors que l’action de N normalise le bimodule M = Hcdim YU (YU , O )e(s) . Dans le cas où N/L est cyclique, on en déduit que l’on peut étendre l’action de L en une action de N sur M . 4.2. Indépendance du parabolique Comme promis, nous détaillons dans cette section un résultat auxiliaire (voir le corollaire 4.5), mais crucial dans la preuve du théorème 4.1. 4.2.1. Indépendance pour les caractères de Deligne-Lusztig. — Lors de la définition G des caractères de Deligne-Lusztig RT (θ) à partir de la cohomologie des variétés YU et XB (voir (1)) nous avons éludé le problème de l’indépendance vis-à-vis du sousgroupe de Borel B contenant T. C’est un des premiers résultats de l’article [15] de Deligne-Lusztig, dont la preuve va motiver les constructions des sections suivantes. Comme au §2.3.1, il sera commode d’utiliser la description des variétés YU et XB à l’aide des éléments de NG (T) et W = NG (T)/T. Nous fixons donc pour cette sous-section et la suivante une paire (T, B) formée d’un tore maximal F -stable T de G, contenu dans un sous-groupe de Borel B de G, lui aussi supposé F -stable. Étant donné une réflexion simple s de W et un élément quelconque w de W , nous allons comparer les variétés X(s, s, w), X(s, w) et X(w). D’après la décomposition de Bruhat, le produit BsBsB se décompose en les doubles classes B t BsB ; on peut donc former le morphisme de multiplication φ : BsB ×B BsB −→ BsB t B. Au-dessus de B, le morphisme φ est un fibré en droites : si on note α la racine simple associée à s et uα : Fq ,→ U le sous-groupe à un paramètre correspondant, la fibre en un élément b ∈ B s’écrit φ−1 (b) = {[buα (x)s : suα (−x)] | x ∈ Fq }. En revanche, × au-dessus de BsB, la fibre est isomorphe à Fq car suα (x)s ∈ BsB si et seulement si x 6= 0. Par changement de base, on en déduit l’existence d’un morphisme ψ : X(s, s, w) X(s, w) = X(s, w) t X(w)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
88
O. DUDAS
tel que : – au-dessus du fermé X(w), le morphisme ψ induit un fibré en droites de sorte que Hci ψ −1 (X(w)), K ' Hci−2 (X(w), K), – au-dessus de l’ouvert X(s, w), le morphisme ψ est un fibré en droites auquel on a retiré les sections nulles, si bien que × Hci ψ −1 (X(s, w)), K ' Hci X(s, w) × Fq , K ' Hci−1 (X(s, w), K) ⊕ Hci−2 (X(s, w), K). Par conséquent, la caractéristique d’Euler de la variété X(s, s, w) est égale à celle de X(w). Les morphismes précédents étant de plus équivariants pour l’action de G, on en déduit que les caractères virtuels associés à ces variétés coïncident. En effectuant des permutations circulaires, cela implique que le caractère virtuel associé à la cohomologie de X(w) ne dépend que de la classe de F -conjugaison de w dans W ; G 0 en d’autres termes, le caractère RT et pas du 0 ⊂B0 (1) ne dépend que du tore T 0 sous-groupe de Borel B . 4.2.2. Le cas des tores. — Les variétés X(s, s, w) et X(w) n’ayant pas la même dimension, il est exclu d’espérer que leurs complexes de cohomologie soient quasiisomorphes, bien que leurs caractères coïncident. Autrement dit, le complexe G 0 RT 0 ⊂B0 (Λ) (voir §2.1 pour la définition) dépend fortement du choix de B , même lorsque Λ = K. Nous allons montrer que c’est néanmoins le cas à un décalage près lorsque l’on travaille avec certains système locaux non triviaux à la place de Λ. Comme au §2, les systèmes locaux considérés sur X(w) proviennent du TwF -torseur Y(w) ˙ X(w), où w˙ est un représentant de w dans NG (T). Nous travaillerons ici exclusivement avec des systèmes locaux associés à des représentations projectives de TwF . De manière équivalente, nous nous concentrerons sur les complexes RΓc (Y(w), ˙ Λ)eθ où eθ est l’idempotent associé au §1.3.2 au caractère θ : TwF −→ Λ× . Fixons une réflexion simple s de W . Un calcul dans les groupes de rang 1 (SL2 ou PGL2 ) montre qu’elle se relève dans NG (T) en l’élément s˙ = uα (1)u−α (−1)uα (1). En relevant les constructions de la section précédente de G/B à G/U on obtient une
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
89
décomposition Y(s, ˙ s˙ −1 , w) ˙ = Yo t Yf selon le diagramme suivant ? _ Yf / Y(s, ˙ s˙ −1 , w) ˙ o Yo TwF
ψ −1 (X(s, w))
/ X(s, s, w) ˙ o
X(s, w)
/ X(s, w) ˙ o
? _ ψ −1 (X(w))
ψ
? _ X(w).
Rappelons que le morphisme ψ induit un fibré en droites au-dessus de X(w). Il se relève au niveau du fermé Yf en un morphisme Yf X(w) qui se factorise par le revêtement Y(w) ˙ X(w) pour donner un fibré en droites Yf Y(w) ˙ équivariant wF pour les actions de G à gauche et de T à droite. On peut résumer ces propriétés à l’aide du carré cartésien suivant : Yf
/ / Y(w) ˙
A1
TwF
ψ −1 (X(w))
TwF
A1
/ / X(w).
Par conséquent, on obtient un isomorphisme RΓc (Yf , Λ) ' RΓc (Y(w), ˙ Λ)[−2]
(14) dans Db (ΛG-mod-ΛTwF ).
La description de l’ouvert Yo est moins élémentaire car le morphisme Yo X(s, w) ne se factorise pas par Y(s, ˙ w) ˙ X(s, w) mais seulement par un revêtement intermédiaire faisant intervenir comme au §2.3.4 un quotient commun des tores TwF et TswF par certains groupes H et H 0 définis plus bas. On aura en tête le diagramme suivant : Y(s, ˙ w) ˙
Yo TwF /H
−1 ψ (X(s, w))
0 / / Y(s, ˙ w)/H ˙ TswF /H 0
/ / X(s, w).
Le morphisme ψ induit une surjection ψ −1 (X(s, w)) X(s, w) dont les fibres sont × isomorphes au tore Fq . Ce morphisme ne se trivialise pas en la projection X(s, w) × ×
Fq X(s, w) même si la cohomologie (à coefficients dans K) de ψ −1 (X(s, w)) coïncide
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
90
O. DUDAS
×
avec celle de X(s, w)×Fq . En revanche, le lemme 4.2 montre que c’est le cas au niveau ×
de la variété Y(s, ˙ w) ˙ quitte à considérer un revêtement fini S de Fq (voir [3, §5.D]). Lemme 4.2. — Il existe (a) un groupe algébrique commutatif S étendant l’action de TwF sur Yo ; et (b) un plongement fermé Y(s, ˙ w) ˙ ,→ Yo , qui induisent un isomorphisme ∼
Y(s, ˙ w) ˙ ×TswF S −→ Yo . ×
Le groupe S est non connexe, mais sa composante connexe S◦ ' Fq est un tore de rang 1 tel que S = TswF ×H 0 S◦ = S◦ ×H TwF avec H = NTwF (S◦ ) = TwF ∩ S◦ et H 0 = NTswF (S◦ ). On retrouve l’isomorphisme TwF /H ' TswF /H 0 mentionné plus haut. Il est important de noter aussi que la construction de S ainsi que des sous-groupes H et H 0 par Bonnafé-Dat-Rouquier est explicite, et permet d’en déduire quels systèmes locaux apparaissent sur S◦ à partir de ceux sur X(s, s, w). Le lemme 4.2 se traduit au niveau des complexes de cohomologie par l’isomorphisme (15)
RΓc (Yo , Λ) ' RΓc (Y(s, ˙ w), ˙ Λ) ⊗ΛTswF RΓc (S, Λ)
dans Db (ΛG-mod-ΛTwF ). Par définition, le groupe fini H est contenu dans la composante connexe de S. En particulier, l’action de H s’étend en l’action du groupe connexe S◦ sur S, et par conséquent induit une action triviale sur la cohomologie. De cette observation et des isomorphismes (14) et (15) on déduit le corollaire suivant (voir [3, Thm. 5.16]). Corollaire 4.3. — Soit θ : TwF −→ Λ× un caractère irréductible de TwF . Avec les notations précédentes, supposons que θ|H 6= 1. Alors RΓc (Y(s, ˙ s˙ −1 , w), ˙ Λ)eθ ' RΓc (Y(w), ˙ Λ)eθ [−2] dans Db (ΛG-mod-ΛTwF ). Des applications successives de ce corollaire combinées à des permutations circulaires permettent alors de passer d’une variété Y(w) ˙ à Y(v) ˙ pour w et v dans la même classe de F -conjugaison de W , à condition que θ remplisse certains critères de régularité.
ASTÉRISQUE 414
(1137)
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
91
4.2.3. Extension au cas parabolique. — Revenons maintenant au problème initial, G G à savoir la comparaison des foncteurs RL⊂P et RL⊂Q . On cherche à montrer qu’à un décalage près, ces foncteurs sont isomorphes lorsqu’on les restreint à une série E` (L, (s)) satisfaisant certains critères vis-à-vis de P et Q. En notant U (resp. V) le radical unipotent de P (resp. Q) cela revient donc à comparer les complexes RΓc (YU , Λ)e(s) et RΓc (YV , Λ)e(s) . Pour faire le lien entre les variétés de DeligneLusztig YU et YV on considère une variété intermédiaire définie par YU,V = (g, h) ∈ G2 g −1 h ∈ U · V et h−1 F (g) ∈ V · F (U) /U × V. Cette définition est entièrement similaire aux généralisations des variétés Y(n) à des suites d’éléments n de NG (T) étudiées au §2.3.1. Comme à la section précédente, on peut considérer la sous-variété fermée Yf = {(g, h) ∈ YU,V | g −1 F (g) ∈ U · F (U)}. La première projection induit un morphisme surjectif Yf YU dont les fibres sont des espaces affines de dimension dU,V = dim(U ∩ F (U)) − dim(U ∩ F (U) ∩ V). À un décalage de 2dU,V près, les complexes de cohomologie à support compact de Yf et YU sont donc égaux. C’est la version parabolique de l’isomorphisme (14). Le théorème suivant (voir [3, Thm. 6.2]) donne une condition pour que la cohomologie du complémentaire ouvert de Yf , coupé par la série de (s), soit acyclique. C’est la version parabolique du corollaire 4.3. Théorème 4.4 (Bonnafé-Dat-Rouquier). — Supposons que CV∗ (s). Alors l’inclusion Yf ,→ YU,V induit un isomorphisme
CU∗ ∩F (U∗ ) (s)
⊂
∼
RΓc (YU,V , Λ)e(s) −→ RΓc (YU , Λ)e(s) [−2dU,V ] dans Db (ΛG-mod-ΛL). Idée de preuve. — La preuve suit la même stratégie que la preuve du théorème 2.6. Le cône du morphisme que l’on cherche à étudier est donné par le complexe RΓc (YU,V \ Yf , Λ)e(s) dont on veut montrer qu’il est acyclique. On commence par utiliser le théorème d’engendrement de la catégorie des complexes parfaits (corollaire 2.5) ainsi que la transitivité de l’induction de Deligne-Lusztig pour se ramener au cas des tores. Il faut alors exprimer la condition CU∗ ∩F (U∗ ) (s) ⊂ CV∗ (s) sur les paires (T, θ) afin de montrer que l’on se trouve dans les conditions d’application du corollaire 4.3. L’application (g, h) 7−→ (h, F (g)) induit un morphisme de variétés YU,V −→ YV,F (U) qui est un isomorphisme au niveau des complexes de cohomologie. En appliquant le théorème 4.4 aux couples (U, V) et (V, F (U)) on en déduit le résultat annoncé (voir [3, Cor. 6.5]).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
92
O. DUDAS
Corollaire 4.5. — Si CU∗ ∩F (U∗ ) (s) ⊂ CV∗ (s) et CV∗ ∩F (V∗ ) (s) ⊂ CF (U∗ ) (s), alors RΓc (YU , Λ)e(s) ' RΓc (YV , Λ)e(s) [dim YV − dim YU ] dans Db (ΛG-mod-ΛL). Par conséquent, les foncteurs G
b G : Db (ΛLeL (s) -mod) −→ D (ΛGe(s) -mod),
G
b G : Db (ΛLeL (s) -mod) −→ D (ΛGe(s) -mod)
RL⊂P [dim YU ] RL⊂Q [dim YV ]
sont isomorphes. Remarque 4.6. — Une des difficultés de la preuve du théorème 4.4 réside dans le fait de trouver le bon énoncé. Nous avons appris des auteurs de [3] que leurs premiers calculs dans GL4 et GL6 faisaient apparaître l’hypothèse plus forte (mais plus simple à formuler) CU∗ (s) = CV∗ (s). Dans le cas particulier de la décomposition de Jordan, cette hypothèse est trivialement vérifiée dès que la condition CG∗ (s)◦ ⊂ L est remplie. Puisqu’alors les complexes de cohomologie sont concentrés en un degré, on en déduit un isomorphisme de ΛG-modules-ΛL Hcdim YU (YU , Λ)e(s) ' Hcdim YV (YV , Λ)e(s) . Si la condition plus forte CG∗ (s) ⊂ L est vérifiée, cela montre que les foncteurs G réalisant l’équivalence de Morita entre ΛLeL (s) et ΛGe(s) sont isomorphes. Notons pour finir qu’une version de ce résultat d’indépendance a permis à J.-F. Dat d’établir une décomposition de Jordan pour les représentations modulaires (lisses) de niveau zéro des groupes GLn (F ) lorsque F est un corps p-adique [14].
RÉFÉRENCES [1] J. L. Alperin – Local representation theory, Cambridge Studies in Advanced Math., vol. 11, Cambridge Univ. Press, 1986. [2] J. L. Alperin & M. Broué – Local methods in block theory, Ann. of Math. 110 (1979), no 1, p. 143–157. [3] C. Bonnafé, J.-F. Dat & R. Rouquier – Derived categories and DeligneLusztig varieties II, Ann. of Math. 185 (2017), no 2, p. 609–670. [4] C. Bonnafé & R. Rouquier – Catégories dérivées et variétés de DeligneLusztig, Publ. Math. Inst. Hautes Études Sci. (2003), no 97, p. 1–59. [5]
, Compactification des variétés de Deligne-Lusztig, Ann. Inst. Fourier 59 (2009), no 2, p. 621–640.
[6] M. Broué – Blocs, isométries parfaites, catégories dérivées, C. R. Acad. Sci. Paris Sér. I Math. 307 (1988), no 1, p. 13–18.
ASTÉRISQUE 414
(1137)
[7] [8] [9] [10] [11] [12]
[13] [14] [15] [16] [17] [18] [19] [20] [21]
[22] [23] [24]
SPLENDEUR DES VARIÉTÉS DE DELIGNE-LUSZTIG
93
, Isométries de caractères et équivalences de Morita ou dérivées, Inst. Hautes Études Sci. Publ. Math. (1990), no 71, p. 45–63. , Isométries parfaites, types de blocs, catégories dérivées, Astérisque 181182 (1990), p. 61–92. M. Broué & G. Malle – Zyklotomische Heckealgebren, Astérisque 212 (1993), p. 119–189. M. Broué, G. Malle & J. Michel – Generic blocks of finite reductive groups, Astérisque 212 (1993), p. 7–92. M. Broué & J. Michel – Blocs et séries de Lusztig dans un groupe réductif fini, J. reine angew. Math. 395 (1989), p. 56–67. P. Cartier – Détermination des caractères des groupes finis simples : travaux de Lusztig, Séminaire Bourbaki, vol. 1985/1986, exposé no 658, Astérisque 145–146 (1987), p. 137–161. J. Chuang & R. Rouquier – Derived equivalences for symmetric groups and sl2 -categorification, Ann. of Math. 167 (2008), no 1, p. 245–298. J.-F. Dat – Equivalences of tame blocks for p-adic linear groups, Math. Ann. 371 (2018), nos 1-2, p. 565–613. P. Deligne & G. Lusztig – Representations of reductive groups over finite fields, Ann. of Math. 103 (1976), no 1, p. 103–161. F. Digne & J. Michel – Groupes réductifs non connexes, Ann. Sci. École Norm. Sup. 27 (1994), no 3, p. 345–406. M. E. Harris – Splendid derived equivalences for blocks of finite groups, J. London Math. Soc. 60 (1999), no 1, p. 71–82. R. Kessar & G. Malle – Quasi-isolated blocks and Brauer’s height zero conjecture, Ann. of Math. 178 (2013), no 1, p. 321–384. M. Linckelmann – On derived equivalences and local structure of blocks of finite groups, Turkish J. Math. 22 (1998), no 1, p. 93–107. G. Lusztig – Characters of reductive groups over a finite field, Annals of Math. Studies, vol. 107, Princeton Univ. Press, 1984. G. Malle – Local-global conjectures in the representation theory of finite groups, in Representation theory—current trends and perspectives, EMS Ser. Congr. Rep., Eur. Math. Soc., 2017, p. 519–539. L. Puig – On the local structure of Morita and Rickard equivalences between Brauer blocks, Progress in Math., vol. 178, Birkhäuser, 1999. J. Rickard – Finite group actions and étale cohomology, Inst. Hautes Études Sci. Publ. Math. (1994), no 80, p. 81–94. , Splendid equivalences : derived categories and permutation modules, Proc. London Math. Soc. 72 (1996), no 2, p. 331–358.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
94
O. DUDAS
[25] R. Rouquier – Block theory via stable and Rickard equivalences, in Modular representation theory of finite groups (Charlottesville, VA, 1998), de Gruyter, 2001, p. 101–146. [26]
, Complexes de chaînes étales et courbes de Deligne-Lusztig, J. Algebra 257 (2002), no 2, p. 482–508.
[27] J-P. Serre – Représentations linéaires des groupes finis « algébriques » (d’après Deligne-Lusztig), Séminaire Bourbaki, vol. 1975/1976, exposé no 487, Lecture Notes in Math., vol. 567, 1977, p. 256–273. [28]
, Représentations linéaires des groupes finis, Hermann, 1978.
[29] T. A. Springer – Linear algebraic groups, Progress in Math., vol. 9, Birkhäuser, 1998.
Olivier DUDAS CNRS, Université Paris-Diderot Sorbonne Université Institut de Mathématiques de Jussieu-Paris Rive Gauche IMJ-PRG F-75013 Paris, France E-mail : [email protected]
ASTÉRISQUE 414
Séminaire BOURBAKI 70e année, 2017–2018, no 1138, p. 95 à 124 doi:10.24033/ast.1082
Octobre 2017
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR [d’après Labourie, Kapovich, Leeb, Porti,...] par Olivier GUICHARD
INTRODUCTION Les sous-groupes discrets des groupes de Lie, ou plutôt leurs actions sur les espaces symétriques et plus généralement même les actions sur les immeubles euclidiens, sont au cœur de cet exposé. Y seront présentés les sous-groupes convexes-cocompacts d’isométries de l’espace hyperbolique Hn et comment généraliser cette classe en rang supérieur. Spécifiquement, voici l’un des résultats qui sera souligné et mis en contexte. Théorème 0.1 (Kapovich, Leeb et Porti [37]). — Soit Γ = hSi un sous-groupe de GLn (R) engendré par un ensemble fini S. On suppose Régularité quasi-isométrique. — Il existe c > 0 et C ≥ 0 tels que, pour tout γ ∈ Γ, µ1 (γ) − µ2 (γ) ≥ c |γ|S − C. On a alors les conclusions suivantes Hyperbolicité. — Le groupe Γ est hyperbolique au sens de Gromov. Son bord de Gromov est noté ∂∞ Γ. Applications au bord. — Il existe des applications continues et Γ-équivariantes β1 : ∂∞ Γ → Pn−1 (R) et βn−1 : ∂∞ Γ → Pn−1∗ (R) = Grn−1 (Rn ) telles que ∀t ∈ ∂∞ Γ,
β1 (t) ⊂ βn−1 (t)
∀t 6= t0 ∈ ∂∞ Γ,
β1 (t) ∩ βn−1 (t0 ) = 0.
Contraction exponentielle. — Il existe k > 0 et K ≥ 0 tels que, pour tout rayon géodésique (γp )p∈N dans le graphe de Cayley de Γ avec γ0 = eΓ dont le point limite dans ∂∞ Γ est noté γ∞ , on a, pour tout p ∈ N,
≥ k p − K = k |γp |S − K. log γp−1 | Tβ (γ ) Pn−1 (R) 1
∞
© Astérisque 414, SMF 2019
96
O. GUICHARD
Réciproquement, un sous-groupe Γ vérifiant ces conclusions satisfait à l’hypothèse de régularité quasi-isométrique. Précisons d’abord quelques notations utilisées dans cet énoncé. Lorsqu’un groupe Γ a une partie génératrice S donnée, la fonction longueur associée est notée | · |S : Γ → N, explicitement, pour tout γ ∈ Γ, |γ|S = inf{p ∈ N | ∃γ1 , . . . , γp ∈ S ∪ S −1 , γ = γ1 · · · γp } (le produit vide étant égal à eΓ ). Une suite (γp )p∈N de Γ est dès lors une géodésique dans le graphe de Cayley si, pour tout p ∈ N, γp−1 γp+1 ∈ S ∪ S −1 et |γ0−1 γp |S = p. Le bord de Gromov de Γ est l’ensemble des classes d’équivalence de rayons géodésiques pour la relation « être à distance de Hausdorff bornée ». Si S1 est une seconde partie génératrice finie de Γ, il existe c1 > 0 tel que, pour tout γ ∈ Γ, |γ|S1 ≥ c1 |γ|S . Ainsi, le choix de la partie génératrice finie S dans l’énoncé ci-dessus importe donc peu et la notation | · |Γ sera dorénavant adoptée pour désigner l’une des fonctions longueurs associées à une partie génératrice finie. Si g est un élément de GLn (R), µ1 (g), . . . , µn (g) désignent les logarithmes des valeurs principales de g, c’est-à-dire e2µ1 (g) , . . . , e2µn (g) est la liste décroissante des valeurs propres de g tg. Dans la conclusion de l’énoncé, g | n−1 désigne Tx P
(R)
l’application tangente au point x du difféomorphisme de Pn−1 (R) induit par l’élément g de GLn (R), c’est une application linéaire de Tx Pn−1 (R) dans Tg·x Pn−1 (R). Sa norme kg | n−1 k est la norme d’opérateur calculée pour une métrique Tx P
(R)
riemannienne sur Pn−1 (R). La compacité de Pn−1 (R) implique que le choix de cette structure riemannienne n’influe que sur les constantes k et K de la conclusion du théorème. Le théorème énoncé ici est un cas particulier (emblématique, bien sûr) des résultats de Kapovich, Leeb et Porti. En effet ceux-ci autorisent : – plus de généralités sur la source. Il n’est pas nécessaire de travailler avec un sous-groupe de type fini Γ mais une application ϕ : Z → GLn (R) d’un espace métrique (Z, dZ ) géodésique localement compact dans GLn (R), l’hypothèse s’écrivant ici : ∀z1 , z2 ∈ Z, µ1 ϕ(z1 )−1 ϕ(z2 ) − µ2 ϕ(z1 )−1 ϕ(z2 ) ≥ c dZ (z1 , z2 ) − C. La conclusion affirme que Z est hyperbolique au sens de Gromov et qu’il existe des applications continues β1 : ∂∞ Z → Pn−1 (R), βn−1 : ∂∞ Z → Pn−1∗ (R) satisfaisant des propriétés de transversalité et de contraction similaires à celles énoncées plus haut. – plus de généralités sur le but. Le même résultat est valable en remplaçant R par C ou par une extension finie de Qp . En fait, on peut aussi considérer des sous-groupes discrets d’un groupe algébrique G semi-simple sur un corps topologique localement compact et même sur un corps non-archimédien à
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
97
valuation non discrète. L’hypothèse est alors que les projections de Cartan (qui sont des éléments de la chambre de Weyl fermée) des éléments de Γ sont quantitativement « loin » d’une réunion de murs de la chambre de Weyl (1). La conclusion est encore l’hyperbolicité au sens de Gromov de Γ et l’existence d’une application, du bord de Gromov ∂∞ Γ dans la variété drapeau associée à cette réunion finie de murs, satisfaisant ces propriétés de transversalité et de contraction. Pour le cas de GLn (R), la chambre de Weyl fermée A+ est l’ensemble des matrices diagonales à coefficients décroissants, la projection d’un élément g de GLn (R) est la matrice dont la diagonale est (µ1 (g), µ2 (g), . . . , µn (g)). Les murs correspondant à l’énoncé du théorème sont {(m1 , m2 , . . . , mn ) ∈ A+ | m1 = m2 } et {(m1 , . . . , mn ) ∈ A+ | mn−1 = mn }, l’éloignement de ce second mur provient de l’hypothèse du théorème appliquée à γ −1 . La variété drapeau associée à ces deux murs est F1,n−1 = {(`, h) ∈ Pn−1 (R)×Pn−1∗ (R) | ` ⊂ h}, les applications β1 et βn−1 se combinant en une application continue, équivariante et transverse β : ∂∞ Γ → F1,n−1 . Notons que, même pour GLn (R), le théorème principal est aussi présenté dans une généralité restreinte puisque tous les autres choix de murs sont possibles conduisant à des applications au bord dans des variétés drapeaux différentes. La condition sur les projections de Cartan peut également s’exprimer en termes de l’action sur l’espace symétrique, ou bien sur l’immeuble de Bruhat et Tits dans le cas où le groupe algébrique est défini sur un corps ultramétrique, associé à G. La position relative de deux points x et y de cet espace symétrique ou immeuble euclidien est encore un élément de la chambre de Weyl du groupe G et la projection de Cartan d’un élément g ∈ G est égale à la position relative de x0 et g · x0 (où x0 est un point base de l’espace symétrique ou immeuble euclidien en question). Ce point de vue permet donc de traiter d’une même manière ces deux cas mais également d’inclure le cas de sous-groupes du groupe des isométries d’un immeuble euclidien non nécessairement localement compact. La démonstration du théorème fait apparaître ce type d’immeubles comme cônes asymptotiques et il est naturel de les inclure dans la discussion. Pour limiter le nombre de notions à introduire, cet exposé n’adoptera que peu ou prou ce langage géométrique au prix de présenter des résultats peut-être partiels. Ce point de vue est largement développé dans les articles de Kapovich, Leeb et Porti [33, 35, 36, 39, 37] ainsi que dans les notes de cours et panorama qu’ils ont écrits [32, 34, 38]. Notons cependant que même pour n = 3 et pour Γ ' (1)
Les énoncés des articles de Kapovich, Leeb et Porti adoptent un point de vue « dual » en demandant que les projections de Cartan soient quantitativement « proches » de la face de la chambre de Weyl égale à l’intersection des murs restants.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
98
O. GUICHARD
F2 le groupe libre à deux générateurs (auquel cas l’hyperbolicité de Γ n’est plus à établir) le résultat est nouveau. Le but de ce texte est de donner des éléments de la démonstration du théorème 0.1, de donner plusieurs autres caractérisations de la classe des sousgroupes (nécessairement discrets) qui apparaissent ici, de faire le lien avec la classe des sous-groupes convexes-cocompacts, d’énumérer certaines propriétés géométriques et dynamiques remarquables de cette classe de sous-groupes. Aussi bien les hypothèses que les conclusions de ce théorème impliquent uniquement la projection de Γ dans PGLn (R). Comme il est parfois commode de se débarrasser du centre de GLn (R), la suite de cet exposé privilégiera de temps en temps les sousgroupes de PGLn (R), voire de SLn (R). Nous ne l’avons pas écrit mais l’action de Γ sur Pn−1∗ (R) vérifie des propriétés de contraction équivalentes. Il peut être aussi utile d’observer que les propriétés énoncées dans ce théorème sont « stables par passage à un sous-groupe d’indice fini » ; précisément – si l’hypothèse de régularité quasi-isométrique est satisfaite pour un sous-groupe d’indice fini de Γ, alors elle l’est pour Γ (quitte à changer les constantes c et C) ; – de même, si les conclusions sont satisfaites pour un sous-groupe d’indice fini de Γ, alors elles le sont pour Γ (quitte à changer les constantes k et K).
1. GROUPES CONVEXES-COCOMPACTS D’ISOMÉTRIES DE L’ESPACE HYPERBOLIQUE Toujours pour rester concret, la discussion suivante est restreinte aux sous-groupes d’isométries de l’espace hyperbolique réel Hn , n ≥ 2, mais son contexte naturel serait plutôt celui des groupes d’isométries de variétés de Cartan et Hadamard de courbure sectionnelle majorée par une constante strictement négative. 1.1. L’espace hyperbolique et ses convexes 1n 0 Le sous-groupe des matrices orthogonales pour Qn,1 = est noté 0 −1 O(n, 1) = {g ∈ GLn+1 (R) | tgQn,1 g = Qn,1 }. La forme quadratique associée à Qn,1 est qn,1 : Rn+1 → R/x 7→ txQn,1 x. Le modèle projectif de l’espace hyperbolique est Hn = {` ∈ Pn (R) | qn,1 |
`r{0}
< 0} ;
il s’identifie à l’hyperboloïde {x = (x1 , . . . , xn+1 ) ∈ Rn+1 | qn,1 (x) = −1, xn+1 > 0}. Son adhérence dans Pn (R) est Hn = {` ∈ Pn (R) | qn,1 |` ≤ 0} et est la réunion de Hn et de ∂∞ Hn = {` ∈ Pn (R) | qn,1 |` = 0}. Aussi bien Hn que son adhérence sont contenus dans la carte affine An = Pn (R) r P({xn+1 = 0}). Dans les coordonnées
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
99
naturelles sur cette carte affine, Hn et Hn sont respectivement la boule unité ouverte et la boule unité fermée. L’action de O(n, 1) sur Hn est transitive et le stabilisateur du point `0 = Ren+1 ((ei )i=1,...,n+1 désigne la base canonique de Rn+1 ) est O(n) × O(1). Puisque ce stabilisateur est compact, il existe une métrique riemannienne O(n, 1)-invariante sur Hn . La distance associée dHn s’exprime aisément en termes de la géométrie projective : si ` et `0 ∈ Hn , alors dHn (`, `0 ) = 1/2 log |[`, `0 ; b, b0 ]| où b, b0 sont deux éléments distincts de ∂∞ Hn tels que `, `0 , b, b0 appartiennent à une même droite projective (si ` 6= `0 , alors {b, b0 } est l’intersection de ∂∞ Hn et de la droite projective `−b `0 −b0 engendrée par ` et `0 ) et où [`, `0 ; b, b0 ] = `−b est le birapport des quatre 0 `0 −b 0 0 points `, ` , b, b calculé dans une identification quelconque de la droite projective contenant ces points avec P1 (R). Le groupe des isométries de (Hn , dHn ) est alors PO(n, 1) = O(n, 1)/{±1n+1 }. Deux points de Hn sont reliés par un unique segment géodésique qui est égal au segment affine les reliant dans An . Plus généralement, un point de Hn et un point de ∂∞ Hn (respectivement deux points distincts de ∂∞ Hn ) sont reliés par un unique rayon géodésique (respectivement une unique géodésique) égal à un segment affine semi-ouvert (respectivement égale à un segment affine ouvert). Un sous-ensemble C de Hn ou de Hn est dit convexe s’il est convexe au sens de la géométrie affine dans la carte affine An . Une condition équivalente, si C est inclus dans Hn , est de demander que C est géodésiquement convexe. 1.2. Groupes convexes-cocompacts, leurs ensembles limites Définition 1.1. — Un sous-groupe Γ de O(n, 1) est dit convexe-cocompact s’il existe un sous-ensemble non vide C de Hn , convexe, Γ-invariant et sur lequel l’action de Γ est propre et cocompacte. Le convexe C est alors nécessairement fermé et le sous-groupe Γ est nécessairement discret. En remplaçant éventuellement C par un voisinage métrique Nδ (C) = {` ∈ Hn | distHn (`, C) ≤ δ}, le quotient Γ\C est une orbivariété à bord dont le groupe fondamental orbifold est égal à Γ. Le groupe Γ est donc de type fini et même de présentation finie. Les sous-groupes finis de O(n, 1) sont toujours convexescocompacts ; il est alors sensé de n’étudier que des groupes infinis. Un sous-groupe cyclique infini hγi de O(n, 1) est convexe-cocompact si et seulement si l’élément γ est hyperbolique ; il a alors un unique axe de translation qui est une géodésique de Hn , le convexe C peut être choisi égal à cet axe. Si Γ est un sous-groupe de O(n, 1), son ensemble limite ΛΓ ⊂ ∂∞ Hn est défini comme l’ensemble des points d’accumulation de l’orbite Γ · `0 ⊂ Hn (`0 = Ren+1 ) dans le bord à l’infini ∂∞ Hn . C’est aussi l’ensemble de points d’accumulation de toute
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
100
O. GUICHARD
orbite de Γ dans Hn . L’ensemble limite est vide si et seulement si le sous-groupe Γ est borné. L’ensemble limite est réduit à un seul élément x ∈ ∂∞ Hn si et seulement si Γ est infini et est contenu dans le sous-groupe {g ∈ O(n, 1) | g | = ±Id| } ⊂ StabO(n,1) (x). x x Lorsque Γ laisse invariant un sous-ensemble convexe C de Hn , l’ensemble limite ΛΓ est alors inclus dans le bord idéal ∂∞ C = C ∩∂∞ Hn (C est l’adhérence de C dans Pn (R)). Si, de plus, Γ est convexe-cocompact, l’inclusion inverse est vérifiée et il y a l’égalité ΛΓ = ∂∞ C. Ainsi, quand Γ est convexe-cocompact et infini, il est alors impossible d’avoir ]ΛΓ = 1 (le feuilletage horocyclique centré en ΛΓ serait Γ-invariant), de sorte que l’on peut toujours considérer l’enveloppe convexe Conv(ΛΓ ) de ΛΓ dans An et que ConvHn (ΛΓ ), son intersection avec Hn , est non vide. Ce convexe ConvHn (ΛΓ ) est alors fermé, Γ-invariant et inclus dans C ; de là l’action de Γ sur ConvHn (ΛΓ ) est propre et cocompacte. Le cas où ΛΓ = {x, x0 } (x 6= x0 ) est aussi particulier : dans ce cas, un sous-groupe d’indice fini de Γ est infini cyclique engendré par un élément hyperbolique. On appelle un groupe Γ élémentaire si ]ΛΓ = 0, 1 ou 2 ; sinon ΛΓ a la puissance du continu et peut être, par exemple, homéomorphe à l’ensemble de Cantor. 1.3. Caractérisation métrique Les valeurs principales d’un élément g de O(n, 1) sont (µ1 (g), . . . , µn+1 (g)) = (µ(g), 0, . . . , 0, −µ(g)) où µ(g) ∈ R+ . La double classe O(n) × O(1) g O(n) × O(1) n 1n−1 o contient un unique élément de la forme pour t = µ(g). cosh t sinh t , t ∈ R+ sinh t cosh t
La distance dHn (`0 , g · `0 ), toujours avec `0 = Ren+1 , est égale à µ(g). On a alors la caractérisation métrique suivante. Proposition 1.2. — Soit Γ un sous-groupe de O(n, 1). Le groupe Γ est convexecocompact si et seulement si Γ est de type fini et il existe c > 0, C ≥ 0 tels que, pour tout γ ∈ Γ, µ(γ) ≥ c |γ|Γ − C. On formule souvent cette conclusion en disant que le groupe Γ est quasiisométriquement plongé dans O(n, 1). Le sens direct de cette proposition suit de ce que l’on a dit plus haut et du lemme de Milnor et Švarc tandis que le sens réciproque utilise deux ingrédients : le fait que les quasi-géodésiques de Hn sont universellement proches de géodésiques (« lemme de Morse ») et le fait que les simplexes géodésiques sont universellement fins. 1.4. Caractérisation dynamique Le flot géodésique (ϕt )t∈R sur le fibré unitaire tangent T 1 Hn commute avec l’action de O(n, 1). Si Γ est un sous-groupe de O(n, 1), on définit l’ensemble récurrent EΓ ⊂ T 1 Hn de la manière suivante : un vecteur v de T 1 Hn appartient à EΓ si et
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
101
seulement si, pour tout voisinage U de v dans T 1 Hn , il existe une suite (γk , tk )k∈Z de Γ×R avec la propriété que, pour tout k ∈ Z, γk ·ϕtk (v) = ϕtk (γk ·v) appartient à U et limk→±∞ tk = ±∞. L’ensemble récurrent EΓ est fermé, Γ-invariant et ϕt -invariant. Si Γ est discret, le quotient Γ\EΓ est l’ensemble récurrent pour le flot géodésique sur le fibré unitaire tangent Γ\T 1 Hn de l’orbivariété riemannienne Γ\Hn . Voici une caractérisation dynamique des sous-groupes convexes-cocompacts. Proposition 1.3. — Soit Γ un sous-groupe de O(n, 1). Le groupe Γ est convexecocompact si et seulement si l’action de Γ sur EΓ est propre et cocompacte. Lorsque Γ est convexe-cocompact, ou plus généralement s’il existe un convexe fermé C ⊂ Hn invariant par Γ, alors l’ensemble EΓ est inclus dans l’ensemble des vecteurs v ∈ T 1 Hn tels que, pour tout t ∈ R, le point base de ϕt (v) appartient à C, i.e. EΓ ⊂ T 1 Hn |C . Quand Γ est convexe-cocompact, Γ\T 1 Hn |C est compact et Γ\EΓ aussi. Réciproquement, si Γ\EΓ est compact, le groupe Γ est alors de type fini et l’injection de Γ dans O(n, 1) est un plongement quasi-isométrique. La proposition 1.2 s’applique. 1.5. Caractérisations par l’action à l’infini de l’espace hyperbolique La convexe-cocompacité peut aussi être caractérisée par l’action de Γ sur Hn = H ∪ ∂∞ Hn . n
Proposition 1.4. — Soit Γ un sous-groupe de O(n, 1). Le groupe Γ est convexecocompact si et seulement si l’action de Γ sur Hn r ΛΓ est propre et cocompacte. En effet si Γ est convexe-cocompact, la projection Hn → C s’étend à Hn r ∂∞ C = Hn r ΛΓ et cette extension est propre et Γ-équivariante ; de là suivent la propreté et la cocompacité de l’action de Γ sur Hn r ΛΓ . Réciproquement supposons l’action de Γ sur Hn r ΛΓ propre et cocompacte. Si ΛΓ = ∅, alors Γ est fini et le cas ]ΛΓ = 1 est impossible (existence du feuilletage horocyclique). Dans les autres cas, le convexe ConvHn (ΛΓ ) est inclus et fermé dans Hn r ΛΓ , le groupe Γ agit donc proprement sur ConvHn (ΛΓ ) et Γ\ConvHn (ΛΓ ) est fermé dans Γ\(Hn r ΛΓ ) donc est compact. En particulier l’action de Γ sur ∂∞ Hn r ΛΓ est propre et cocompacte. Il faut se garder de croire que la réciproque est exacte, par exemple les travaux de Bers [8] impliquent l’existence de sous-groupes Γ de O(3, 1), isomorphes au groupe fondamental d’une surface compacte, pour lesquels Γ\(∂∞ H3 r ΛΓ ) est compact mais Γ\(H3 r ΛΓ ) ne l’est pas. Néanmoins la caractérisation suivante n’implique que l’action de Γ sur ∂∞ Hn . Soit d∂∞ Hn une distance sur ∂∞ Hn provenant d’une métrique riemannienne (∂∞ Hn étant une variété compacte, le choix particulier de la métrique riemannienne n’influe que sur certaines constantes dans la suite). L’action de Γ est dite dilatante
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
102
O. GUICHARD
au point z ∈ ∂∞ Hn s’il existe γ ∈ Γ, c > 1 et U ⊂ ∂∞ Hn un voisinage de z tels que, pour tous z1 , z2 dans U , d∂∞ Hn (γ · z1 , γ · z2 ) ≥ c d∂∞ Hn (z1 , z2 ). Théorème 1.5. — Soit Γ un sous-groupe discret de O(n, 1). Le groupe Γ est convexe-cocompact si et seulement si, pour tout z ∈ ΛΓ , l’action de Γ est dilatante (dans ∂∞ Hn ) au point z. La démonstration de ce résultat est un peu plus délicate que les caractérisations précédentes ; c’est pourquoi il se trouve ici sous l’intitulé de théorème. Il faut en fait faire le lien entre l’action au bord et l’action sur Hn . Il est également possible de détecter, pour un sous-groupe Γ donné, si un point z de ΛΓ est dilatant selon la façon dont l’orbite Γ · `0 s’accumule sur z (de manière « transverse »/« conique » ou non par rapport au bord ∂∞ Hn , cf. la définition 5.2 plus bas). De la même manière : Proposition 1.6. — Soit Γ un sous-groupe discret de O(n, 1). Le groupe Γ est convexe-cocompact si et seulement si, pour tout z ∈ ΛΓ , l’action de Γ est dilatante (dans la variété à bord Hn munie d’une quelconque distance riemannienne) au point z. À nouveau, le sens direct nécessite le lien entre dilatation au point z et convergence « transverse »/« conique » vers z. Pour la réciproque, l’action de Γ sur Hn r ΛΓ est propre (c’est toujours le cas pour un groupe discret) et la dilatation en ΛΓ permet de montrer que cette action est cocompacte. 1.6. Deux propriétés Pour finir cette partie, énonçons deux propriétés importantes des groupes convexescocompacts. Tout d’abord, le groupe Γ est quasi-isométrique au convexe C ⊂ Hn et est donc hyperbolique au sens de Gromov. Il est possible de réexprimer certains résultats de cette section, en y ajoutant une version quantitative de la dilatation évoquée plus haut, sous une forme similaire au théorème 0.1. Corollaire 1.7. — Soit Γ un sous-groupe de O(n, 1). Le groupe Γ est convexecocompact si et seulement si Γ est hyperbolique au sens de Gromov et qu’il existe β : ∂∞ Γ → ΛΓ un homéomorphisme équivariant et k > 0, K ≥ 0 tels que, pour tout
≥ k p−K rayon géodésique (γp )p∈N dans Γ avec γ0 = eΓ , on ait log γp−1 | n Tβ(γ∞ ) ∂∞ H
où γ∞ ∈ ∂∞ Γ est l’extrémité de la géodésique (γp )p∈N . Enfin les groupes convexes-cocompacts sont stables par petite déformation.
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
103
Théorème 1.8. — Soit Γ un sous-groupe convexe-cocompact de O(n, 1) et notons ι : Γ → O(n, 1) l’injection de Γ dans O(n, 1). Il existe alors un voisinage U de ι dans l’ensemble Hom(Γ, O(n, 1)) des homomorphismes de Γ dans O(n, 1) tel que, pour tout ρ dans U , ρ est injectif et son image ρ(Γ) est convexe-cocompacte. La topologie sous-entendue sur Hom(Γ, O(n, 1)) est celle de la convergence simple. On peut en fait préciser les conclusions du théorème : les actions de ρ(Γ) et de Γ = ι(Γ) sur Hn sont topologiquement conjuguées, l’ensemble limite Λρ(Γ) varie continûment avec ρ, etc.
2. LA PRÉHISTOIRE : ABSENCE DE SOUS-GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR Les premiers résultats concernant les généralisations des groupes convexescocompacts en rang supérieur sont en fait négatifs : si l’on généralise hâtivement la définition, aucun exemple intéressant et nouveau n’est produit. Donnons ces résultats de rigidité pour les sous-groupes de SLn (R), n ≥ 3. Soit Xn ⊂ Mn (R) l’ensemble des matrices symétriques, positives et de déterminant 1. C’est un espace homogène pour l’action de SLn (R) par transconjugaison : (g, x) 7→ g · x = g x tg et les stabilisateurs sont compacts (celui de la matrice identité 1n ∈ Xn est le sous-groupe SO(n)). Ainsi Xn admet une métrique riemannienne SLn (R)-invariante. La courbure sectionnelle de cette métrique (convenablement normalisée) varie entre −1 et 0. Il y a donc dans Xn des directions « hyperboliques » où la géométrie est semblable à celle de l’espace hyperbolique mais aussi des directions « plates » où la géométrie est celle de l’espace euclidien. En particulier, il n’est pas difficile de construire des quasi-géodésiques qui ne sont contenues dans le voisinage métrique d’aucune géodésique (absence de lemme de Morse en rang supérieur, voir cependant la partie 6). Le fait que Xn soit de courbure négative implique qu’il est uniquement géodésique : toute paire de points est les extrémités d’un unique segment géodésique. Une notion de convexité s’en déduit aisément. Théorème 2.1 (Kleiner et Leeb [41]). — Soit Γ un sous-groupe Zariski dense de SLn (R), n ≥ 3. Supposons qu’il existe un convexe C ⊂ Xn non vide, Γ-invariant et sur lequel l’action de Γ est propre et cocompacte. Alors Γ est un réseau cocompact de SLn (R).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
104
O. GUICHARD
L’hypothèse de Zariski densité a été ajoutée ici pour simplifier la conclusion mais il y a un résultat de structure sans cette hypothèse. Ce théorème vaut, bien sûr, pour tout groupe de Lie semi-simple. Pour énoncer le second résultat de rigidité, introduisons D le sous-groupe de SLn (R) des matrices diagonales. Pour Γ un sous-groupe discret de SLn (R), notons EΓ ⊂ Γ\SLn (R) l’adhérence des points fixes des éléments réguliers (i.e. à valeurs propres deux à deux distinctes) de D pour l’action à droite. C’est un ensemble D-invariant. Lorsque n = 2, Γ\SL2 (R) s’identifie au (à un revêtement double du) fibré unitaire tangent de Γ\H2 et l’action à droite de D est le flot géodésique ; dans ce cas EΓ est l’adhérence de la réunion des géodésiques fermées. Théorème 2.2 (Quint [52]). — Soit Γ un sous-groupe discret et Zariski dense de SLn (R), n ≥ 3. Supposons EΓ compact. Le groupe Γ est alors un réseau cocompact de SLn (R). Bien sûr, il y a, comme plus haut, la conclusion de structure sans l’hypothèse de Zariski densité. Aussi le cas de sous-groupes discrets de groupes algébriques sur les corps ultramétriques est traité. Quint [52, §5] déduit le théorème 2.1 à partir de son résultat. À l’opposé, si l’on impose seulement au sous-groupe d’être de type fini et quasiisométriquement plongé, la classe des sous-groupes obtenus a de « mauvaises » propriétés : – il existe un sous-groupe Γ de SL2 (R) × SL2 (R), isomorphe au groupe libre à deux générateurs, quasi-isométriquement plongé et vérifiant la propriété suivante : dans tout voisinage U ⊂ Hom(Γ, SL2 (R) × SL2 (R)) de l’injection de Γ dans SL2 (R) × SL2 (R), il existe une représentation d’image dense, voir [26, Prop. A.1]. – il existe un sous-groupe de SL2 (R)×SL2 (R), de type fini, quasi-isométriquement plongé mais qui n’est pas de présentation finie, voir [39, Ex. 6.34].
3. LES REPRÉSENTATIONS ANOSOV Cette partie introduit la notion, due à Labourie [43], de représentation Anosov. La définition ci-dessous est un peu éloignée de celle donnée initialement par Labourie, elle correspond à la notion de sous-groupe « asymptotiquement plongé » de [39]. En particulier, l’absence de flot et de décomposition hyperbolique pour ce flot dans les lignes à venir ne permet pas d’apprécier le choix de la terminologie. Fixons ici Γ un groupe hyperbolique au sens de Gromov, son bord de Gromov est toujours noté ∂∞ Γ.
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
105
Définition 3.1. — Une représentation ρ : Γ → GLn (R) est dite Anosov s’il existe des applications continues et ρ-équivariante β1 : ∂∞ Γ → Pn−1 (R) et βn−1 : ∂∞ Γ → Pn−1∗ (R) avec, pour tout t ∈ ∂∞ Γ, β1 (t) ⊂ βn−1 (t) et, pour tous t 6= t0 ∈ ∂∞ Γ, β1 (t) ⊕ βn−1 (t0 ) = Rn et vérifiant Contraction. — Pour tous t1 et t2 dans ∂∞ Γ, toute suite (γp )p∈N de Γ et tout ` ∈ Pn−1 (R), si lim γp = t1 , lim γp−1 = t2 (limites dans Γ ∪ ∂∞ Γ) et si ` est transverse à βn−1 (t2 ), alors lim ρ(γp ) · ` = β1 (t1 ). On dit qu’un sous-groupe Γ de GLn (R) est Anosov si l’injection de Γ dans GLn (R) est Anosov. Comme pour l’énoncé du théorème 0.1, seule l’image de Γ dans PGLn (R) importe et l’on préfère considérer des sous-groupes de PGLn (R) ou de SLn (R). La deuxième conclusion du théorème 0.1 pourrait se réécrire « l’injection de Γ dans GLn (R) est Anosov ». La propriété dynamique des suites divergentes donnée dans la définition est une propriété de contraction faible. Celle donnée dans le théorème 0.1 est une propriété de contraction exponentielle. Dans la partie 5 seront données plusieurs caractérisations des représentations Anosov, certaines ne faisant pas a priori l’hypothèse d’hyperbolicité du groupe Γ. L’image finale sera celle d’une classe de sous-groupes discrets généralisant la classe des sous-groupes convexes-cocompacts. Citons tout de suite trois propriétés des représentations Anosov qui établissent déjà l’analogie avec les sous-groupes convexes-cocompacts : – un sous-groupe Anosov est quasi-isométriquement plongé ; – l’action d’un sous-groupe Anosov ρ(Γ) est dilatante sur Pn−1 (R) en tout point de β1 (∂∞ Γ) ; – le sous-ensemble de Hom(Γ, GLn (R)) constitué des représentations Anosov est ouvert. La définition ci-dessus est un cas restreint de la notion. Il est possible de faire la « même » définition pour des représentations de Γ dans G un groupe de Lie réductif ; la paire (Pn−1 (R), Pn−1∗ (R)) devant être remplacée par (G/P, G/P opp ) où P est un sous-groupe parabolique de G et P opp est un sous-groupe parabolique de G opposé à P . On utilisera parfois cette notion plus générale dans la suite et on appellera les représentations la vérifiant P -Anosov ou F -Anosov avec F = G/P . Plus encore, les caractérisations données plus bas permettent d’englober les groupes d’isométries d’immeubles euclidiens. Labourie [43] appelle plutôt ces représentations G/L-Anosov, où L = P ∩P opp est le facteur de Levi, et les a introduites pour les représentations des groupes de revêtements galoisiens de variétés compactes munies d’un flot d’Anosov. L’idée de remplacer ces
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
106
O. GUICHARD
variétés par le flot géodésique d’un groupe hyperbolique, et donc d’inclure tous les groupes hyperboliques dans la définition, remonte à [29].
4. EXEMPLES L’un des intérêts de la notion de représentation Anosov est l’abondance d’exemples. 4.1. Les espaces de Teichmüller généralisés Il est aujourd’hui habituel d’appeler ainsi certaines composantes connexes de la variété des représentations Hom(Γg , G) du groupe fondamental Γg ' ha1 , . . . , ag , b1 , . . . , bg | [a1 , b1 ] · · · [ag , bg ]i d’une surface orientée, connexe, compacte, sans bord et de genre g ≥ 2, qui généralisent la composante de Teichmüller qui est la composante connexe de Hom(Γg , SO(2, 1)) constituée des représentations ρ : Γg → SO(2, 1) injectives, préservant l’orientation, et dont l’image ρ(Γg ) agit proprement sur H2 (on dira que ρ est une représentation fuchsienne) (une telle action est automatiquement cocompacte : la surface quotient ρ(Γg )\H2 a son premier groupe d’homotopie isomorphe à Γg et doit donc être compacte). Il existe des versions des résultats ci-dessous pour des surfaces ouvertes et leurs groupes fondamentaux (qui sont alors des groupes libres de type fini) ; la discussion suivante se restreint, pour des raisons de simplicité, aux surfaces fermées. 4.1.1. Composante de Hitchin. — Soit τn : PGL2 (R) ' O(2, 1) → PGLn (R) le morphisme induit par l’action de GL2 (R) sur la puissance symétrique n-ième S n−1 R2 ' Rn (explicitement S n−1 R2 est l’espace des polynômes homogènes de degré n − 1 en deux variables). La composante de Hitchin est définie comme la composante connexe de Hom(Γg , PGLn (R)) contenant les compositions τn ◦ ρ où ρ : Γg → PGL2 (R) est fuchsienne. Théorème 4.1 (Hitchin [30]). — Pour l’action de PGLn (R) par conjugaison sur les représentations, la composante de Hitchin est PGLn (R)-difféomorphe 2 à R(2g−2)×(n −1) × PGLn (R). Théorème 4.2 (Labourie [43]). — Soit B le sous-groupe de PGLn (R) des matrices triangulaires supérieures. Toute représentation dans la composante de Hitchin est B-Anosov.
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
107
Les travaux de Labourie apportent des informations plus précises sur l’application Qn au bord β : ∂∞ Γg → PGLn (R)/B ' Flag (Rn ) = {(E1 , . . . , En−1 ) ∈ i=1 Gri (Rn ) | ∀i = 1, . . . , n − 2, Ei ⊂ Ei+1 } et permettent de donner une caractérisation des représentations qui appartiennent à la composante de Hitchin. Les travaux de Fock et Goncharov [24] donnent également une caractérisation de ces représentations basée sur la notion de positivité « totale » des matrices (voir Lusztig [46]). Pour un groupe de Lie G simple, adjoint et déployé sur R, i.e. G est égal à PSLn (R), PSp2m (R), PSO(p, p + 1) ou l’un des 5 groupes exceptionnels, le PSL2 (R) principal de G permet de définir la composante de Hom(Γg , G) contenant les représentations fuchsiennes et Hitchin a démontré que cette composante est G-difféomorphe à R(2g−2)×dim G × G. En s’appuyant sur la notion de positivité des représentations de Γg dans G développée par Fock et Goncharov, il vient que toute représentation Γg → G dans la composante de Hitchin est B-Anosov où B est le sous-groupe de Borel de G. 4.1.2. Représentations maximales. — Le groupe fondamental de Sp2m (R) = {g ∈ GL2m (R) | tgJm g = Jm }, où Jm = ( 10m −10m ), est isomorphe à Z. Le revêtement ›2m (R) de Sp2m (R) est un groupe de Lie et le noyau de la projection universel Sp ›2m (R) → Sp2m (R) est contenu dans le centre de Sp ›2m (R) et s’identifie naturelle Sp ˜ g −1 h ˜ −1 à π1 (Sp2m (R)) ' Z. Pour g et h dans Sp2m (R), le commutateur ˜[g, h˜] = g˜h˜ ˜ › de relevés g˜ et h ∈ Sp2m (R) de g et h ne dépend pas de ces relevés et sa projection dans Sp2m (R) est égale à [g, h]. Qg Soit maintenant ρ : Γg → Sp2m (R) un morphisme, la projection de i=1 ˜[ρ(ai ), ρ(bi )˜] Qg Qg dans Sp2m (R) est égale à i=1 [ρ(ai ), ρ(bi )] = ρ i=1 [ai , bi ] = ρ(eΓ ) = eSp2m (R) ›2m (R) → Sp2m (R), c’est-à-dire et cet élément appartient donc au noyau de Sp à π1 (Sp2m (R)) ' Z. Définition 4.3. — On appelle nombre d’Euler ou nombre de Toledo et on note e(ρ) Qg le nombre entier i=1 ˜[ρ(ai ), ρ(bi )˜]. Théorème 4.4 (Inégalité de Milnor et Wood). — Pour toute représentation ρ : Γg → Sp2m (R), on a |e(ρ)| ≤ m(g − 1). Définition 4.5. — Une représentation ρ : Γg → Sp2m (R) est dite maximale si |e(ρ)| = m(g − 1). Soit Q le stabilisateur dans Sp2m (R) de l’espace engendré par e1 , . . . , em (toujours avec (ei )i=1,...,2m la base canonique de R2m ), c’est un sous-groupe parabolique maximal de Sp2m (R). Théorème 4.6 (Burger, Labourie, Iozzi et Wienhard [16]). — Toute représentation maximale est Q-Anosov.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
108
O. GUICHARD
Ce résultat est basé sur les travaux de Burger, Iozzi et Wienhard [17] établissant l’existence d’une application équivariante, continue à droite ∂∞ Γg → Sp2m (R)/Q ' Lag (R2m ) = {h ∈ Grm (R2m ) | ∀x, y ∈ h, txJm y = 0} qui satisfait de surcroît une propriété de « maximalité ». Lorsque G est un groupe de Lie simple et de type hermitien, le groupe fondamental de G a toujours un facteur cyclique infini ce qui permet de définir un nombre d’Euler/Toledo pour les représentations Γg → G. Il y a encore une majoration de cet entier et donc une notion de représentations maximales. Les travaux de Burger, Iozzi et Wienhard montrent que ces représentations sont Anosov par rapport à un sous-groupe parabolique bien déterminé. 4.2. Autres exemples 4.2.1. Les sous-groupes convexes-cocompacts. — Ces sous-groupes sont Anosov ! Plus généralement si Γ est un sous-groupe convexe-cocompact de O(n, 1) et si τ : O(n, 1) → G est un plongement, alors τ (Γ) est Anosov relativement à un sousgroupe parabolique de G déterminé par le morphisme τ . 4.2.2. Groupes de Schottky. — Les groupes de Schottky, c’est à dire les sousgroupes engendrés par une paire (de puissances) d’éléments réguliers et suffisamment transverses, sont Anosov. Une démonstration géométrique, i.e. à partir de l’action sur l’espace symétrique et n’utilisant pas de versions du lemme du ping-pong, se trouve dans [39] et est basée sur le théorème 5.9. 4.2.3. Groupes de surfaces dans PGL3 (R). — Dans [3], Barbot étudie les représentations Anosov ρ de groupes de surface Γg dans PGL3 (R). Il montre en particulier qu’il y a toujours un ouvert Ω ⊂ Flag (R3 ) de la variété drapeau sur lequel ρ(Γg ) agit proprement et avec quotient compact. Il caractérise aussi les représentations de la composante de Hitchin avec Ω : ρ appartient à la composante de Hitchin si et seulement si Ω n’est pas connexe. 4.2.4. Convexes divisibles. — On appelle ainsi les ouverts proprement convexes Ω de l’espace projectif Pn−1 (R) pour lesquels il existe un sous-groupe Γ de Aut(Ω) = {g ∈ PGLn (R) | g · Ω = Ω} agissant proprement sur Ω avec quotient compact. Les réseaux de O(n − 1, 1) sont de tels exemples avec Ω = Hn−1 . Benoist [7] démontre que le groupe Γ est hyperbolique au sens de Gromov si et seulement si Ω est strictement convexe, auquel cas le bord de Gromov ∂∞ Γ s’identifie de manière Γ-équivariante à ∂Ω. En utilisant l’action sur le convexe polaire Ω0 ⊂ Pn−1∗ (R) on obtient une seconde application ∂∞ Γ → Pn−1∗ (R). À partir de là, il est aisé de démontrer que Γ → PGLn (R) est Anosov.
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
109
Le théorème de stabilité des représentations Anosov peut être utilisé dans ce cas pour retrouver un résultat de Koszul [42] de stabilité des structures projectives convexes sur une variété compacte. Dans [31] Kapovich construit des ouverts convexes divisibles (Ω, Γ) pour lesquels le quotient Γ\Ω est une variété de Gromov et Thurston ; ceci donne les premiers exemples de sous-groupes Anosov qui ne sont pas isomorphes à un réseau d’un groupe de Lie. 4.2.5. Sous-groupes quasi-fuchsiens dans SO(2, n). — Barbot et Mérigot ont défini une notion de sous-groupe Γ quasi-fuchsien dans SO(2, n) : l’ensemble limite ΛΓ , dans le projectivisé du cône isotrope pour la forme quadratique q2,n , est homéomorphe à la sphère de dimension n − 1 et vérifie une propriété d’« acausalité ». Ils démontrent dans [5] qu’alors Γ est Anosov et que, réciproquement, un sous-groupe Anosov dont le bord de Gromov ∂∞ Γ est homéomorphe à une sphère de dimension n − 1 est quasifuchsien. Barbot [4] démontre ensuite que le sous-ensemble des représentations quasifuchsiennes dans Hom(Γ, SO(2, n)) est fermé ; comme cet ensemble est également ouvert, il est réunion de composantes connexes. 4.2.6. Groupes de Coxeter. — En se basant sur leurs travaux qui développent la notion de sous-groupes convexes-cocompacts en géométrie projective (voir le paragraphe 7.4 plus bas), Danciger, Guéritaud et Kassel [21, 22] montrent que tous les groupes de Coxeter à angles droits et hyperboliques admettent des représentations Anosov ; les images de ces représentations sont des groupes de réflexions hyperplanes. Ceci permet d’avoir de nouveaux exemples de représentations Anosov pour des groupes discrets qui ne sont pas des réseaux d’un groupe de Lie. En utilisant ces travaux, Lee et Marquis [45] ont donné les premiers exemples de sous-groupes quasi-fuchsiens (au sens de Barbot et Mérigot, voir § 4.2.5) qui ne sont pas isomorphes à des réseaux de O(1, n).
5. DIFFÉRENTES CARACTÉRISATIONS DES SOUS-GROUPES ANOSOV Cette partie passe en revue quelques caractérisations des représentations Anosov (ici des représentations P1 -Anosov dans GLn (R)), il y en a bien d’autres et le lecteur pourra consulter [26, 29, 32, 33, 34, 35, 36, 37, 38, 39, 43] pour un tableau plus complet. 5.1. Un peu de géométrie de l’espace symétrique Ce paragraphe aborde de manière succincte, pour le groupe SLn (R), la géométrie de l’espace symétrique et les variétés drapeaux comme « bord à l’infini » de l’espace symétrique ; ceci est traité de manière plus systématique dans les articles de Kapovich, Leeb et Porti.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
110
O. GUICHARD
Nous travaillerons dans cette partie plutôt avec le groupe SLn (R) que GLn (R) ; il est commode et naturel de se « débarrasser » du facteur central de GLn (R) et de travailler avec un groupe de Lie connexe. L’espace symétrique SLn (R)/SO(n) s’identifie à Xn = {s ∈ Mn (R) | ts = s, det s = 1, et ∀x ∈ Rn r {0}, txsx > 0}. Soit s0 = 1n le point de Xn dont le stabilisateur est SO(n). La décomposition de Cartan dans SLn (R) (qui est reliée aux valeurs principales déjà mentionnées) implique le (et est même équivalente au) fait que pour tout s dans Xn , il existe un élément k de SO(n) et une matrice diagonale µ = Pn µ diag(µ1 , . . . , µn ) avec µ1 ≥ µ2 ≥ · · · ≥ µn et i=1 µi = 0 tels que s = ke · s0 . Le n-uplet (µ1 , . . . , µn ) est alors uniquement déterminé. On dira que le segment s0 s est régulier si à la fois µ1 > µ2 et µn−1 > µn . Plus généralement, si s et s0 sont deux points de Xn , il existe un élément g de SLn (R) et une matrice diagonale µ = diag(µ1 , . . . , µn ) avec µ1 ≥ · · · ≥ µn tels que s = g · s0 et s0 = geµ · s0 . La matrice µ est uniquement déterminée par (s, s0 ). Le segment ss0 est dit régulier si µ1 > µ2 et µn−1 > µn . La matrice associée à (s0 , s) est la matrice diagonale diag(−µn , −µn−1 , . . . , −µ1 ). Ainsi le segment s0 s est régulier si et seulement si ss0 l’est. La variété des drapeaux constitués d’une droite et d’un hyperplan est notée = {(`, h) ∈ Pn−1 (R) × Pn−1∗ (R) | ` ⊂ h}. C’est un espace homogène sous l’action de SO(n) et le stabilisateur dans SO(n) de f0 = (`0 , h0 ) où `0 = Re1 et h0 = Re1 ⊕ · · · ⊕ Ren−1nest le sous-groupe M de SO(n) constitué des matrices o ε a diagonales par blocs, M = ε, δ ∈ {±1}, a ∈ O(n − 2), εδ det a = 1 . F1,n−1
δ
On appellera cône de Weyl (centré en s0 et de direction f0 ) et on notera V (s0 , f0 ) le sous-ensemble de Xn formé des meµ ·s0 avec µ = diag(µ1 , . . . , µn ), µ1 ≥ µ2 ≥ · · · ≥ µn et m ∈ M . Si f = (`, h) appartient à F1,n−1 , soit k ∈ SO(n) tel que f = k · f0 , le cône de Weyl V (s0 , f ) est l’image de V (s0 , f0 ) par k : V (s0 , f ) = k · V (s0 , f0 ) = {k1 eµ · s0 | µ = diag(µ1 , . . . , µn ), µ1 ≥ · · · ≥ µn , k1 ∈ SO(n), k1 · f0 = f }. Un point s = g · s0 appartient à V (s0 , f ) si et seulement si la matrice g tg stabilise ` et h (et donc `⊥ et h⊥ ) et si kg tg|` k ≥ kg tg | ⊥ k et k(g tg)−1 | ⊥ k ≥ k(g tg)−1 | k. Il existe donc toujours ` h h un cône de Weyl V (s0 , f ) (f = (`, h) ∈ F1,n−1 ) contenant s = g · s0 = keµ · s0 et ce cône de Weyl est uniquement déterminé par s si et seulement si kg tg|` k > kg tg | ⊥ k ` et k(g tg)−1 | ⊥ k > k(g tg)−1 | k. Comme ici eµ1 = kg tg|` k, eµ2 = kg tg | ⊥ k, e−µn = h h ` k(g tg)−1 | ⊥ k et e−µn−1 = k(g tg)−1 | k, l’unicité de ce cône de Weyl est équivalente à h h ce que le segment s0 s est régulier. On peut bien sûr considérer des cônes de Weyl de sommets quelconques : si s ∈ Xn et f ∈ F1,n−1 , il existe g ∈ SLn (R) tel que s = g · s0 et f = g · f0 (toujours car le stabilisateur de s0 dans SLn (R) agit transitivement sur F1,n−1 ), on pose V (s, f ) = g · V (s0 , f0 ). Comme g est uniquement déterminé par multiplication à droite par un
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
111
élément de M près et comme V (s0 , f0 ) est invariant par M , cet ensemble dépend uniquement de la paire (s, f ) et non de g. Pour tout autre point s0 de Xn , il existe un cône de Weyl V (s, f ) contenant s0 et ce cône est unique si et seulement si ss0 est un segment régulier. Soit maintenant ss0 un segment régulier, le diamant ♦s,s0 déterminé par ss0 est l’intersection du cône de Weyl V (s, f ) contenant s0 et du cône de Weyl V (s0 , f 0 ) contenant s : ♦s,s0 = V (s, f ) ∩ V (s0 , f 0 ). C’est un sous-ensemble compact de Xn . On a ♦s0 ,s = ♦s,s0 et, pour tout s00 ∈ ♦s,s0 tel que ss00 est régulier, ♦s,s00 ⊂ ♦s,s0 . Notons aussi que, sous ces hypothèses, les drapeaux f = (`, h) et f 0 = (`0 , h0 ) sont transverses : ` ∩ h0 = 0 et `0 ∩ h = 0. Nous aurons également besoin de versions quantitatives de la régularité. Un segment ss0 de Xn sera dit -régulier (où > 0 est fixé) si s = g · s0 , s0 = geµ · s0 avec µ = diag(µ1 , . . . , µn ), µ1 ≥ · · · ≥ µn , sont » tels que µ1 − µ2 ≥ dXn (s, s0 ) Pn 0 0 2 et µn−1 − µn ≥ dXn (s, s ) avec dXn (s, s ) = i=1 µi (dXn est la distance riemannienne dans Xn ). On notera V (s, f ) l’ensemble des s0 dans V (s, f ) tels que ss0 est -régulier. On notera ♦s,s0 l’intersection V (s, f ) ∩ V (s0 , f 0 ) où f et f 0 sont déterminés par le segment régulier ss0 comme ci-dessus. 5.2. Un peu de dynamique sur F1,n−1 Les notions introduites dans le paragraphe précédent permettent de définir l’ensemble limite dans F1,n−1 d’un sous-groupe Γ de SLn (R). Définition 5.1. — On note ΛΓ ⊂ F1,n−1 et on appelle ensemble limite de Γ dans F1,n−1 l’ensemble des limites de suites (fp )p∈N de F1,n−1 telles qu’il existe une suite (γp )p∈N dans Γ avec – lim µ1 (γp ) − µ2 (γp ) = lim µn−1 (γp ) − µn (γp ) = +∞, – lim dXn (s0 , γp · s0 ) = +∞ et, – pour tout p ∈ N, γp · s0 ∈ V (s0 , fp ). L’ensemble limite est fermé, il ne dépend pas du point base s0 . On pourrait, dans la définition, supposer seulement que γp · s0 est dans un R-voisinage de V (s0 , fp ) où R ≥ 0 est indépendant de p. On appelle points coniques les points de ΛΓ obtenus ainsi en prenant une suite (fp )p∈N constante : Définition 5.2. — Un élément f de F1,n−1 est un point limite conique s’il existe une suite (γp )p∈N de Γ et R ≥ 0 avec lim dXn (s0 , γp · s0 ) = +∞ et, pour tout p ∈ N, γp · s0 appartient au R-voisinage du cône de Weyl V (s0 , f ). Des caractérisations des sous-groupes Anosov seront aussi données en termes de l’action de Γ sur F1,n−1 , i.e. sans référence à l’espace symétrique Xn . Les notions pertinentes sont les suivantes.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
112
O. GUICHARD
Définition 5.3. — Une suite (gp )p∈N de SLn (R)N est dite contractante sur F1,n−1 s’il existe f + et f − dans F1,n−1 tels que, pour tout f ∈ F1,n−1 , si f est transverse à f − , alors la suite (gp · f )p∈N tend vers f + . L’action de Γ sur F1,n−1 sera dite de convergence si toute suite de Γ tendant vers l’infini a une sous-suite contractante. (On dit qu’une suite (γp )p∈N tend vers l’infini quand lim dXn (s0 , γp · s0 ) = +∞.) Si (gp )p∈N est une suite contractante, alors les drapeaux f ± de la définition sont uniquement déterminés et la convergence vers f + est en fait uniforme sur les compacts de F1,n−1 contenus dans l’ouvert des éléments de F1,n−1 transverses à f − . On peut détecter l’existence d’une sous-suite contractante à l’aide de la projection de Cartan. Pour tout g dans SLn (R) notons encore µ(g) = diag(µ1 (g), . . . , µn (g)) l’unique matrice diagonale à coefficients décroissants contenue dans la double classe SO(n)gSO(n). Alors une suite (gp )p∈N ∈ SLn (R)N a une sous-suite contractante si et seulement si sup{µ1 (gp )−µ2 (gp ), p ∈ N} = sup{µn−1 (gp )−µn (gp ), p ∈ N} = +∞. Les définitions ci-dessus sont empruntées des articles de Kapovich, Leeb et Porti. Benoist [6] définit aussi une notion d’ensemble limite qu’il étudie en détails. Dans ses travaux sur les mesures de Patterson et Sullivan en rang supérieur, Albuquerque [1] introduit également une notion de point limite conique. 5.3. Sous-groupes de convergence, dilatant et à ensemble limite transverse La caractérisation donnée ici des représentations Anosov est un analogue du théorème 1.5 pour les sous-groupes convexes-cocompacts. Théorème 5.4 (Kapovich, Leeb et Porti [39]). — Soit Γ un sous-groupe discret de SLn (R). On suppose Transversalité. — Pour tous f 6= f 0 dans ΛΓ , les drapeaux f et f 0 sont transverses. Convergence. — L’action de Γ sur F1,n−1 est de convergence (définition 5.3). Dilatation. — L’action de Γ en tout point f ∈ ΛΓ est dilatante : il existe γ ∈ Γ, c > 0 et un voisinage U de f dans F1,n−1 tels que, pour tous f1 , f2 ∈ U , dF1,n−1 (γ · f1 , γ · f2 ) ≥ c dF1,n−1 (f1 , f2 ) (dF1,n−1 est une distance riemannienne sur F1,n−1 ). Alors le groupe Γ est de type fini, hyperbolique au sens de Gromov et Γ est un sous-groupe Anosov de SLn (R). De plus, si β1 : ∂∞ Γ → Pn−1 (R) et βn−1 : ∂∞ Γ → Pn−1∗ (R) sont les applications au bord associées, l’application β = (β1 , βn−1 ) : ∂∞ Γ → F1,n−1 ⊂ Pn−1 (R) × Pn−1∗ (R) induit un homéomorphisme Γ-équivariant sur ΛΓ . Dans ce théorème, l’hyperbolicité est déduite du résultat suivant :
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
113
Théorème 5.5 (Bowditch [11]). — Soit Z un espace topologique compact, métrisable et parfait et soit Γ un groupe d’homéomorphismes de Z agissant proprement sur {(z1 , z2 , z3 ) ∈ Z 3 | z1 6= z2 , z2 6= z3 , z3 6= z1 } et avec quotient compact. Le groupe Γ est alors de type fini, hyperbolique au sens de Gromov et son bord de Gromov ∂∞ Γ s’identifie à Z de manière Γ-équivariante. 5.4. Sous-groupes réguliers à ensemble limite conique et transverse Cette caractérisation entre en résonance avec le corollaire 1.7 pour les sous-groupes convexes-cocompacts. Théorème 5.6 (Kapovich, Leeb et Porti [39]). — Soit Γ un sous-groupe de SLn (R). On suppose Régularité. — limγ→∞,γ∈Γ µ1 (γ) − µ2 (γ) = +∞ (de manière équivalente, pour toute suite (γp )p∈N d’éléments deux à deux distincts, limp µ1 (γp ) − µ2 (γp ) = +∞). Transversalité. — Pour tous f , f 0 dans ΛΓ , si f 6= f 0 , alors f et f 0 sont transverses. Conicalité. — Tout point f de ΛΓ est un point limite conique (définition 5.2). Alors le groupe Γ est de type fini, hyperbolique au sens de Gromov et l’injection de Γ dans SLn (R) est une représentation Anosov. Bien sûr, réciproquement, un sous-groupe Anosov satisfait à toutes les conditions énoncées dans ces deux théorèmes. 5.5. Action de type Morse Le lemme de Morse, pour les espaces hyperboliques, affirme que les quasigéodésiques sont à distance finie de géodésiques. Un tel énoncé n’est pas vrai en rang supérieur mais Kapovich, Leeb et Porti [37] en ont donné une version pour Xn (et pour les espaces symétriques et les immeubles euclidiens) : un segment géodésique régulier (i.e. vérifiant la condition énoncée dans le théorème 0.1) est proche d’un diamant (respectivement, un rayon géodésique régulier est proche d’un cône de Weyl et une géodésique biinfinie est proche de la réunion de deux cônes de Weyl de même sommet et de directions transverses). La partie 6 suivante donne quelques énoncés intermédiaires qui mènent à ce résultat d’approximation des quasi-géodésiques régulières. Voyons maintenant qu’un sous-groupe hyperbolique vérifiant cette propriété d’approximation est Anosov. Théorème 5.7 (Kapovich, Leeb et Porti [39]). — Soit Γ un sous-groupe de type fini de SLn (R). On suppose que Γ est hyperbolique au sens de Gromov et que Régularité. — limγ→∞,γ∈Γ µ1 (γ) − µ2 (γ) = +∞.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
114
O. GUICHARD
Morse. — Il existe R ≥ 0 pour lequel la propriété suivante est vérifiée : pour toute géodésique finie (γp )p=0,...,P dans le graphe de Cayley de Γ, il existe s et s0 dans Xn tels que dXn (γ0 · s0 , s) ≤ R, dXn (γP · s0 , s0 ) ≤ R, le segment ss0 est régulier et, pour tout p = 0, . . . , P , γp · s0 appartient au R-voisinage du diamant ♦s,s0 . Le groupe Γ est alors un sous-groupe Anosov. Réciproquement, un sous-groupe Anosov est « Morse » de manière quantitative : Théorème 5.8 (Kapovich, Leeb et Porti [39]). — Soit Γ un sous-groupe Anosov de SLn (R). Il existe alors L ≥ 1, A ≥ 0, R ≥ 0 et > 0 tels que, pour toute géodésique finie (γp )p=0,...,P dans le graphe de Cayley de Γ, on a : –– l’application {0, 1, . . . , P } → Xn /p 7→ γp · s0 est une (L, A)-quasi-géodésique ; –– il existe s ∈ BXn (γ0 · s0 , R) et s0 ∈ BXn (γP · s0 , R) tels que {γp · s0 , p = 0, . . . , P } est contenu dans le R-voisinage de ♦s,s0 . Lorsque les conclusions du théorème sont satisfaites, on parlera de quasi-géodésique de classe Morse ou (L, A, , R)-géodésique de classe Morse et on dira que le groupe Γ est quasi-plongé de classe Morse ou (L, A, , R)-plongé de classe Morse dans SLn (R). Lorsqu’elles sont vérifiées seulement pour les géodésiques de longueur ≤ S donnée, on dira que Γ est localement (L, A, , R, S)-plongé de classe Morse ou localement quasiplongé de classe Morse dans SLn (R). Puisque toutes les propriétés énoncées dans le théorème sont invariantes par multiplication à gauche par un élément de Γ, on peut aussi bien se restreindre aux géodésiques (γp )p=0,...,P vérifiant γ0 = eΓ . La condition d’être localement quasi-plongé de classe Morse n’implique donc qu’un nombre fini de géodésiques (elles aussi finies) de Γ. Cette condition suffit cependant à assurer la condition globale. Théorème 5.9 (Kapovich, Leeb et Porti [39]). — Soit (L, A, , R) fixé et 0 > . Il existe S ≥ 0 tel que si Γ est un sous-groupe de SLn (R), hyperbolique au sens de Gromov, si Γ est régulier, et si Γ est localement (L, A, 0 , R, S)-plongé de classe Morse dans SLn (R), alors Γ est (L, A, , R)-plongé de classe Morse. 5.6. Divergence Les représentations Anosov vérifient d’autres propriétés fortes de divergence. Dans [26] est prouvé le fait que, si Γ est un sous-groupe Anosov de GLn (R), alors, pour tout i = 2, . . . , n et pour tout rayon géodésique (γp )p∈N dans Γ, l’application N → R+ /p 7→ µ1 (γp ) − µi (γp ) est une quasi-isométrie. Les constantes de quasiisométries peuvent être prises uniformes pour les rayons géodésiques tels que γ0 = eΓ . Réciproquement il est établi que, si la fonction Γ → R+ /γ 7→ µ1 (γ) − µ2 (γ), pour un sous-groupe Γ de type fini, vérifie une propriété de divergence « logarithmique », les suites (fp )p∈N , dans F1,n−1 , associées à un rayon géodésique (γp )p∈N par la relation
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
115
γp · s0 ∈ V (s0 , fp ) sont toutes convergentes et de même limite ce qui permet de définir une application β : ∂∞ Γ → F1,n−1 équivariante et continue. Lorsque de plus Γ est hyperbolique au sens de Gromov et que les fonctions p 7→ µ1 (γp ) − µi (γp ) sont des quasi-isométries, il est démontré que β vérifie la propriété de transversalité et que le sous-groupe Γ est Anosov. Un résultat analogue est le fait que, pour toute quasi-géodésique de classe Morse (γp )p∈N , la suite des projections de Cartan (µ(γp γ0−1 ))p∈N est, elle aussi, une quasi-géodésique de classe Morse [35].
6. HYPERBOLICITÉ DU GROUPE Γ Cette section explique une partie des conclusions du théorème 0.1, à savoir celle concernant l’hyperbolicité du groupe. Remarquons que les hypothèses du théorème peuvent se réexprimer en disant que l’application orbitale Γ → Xn /γ 7→ γ · s0 est un plongement quasi-isométrique et qu’il existe D ≥ 0 et > 0 tels que, pour tous γ, γ 0 dans Γ, si dXn (γ · s0 , γ 0 · s0 ) ≥ D alors le segment d’extrémités γ · s0 et γ 0 · s0 est -régulier. Posons Z = Γ · s0 ⊂ Xn muni de la distance dZ déduite de celle de Xn par restriction, Z est quasi-isométrique à Γ. Il s’agit donc de démontrer que (Z, dZ ) est hyperbolique au sens de Gromov. La caractérisation suivante de l’hyperbolicité sera utilisée ici : (Z, dZ ) est hyperbolique au sens de Gromov si et seulement si tout cône asymptotique (notion due à van den Dries et Wilkie [23] et à Gromov [25]) de (Z, dZ ) est un arbre réel, i.e. est 0-hyperbolique. Soit F ⊂ P (N) un ultrafiltre non principal (i.e. F ne contient aucun ensemble fini, est stable par intersection finie et par passage au sur-ensemble, et est maximal pour ces propriétés). Un cône asymptotique de (Z, dZ ) est un espace métrique (Z , dZ ) obtenu à partir d’une suite (λp )p∈N de réels strictement positifs tendant vers 0 et d’une suite de points base (bp )p∈N ∈ Z N de la manière suivante : – soit Zb le sous-ensemble des suites (zp )p∈N telles que la suite réelle (λp dZ (bp , zp ))p∈N est bornée selon F (i.e. il existe M ≥ 0 tel que l’ensemble {p ∈ N | |λp dZ (bp , zp )| ≤ M } appartient à F). Dans ce cas, cette suite est automatiquement convergente selon F (i.e. il existe t ∈ R tel que, pour tout > 0, {p ∈ N | |λp dZ (bp , zp ) − t| ≤ } appartient à F) ; b , d ((z ) , (z 0 ) ) = – on définit, quels que soient (zp )p∈N et (zp0 )p∈N dans Z p p b p p Z 0 limF λp dZ (zp , zp ). Alors dZb est symétrique et vérifie l’inégalité triangulaire ; b par la relation d’équivalence – on obtient un espace métrique Z en quotientant Z b ×Z b. dont le graphe est {d = 0} ⊂ Z b Z
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
116
O. GUICHARD
Ce cône asymptotique est maintenant un espace métrique connexe par arcs ; mieux il existe des géodésiques (paramétrées par un intervalle de R) entre toute paire de points de Z . Aussi (et presque par construction) Z se plonge dans le cône asymptotique X de Xn . Par les travaux de Kleiner et Leeb [40], il est connu que ce cône asymptotique X a la propriété remarquable d’être un immeuble euclidien de type An−1 (i.e. du même type que Xn ). Concrètement, dans X , on peut définir : – pour tout (s, s0 ) ∈ X 2 , un n-uplet µ(s, s0 ) = (µ1 , . . . , µn ) ∈ Rn avec µ1 ≥ µ2 ≥ Pn · · · ≥ µn (et i=1 µi = 0) ; en particulier les notions de segment régulier et de segment -régulier ; Q – une « variété drapeau » à l’infini F∞ (ici l’ultraproduit F F1,n−1 ) et donc des cônes de Weyl et des diamants. Une différence étant que, pour les immeubles euclidiens, un segment régulier appartient à plusieurs cônes de Weyl, néanmoins les différents diamants que l’on peut dès lors construire sont tous égaux ; – en tout point s de X une « variété drapeau » Fs des directions des (germes de) cônes de Weyl au point s. Dans ces variétés drapeaux F∞ et Fs , la notion de transversalité est bien définie. Une différence importante avec le cas de Xn est que la topologie induite sur Fs est la topologie discrète. Il y a des projections naturelles F∞ → Fs et, pour tout s0 dans X tel que le segment ss0 est régulier, le (germe de) cône de Weyl contenant ce segment définit un élément f (s0 ) ∈ Fs . Cette fonction permet de caractériser le diamant (de X ) ♦s− ,s+ : s appartient au diamant ♦s− ,s+ si et seulement si f (s− ) et f (s+ ) ∈ Fs sont transverses. Par hypothèse sur Z (ou plutôt sur Γ), l’ensemble Z est automatiquement -régulier, c’est-à-dire que toute paire de points distincts dans Z ⊂ X définit un segment -régulier. Une étape importante est d’obtenir : Tout segment rectifiable dans Z est contenu dans le diamant défini par ses extrémités, voir [37, Th. 5.6]. À partir de là, Kapovich, Leeb et Porti démontrent que Z est un arbre métrique, [37, Cor. 6.5 et 6.6]. Cette propriété des chemins rectifiables et -réguliers est quant à elle obtenue grâce à un contrôle des propriétés de contraction de la projection π♦ : X → ♦ sur un diamant ♦ (les diamants sont convexes). Cette projection est 1-lipschitzienne pour dX mais des estimées plus fines sont nécessaires pour pouvoir conclure. Pour ce faire, Kapovich, Leeb et Porti introduisent d♦ une métrique sur ♦ pour laquelle ils démontrent : La projection π♦ est (localement) 1-lipschitzienne de X r ♦ dans (♦, d♦ ) [37, Th. 4.8].
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
117
La propriété recherchée provient alors du fait que, pour les segments -réguliers, la distance d♦ est quantitativement plus grande que dX . La définition de d♦ est ainsi : la longueur d’un chemin géodésique par morceaux ne « change » pas mais l’on autorise dans ♦ = ♦s− ,s+ uniquement des morceaux qui sont des segments géodésiques xy non inclus dans l’intérieur des cônes de Weyl V (x, f ) (ou V (y, f )) qui contiennent s− ou s+ , autrement dit y n’appartient pas aux diamants ♦s− ,x , ♦x,s+ [37, § 4.1].
7. UN PANORAMA (TROP RAPIDE) AUTOUR DES REPRÉSENTATIONS ANOSOV Cet exposé n’a permis d’aborder que quelques caractérisations des représentations Anosov, les articles mentionnés plus haut en contiennent d’autres renforçant encore le lien avec les sous-groupes convexes-cocompacts (qui eux-mêmes admettent d’autres caractérisations). En outre, il existe aussi des caractérisations utilisant les valeurs propres des éléments du groupe plutôt que leurs valeurs principales. Par ailleurs, la métrique d♦ introduite plus haut admet une interprétation naturelle en termes de la géométrie finslérienne de l’espace symétrique ; Kapovich et Leeb [33] ont élaboré sur cette géométrie finslérienne et les compactifications de l’espace symétrique qui s’en suivent. Il existe également une autre démonstration du lemme de Morse pour les espaces symétriques donnée par Bochi, Potrie et Sambarino [10] et se basant sur la notion de décomposition dominée en systèmes dynamiques et les résultats de Avila, Bochi et Yoccoz [2] et de Bochi et Gourmelon [9] dans ce domaine. 7.1. Structures géométriques Les représentations Anosov entretiennent des liens forts avec les structures géométriques. Les résultats de Barbot sur les représentations Anosov dans PGL3 (R) vont dans ce sens, § 4.2.3. L’article [29] montre, entre autres, que tout sous-groupe Anosov Γ d’un groupe de Lie semi-simple G est l’holonomie d’une structure géométrique sur une variété compacte ; plus précisément, il existe un G-espace homogène compact E , un ouvert Γ-invariant Ω de E (construit explicitement à partir de l’application au bord ∂∞ Γ → G/P et d’une représentation de G dans GLN (R)) sur lequel Γ agit proprement et avec quotient compact. L’article [36] offre des éclairages nouveaux sur ces domaines de discontinuité avec quotient compact : l’argument de cocompacité est de nature dynamique (et non cohomologique) et Ω est ici un ouvert de F = G/P 0 d’une variété drapeaux et est construit à partir d’une donnée combinatoire sur le groupe de Weyl W , explicitement il s’agit d’un
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
118
O. GUICHARD
sous-ensemble de W appelé « épaississement équilibré ». Y est démontré aussi que, dans F = G/Pmin , l’ouvert Ω est toujours non vide si G a au moins un facteur simple qui n’est pas de type A1 , B2 ou G2 . L’étude de ces structures géométriques prend maintenant un nouvel élan pour les espaces de Teichmüller généralisés où les outils analytico-algébro-géométriques, déjà utilisés depuis longtemps pour établir des propriétés de ces espaces de modules, commencent aujourd’hui à être employés pour étudier ces structures géométriques. Un premier papier dans cette direction est celui de Collier, Tholozan et Toulisse [20] sur les représentations maximales dans SO(2, n). 7.2. Dynamique Le « formalisme thermodynamique » a d’abord été introduit en théorie des systèmes dynamiques par Bowen [12, 13], Parry et Pollicott [50], Ruelle [53] et d’autres. Il a été ensuite utilisé par McMullen [47] puis par Bridgeman [14] pour les représentations fuchsiennes et quasi-fuchsiennes (de nouvelles formules y sont données pour la métrique de Weil et Petersson). L’article de Bridgeman, Canary, Labourie et Sambarino [15] développe ce formalisme pour les représentations Anosov : ils construisent une nouvelle métrique (dite « de pression ») sur l’espace des modules des représentations Anosov (Zariski denses) et démontrent que certains invariants dynamiques (entropie, dimension de Hausdorff de l’ensemble limite, etc.) varient analytiquement. Avec ces outils, Potrie et Sambarino [51] ont démontré un résultat de rigidité pour les représentations ρ : Γg → SLn (R) de la composante de Hitchin : la représentation ρ factorise par le SL2 (R) principal si et seulement si l’entropie de ρ est maximale (et donc égale à 1). 7.3. Compactification, dégénérescence Les travaux de Kapovich et Leeb et ceux de [28] proposent des compactifications des espaces localement symétriques Γ\G/K associés à des sous-groupes Anosov. Kapovich et Leeb [33] montrent que les compactifications obtenues ont une structure naturelle de variétés à coins. Réciproquement, ils établissent une caractérisation à l’aide de ces compactifications : un sous-groupe Γ de SLn (R) est Anosov si et seulement si Γ est uniformément régulier (c’est-à-dire les éléments de Γ assez grands sont -réguliers) et si le quotient Γ\Xn admet une compactification finslérienne et « respectant les fibrations naturelles à l’infini ». Il est également possible d’utiliser les structures géométriques mentionnées plus haut pour obtenir des compactifications de quotients Γ\G/H plus généraux. Centrons le reste de ce paragraphe sur les quotients Γ\ (G × G) /∆(G) où Γ est un sous-groupe de G × G et ∆(G) est le sous-groupe diagonal de G × G. L’étude de ces quotients a une longue histoire que nous n’évoquons pas ici. L’article [27] montre que ces doubles
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
119
quotients ont des compactifications naturelles lorsque Γ est Anosov dans un surgroupe G0 de G×G (G0 est explicite, il est simple si G est simple). Il y a des réciproques quand G est de rang réel égal à 1 : si Γ est un sous-groupe de G×G agissant proprement et avec quotient compact sur (G × G)/∆(G), alors le groupe Γ est un sous-groupe Anosov dans G0 d’un groupe de Lie simple G0 contenant G × G (voir [26] qui donne un énoncé plus général). Un autre aspect est la compactification de l’espace des modules des représentations Anosov, et donc de comprendre les dégénérescences de suites de représentations Anosov. Les travaux généraux de Parreau [49] construisent des compactifications de l’espace des modules de toutes les représentations par des actions sur les immeubles euclidiens. Dans [18], Burger et Pozzetti analysent quels sont les immeubles intervenant dans la compactification de l’espace des modules des représentations maximales dans Sp2m (R) et détaillent les structures particulières des actions obtenues. L’article [48] donne quels groupes Γ admettent des suites « fortement » dégénérées d’actions Anosov. L’action du groupe des automorphismes extérieurs Out(Γ) sur l’espace des modules des représentations Anosov est propre [44, 54]. Dans [19], Canary, Lee et Stover introduisent une notion de représentation « Anosov amalgamés » et démontrent la propreté de l’action de Out(Γ) sur leur espace de modules quand le groupe Γ a un bout. Ils montrent également que, pour une infinité de groupes Γ, l’espace des représentations Anosov amalgamées, qui contient toujours l’espace des représentations Anosov, ne coïncide pas avec ce dernier. 7.4. Le retour des sous-groupes convexes-compacts Les travaux récents de Danciger, Guéritaud et Kassel [21, 22] rétablissent de plein droit la convexe-cocompacité dans l’étude des représentations Anosov. L’un de leurs résultats est le théorème suivant : un sous-groupe Γ de SLn (R) est Anosov et laisse stable un convexe propre de l’espace projectif Pn−1 (R) si et seulement si Γ agit de manière convexe-cocompacte sur un ouvert convexe Ω ⊂ Pn−1 (R) strictement convexe et à bord C 1 (i.e. il existe C ⊂ Ω fermé, convexe, Γ-invariant, sur lequel Γ agit proprement avec quotient compact). Zimmer [55] démontre un résultat analogue pour une notion légèrement différente de convexe cocompacité, et en déduit des énoncés de rigidité. En fait des hypothèses plus faibles sur Ω impliquent déjà que Γ est Anosov. Si ce résultat ne peut s’appliquer aux sous-groupes de SLn (R) ne stabilisant aucun convexe de l’espace projectif, on en tire tout de même le résultat inconditionnel suivant : un sous-groupe Γ de SLn (R) est Anosov si et seulement si l’action de Γ par transconjugaison sur l’espace Sn (R) des matrices symétriques est convexe-cocompacte : il existe Ω ⊂ P(Sn (R)), un ouvert convexe, Γ-invariant, strictement convexe et à bord C 1 , sur lequel l’action de Γ est convexe-cocompacte.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
120
O. GUICHARD
RÉFÉRENCES [1] P. Albuquerque – Patterson-Sullivan theory in higher rank symmetric spaces, Geom. Funct. Anal. 9 (1999), no 1, p. 1–28. [2] A. Avila, J. Bochi & J.-C. Yoccoz – Uniformly hyperbolic finite-valued SL(2, R)-cocycles, Comment. Math. Helv. 85 (2010), no 4, p. 813–884. [3] T. Barbot – Three-dimensional Anosov flag manifolds, Geom. Topol. 14 (2010), no 1, p. 153–191. [4]
, Deformations of Fuchsian AdS representations are quasi-Fuchsian, J. Differential Geom. 101 (2015), no 1, p. 1–46.
[5] T. Barbot & Q. Mérigot – Anosov AdS representations are quasi-Fuchsian, Groups Geom. Dyn. 6 (2012), no 3, p. 441–483. [6] Y. Benoist – Propriétés asymptotiques des groupes linéaires, Geom. Funct. Anal. 7 (1997), no 1, p. 1–47. [7]
, Convexes divisibles. I, in Algebraic groups and arithmetic, Tata Inst. Fund. Res., Mumbai, 2004, p. 339–374.
[8] L. Bers – On boundaries of Teichmüller spaces and on Kleinian groups. I, Ann. of Math. 91 (1970), p. 570–600. [9] J. Bochi & N. Gourmelon – Some characterizations of domination, Math. Z. 263 (2009), no 1, p. 221–231. [10] J. Bochi, R. Potrie & A. Sambarino – Anosov representations and dominated splittings, J. Eur. Math. Soc. (JEMS) 21 (2019), no 11, p. 3343–3414. [11] B. H. Bowditch – A topological characterisation of hyperbolic groups, J. Amer. Math. Soc. 11 (1998), no 3, p. 643–667. [12] R. Bowen – Symbolic dynamics for hyperbolic flows, Amer. J. Math. 95 (1973), p. 429–460. [13]
, Hausdorff dimension of quasicircles, Inst. Hautes Études Sci. Publ. Math. (1979), no 50, p. 11–25.
[14] M. Bridgeman – Hausdorff dimension and the Weil-Petersson extension to quasifuchsian space, Geom. Topol. 14 (2010), no 2, p. 799–831. [15] M. Bridgeman, R. Canary, F. Labourie & A. Sambarino – The pressure metric for Anosov representations, Geom. Funct. Anal. 25 (2015), no 4, p. 1089– 1179. [16] M. Burger, A. Iozzi, F. Labourie & A. Wienhard – Maximal representations of surface groups : symplectic Anosov structures, Pure Appl. Math. Q. 1 (2005), no 3, Special Issue in memory of Armand Borel. Part 2, p. 543–590.
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
121
[17] M. Burger, A. Iozzi & A. Wienhard – Surface group representations with maximal Toledo invariant, Ann. of Math. 172 (2010), no 1, p. 517–566. [18] M. Burger & M. B. Pozzetti – Maximal representations, non-Archimedean Siegel spaces, and buildings, Geom. Topol. 21 (2017), no 6, p. 3539–3599. [19] R. D. Canary, M. Lee & M. Stover – Amalgam Anosov representations, Geom. Topol. 21 (2017), no 1, p. 215–251. [20] B. Collier, N. Tholozan & J. Toulisse – The geometry of maximal representations of surface groups into SO0 (2, n), Duke Math. J. 168 (2019), no 15, p. 2873–2949. [21] J. Danciger, F. Guéritaud & F. Kassel – Convex cocompactness in pseudoRiemannian hyperbolic spaces, Geom. Dedicata 192 (2018), p. 87–126, volume en l’honneur de Bill Goldman. [22]
, Convex cocompact actions in real projective geometry, prépublication arXiv:1704.08711.
[23] L. van den Dries & A. J. Wilkie – Gromov’s theorem on groups of polynomial growth and elementary logic, J. Algebra 89 (1984), no 2, p. 349–374. [24] V. Fock & A. Goncharov – Moduli spaces of local systems and higher Teichmüller theory, Publ. Math. Inst. Hautes Études Sci. (2006), no 103, p. 1–211. [25] M. Gromov – Asymptotic invariants of infinite groups, in Geometric group theory, Vol. 2 (Sussex, 1991), London Math. Soc. Lecture Note Ser., vol. 182, Cambridge Univ. Press, 1993, p. 1–295. [26] F. Guéritaud, O. Guichard, F. Kassel & A. Wienhard – Anosov representations and proper actions, Geom. Topol. 21 (2017), no 1, p. 485–584. [27]
, Compactification of certain Clifford-Klein forms of homogeneous spaces, Michigan Math. J. 66 (2017), no 1, p. 49–84.
reductive
[28] O. Guichard, F. Kassel & A. Wienhard – Tameness of Riemannian locally symmetric spaces arising from Anosov representations, prépublication arXiv:1508.04759. [29] O. Guichard & A. Wienhard – Anosov representations : domains of discontinuity and applications, Invent. math. 190 (2012), no 2, p. 357–438. [30] N. J. Hitchin – Lie groups and Teichmüller space, Topology 31 (1992), no 3, p. 449–473. [31] M. Kapovich – Convex projective structures on Gromov-Thurston manifolds, Geom. Topol. 11 (2007), no 3, p. 1777–1830. [32] M. Kapovich & B. Leeb – Discrete isometry groups of symmetric spaces, in Handbook of group actions. Vol. IV, Adv. Lect. Math. (ALM), vol. 41, Int. Press, 2018, p. 191–290.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
122
[33] [34] [35] [36] [37] [38]
[39] [40]
[41] [42] [43] [44] [45] [46] [47] [48] [49] [50]
O. GUICHARD
, Finsler bordifications of symmetric and certain locally symmetric spaces, Geom. Topol. 22 (2018), no 5, p. 2533–2646. M. Kapovich, B. Leeb & J. Porti – Some recent results on Anosov representations, Transform. Groups 21 (2016), no 4, p. 1105–1121. , Anosov subgroups : dynamical and geometric characterizations, Eur. J. Math. 3 (2017), no 4, p. 808–898. , Dynamics on flag manifolds : domains of proper discontinuity and cocompactness, Geom. Topol. 22 (2018), no 1, p. 157–234. , A Morse Lemma for quasigeodesics in symmetric spaces and euclidean buildings, Geom. Topol. 22 (2018), no 7, p. 3827–3923. , Lectures on Anosov representations I : Dynamical and geometric characterizations, prépublication https://pdfs.semanticscholar.org/a80b/ 0ca99dd75b0d9e8b1f51ad520b3ab8422151.pdf. , Morse actions of discrete groups on symmetric spaces, prépublication arXiv:1403.7671. B. Kleiner & B. Leeb – Rigidity of quasi-isometries for symmetric spaces and Euclidean buildings, Inst. Hautes Études Sci. Publ. Math. (1997), no 86, p. 115– 197. , Rigidity of invariant convex sets in symmetric spaces, Invent. math. 163 (2006), no 3, p. 657–676. J.-L. Koszul – Déformations de connexions localement plates, Ann. Inst. Fourier 18 (1968), no fasc., fasc. 1, p. 103–114. F. Labourie – Anosov flows, surface groups and curves in projective space, Invent. math. 165 (2006), no 1, p. 51–114. , Cross ratios, Anosov representations and the energy functional on Teichmüller space, Ann. Sci. Éc. Norm. Supér. 41 (2008), no 3, p. 437–469. G.-S. Lee & L. Marquis – Anti–de Sitter strictly GHC-regular groups which are not lattices, Trans. Amer. Math. Soc. 372 (2019), no 1, p. 153–186. G. Lusztig – Total positivity in reductive groups, in Lie theory and geometry, Progr. Math., vol. 123, Birkhäuser, 1994, p. 531–568. C. T. McMullen – Thermodynamics, dimension and the Weil-Petersson metric, Invent. math. 173 (2008), no 2, p. 365–425. L. Merlin – A note on degenerations of Morse actions, prépublication arXiv:1612.09332. A. Parreau – Compactification d’espaces de représentations de groupes de type fini, Math. Z. 272 (2012), nos 1-2, p. 51–86. W. Parry & M. Pollicott – Zeta functions and the periodic orbit structure of hyperbolic dynamics, Astérisque, vol. 187-188, 1990.
ASTÉRISQUE 414
(1138)
GROUPES CONVEXES-COCOMPACTS EN RANG SUPÉRIEUR
123
[51] R. Potrie & A. Sambarino – Eigenvalues and entropy of a Hitchin representation, Invent. math. 209 (2017), no 3, p. 885–925. [52] J.-F. Quint – Groupes convexes cocompacts en rang supérieur, Geom. Dedicata 113 (2005), p. 1–19. [53] D. Ruelle – Thermodynamic formalism, Encyclopedia of Mathematics and its Applications, vol. 5, Addison-Wesley Publishing Co., Reading, Mass., 1978. [54] A. Wienhard – The action of the mapping class group on maximal representations, Geom. Dedicata 120 (2006), p. 179–191. [55] A. Zimmer – Projective Anosov representations, convex cocompact actions, and rigidity, prépublication arXiv:1704.08582.
Olivier GUICHARD Université de Strasbourg, CNRS, IRMA UMR 7501 7, rue René Descartes F-67000, Strasbourg, France E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1139, p. 125 à 166 doi:10.24033/ast.1083
Octobre 2017
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL [d’après Soergel et Elias-Williamson] par Simon RICHE
INTRODUCTION 0.1. Bimodules de Soergel Les bimodules de Soergel sont certains bimodules gradués sur des algèbres de polynômes, associés à un système de Coxeter (W, S) et une représentation V de W . Ces bimodules ont été introduits au début des années 90 dans les travaux de Soergel [29, 30], dans le cas particulier où W est le groupe de Weyl d’un groupe algébrique semisimple complexe G, et V est l’algèbre de Lie d’un tore maximal de G. Dans ce cas Soergel montre que cette catégorie est équivalente à la catégorie des complexes semisimples B-équivariants (pour la t-structure perverse) sur la variété de drapeaux G/B de G (où B ⊂ G est un sous-groupe de Borel) ; on en déduit que 1. l’anneau de Grothendieck scindé de cette catégorie est canoniquement isomorphe à l’algèbre de (Iwahori-)Hecke H(W,S) de (W, S) ; 2. les bimodules de Soergel indécomposables (à décalage près de la graduation) sont paramétrés par W (on notera Bw le bimodule associé à w ∈ W ) ; 3. les classes de ces objets dans l’anneau de Grothendieck, identifié à H(W,S) , forment la base de Kazhdan-Lusztig de H(W,S) . En utilisant ces propriétés, Soergel obtient alors une nouvelle preuve de la conjecture de Kazhdan-Lusztig [18] sur les multiplicités dans la catégorie O de l’algèbre de Lie semisimple complexe duale de G au sens de Langlands, prouvée précédemment et par d’autres méthodes (1) par Be˘ılinson-Bernstein [3] et Brylinski-Kashiwara [6].
(1)
On renvoie à [35] pour une présentation de ces travaux.
© Astérisque 414, SMF 2019
126
S. RICHE
Dans un travail ultérieur [33] (après des premiers résultats obtenus dans [30]), Soergel a défini (2) et étudié ces bimodules pour un système de Coxeter arbitraire et une représentation de W satisfaisant une certaine condition technique (3). Dans ce cadre il n’existe pas de « géométrie » associée, de sorte que les arguments utilisés sont nécessairement algébriques. Il montre dans cet article que les propriétés (1) et (2) ci-dessus sont vraies dans cette généralité. Par contre, la propriété (3) s’avère être beaucoup plus subtile, et n’est énoncée que comme une conjecture (sous l’hypothèse que le corps de base est de caractéristique 0). Soergel remarque que cette conjecture impliquerait la positivité des polynômes de Kazhdan-Lusztig (comme conjecturé par Kazhdan-Lusztig [18]), c’est-à-dire une solution à l’un des problèmes centraux dans la combinatoire des groupes de Coxeter. Depuis ces travaux fondateurs, les bimodules de Soergel (sous différentes formes) se sont révélés être des outils extrêmement utiles en théorie des représentations (voir [30, 34, 37, 9, 4, 26] pour quelques exemples), car ils permettent souvent de faire un lien avec la géométrie d’une variété de drapeaux appropriée. Mais dans tous les cas la preuve de certaines de leurs propriétés sort du cadre algébrique de leur définition, et repose sur la géométrie. 0.2. Les résultats d’Elias-Williamson L’objet principal de cet exposé est d’expliquer la preuve, due à Elias-Williamson [10], de la conjecture de Soergel évoquée au §0.1. Soergel remarque dans [33] que, si on cherche à démontrer la conjecture par récurrence sur la longueur de l’élément de W considéré, on doit vérifier que certaines formes bilinéaires sur des espaces de morphismes sont non dégénérées. L’intuition fondamentale de Elias-Williamson est que cette propriété n’est que la partie émergée d’un iceberg beaucoup plus profond : les bimodules de Soergel possèdent toute une « théorie de Hodge » qu’il faut construire en même temps qu’on démontre la conjecture de Soergel. Plus précisément, Elias-Williamson se placent dans le cadre d’une représentation V réelle de (W, S) qui possède la propriété technique de Soergel et une autre condition de « positivité » (4). (Chaque groupe de Coxeter possède une représentation de ce type.) On pose R := Sym(V ∗ ), qu’on considère comme un anneau gradué engendré en degré 2. Ils considèrent alors un certain élement ρ ∈ V ∗ = R2 et remarquent que (2)
Dans [33], Soergel utilise le terme « speziellen Bimoduln » pour ces objets. Les premières occurences du terme « bimodules de Soergel » dans la littérature semblent être dans [28] et [19]. (3) Wolfgang Soergel m’a fait savoir qu’il tenait à remercier particulièrement Patrick Polo pour ses contributions dans la genèse de l’article [33]. (4) La preuve d’Elias-Williamson repose sur l’utilisation de l’ordre sur R, et donc ne s’applique pas à d’autres corps de coefficients. Les spécialistes semblent douter de la véracité de la conjecture de Soergel sur d’autres corps de caractéristique 0. (Divers contre-exemples sont connus en caractéristique positive.)
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
127
si w ∈ W et si la conjecture de Soergel est connue pour w (c’est-à-dire si la classe dans le groupe de Grothendieck scindé du bimodule indécomposable Bw associé à w est l’élément de la base de Kazhdan-Lusztig associé à w) alors Bw possède une forme bilinéaire symétrique « invariante » h−, −iBw : Bw × Bw → R canonique, unique à un scalaire dans R>0 près. On notera de même la forme bilinéaire symétrique (Bw ⊗R R)× (Bw ⊗R R) → R induite par h−, −iBw . Ils démontrent simultanément, par récurrence sur la longueur de w, que : 1. la conjecture de Soergel est vraie pour w ; 2. Bw ⊗R R vérifie le théorème de Lefschetz difficile, au sens où pour tout i ≥ 0 la ∼ multiplication par ρi induit un isomorphisme (Bw ⊗R R)−i − → (Bw ⊗R R)i entre les parties de degré −i et i ; 3. Bw ⊗R R, muni de la forme induite par h−, −iBw , vérifie les relations de Hodge-Riemann, au sens où pour tout i ≥ 0 la restriction de la forme (x, y) 7→ hx, ρi · yiBw sur (Bw ⊗R R)−i aux éléments primitifs (c’est-à-dire `(w)−i annulés par ρi+1 ) est (−1) 2 -définie (5) (où ` désigne la fonction de longueur sur W ). Notons que la propriété (3) est l’étape cruciale pour démontrer (1), mais que d’un autre côté cette propriété n’a un sens précis qu’une fois que (1) est démontrée (pour que la forme bilinéaire h−, −iBw soit fixée). Les preuves de ces deux propriétés sont donc nécessairement imbriquées. La propriété (2) est elle impliquée par (3), mais joue un rôle crucial dans la récurrence. Dans le cas où W est le groupe de Weyl d’un groupe algébrique complexe G, et où V est l’algèbre de Lie d’un tore maximal, Bw ⊗R R s’identifie à la cohomologie d’intersection de la variété de Schubert associée à W . Dans ce cas, les propriétés (2) et (3) découlent du théorème de Lefschetz difficile et des relations de Hodge-Riemann « classiques », appliqués à ce cas particulier. On renvoie à [11, 42] pour plus de détails. 0.3. Structure de la preuve La structure de la preuve de [10] est inspirée par la preuve du Théorème de Décomposition donnée récemment par de Cataldo-Migliorini. (Voir [7, 40] pour des présentations de cette preuve. Notons cependant que la « traduction » de ces idées dans le langage algébrique des bimodules de Soergel est hautement non triviale !) On a essayé de ne présenter que les parties indispensables de cette preuve, quitte à omettre certains résultats intermédiaires intéressants mais qui peuvent être contournés (voir par exemple la remarque 2.10). (5)
Ici on dit qu’une forme bilinéaire symétrique est (+1)-définie, resp. (−1)-définie, si elle est définie positive, resp. définie négative.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
128
S. RICHE
Comme expliqué ci-dessus, la preuve procède par récurrence sur la longueur de l’élément considéré. On fixe donc w ∈ W \ {e}, on écrit w = ys avec s ∈ S et `(y) < `(w), et on suppose toutes les propriétés voulues pour les éléments de longueur ≤ `(y). Comme suggéré au §0.2, pour démontrer la conjecture de Soergel pour w il faut vérifier que certaines formes bilinéaires sur des espaces HomB (Bz , By ⊗R Bs ) (où `(z) ≤ `(y)) sont non dégénérées où B désigne la cat´égorie des bimodules de Soergel considérés. Pour ce faire, Elias-Williamson remarquent que HomB (Bz , By ⊗R Bs ) s’injecte (par une isométrie pour des formes bilinéaires −`(z) appropriées) dans le sous-espace des éléments primitifs dans (By ⊗R Bs ) ⊗R R . Puisque la restriction à un sous-espace d’une forme bilinéaire symétrique définie positive ou négative est non dégénérée, ceci ramène la preuve de la conjecture de Soergel pour w à un résultat de type « Hodge-Riemann » pour By ⊗R Bs . Il est par ailleurs facile de voir que le théorème de Lefschetz difficile et les relations de Hodge-Riemann pour Bw découlent également de ce résultat. Pour démontrer cet énoncé, Elias-Williamson considèrent l’opérateur de Lefschetz « déformé » Ly,s ζ := ρ · idBy ⊗Bs + idBy ⊗ (ζρ · idBs ) : By ⊗R Bs → By ⊗R Bs (2) pour ζ ∈ R≥0 . (Ici, (2) désigne le foncteur de décalage de la graduation par 2 vers la gauche.) Ils remarquent tout d’abord que les relations de Hodge-Riemann pour By impliquent que Ly,s ζ vérifie le résultat voulu si ζ 0. En utilisant le fait que ce résultat peut s’énoncer en terme de la signature de certaines formes bilinéaires symétriques, et que la signature ne peut pas varier dans une famille continue de formes bilinéaires symétriques non dégénérées, ceci ramène la preuve du résultat voulu à vérifier que Ly,s vérifie le théorème de Lefschetz difficile pour tout ζ ≥ 0. ζ Dans leur preuve de l’énoncé géométrique correspondant, de Cataldo-Migliorini utilisent le théorème de Lefschetz faible pour une section hyperplane. Cet énoncé n’a aucun analogue dans le monde des bimodules de Soergel, et Elias-Williamson utilisent à la place des différentielles apparaissant dans les « complexes de Rouquier », qui permettent de factoriser l’opérateur ρ · idBy en une composée By → D(1) → By (2), où D est une somme de termes de la forme Bz avec `(z) < `(y) qui vérifie une version appropriée des relations de Hodge-Riemann pour une forme convenable. Notons que cet argument impose de considérer également les relations de Hodge-Riemann pour l’opérateur Lζ sur Bz ⊗R Bs (quand `(zs) > `(z)) comme une hypothèse de récurrence, en plus des propriétés considérées au §0.2. 0.4. Applications La preuve de la conjecture de Soergel a deux applications très importantes, déjà suggérées au §0.1. La première est qu’elle permet de donner une preuve algébrique
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
129
de la conjecture de Kazhdan-Lusztig concernant les multiplicités des modules simples dans les modules de Verma d’une algèbre de Lie semi-simple complexe. La seconde application (suggérée par Soergel dans [33]) est la preuve d’une autre conjecture de Kazhdan-Lusztig affirmant que les coefficients des polynômes de Kazhdan-Lusztig (des polynômes apparaissant dans diverses formules de caractères en théorie de Lie) sont positifs ou nuls. Cette conjecture était connue quand W est le groupe de Weyl d’un groupe algébrique (ou plus généralement d’un groupe de Kac-Moody) ; mais dans le cas général elle constituait un des problèmes centraux du domaine depuis sa formulation en 1979.
0.5. Prolongements Du point de vue d’Elias-Williamson, les résultats énoncés au §0.2 forment la théorie de Hodge « globale » des bimodules de Soergel. Dans des articles ultérieurs [39, 12], ils ont développé des versions « locale » et « relative » de cette théorie, qui ont également des applications importantes en théorie de Lie. Pour des raisons de place, ces résultats (et leurs applications) ne sont évoqués que brièvement, à la fin de ces notes.
0.6. Contenu des notes Dans la partie 1, on rappelle les résultats de base sur les bimodules de Soergel, suivant [33]. Dans la partie 2 on présente les résultats principaux de [10] et leurs preuves. Dans la partie 3 on expose les applications de ces résultats. Enfin, dans la partie 4 on évoque brièvement les résultats de [39] et [12].
0.7. Remerciements Je remercie Geordie Williamson pour de nombreuses discussions autour de ces travaux et de résultats connexes, avant et pendant la préparation de cet exposé, ainsi que pour ses remarques sur une version préliminaire de ces notes. Je remercie également Wolfgang Soergel pour l’autorisation de reproduire sa preuve de la proposition 1.13 et pour ses remarques sur une version préliminaire de ce texte, et George Lusztig pour ses remarques. Enfin, je remercie V. Le Dret pour sa relecture très attentive de ces notes. Ce travail a bénéficié du soutien de la bourse ANR-13-BS01-0001-01 de l’Agence Nationale de la Recherche. This project has received funding from the European Research Council (ERC) under the European Union’s Horizon 2020 research and innovation programme (grant agreement No. 677147).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
130
S. RICHE
1. BIMODULES DE SOERGEL 1.1. Systèmes de Coxeter et algèbres de Hecke Soit W un groupe, et soit S ⊂ W un sous-ensemble constitué d’éléments d’ordre 2, qu’on supposera fini. Pour tous s, t ∈ S (non nécessairement distincts), on note mst ∈ Z≥1 ∪ {∞} l’ordre de st dans W . On dit que (W, S) est un système de Coxeter si le morphisme canonique du groupe de présentation hS | (st)mst = 1 pour tous s, t ∈ S tels que mst 6= ∞i dans W est un isomorphisme. (On dit alors parfois – comme ici dans l’introduction – que W est un groupe de Coxeter, mais on évitera cette terminologie impropre dans le reste de ces notes.) Notons que pour tout ensemble fini S et tous éléments mst ∈ Z≥1 ∪ {∞} tels que mss = 1 et mst = mts ≥ 2 pour s 6= t, il existe un système de Coxeter de générateurs S et tel que mst est l’ordre de st pour tous s, t ∈ S ; voir par exemple [5, §V.4.3]. Si w ∈ W , on appellera décomposition réduite de w toute écriture de w en produit d’éléments de S de longueur minimale. Cette longueur est appelée la longueur de w, et notée `(w). L’ensemble W est muni d’un ordre naturel appelé ordre de Bruhat, qu’on notera ≤, et pour lequel la fonction ` : W → Z≥0 est strictement croissante. Ces groupes apparaissent « naturellement » en théorie de Lie de la façon suivante. Soit G un groupe algébrique réductif connexe sur un corps algébriquement clos, soit B ⊂ G un sous-groupe de Borel, et soit T ⊂ B un tore maximal. Soit W = NG (T )/T le groupe de Weyl de (G, T ). Soit également Φ ⊂ X ∗ (T ) le système de racines de (G, T ), soit Φ+ ⊂ Φ le système positif constitué des racines de B, et soit Φs la base de Φ associée. À toute racine α on peut associer une coracine α∨ ∈ X∗ (T ), et une réflexion sα ∈ W telle que sα agit sur T par sα (t) = t·α∨ (α(t)−1 ). Si S = {sα : α ∈ Φs }, alors (W, S) est un système de Coxeter. Si on considère une construction similaire plus généralement pour les groupes de Kac-Moody associés à des matrices de Cartan généralisées (voir [36, 22]), on obtient de cette manière tous les groupes de Coxeter cristallographiques, c’est-à-dire tels que mst ∈ {2, 3, 4, 6, ∞} pour tous s 6= t. Si (W, S) est un système de Coxeter, l’algèbre de Hecke associée est la Z[v, v−1 ]-algèbre H(W,S) (où v est une indéterminée) engendrée par des éléments {Hs : s ∈ S} soumis aux relations suivantes : – relations quadratiques : (Hs )2 = 1 + (v−1 − v)Hs pour s ∈ S ; – relations de tresse : si s, t ∈ S avec s 6= t et mst 6= ∞, alors H H · · · = Ht Hs · · · . | s {zt } | {z }
mst termes
ASTÉRISQUE 414
mst termes
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
131
Les relations de tresse et le « lemme de Matsumoto » (voir [5, §IV.1.5, proposition 5]) assurent que si w ∈ W et si w = s1 · · · sn est une expression réduite, alors l’élément Hw := Hs1 · · · Hsn ne dépend que de w. De plus, les éléments {Hw : w ∈ W } forment une Z[v, v−1 ]-base de H(W,S) (voir [5, §IV.2, Exercice 23]). Les relations quadratiques montrent que les éléments Hs sont inversibles dans H(W,S) . Il en découle que cette propriété est vraie pour tous les éléments Hw , de sorte qu’on peut définir une involution d’anneaux d de H(W,S) en posant d(v) = v−1
et d(Hw ) = (Hw−1 )−1 .
Kazhdan-Lusztig ont construit dans [18] une base remarquable de H(W,S) de la façon suivante : pour tout w ∈ W , il existe un unique élément H w qui vérifie M d(H w ) = H w et H w ∈ Hw + vZ[v] · Hy ; y∈W
alors {H w : w ∈ W } forme une base de H(W,S) . (Voir également [31, Theorem 2.1] pour une preuve plus simple de ce résultat.) Les polynômes de Kazhdan-Lusztig sont les éléments {hy,w : y, w ∈ W } de Z[v] déterminés par X Hw = hy,w · Hy . y∈W
(On peut facilement vérifier que si hy,w 6= 0 alors y ≤ w, et que hw,w = 1.) Ci-dessous on considérera également les constantes de structure {µzx,y : x, y, z ∈ W } de la multiplication de H(W,S) dans cette base, définies par X Hx · Hy = µzx,y · H z . z∈W
Il est facile de voir que si x ∈ W et s ∈ S satisfont xs > x, alors pour tout z ∈ W on a (1)
µzx,s ∈ Z.
1.2. Représentations réflexion fidèles Soit (W, S) un système de Coxeter, et soit V une représentation de W de dimension finie sur un corps de caractéristique impaire ou nulle. On pose T := {wsw−1 : w ∈ W, s ∈ S}. Suivant Soergel [33], on dit que V est réflexion fidèle si 1. V est fidèle ; 2. pour tout x ∈ W , V x := {v ∈ V | x · v = v} est un hyperplan de V si et seulement si x ∈ T .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
132
S. RICHE
(Les éléments de T sont souvent appelés réflexions. Notons que nos hypothèses assurent que ces éléments agissent sur V comme des réflexions, c’est-à-dire avec un hyperplan de points fixes et une droite propre de valeur propre associée −1.) Deux exemples importants de représentations réflexion fidèles sont fournis par la proposition suivante. (Le cas (1) est important car il montre que tout système de Coxeter admet une représentation réflexion fidèle ; le cas (2) est celui qui apparaît naturellement en théorie de Lie.) Proposition 1.1. — 1. Soit (W, S) un système de Coxeter, et soit V un R-espace vectoriel de dimension finie muni d’une famille libre (es )s∈S de vecteurs et d’une famille libre (e∨ s )s∈S de formes linéaires telles que het , e∨ s i = −2 cos(π/mst )
pour tous s, t ∈ S
(où par convention cos(π/∞) = 1). Alors la formule s · v = v − hv, e∨ s ies définit une représentation de W sur V qui est réflexion fidèle. 2. Soit A une matrice de Cartan généralisée symétrisable (6) dont les lignes et colonnes sont paramétrées par un ensemble fini I, et soit (h, {αi : i ∈ I}, {αi∨ : i ∈ I}) une réalisation de A sur R au sens de Kac (voir [22, Definition 1.1.2]). Soit (W, S) le système de Coxeter associé (voir [22, Definition 1.3.1 & Proposition 1.3.21]). Alors la représentation de W sur h∗ est réflexion fidèle. Démonstration. — Le cas (1) est démontré dans [33, Proposition 2.1]. (La condition que V est de dimension minimale imposée dans [33] n’est pas nécessaire.) Le cas (2) est probablement bien connu, mais n’est pas traité dans la littérature à notre connaissance. Donnons-en donc la preuve (qui est très similaire à celle de [33, Proposition 2.1]). Puisque W est défini comme un sous-groupe des automorphismes de h∗ , la représentation de W sur h∗ est fidèle ; par ailleurs, tous les éléments de T agissent par des réflexions. Soit maintenant x ∈ W , et supposons que (h∗ )x est un hyperplan de h∗ . Comme W est engendré par des réflexions de h∗ , on a det(x) ∈ {±1}. Supposons tout d’abord que det(x) = 1. Choisissons c ∈ h∗ tel que h∗ = (h∗ )x ⊕ Rc. Alors on a x(c) ∈ c + (h∗ )x ; on note v0 = x(c) − c. Pour tous v ∈ (h∗ )x et λ ∈ R on a donc x(v + λc) = v + λc + λv0 . Puisque A est symétrisable, d’après [22, Proposition 1.5.2] il existe une forme bilinéaire symétrique non dégénérée h−, −i sur h∗
(6)
Cette hypothèse n’est probablement pas nécessaire, mais nous n’avons pas pu trouver de preuve qui l’évite.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
133
qui est W -invariante. Pour v et λ comme ci-dessus on a alors hv + λc, v + λci = hv + λc + λv0 , v + λc + λv0 i, c’est-à-dire 2λhv, v0 i + λ2 2hc, v0 i + hv0 , v0 i = 0. On en déduit que h2c + v0 , v0 i = 0 et que hv, v0 i = 0 pour tout v ∈ (h∗ )x . Donc v0 appartient au noyau de notre forme, ce qui implique que v0 = 0. Donc c ∈ (h∗ )x , une contradiction. On suppose maintenant que det(x) = −1. Soient D = {v ∈ h∗ | ∀i ∈ I, hv, αi∨ i ≥ 0},
D◦ = {v ∈ h∗ | ∀i ∈ I, hv, αi∨ i > 0}, S et considérons également le cône de Tits C = y∈W y(D). Rappelons que C est convexe ; voir [22, Proposition 1.4.2(c)]. Les hyperplans de réflexion des éléments de T sont les hyperplans définis par les coracines réelles positives. Si v ∈ D◦ , d’après [22, Proposition 1.4.2(a)] on a StabW (v) = {1}. Donc D◦ et x(D◦ ) n’intersectent aucun de ces hyperplans. Il découle de [22, Proposition 1.4.2(c)] que seul un nombre fini de ces hyperplans séparent D◦ et x(D◦ ). Pour une raison similaire, (h∗ )x ne peut intersecter aucune région de la forme y(D◦ ) pour y ∈ W . Si v ∈ D◦ , le segment joignant v à x(v) croise (h∗ )x . Ce point d’intersection appartient à C (par convexité) mais à aucun des y(D◦ ) pour y ∈ W ; donc il appartient à un hyperplan de réflexion associé à un élément de T , qui doit séparer D◦ et x(D◦ ). Ainsi, une partie ouverte de (h∗ )x est réunion de ses intersections avec un nombre fini d’hyperplans de réflexion. Ceci implique que (h∗ )x coïncide avec l’un de ces hyperplans, dont nous noterons t la réflexion associée. Alors xt est un élément de W de déterminant 1 et dont les points fixes contiennent un hyperplan. Par le cas traité ci-dessus, on a nécessairement xt = e, donc x = t. Remarque 1.2. — Si A est une matrice de Cartan généralisée symétrisable, et si de plus aij aji ≤ 4 pour tous i, j ∈ I, alors on peut vérifier que les représentations du système de Coxeter (W, S) associé données par les points (1) et (2) de la proposition 1.1 (où on a supposé V de dimension minimale dans le cas (1)) sont isomorphes. Par contre, si aij aji ≥ 5 pour un couple (i, j), ces représentations ne sont pas isomorphes en général ; en fait elle n’ont même pas nécessairement la même dimension. 1.3. Bimodules de Soergel Fixons un système de Coxeter (W, S) et une représentation réflexion fidèle V de (W, S) sur un corps k infini (7). On pose R := Sym(V ∗ ), qu’on considère comme (7)
Cette condition n’est pas nécessaire, mais elle est imposée dans [33] pour pouvoir identifier R à l’algèbre des fonctions polynomiales sur V .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
134
S. RICHE
une algèbre graduée avec les formes linéaires V ∗ ⊂ R en degré 2. Pour tout s ∈ S, on définit un bimodule gradué Bs sur R en posant Bs := R ⊗Rs R(1), où Rs ⊂ R désigne les invariants de s et où (1) est le foncteur de décalage de la graduation tel que (M (1))n = M n+1 , de sorte que Bs est engendré en degré −1. (Cidessous, on notera (n) la n-ième puissance de (1), pour tout n ∈ Z, et on utilisera cette notation pour d’autres catégories d’objets Z-gradués.) Pour tout mot w = (s1 , . . . , sr ) en S on définit le bimodule de Bott-Samelson BS(w) associé à w en posant BS(w) := Bs1 · · · Bsr . (Ici et ci-dessous, on omet le symbole de produit tensoriel ⊗R , et nous écrivons donc M N au lieu de M ⊗R N .) Par convention, si w est vide ce produit tensoriel est interprété comme égal à R. On définit la catégorie B des bimodules de Soergel associée à (W, S) et V comme la sous-catégorie pleine de la catégorie des R-bimodules gradués dont les objets sont les sommes directes de facteurs directs de bimodules de la forme BS(w)(n) pour w un mot en S et n ∈ Z. Comme BS(w1 )BS(w2 ) = BS(w1 w2 ), cette sous-catégorie est stable par produit tensoriel, et donc munie d’une structure naturelle de catégorie monoïdale. Il est facile de voir que le bimodule Bs est libre et de type fini comme R-module à droite et comme R-module à gauche. Il en est donc de même des bimodules BS(w), et par suite (puisque tout R-module gradué projectif de type fini est libre) de tous les objets de B. On en déduit que la catégorie B est de Krull-Schmidt ; en particulier, tout objet admet une décomposition essentiellement unique en somme d’objets indécomposables, et un objet est indécomposable si et seulement si son anneau d’endomorphismes est local. Remarque 1.3. — La définition de B donnée ci-dessus n’est pas identique à celle adoptée dans [33]. Plus précisément, Soergel commence par définir un morphisme de H(W,S) vers l’anneau de Grothendieck scindé des R-bimodules gradués de type fini à gauche et à droite, puis définit B comme la sous-catégorie pleine dont les objets sont ceux dont la classe appartient à l’image de ce morphisme ; voir [33, Definition 5.11]. Les objets de B sont alors des facteurs directs de sommes de décalés de bimodules de Bott-Samelson (voir [33, Lemma 5.13]), mais a priori B ne contient pas tous les tels facteurs directs. Il démontre cependant à la fin de son article que B est stable par facteurs directs, voir [33, Satz 6.14]. Cette catégorie contient donc tous les facteurs directs de sommes de décalés de bimodules de Bott-Samelson, ce qui montre qu’elle peut être définie comme on l’a fait ci-dessus.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
135
1.4. Théorème de catégorification On continue avec les conventions du §1.3. Notons [B] le groupe de Grothendieck scindé (8) de B, qu’on considère comme une algèbre pour le produit induit par la structure monoïdale sur B. Cette algèbre est en fait une Z[v, v−1 ]-algèbre pour l’action définie par v · [M ] = [M (1)]. Le théorème suivant est l’un des résultats principaux de [33]. Théorème 1.4. — Il existe un unique isomorphisme de Z[v, v−1 ]-algèbres H(W,S)
∼
− → [B]
envoyant H s = Hs + v sur Bs . L’unicité dans ce théorème est évidente, puisque les éléments H s engendrent H(W,S) comme Z[v, v−1 ]-algèbre. Ce qu’il faut démontrer est donc que les classes {[Bs ] : s ∈ S} vérifient les relations définissant H(W,S) (ce qui se ramène au cas des groupes dihédraux, et peut se faire « à la main » ; voir [33, §4]), puis que le morphisme obtenu est un isomorphisme. Pour cela, Soergel construit un inverse à gauche de ce morphisme, puis classifie les objets indécomposables de B, de la façon suivante (voir [33, Satz 6.14]). Théorème 1.5. — Pour tout w ∈ W et toute expression réduite w de w, il existe un unique facteur direct Bw de BS(w) qui n’est facteur direct d’aucun bimodule gradué de la forme BS(w0 )(n) avec n ∈ Z et w0 un mot de longueur strictement plus petite que celle de w. De plus, Bw ne dépend que de w, et les bimodules {Bw (n) : w ∈ W, n ∈ Z} forment une famille de représentants des classes d’isomorphisme d’objets indécomposables dans B. Remarque 1.6. — 1. Pour s ∈ S, le bimodule gradué Bs est clairement indécomposable, donc cette notation n’est pas ambiguë : cet objet est bien le bimodule de Soergel indécomposable associé à l’élément s ∈ W . 2. Puisque R est concentré en degrés pairs, tout bimodule gradué indécomposable est soit concentré en degrés pairs, soit concentré en degrés impairs ; plus précisément, dans notre cas on a (Bw )n = 0 si n 6≡ `(w) (mod 2). 3. L’objet Bw n’est défini qu’à isomorphisme près. Dans les cas où la conjecture de Soergel (voir le §1.5 ci-dessous) est connue, la formule (2) ci-dessous montre que EndB (Bw ) = k ; l’isomorphisme considéré ci-dessus est donc unique à scalaire près dans ces cas. (8)
Rappelons que le groupe de Grothendieck scindé d’une catégorie additive (essentiellement petite) est le quotient du groupe abélien libre engendré par les classes d’isomorphisme d’objets par les relations [M ] = [M 0 ] + [M 00 ] si M ∼ = M 0 ⊕ M 00 .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
136
S. RICHE
Le lemme suivant résume les propriétés « basiques » des bimodules de Soergel indécomposables. (Ici, le cas w = s de (1), qui peut se vérifier « à la main », est la « catégorification » des relations quadratiques dans H(W,S) .) Lemme 1.7. — Soient w ∈ W et s ∈ S. 1. Si ws < w, alors Bw Bs ∼ = Bw (1) ⊕ Bw (−1). 2. Si ws > w, alors Bws est un facteur direct de Bw Bs avec multiplicité 1, et tous les autres facteurs directs sont de la forme By (i) avec y < ws. Idée de preuve. — La propriété (2) est évidente d’après la caractérisation des objets Bw et Bws et la propriété de Krull-Schmidt dans B. La propriété (1) est un petit peu plus subtile. Elle peut se démontrer en utilisant la théorie des bimodules de s Soergel « singuliers » de [38], qui implique qu’il existe un R-Rs bimodule gradué Bw s tel que Bw = Bw ⊗Rs R ; voir [38, Proposition 7.11]. Une autre approche, utilisant la « base de feuilles légères » de [23], serait de procéder par récurrence sur `(w), en utilisant l’analogue dans le contexte étudié ici de [26, Lemma 4.2.3]. La preuve du théorème 1.5 repose sur une formule pour la dimension des espaces de morphismes entre bimodules de Soergel, qui jouera également un rôle important dans la suite. Remarquons que tout R-bimodule peut être vu naturellement comme un faisceau cohérent sur V × V . Pour tout x ∈ W on pose Gr(x) := {(x · v, v) : v ∈ V } ⊂ V × V, et pour A ⊂ W fini on note [
Gr(A) =
Gr(x).
x∈A
Pour tout R-bimodule M et tout A ⊂ W , on note ΓA (M ) le sous-bimodule de M constitué des éléments dont le support est contenu dans Gr(A0 ) (c’est-à-dire dont la restriction au complémentaire de Gr(A0 ) est nulle) pour A0 une partie finie de A. Pour i ∈ Z on notera Γ≤i au lieu de Γ{y∈W |`(y)≤i} , et de même pour Γi . Pour x ∈ W on pose ∆x := O (Gr(x))(−`(x)),
∇x := O (Gr(x))(`(x)).
(En termes plus concrets, on peut identifier Gr(x) à V via la première projection ; ceci fournit un isomorphisme entre ∆x – ou ∇x – et R, sous lequel l’action de R à gauche s’identifie à l’action naturelle par multiplication. L’action à droite d’un élément f ∈ R s’identifie elle à la multiplication par x · f .) Si M est un R-bimodule gradué, on dira
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
137
que M admet une ∆-filtration, resp. une ∇-filtration, si M = ΓA (M ) pour une partie finie A ⊂ W et si pour tout i ∈ Z il existe un isomorphisme M ⊕d(M,x,n) Γ≥i (M )/Γ>i (M ) ∼ ∆x (n) , = `(x)=i n∈Z
resp. Γ≤i (M )/Γ0 := i>0 R . L’inclusion Γ≤0 (B) ,→ B est scindée comme morphisme de R-modules à droite (voir la remarque 1.8(2)), ce qui implique que notre morphisme est injectif. Pour conclure, il faut donc montrer que tout élément de B ⊗R k annulé par R>0 appartient au sous-espace Γ≤0 (B) ⊗R k ⊂ B ⊗R k. Soit donc b ∈ B ⊗R k non nul, et soit i ∈ Z≥0 l’unique entier tel que b appartient à Γ≤i (B) ⊗R k mais pas à Γ≤i−1 (B) ⊗R k. On va montrer que si i 6= 0, alors b n’est pas annulé par R>0 . Pour cela, choisissons une préimage a de b dans Γ≤i (B). Écrivons le quotient M = Γ≤i (B)/Γ≤i−1 (B) comme une somme directe M M= My y∈W `(y)=i
où chaque My est une somme de copies de décalés de ∇y , et considérons la décomposition X a= ay y
de l’image a de a dans M selon ces facteurs directs. Par hypothèse l’image de a dans M ⊗R k est non nulle, donc il existe y tel que l’image de ay dans M ⊗R k est non nulle. Soit maintenant w0 ∈ W l’élément de plus grande longueur, et considérons un élément c0w0 de (R ⊗RW R)2`(w0 ) non nul et qui s’annule sur chaque Gr(x) avec x 6= w0 , voir [30, Proposition 2]. Choisissons également une préimage cw0 de c0w0 dans (R ⊗k R)2`(w0 ) . Alors, si les opérateurs de Demazure (∂x )x∈W sont définis comme dans [30, §2.2], l’élément cy := ∂yw0 (cw0 ) ∈ (R ⊗k R)2`(y) s’annule sur tous les Gr(z) avec z 6≥ y d’après [30, Lemma 5]. En particulier, au vu de la remarque 1.10(2), le produit cy · a ne dépend que de ay . D’autre part, il est remarqué dans [33, Bemerkung 6.7] que la multiplication par cy induit un ∼ isomorphisme (non gradué) Γ≤y (B)/Γ0 (puisque i = `(y) est non nul par hypothèse). Il découle en particulier de la proposition 1.13 que si w ∈ W l’anneau des endomorphismes de Bw ⊗R k comme R-module gradué est un quotient de EndB (Bw ), donc est un anneau local. Donc ce module gradué est indécomposable. En appliquant des résultats généraux sur les algèbres de dimension finie (voir [15]), on obtient même que Bw ⊗R k est indécomposable comme R-module non gradué. En particulier, il
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
143
s’ensuit que les modules Bw ⊗R k sont exactement les R-modules (non gradués) qu’on peut obtenir comme facteurs directs indécomposables des modules de la forme BS(w) ⊗R k = R ⊗Rs1 R ⊗Rs2 · · · ⊗Rsn k où w = (s1 , . . . , sn ) est un mot en S. Remarque 1.14. — La preuve ci-dessus utilise de façon cruciale l’hypothèse que W est fini. En fait, la proposition 1.13 est fausse en général si W est infini. Des exemples explicites de bimodules de Soergel B indécomposables tels que B ⊗R k est décomposable ont été exhibés par L. Patimo.
2. LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL : CAS GLOBAL Dans cette partie, le corps de base de tous les espaces vectoriels considérés sera (tacitement) R. 2.1. Hypothèses On fixe un système de Coxeter (W, S) et une représentation V de W qui est réflexion fidèle. On fixe également des éléments (αs∨ )s∈S de V et (αs )s∈S de V ∗ tels que s · v = v − hαs , viαs∨ pour tous s ∈ S et v ∈ V . (De tels éléments existent puisque chaque s ∈ S agit par une réflexion sur V .) On suppose qu’il existe un élément ρ ∈ V ∗ tel que pour s ∈ S et w ∈ W on a (5)
hw(ρ), αs∨ i > 0
⇔
sw > w.
(En particulier, si w = 1, ceci implique que hρ, αs∨ i > 0 pour tout s ∈ S.) Dans les situations considérées dans la proposition 1.1, dans le cas (1) on peut poser αs∨ = es , αs = e∨ s , et prendre pour ρ tout élément tel que hρ, es i > 0 pour tout s ∈ S (voir [5, §V.4.4], en remarquant que Vect({es : s ∈ S}) est isomorphe comme W -représentation à la représentation géométrique de W ) ; dans le cas (2) on peut prendre pour les αs , resp. αs∨ , les racines simples, resp. coracines simples, et pour ρ tout élément tel que hρ, αs∨ i > 0 pour tout s ∈ S (voir [22, Lemma 1.3.13]). 2.2. Algèbre linéaire « de Hodge » Dans cette sous-partie on fixe une terminologie qui permet d’énoncer de façon « compacte » les résultats principaux de [10]. Cette terminologie est motivée par la théorie de Hodge des variétés projectives complexes ; voir [42, §2–3] pour plus de détails. (Notons toutefois que les définitions considérées ici sont légèrement différentes de celles considérées dans [42].)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
144
S. RICHE
On appellera donnée de Lefschetz une paire (E, L) où E est un espace vectoriel gradué de dimension finie concentré soit en degrés pairs, soit en degrés impairs, et L : E → E(2) est une application linéaire graduée. On dira que (E, L) vérifie le théorème de Lefschetz difficile si, pour tout i ≥ 0, l’application linéaire L◦i : E −i → E i est un isomorphisme. Dans ce cas, en posant, pour tout i ≥ 0, PL−i := {v ∈ E −i | L◦(i+1) (v) = 0}, on obtient un isomorphisme canonique de R[L]-modules gradués M ∼ R[L]/Li+1 ⊗R PL−i − → E. i≥0
PL−i
−i
(Le sous-espace ⊂ E est appelé sous-espace des éléments primitifs de degré −i.) On appellera donnée de Hodge-Riemann un triplet (E, L, h−, −i) où (E, L) est une donnée de Lefschetz et h−, −i : E × E → R est une forme bilinéaire symétrique non dégénérée graduée (c’est-à-dire telle que hE i , E j i = 0 si i + j 6= 0) pour laquelle L est autoadjoint (c’est-à-dire vérifie hLx, yi = hx, Lyi pour tous x, y ∈ E). On dira que (E, L, h−, −i) vérifie les relations de Hodge-Riemann (10) si, en notant min le degré minimal en lequel E est non nul, pour tout i ∈ 2Z≥0 tel que min +i ≤ 0, la restriction de la forme bilinéaire symétrique sur E min +i définie par (x, y) 7→ hx, L◦(− min −i) (y)i i
à PLmin +i = {v ∈ E min +i | L◦(− min −i+1) (v) = 0} est (−1) 2 -définie. Les relations de Hodge-Riemann sont « plus fortes » que le théorème de Lefschetz difficile, au sens suivant. Lemme 2.1. — Soit (E, L, h−, −i) une donnée de Hodge-Riemann qui vérifie les relations de Hodge-Riemann (ce qui implique en particulier que dim(E i ) = dim(E −i ) pour tout i ∈ Z≥0 ). Alors (E, L) vérifie le théorème de Lefschetz difficile. Démonstration. — Nous allons démontrer par récurrence descendante sur j que, pour tout j ≥ 0, la forme bilinéaire symétrique sur E −j définie par (x, y) 7→ hx, L◦j (y)i est non dégénérée. Cette propriété implique que L◦j : E −j → E j est injective, et donc un isomorphisme puisque dim(E −j ) = dim(E j ). Le cas initial est j = − min (où min est le degré minimal en lequel E est non nul), qui découle des relations de Hodge-Riemann en degré min puisque L◦(− min +1) = 0. Supposons maintenant le résultat démontré pour j + 2 (c’est-à-dire en degré −j − 2). Puisque L◦(j+2) : E −j−2 → E j+2 est un isomorphisme, L est injectif sur E −j−2 et on a E −j = L(E −j−2 ) ⊕ PL−j . De plus il est facile de voir que cette décomposition est (10)
Dans [10], les auteurs autorisent les signes « opposés » à ceux considérés ici dans les relations de Hodge-Riemann. Ils parlent alors de « signes standard » pour les conditions considérées dans ces notes.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
145
orthogonale pour la forme sur E −j considérée ci-dessus, et que L induit une isométrie de E −j−2 (muni de (x, y) 7→ hx, L◦(j+2) (y)i) vers L(E −j−2 ) (muni de (x, y) 7→ hx, L◦j (y)i). On déduit de notre hypothèse de récurrence que la restriction de notre forme à L(E −j−2 ) est non dégénérée. Sa restriction à PL−j est également non dégénérée par hypothèse. Donc la forme est non dégénérée sur E −j . Dans l’autre sens, la propriété de Lefschetz difficile peut parfois aider à démontrer les relations de Hodge-Riemann grâce au résultat suivant, dont la preuve utilise les mêmes méthodes que la preuve précédente. Lemme 2.2. — Soit (E, L, h−, −i) une donnée de Hodge-Riemann, et supposons que (E, L) vérifie le théorème de Lefschetz difficile. Alors (E, L, h−, −i) vérifie les relations de Hodge-Riemann si et seulement si pour tout i ∈ 2Z≥0 tel que min +i ≤ 0 (où min est le degré minimal en lequel E est non nul), la forme bilinéaire sur E min +i définie par (x, y) 7→ hx, L◦(− min −i) (y)i a pour signature (11) i dim(E min )− dim(E min +2 )−dim(E min ) +· · ·+(−1) 2 dim(E min +i )−dim(E min +i−2 ) . En utilisant le fait que la signature d’une famille continue de formes bilinéaires symétriques non dégénérées ne peut pas varier, on en déduit le principe suivant, qui est crucial dans la preuve de [10]. Corollaire 2.3. — Soit I un intervalle de R. On suppose donnés : – un espace vectoriel gradué E de dimension finie concentré soit en degrés pairs, soit en degrés impairs ; – une forme bilinéaire symétrique non dégénérée graduée h−, −i : E × E → R ; – une famille continue (Lt )t∈I d’applications linéaires graduées E → E(2) autoadjointes pour h−, −i. Supposons que (E, Lt ) vérifie le théorème de Lefschetz difficile pour tout t ∈ I. S’il existe t0 ∈ I tel que (E, Lt0 , h−, −i) vérifie les relations de Hodge-Riemann, alors (E, Lt , h−, −i) vérifie les relations de Hodge-Riemann pour tout t ∈ I. Enfin, le lemme suivant (voir [10, Lemma 2.3]) joue un rôle crucial pour démontrer le théorème de Lefschetz difficile. (11) Ici, la signature d’une forme bilinéaire symétrique est interprétée comme r − s, où r, respectivement s, est le nombre de coefficients strictement positifs, respectivement strictement négatifs, dans la décomposition de la forme quadratique associée en combinaison linéaire de carrés de formes linéaires linéairement indépendantes.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
146
S. RICHE
Lemme 2.4. — Soit (E, LE , h−, −iE ) une donnée de Hodge-Riemann qui vérifie les relations de Hodge-Riemann, et soit E 0 un espace vectoriel gradué de dimension finie muni d’une forme bilinéaire symétrique h−, −iE 0 (qu’on ne suppose pas non dégénérée) et d’une application linéaire graduée LE 0 : E 0 → E 0 (2). Soit également ϕ : E 0 → E(1) une application linéaire graduée qui est injective en degrés ≤ −1 et qui vérifie ϕ ◦ LE 0 = LE ◦ ϕ
et
hϕ(x), ϕ(y)iE = hx, LE 0 (y)iE 0 pour tous x, y ∈ E 0 .
Alors (LE 0 )◦i : (E 0 )−i → (E 0 )i est injective pour tout i ≥ 0. Démonstration. — Le résultat est évident pour i = 0. Soient maintenant i ≥ 1 et x ∈ (E 0 )−i \ {0}. Si 0 6= (LE )◦i (ϕ(x)) = ϕ (LE 0 )◦i (x) , alors (LE 0 )◦i (x) 6= 0. Sinon, ϕ(x) est un élément primitif non nul de E −i+1 , de sorte que 0 6= hϕ(x), (LE )◦(i−1) (ϕ(x))iE = hx, (LE 0 )◦i (x)iE 0 , et donc (LE 0 )◦i (x) 6= 0. 2.3. Formes invariantes Si B est un bimodule de Soergel, une forme invariante sur B est une application R-bilinéaire graduée (12) h−, −iB : B × B → R qui vérifie hrx, yi = hx, ryi et hxr, yi = hx, yri = hx, yir pour tous x, y ∈ B et r ∈ R. La donnée d’une telle forme est équivalente, via x 7→ hx, −iB à celle d’un morphisme de R-bimodules gradués B → D(B), où on a défini D par M D(B) := HomModZ −R (B, R(i)), i∈Z
où Mod − R désigne la catégorie des R-modules à droite gradués, et où la structure de R-bimodule est définie par (rf r0 )(x) = f (rxr0 ) pour r, r0 ∈ R, f ∈ D(B), x ∈ B. On dira que cette forme invariante est non dégénérée si le morphisme associé B → D(B) est un isomorphisme. Z
Le lemme suivant (facile à vérifier) fournit la méthode principale pour construire de telles formes. Lemme 2.5. — Soient B, B 0 des bimodules de Soergel, et h−, −iB , h−, −iB 0 des formes invariantes sur B et B 0 . On définit une forme R-bilinéaire sur BB 0 en posant hb1 ⊗ b01 , b2 ⊗ b02 iBB 0 = h(hb1 , b2 iB ) · b01 , b02 iB 0 . Alors h−, −iBB 0 est une forme invariante sur BB 0 , qui est non dégénérée, resp. symétrique, si h−, −iB et h−, −iB 0 sont non dégénérées, resp. symétriques. (12)
Ici, cette condition signifie que hx, yiB ∈ Ri+j si x ∈ B i et y ∈ B j .
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
147
En particulier, on peut construire une forme invariante symétrique non dégénérée sur Bs de la façon suivante : les vecteurs 1 ce := 1 ⊗ 1 et cs := (αs ⊗ 1 + 1 ⊗ αs ) 2 forment une base de Bs comme R-module à droite ; on définit alors hr1 ⊗ r2 , r10 ⊗ r20 iBs comme le coefficient de r1 r10 ⊗ r2 r20 sur cs dans la base précédente. Pour tout mot w en S, la construction du lemme 2.5 fournit alors une forme invariante symétrique et non dégénérée sur BS(w), qu’on notera h−, −iBS(w) et qu’on appellera forme d’intersection (13). L’existence de la forme d’intersection sur BS(w) montre en particulier que D(BS(w)) ∼ = BS(w). En utilisant la caractérisation de Bw donnée au théorème 1.5 on en déduit que pour tout w ∈ W on a (6)
D(Bw ) ∼ = Bw .
En particulier, ceci implique que dim((Bw ⊗R R)−i ) = dim((Bw ⊗R R)i ) pour tout i ≥ 0. De la forme d’intersection sur BS(w) on peut déduire (par restriction) une forme invariante symétrique non dégénérée sur chaque Bw grâce au lemme suivant. Lemme 2.6. — Si B est un bimodule de Soergel muni d’une forme invariante non dégénérée h−, −iB , si w ∈ W , et si Bw apparaît comme facteur direct de B avec multiplicité 1, alors pour tout choix d’inclusion scindée Bw ,→ B la restriction de h−, −iB à Bw est non dégénérée. Démonstration. — Notons f : Bw ,→ B l’inclusion scindée choisie. Notre forme sur B ∼ induit un isomorphisme B − → D(B). Notre hypothèse et (6) montrent que Bw est facteur direct de D(B) avec multiplicité 1, et que D(f ) : D(B) D(Bw ) est une projection sur un tel facteur. La preuve de l’unicité de la décomposition en facteurs indécomposables dans une catégorie de Krull-Schmidt montre alors que la composée ∼
Bw ,→ B − → D(B) D(Bw ) est un isomorphisme, ce qui implique que la restriction considérée est non dégénérée.
Si la conjecture de Soergel est vérifiée pour w (c’est-à-dire si ch∆ (Bw ) = H w ) alors (4) et (6) montrent que dimR HomB (Bw , D(Bw )) = 1. (13)
Cette terminologie est justifiée par l’analogie avec la preuve du Théorème de Décomposition par de Cataldo et Migliorini (voir le §0.3), où certaines formes d’intersection en homologie de BorelMoore jouent un rôle crucial. Les formes h−, −iBS(w) peuvent être considérées comme des analogues algébriques de ces formes.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
148
S. RICHE
On en déduit que, sous cette hypothèse, il existe une unique forme invariante non nulle sur Bw à scalaire près. D’après nos remarques précédentes, elle est symétrique et non dégénérée. On peut vérifier par un calcul explicite (voir [10, Lemma 3.10]) que si w ∈ W et si w est une expression réduite pour w, pour tout c ∈ BS(w)−`(w) non nul le scalaire hc, ρ`(w) · ciBS(w) est strictement positif. Comme, pour toute inclusion scindée −`(w)
Bw ,→ BS(w), la restriction Bw → BS(w)−`(w) est un isomorphisme (voir la remarque 1.10(1)), on obtient finalement, sous l’hypothèse que la conjecture de Soergel est vérifiée pour w, qu’il existe (à scalaire strictement positif près) une unique forme −`(w) invariante h−, −iBw sur Bw telle que hc, ρ`(w) · ciBS(w) > 0 pour c ∈ Bw non nul, et que cette forme est symétrique et non dégénérée. On l’appellera également forme d’intersection. (Les énoncés considérés ci-dessous ne dépendent du choix de cette forme qu’à un scalaire positif près, de sorte qu’on peut la fixer de façon arbitraire.) 2.4. Énoncés Si B est un bimodule de Soergel, on posera B := B ⊗R R, où R est vu comme un R-module à gauche gradué de la façon standard. Si h−, −iB est une forme invariante sur B, elle induit une forme R-bilinéaire graduée sur B, qu’on notera de la même façon. Notons que, pour tout x ∈ Rn , le morphisme x · (−) : B → B(n) est autoadjoint pour toute telle forme. Les résultats principaux de [10] peuvent s’énoncer de la façon suivante. Théorème 2.7. — 1. La conjecture 1.11 est vraie pour la représentation V , c’està-dire ch∆ (Bw ) = H w pour tout w ∈ W . 2. Pour tout w ∈ W , la donnée de Lefschetz (Bw , ρ · (−)) vérifie le théorème de Lefschetz difficile. 3. Pour tout w ∈ W , la donnée de Hodge-Riemann (Bw , ρ · (−), h−, −iBw ) vérifie les relations de Hodge-Riemann. Notons que, d’après le lemme 2.1, l’énoncé (3) du théorème 2.7 implique l’énoncé (2) ; cependant cette propriété joue un rôle crucial dans la preuve de l’énoncé (3) et mérite donc d’être énoncée explicitement. D’autre part, l’énoncé (1) est nécessaire pour fixer la forme h−, −iBw , et donc pour que l’énoncé (3) ait un sens. Les trois propriétés énoncées dans le théorème 2.7 sont démontrées simultanément par Elias-Williamson, par récurrence sur la longueur de w. Pour expliquer cette preuve, on dira que la conjecture de Soergel, resp. le théorème de Lefschetz difficile, resp. les relations de Hodge-Riemann, sont vérifiés en longueur ≤ n si l’énoncé (1), resp. (2), resp. (3), du théorème 2.7 est vérifié pour tout w ∈ W tel que `(w) ≤ n. La première étape de la preuve est le résultat suivant.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
149
Proposition 2.8. — Soit n ≥ 0, et supposons que la conjecture de Soergel, le théorème de Lefschetz difficile et les relations de Hodge-Riemann sont vérifiés en longueur ≤ n. Supposons d’autre part que pour tout w ∈ W tel que `(w) = n et tout s ∈ S tel que ws > w la donnée de Hodge-Riemann (Bw Bs , ρ · (−), h−, −iBw Bs ) vérifie les relations de Hodge-Riemann, où h−, −iBw Bs est définie comme au lemme 2.5 à partir des formes d’intersection sur Bw et Bs . Alors la conjecture de Soergel, le théorème de Lefschetz difficile et les relations de Hodge-Riemann sont vérifiés en longueur ≤ n + 1. Idée de preuve. — Soit x ∈ W avec `(x) = n + 1, et écrivons x = ys avec s ∈ S et `(y) = n. D’après une idée de Soergel (voir [33, Lemma 7.1(2)]), puisque la conjecture 1.11 est vraie en longueur ≤ `(y), pour démontrer que ch∆ (Bx ) = H x il suffit de montrer que pour tout z < x la forme bilinéaire sur HomB (Bz , By Bs ) définie par la composition (4)
HomB (Bz , By Bs ) ⊗R HomB (By Bs , Bz ) → HomB (Bz , Bz ) = R (où HomB (By Bs , Bz ) est identifié à HomB (Bz , By Bs ) via f 7→ f ∗ , où l’adjoint est pris par rapport aux formes d’intersection sur Bz et By Bs ) est non dégénérée. Elias-Williamson démontrent alors (voir [10, Theorem 4.1]) qu’il existe une injection −`(z) HomB (Bz , By Bs ) ,→ By Bs dont l’image est contenue dans la partie primitive de (By Bs )−`(z) (c’est-à-dire le noyau de ρ`(z)+1 · (−)) et qui est une isométrie à un scalaire positif près, où HomB (Bz , By Bs ) est muni de la forme bilinéaire considérée ci-dessus et (By Bs )−`(z) de la « forme de Lefschetz » (x, y) 7→ hρ`(z) x, yiBy Bs . Puisque la restriction d’une forme définie positive ou négative à un sous-espace est non dégénérée, les relations de Hodge-Riemann sur By Bs impliquent alors que notre forme sur HomB (Bz , By Bs ) est non dégénérée, ce qui implique la conjecture de Soergel pour l’élément x. Puisque les relations de Hodge-Riemann sont vérifiées sur By Bs , le théorème de Lefschetz difficile est vrai pour cet espace par le lemme 2.1. Ceci implique le théorème de Lefschetz difficile pour son sous-espace Bx . Les relations de Hodge-Riemann se transmettent également clairement de By Bs à Bx , puisque la restriction de h−, −iBy Bs à Bx coïncide avec h−, −iBx à un scalaire strictement positif près (voir notamment le lemme 2.6) et puisque le degré minimal en lequel ces espaces sont non nuls est le même (à savoir −n − 1), voir la remarque 1.10(1). La proposition 2.8 ramène la preuve du théorème 2.7 à la preuve des relations de Hodge-Riemann pour Bw Bs quand ws > w, sous l’hypothèse que la conjecture de Soergel, le théorème de Lefschetz difficile et les relations de Hodge-Riemann sont
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
150
S. RICHE
connus en longueur ≤ `(w). La preuve de cette propriété utilise une factorisation de l’opérateur de Lefschetz (c’est-à-dire la multiplication par ρ) construite à partir des complexes de Rouquier, comme expliqué dans le paragraphe suivant. 2.5. Complexes de Rouquier Pour tout s ∈ S, on note Fs le complexe m
s R(1) → 0 → · · · · · · → 0 → Bs −−→
∈ C b (B),
où Bs est en degré cohomologique 0 et le morphisme ms : Bs → R(1) est défini par r ⊗ r0 7→ rr0 . Pour tout mot w = (s1 , . . . , sn ) en S, on définit alors le complexe Fw := Fs1 ⊗R · · · ⊗R Fsn . Pour éviter les confusions avec la Z-graduation des bimodules, on notera nFw pour le terme en degré cohomologique n du complexe Fw . La propriété cruciale de ces complexes (qu’on n’utilisera pas dans la preuve ci-dessous) est due à Rouquier (voir [27, Proposition 9.4 et §9.3]) et affirme que, si w est une expression réduite, alors l’image de Fw dans la catégorie homotopique K b (B) ne dépend que de l’image de w dans W , à isomorphisme canonique près. Une propriété que nous utiliserons ci-dessous, et qui est beaucoup plus facile à vérifier (par exemple par récurrence sur la longueur), est que pour toute expression réduite w d’image w dans W on a ( R(−`(w)) si i = 0 ; i (7) H (Fw ⊗R R) = 0 sinon. L’énoncé suivant joue un rôle crucial dans la preuve présentée au §2.6 (14). Dans cet énoncé, on notera M pour le morphisme idM . Lemme 2.9. — Soit n ≥ 1. Supposons la conjecture de Soergel connue en longueur ≤ n. Supposons de plus que pour tout y ∈ W tel que `(y) ≤ n − 2 et tout s ∈ S tel que ys > y, le triplet (By Bs , ρ · (−), h−, −iBy Bs ) vérifie les relations de Hodge-Riemann (15) (où la forme invariante sur By Bs est celle fournie par le lemme 2.5 à partir des formes d’intersection sur By et Bs ). Soit w ∈ W de longueur n, et soit w une expression réduite pour w. Alors il existe un bimodule de Soergel D muni d’une forme invariante symétrique non dégénérée h−, −iD et un morphisme d : Bw → D(1) tels que : (14)
Cet énoncé n’est pas utilisé sous cette forme dans la preuve originale de [10]. Il apparaît explicitement dans [39, 12] (où les hypothèses considérées ici sont connues d’après [10]), et permet de simplifier légèrement la preuve de [10], comme on le verra au §2.6. (15) Comme remarqué au §2.4, cette hypothèse entraîne que les relations de Hodge-Riemann sont connues en longueur ≤ n − 1.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
151
1. D est une somme directe de bimodules de la forme Bz avec z < w (sans décalage) ; 2. le degré minimal en lequel D est non nul est −n+1, et D est concentré en degrés de la même parité que −n + 1 ; 3. le triplet (D, ρ · (−), h−, −iD ) vérifie les relations de Hodge-Riemann ; 4. on a d∗ ◦ d = ρBw − Bw w−1 (ρ), où l’adjoint est pris par rapport à la forme d’intersection sur Bw et la forme h−, −iD sur D ; 5. il existe des inclusions scindées Bw ,→ 0Fw et D(1) ,→ 1Fw telles que le diagramme suivant est commutatif : d
Bw Fw
0
0
dFw
/ D(1) / 1Fw .
Démonstration. — On procède par récurrence sur n. Si n = 1 on a w = s ∈ S, et p p on peut choisir D = R et d = hρ, αs∨ ims . Ici l’adjoint de d est hρ, αs∨ iδs , où le morphisme δs : R → Bs (1) est défini par 1 δs (r) = r · (αs ⊗ 1 + 1 ⊗ αs ), 2 et il est facile de voir que (8)
ρBs − Bs s(ρ) = hρ, αs∨ iδs ◦ ms .
Supposons maintenant le résultat vérifié pour n, et vérifions-le pour n + 1. Soient w ∈ W de longueur n et w une expression réduite pour w, et soit s ∈ S tel que ws > w. On considère l’expression réduite ws de ws. Soient D, h−, −iD et d : Bw → D(1) comme dans l’énoncé (pour l’élément w), et notons a : Bw ,→ 0Fw et b : D(1) ,→ 1Fw des choix d’inclusions scindées telles que b ◦ d = 0dFw ◦ a. Écrivons D = D↑ ⊕ D↓ où D↑ , resp. D↓ , est une somme d’objets de la forme Bz avec zs > z, resp. avec zs < z. Puisque HomB (D↑ , D(D↓ )) = HomB (D↓ , D(D↑ )) = 0 d’après (4) et nos hypothèses, cette décomposition est automatiquement orthogonale pour h−, −iD . D’après (5) on a hw−1 ρ, αs∨ i > 0, de sorte qu’on peut définir le morphisme ! p hw−1 ρ, αs∨ iBw ms f := : Bw Bs → Bw (1) ⊕ DBs (1). dBs Il est facile de vérifier que si on munit Bw Bs de la forme h−, −iBw Bs fournie par le lemme 2.5, et Bw ⊕ DBs de la somme de la forme d’intersection de Bw et de la forme h−, −iDBs fournie par le lemme 2.5, on a ä Äp f∗ = hw−1 ρ, αs∨ iBw δs d∗ Bs ,
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
152
S. RICHE
de sorte qu’en utilisant une formule similaire à (8) on trouve que f ∗ ◦ f = ρBw Bs − Bw Bs (ws)−1 (ρ). De plus, on a un diagramme commutatif Bw Bs (9)
aBs 0
Fws
= 0Fw Bs
f å Ç0 Fws ms 0 dFws = 0 dFw Bs
/ Bw (1) ⊕ DBs (1) √ −11 hw
ρ,α∨ si
a(1) 0
0 / 1Fws = 0Fw (1) ⊕ 1Fw Bs .
!
bBs
Le bimodule gradué Bws est un facteur direct de Bw Bs d’après le lemme 1.7(2). La conjecture de Soergel en longueur ≤ n + 1 implique qu’on a Bw Bs ∼ = Bws ⊕ E, où E est une somme de termes de la forme Bz (sans décalage), et que de plus une telle décomposition est automatiquement orthogonale pour la forme h−, −iBw Bs (voir notamment (1), (4) et (6)). On peut supposer que la restriction de cette forme à Bws est h−, −iBws , et alors l’adjoint de l’inclusion Bws ,→ Bw Bs est la projection Bw Bs Bws orthogonale à E. Ainsi, si g : Bws → Bw (1) ⊕ DBs (1) est la composée de f et de cette inclusion, on a (10)
g ∗ ◦ g = ρBws − Bws (ws)−1 (ρ),
et un analogue du diagramme commutatif (9). Pour conclure, il nous reste maintenant à « simplifier » le terme Bw (1) ⊕ DBs (1) de sorte qu’il satisfasse les conditions de l’énoncé. La commutativité de (9), le fait que 1dFws ◦ 0dFws = 0 et l’injectivité de b impliquent que la composée de g avec le morphisme Ç
(11)
d(1) Dms (1) 0 1dFw ◦(bBs )
å
Bw (1) ⊕ DBs (1) −−−−−−−−−−−−−→ D(2) ⊕ 2 Fw Bs
est nulle. Le bimodule DBs se décompose en une somme orthogonale D↑ Bs ⊕ D↓ Bs . Ici on a D↓ Bs ∼ = D↓ (−1) ⊕ D↓ (1) d’après le lemme 1.7(1), et cette décomposition D↓ m
s peut être choisie de telle sorte que la composée D↓ (1) ,→ D↓ Bs −−−−→ D↓ (1) est l’identité (voir la preuve de [10, Lemma 6.5]). Ainsi il existe des facteurs directs de Bw (1) ⊕ DBs (1) et D(2) ⊕ 2 Fw Bs qui s’identifient à D↓ (2), et tels que le facteur de l’application considérée dans (11) sur ces termes s’identifie à idD↓ (2) . Ceci implique que l’application g s’écrit comme la composée (16) de son facteur h : Bws → Bw (1) ⊕ D↑ Bs (1) ⊕ D↓ par le morphisme Bw (1) ⊕ D↑ Bs (1) ⊕ D↓ → Bw (1) ⊕ D↑ Bs (1) ⊕ D↓ ⊕ D↓ (2)
(16)
Cet argument est un cas particulier du procédé d’élimination gaussienne qui permet, dans un id
complexe, d’éliminer un facteur direct de la forme M −→ M sans changer le complexe à homotopie près.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
153
id donné par −γ , où γ est la composée de l’inclusion Bw (1) ⊕ D↑ Bs (1) ⊕ D↓ ,→ Bw (1) ⊕ DBs (1), suivie de (11), puis de la projection sur D↓ (2). On remplace alors g par h, et on obtient un diagramme similaire à (9) (où le terme en haut à droite est maintenant Bw (1) ⊕ D↑ Bs (1) ⊕ D↓ , et où la flèche de droite a été modifiée de la façon appropriée). Maintenant, on remarque que HomB (Bws , D↓ ) = 0 d’après (4), de sorte qu’on doit avoir h(Bws ) ⊂ Bw (1) ⊕ D↑ Bs (1), et qu’on peut donc considérer h comme un morphisme Bws → Bw (1) ⊕ D↑ Bs (1). On a alors h∗ ◦ h = ρBws − Bws (ws)−1 (ρ); en effet, cela découle de (10) et du fait que la composante de g donnée par un morphisme Bws → D↓ est nulle et que la composante de g ∗ donnée par un morphisme D↓ (2) → Bws (2) également (pour la même raison que ci-dessus). Pour conclure, il reste à voir que notre bimodule Bw ⊕ D↑ Bs vérifie les conditions (1)–(3). Pour (1), cela découle de la conjecture de Soergel en longueur ≤ n et (1), qui montrent que D↑ Bs est une somme d’objets Bz avec z < ws. La condition (2) est claire puisque le degré minimal en lequel Bw , resp. D↑ , est non nul est −n, resp. ≥ −n + 1. En ce qui concerne (3), pour le facteur Bw cela découle de nos hypothèses (voir la note (15)). Pour D↑ Bs , on remarque qu’on a une décomposition orthogonale M D↑ = Vy ⊗R By `(y)≤n−1 `(y)≡−n+1 (mod 2) ys>y
où chaque By est muni de sa forme d’intersection et Vy := HomB (By , D↑ ) est muni −n+1+`(y) 2 d’une forme bilinéaire symétrique (−1) -définie. Donc la propriété voulue découle de nos hypothèses sur les bimodules By Bs . Remarque 2.10. — Dans [10] les auteurs prouvent des résultats plus forts sur les complexes Fw (mais qui ne sont pas nécessaires à la preuve du théorème 2.7). Ils démontrent notamment que pour tout w ∈ W et toute expression réduite w pour w, si la conjecture de Soergel est connue pour tous les éléments y ≤ w, il existe un facteur direct Fw0 ⊂ Fw tel que l’inclusion est un isomorphisme dans K b (B), et tel que pour tout i, iFw0 est une somme d’objets de la forme Bz (i) avec z ∈ W ; voir [10, Theorem 6.9]. En utilisant cela et le théorème 2.7, on peut démontrer que si on écrit P −1 Hw = ], alors (−1)`(w)−`(y) gy,w ∈ Z≥0 [v] pour y gy,w · H y avec gy,w ∈ Z[v, v tous y, w ∈ W (voir [10, Remark 6.10]). Cette propriété a été étendue à un cadre « tordu » par Gobet [14] pour démontrer une conjecture combinatoire de Dyer.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
154
S. RICHE
2.6. Preuve du théorème 2.7 La preuve du théorème 2.7 va se faire par récurrence sur `(w). Elle nécessite encore un ingrédient : la déformation. En fait, pour w ∈ W , s ∈ S et ζ ∈ R≥0 , on considère « l’opérateur de Lefschetz déformé » Lw,s := (ρ · (−))Bs + Bw (ζρ · (−)) : Bw Bs → Bw Bs (2). ζ On notera de même le morphisme induit de Bw Bs vers Bw Bs (2). Des calculs explicites et relativement élémentaires montrent les résultats suivants (voir [10, Theorem 5.1] pour (1) et [10, Theorem 6.19] pour (2)). Proposition 2.11. — 1. Soient w ∈ W et s ∈ S. Supposons la conjecture de Soergel et les relations de Hodge-Riemann vérifiées pour w. Alors le triplet (Bw Bs , Lw,s ζ , h−, −iBw Bs ) vérifie les relations de Hodge-Riemann si ζ 0. 2. Supposons que ζ > 0, et soient w ∈ W et s ∈ S. Si ws < w et si le théorème de Leftschetz difficile est vérifié pour w, alors (Bw Bs , Lw,s ζ ) vérifie le théorème de Lefschetz difficile. On peut maintenant donner la preuve du théorème 2.7. En fait on va démontrer par récurrence sur n ∈ Z≥0 que : 1. la conjecture de Soergel, le théorème de Lefschetz difficile et les relations de Hodge-Riemann sont vrais en longueur ≤ n ; 2. pour tout ζ ≥ 0, tout w ∈ W et tout s ∈ S tels que ws > w et `(ws) ≤ n, le triplet (Bw Bs , Lw,s ζ , h−, −iBw Bs ) vérifie les relations de Hodge-Riemann (où, comme d’habitude, la forme h−, −iBw Bs est celle fournie par le lemme 2.5 à partir des formes d’intersection sur Bw et Bs ). Ces propriétés sont évidentes si n ∈ {0, 1}. On les suppose donc vérifiées pour un n ≥ 1. D’après la proposition 2.8, pour démontrer (1) en longueur n + 1 il suffit de vérifier que pour tout w ∈ W tel que `(w) = n et tout s ∈ S tel que ws > w la donnée de Hodge-Riemann (Bw Bs , ρ·(−), h−, −iBw Bs ) vérifie les relations de Hodge-Riemann. Puisque ρBw Bs = Lw,s 0 , ceci est un cas particulier de la propriété (2) au rang n + 1. Et pour démontrer cette propriété, d’après le corollaire 2.3 et la proposition 2.11(1), il suffit de vérifier que le couple (Bw Bs , Lw,s ζ ) vérifie le théorème de Lefschetz difficile pour tout ζ ≥ 0. Soient donc w ∈ W de longueur n, s ∈ S tel que ws > w, et ζ ≥ 0. Considérons tout d’abord le cas ζ = 0. Nos hypothèses permettent d’appliquer le lemme 2.9 à w : soient D, h−, −iD et d : Bw → D(1) les données fournies par ce lemme. D’après (5) on a hw−1 ρ, αs∨ i > 0, ce qui permet de considérer le morphisme
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
p d0 :=
hw−1 ρ, αs∨ iBw ms dBs
155
! : Bw Bs → Bw (1) ⊕ DBs (1)
(comme dans la preuve du lemme 2.9). Ce morphisme est compatible avec la différentielle en degré 0 d’un complexe de Rouquier associé à ws (au même sens que dans le lemme 2.9), de sorte que (7) implique que d0 := d0 ⊗R R est injectif en degrés ≤ n. On a également, pour les formes bilinéaires appropriées, (12)
(d0 )∗ ◦ d0 = ρBw Bs − Bw Bs (ws)−1 (ρ).
Comme dans la preuve du lemme 2.9, on a une décomposition canonique et orthogonale D = D↑ ⊕ D↓ où les facteurs directs de D↑ , resp. D↓ , sont de la forme Bz avec zs > z, resp. zs < z. On notera h−, −iD↑ et h−, −iD↓ les restrictions de h−, −iD à ces facteurs. On a également une décomposition non canonique et non orthogonale D↓ Bs ∼ = D↓ (1) ⊕ D↓ (−1) (voir le lemme 1.7(1)), qu’on peut choisir de telle sorte que D↓ m
s la composée D↓ (1) ,→ D↓ Bs −−−−→ D↓ (1) est l’identité. Dans la suite on fixe une telle décomposition. Notons que
(13)
hx, yiD↓ Bs = 0 pour x, y ∈ D↓ (1)
(où la forme h−, −iD↓ Bs est celle fournie par le lemme 2.5). En effet, la forme invariante h−, −iD↓ Bs définit un morphisme D↓ (1) ⊕ D↓ (−1) = D↓ Bs → D(D↓ Bs ) = D(D↓ (1) ⊕ D↓ (−1)) ∼ = D↓ (−1) ⊕ D↓ (1) (où on a fixé un isomorphisme D(D↓ ) ∼ = D↓ ). Le facteur de ce morphisme de D↓ (1) ↓ ↓ vers D(D (1)) ∼ = D (−1) doit être nul par (4), ce qui se traduit plus concrètement par (13). Une fois ces considérations établies, on peut considérer d0 comme un morphisme de Bw Bs vers Bw (1)⊕D↑ Bs (1)⊕D↓ (2)⊕D↓ . On notera d0 = d01 +d02 +d03 +d04 avec d0j un morphisme de Bw Bs vers le j-ième terme de cette décomposition, pour j ∈ {1, 2, 3, 4}, et on pose d0j := d0j ⊗R R. ◦i Soit maintenant i ≥ 0, et montrons que (Lw,s : (Bw Bs )−i → (Bw Bs )i est un 0 ) isomorphisme ou, de façon équivalente, est injective. Soit x ∈ (Bw Bs )−i . Si d04 (x) 6= 0, alors du théorème de Lefschetz difficile pour D↓ (qui est connu par récurrence) on ◦i déduit que ρi · d04 (x) 6= 0, donc que (Lw,s 0 ) (x) 6= 0. On pose maintenant E := Bw ⊕ D↑ Bs , E 0 := ker(d04 ), et on note ϕ := d01 + d02 : E 0 → E(1). Nous allons vérifier que ces données satisfont les conditions du lemme 2.4, ce qui achèvera la preuve du cas ζ = 0. En effet :
– E vérifie les relations de Hodge-Riemann grâce à nos hypothèses de récurrence, comme dans la preuve du lemme 2.9 ;
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
156
S. RICHE
– par le même argument « d’élimination gaussienne » que dans la preuve du lemme 2.9, on peut construire un diagramme commutatif similaire à (9) dans lequel la première ligne est d01 ⊕d02 ⊕d04 : Bw Bs → Bw (1)⊕D↑ Bs (1)⊕D↓ ; comme pour d0 cela implique que d01 ⊕ d02 ⊕ d04 est injectif en degrés ≤ n (donc a fortiori en degrés ≤ −1), puis que ϕ possède également cette propriété ; – ϕ commute aux opérateurs de Lefschetz car cette application est obtenue à partir d’un morphisme de bimodules ; – pour x, y ∈ E 0 , on a hϕ(x), ϕ(y)iE = hd01 (x), d01 (y)iBw + hd02 (x), d02 (y)iD↑ Bs (13)
(12)
= hd0 (x), d0 (y)iBw ⊕DBs = hx, Lw,s 0 (y)iE 0 .
La preuve dans le cas ζ > 0 est basée sur les mêmes idées, mais dans ce cas on ne peut pas utiliser la décomposition D↓ Bs ∼ = D↓ (1) ⊕ D↓ (−1) car elle n’est pas compatible avec l’opérateur de Lefschetz déformé. On considère encore le morphisme d : Bw → D(1) fourni par le lemme 2.9, et on pose ! p hw−1 ρ, αs∨ i + ζhρ, αs∨ iBw ms f := : Bw Bs → Bw (1) ⊕ DBs (1). dBs On peut alors vérifier que f ∗ ◦ f = Lw,s − Bw Bs (sw−1 (ρ) + ζs(ρ)) ζ (où les formes invariantes sont choisies comme dans le lemme 2.9) et que, si L est l’opérateur sur Bw (1) ⊕ DBs (1) donné par ρBw (1) sur Bw (1) et par = L ◦ f où f := f ⊗R R. On ρDBs (1) + ζDρBs (1) sur DBs (1), on a f ◦ Lw,s ζ conclut encore une fois en utilisant le lemme 2.4. (Pour vérifier les relations de Hodge-Riemann sur DBs , on utilise les mêmes arguments que dans la preuve du lemme 2.9 pour se ramener au cas d’un bimodule By Bs . Dans ce cas, si ys > y on utilise l’hypothèse de récurrence. Et si ys < y on utilise les deux énoncés de la proposition 2.11 et le corollaire 2.3.)
3. APPLICATIONS EN COMBINATOIRE ET THÉORIE DES REPRÉSENTATIONS 3.1. Positivité des polynômes de Kazhdan-Lusztig Soit (W, S) un système de Coxeter. La première application des résultats de [10] est l’énoncé suivant, qui avait été conjecturé par Kazhdan-Lusztig dans [18, commentaire précédant la définition 1.2]. (Le fait que la conjecture 1.11 implique ces énoncés avait déjà été remarqué dans [33].)
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
157
Théorème 3.1. — 1. Pour tous w, y ∈ W , on a hy,w ∈ Z≥0 [v]. 2. Pour tous x, y, z ∈ W , on a µzx,y ∈ Z≥0 [v, v−1 ]. Démonstration. — D’après la proposition 1.1 il existe une représentation V de W qui vérifie les conditions de la partie 2. Alors (1) découle de la conjecture 1.11 et de la définition de ch∆ . Le point (2) découle également directement de la conjecture 1.11 et du fait que l’isomorphisme du théorème 1.4 respecte la structure d’algèbre. 3.2. Preuve algébrique de la conjecture de Kazhdan-Lusztig Pour toutes les notions considérées dans cette sous-partie, on renvoie à [17]. Soit g une algèbre de Lie semisimple complexe, soit b ⊂ g une sous-algèbre de Borel, et soit h ⊂ b une sous-algèbre de Cartan. Soient W le groupe de Weyl associé, et S ⊂ W le sous-ensemble des réflexions simples, de sorte que (W, S) est un système de Coxeter (voir le §1.1). Si hR ⊂ h est le sous-R-espace vectoriel engendré par les coracines, alors la conjecture de Soergel est connue pour l’action de W sur (hR )∗ par le théorème 2.7. On peut facilement en déduire cette conjecture pour l’action de W sur h∗ , voir par exemple [33, Bemerkung 6.15]. On notera w0 ∈ W l’unique élément de plus grande longueur. Considérons la catégorie O de Bernstein-Gelfand-Gelfand associée, et notons O0 son bloc de 0, c’est-à-dire la sous-catégorie pleine constituée des modules sur lesquels l’annulateur du module trivial C dans le centre de U (g) agit de façon nilpotente. Notons ρ la demi-somme des racines positives de g déterminées par b et, pour tout w ∈ W , par Mw le module de Verma de plus haut poids w−1 (ρ) − ρ et par Lw son unique quotient simple. Ces objets appartiennent à O0 , et {Lw : w ∈ W } est un système de représentants des classes d’isomorphisme d’objets simples dans O0 . Il est bien connu que la catégorie O0 a assez d’objets projectifs, et on notera P la couverture projective de Lw0 = Mw0 . La deuxième application principale des résultats de [10] est une preuve algébrique du résultat suivant, qui avait été conjecturé par Kazhdan-Lusztig dans [18, Conjecture 1.5] (17) et démontré en utilisant des méthodes géométriques par BrylinskiKashiwara [6] et Be˘ılinson-Bernstein [3] indépendamment. Théorème 3.2. — Pour tous y, w ∈ W , la multiplicité de Lw comme facteur de composition de My est hy,w (1). (17)
La normalisation des modules Mw et Lw dans [18] est différente de celle adoptée ici. Pour comparer le théorème 3.2 à [18, Conjecture 1.5] il faut remarquer que hy,w = hy−1 ,w−1 = hw0 yw0 ,w0 ww0 pour tous y, w ∈ W .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
158
S. RICHE
Dans le reste de ce paragraphe, on donne un aperçu de cette preuve (inspiré de la partie « algébrique » de [29], mais légèrement différente (18)). Notons C le quotient de Sym(h) par l’idéal engendré par les éléments homogènes W -invariants de degré strictement positif (19). La première étape consiste à construire un isomorphisme d’algèbres canonique ∼
C− → HomO0 (P, P ) ;
(14)
voir [29, Endomorphismensatz 7] pour la preuve originale de cet énoncé (due à Soergel et basée sur des idées de « déformation » de la catégorie O ) et [1, §4] pour une preuve plus simple due à Bernstein. Une fois ce fait établi, on peut considérer le foncteur V : O0 → C − Mod,
M 7→ HomO0 (P, M ).
Lemme 3.3. — Pour tous M, N ∈ O0 projectifs, le foncteur V induit une injection HomO0 (M, N ) ,→ HomC (V(M ), V(N )). Démonstration. — Puisque N est projectif, son socle est une somme directe de copies de Lw0 (voir [17, Corollary 4.8]). En particulier, tout sous-module non nul de N admet Lw0 comme facteur de composition, et n’est donc pas annulé par V. Il s’ensuit que si f : M → N est non nul alors V(f ) est non nul, ce qui prouve l’injectivité voulue. On introduit ensuite, pour tout s ∈ S, le foncteur de « croisement de mur » ϑs : O0 → O0 Tµ0 T0µ
donné par une composée où µ est un caractère entier de h dans l’adhérence de la chambre de Weyl dominante et qui appartient à l’hyperplan orthogonal à la racine associée à s et passant par −ρ mais à aucun autre hyperplan de ce type (voir par exemple [17, §7.15]). On peut alors construire un isomorphisme de foncteurs V ◦ ϑs ∼ = R ⊗R s V en considérant un analogue « singulier » de l’isomorphisme (14) (voir par exemple [1, p. 422]) et sa compatibilité avec (14) via le foncteur de translation (voir par exemple [29, Theorem 8]) puis des arguments généraux, voir [29, Theorem 10]. Puisque les objets projectifs de O0 se déduisent de Me (dont l’image par V est le module trivial C) en appliquant les foncteurs ϑs et en prenant des facteurs directs, on en déduit que la restriction de V aux objets projectifs prend ses valeurs dans les modules de Soergel (voir le §1.7), puis en comparant les dimensions d’espaces (18)
Cette simplification de la preuve est rendue possible par les résultats de [33], qui n’étaient pas disponibles au moment où [29] a été publié. (19) Dans [29], Soergel appelle cette algèbre l’algèbre coinvariante de W . Comme il l’a remarqué plus tard, bien qu’il se soit imposé dans la littérature, ce nom ne semble pas opportun dans la mesure où il ne respecte pas l’usage habituel du mot « coinvariant ».
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
159
de morphismes (voir notamment (2) et la proposition 1.13) que cette restriction est pleinement fidèle et envoie la couverture projective Pw de Lw sur Bw ⊗R C. Si on note Proj(O0 ) la catégorie des objets projectifs dans O0 et B0 la catégorie des modules de Soergel (non gradués) on obtient alors un diagramme commutatif d’isomorphismes [V]
[Proj(O0 )]
/ [B0 ]
∼ ∼
[M ]7→
P
w (M :Mw )·w
(
Z[W ]
w
∼
où la flèche de droite est induite par l’isomorphisme du théorème 1.4. (Dans la flèche de gauche, on note (M : Mw ) la multiplicité de Mw dans une filtration standard de M ; voir [17, Theorem 3.10].) D’après la conjecture 1.11, la flèche de droite envoie la classe P de Bw ⊗R C sur y hy,w (1) · y, ce qui montre que (Pw : My ) = hy,w (1). On conclut en utilisant la formule de réciprocité, voir par exemple [17, §3.11].
4. VARIANTES : LE CAS LOCAL ET LE CAS RELATIF Les résultats présentés en partie 2 forment la théorie de Hodge « globale » des bimodules de Soergel. Dans [39] et [12], les auteurs développent des versions « locale » et « relative » de cette théorie, et en déduisent des applications en combinatoire et en théorie des représentations. Dans cette partie on se place sous les mêmes hypothèses que dans la partie 2. 4.1. Cas local Dans cette sous-partie, on suppose de plus qu’il existe un élément ρ∨ ∈ V tel que pour w ∈ W et s ∈ S on a hw(ρ∨ ), αs i > 0
⇔
sw > w.
(Cette hypothèse est satisfaite dans les deux exemples de la proposition 1.1.) Pour w ∈ W et B dans B, on note Γw (B) := B ⊗R⊗R R O (Gr(w)). On note Γw (−) pour Γ{w} (−), et on considère la composée w iB w : Γw (B) ,→ B Γ (B),
qu’on verra comme un morphisme de R-modules gradués à gauche. Il n’est pas très difficile de voir que si Q est la localisation de R en tous les éléments de la forme y(αs ) pour s ∈ S et y ∈ W , alors Q ⊗R iB w est un isomorphisme. En particulier, si on fixe
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
160
S. RICHE
une indéterminée z (de degré 2) et si on considère R[z] comme un R-module gradué via ξ 7→ hξ, ρ∨ i · z pour ξ ∈ V ∗ , alors l’application w R[z] ⊗R iB w : R[z] ⊗R Γw (B) → R[z] ⊗R Γ (B)
est injective. On note Hx,y := coker(R[z] ⊗R iBx y )(−1). Le premier résultat important de [39] (conjecturé par Soergel, voir [33, Bemerkung 7.2], et motivé par « l’exemple fondamental » de Bernstein-Lunts [2, Chapter 14]) est que ces modules vérifient une version du théorème de Leftschetz difficile, comme suit. Théorème 4.1. — Pour tout i ≥ 0, la multiplication par z i induit un isomorphisme ∼ (Hx,y )−i − → (Hx,y )i . L’intérêt principal de ce résultat est qu’il permet de donner une preuve algébrique de la conjecture de Jantzen concernant la « filtration de Jantzen » des modules de Verma. (Voir [17, §8.12] pour une discussion de cette conjecture, et [39, §1.4–1.5] pour une discussion du lien entre le théorème 4.1 et cette conjecture, qui repose sur des travaux de Soergel [34] et Kübel [20, 21].) La preuve du théorème 4.1 repose sur le même genre d’arguments que celle de [10]. Elle démontre simultanément une version des relations de Hodge-Riemann, qu’on explique maintenant. Les mêmes considérations que dans la partie 2 montrent qu’il existe une unique forme R-bilinéaire graduée symétrique non dégénérée h−, −i0By : By × By → R qui vérifie hra, bi0By = ha, rbi0By = rha, bi0By et har, bi0By = ha, bri0By pour tous a, b ∈ By et r ∈ R. En restreignant cette forme à Γx (By ), puis en tensorisant par R[z], et enfin en identifiant R[z, z −1 ] ⊗R Γx (By ) à B R[z, z −1 ] ⊗R Γx (By ) via R[z, z −1 ] ⊗R ix y , on obtient une forme bilinéaire h−, −ixy : (R[z] ⊗R Γx (By )) × (R[z] ⊗R Γx (By )) → R[z, z −1 ]. Pour i ≥ 0, on définit la partie primitive P −i ⊂ (R[z] ⊗R Γx (By ))−i comme l’orthogonal (pour h−, −ixy ) du sous-module de R[z] ⊗R Γx (By ) engendré par les éléments de degré < −i. La version « locale » des relations de Hodge-Riemann démontrée dans [39] est la suivante. Théorème 4.2. — Pour tout i > 0, la forme bilinéaire symétrique (−, −)i : P −i × P −i → R définie par (a, b)i := z i ha, bixy est (−1)`(x)+ en lequel R[z] ⊗R Γx (By ) est non nul.
ASTÉRISQUE 414
−i−min 2
-définie, où min est le degré minimal
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
161
4.2. Cas relatif Maintenant que la conjecture 1.11 est connue, les formules (4) s’appliquent pour tous x, y ∈ W . On dira qu’un objet B de B est pervers (20) s’il est une somme directe d’objets Bx (sans décalage). Dans ce cas, comme déjà utilisé dans la preuve du lemme 2.9, les propriétés (4) montrent que si on pose Vx := HomB (Bx , B) il existe un isomorphisme canonique M ∼ Vx ⊗R Bx − → B. x∈W
De plus, tout objet B de B admet une filtration exhaustive canonique (et fonctorielle) · · · ⊂ τ≤i B ⊂ τ≤i+1 B ⊂ · · · par des inclusions scindées telles que τ≤i B/τ≤i−1 B (i) est pervers pour tout i ∈ Z. On pose alors H i (B) := τ≤i B/τ≤i−1 B (i), Hzi (B) := HomB (Bz , H i (B)). Tout morphisme f : B → B 0 (j) induit des morphismes H i (f ) : H i (B) → H i+j (B 0 ), qui sont « encodés » par des morphismes d’espaces vectoriels Hzi (f ) : Hzi (B) → Hzi+j (B 0 ). D’autre part, si B est dans B et si h−, −iB est une forme invariante sur B, les propriétés (4) montrent que cette forme induit un accouplement non dégénéré H i (B) × H −i (B) → R. Une fois fixées des formes d’intersection sur chaque Bx , cet accouplement est « encodé » par des accouplements Hzi (B) × Hz−i (B) → R, qu’on notera encore h−, −iB . Le résultat principal de [12] s’énonce de la façon suivante. Théorème 4.3. — Soient x, y, z ∈ W . L’opérateur L : Hz• (Bx By ) → Hz•+2 (Bx By ) induit par le morphisme Bx ρBy : Bx By → Bx By (2) vérifie le théorème de Lefschetz difficile, c’est-à-dire que pour tout i ≥ 0 il induit un isomorphisme ∼
L◦i : Hz−i (Bx By ) − → Hzi (Bx By ). De plus, ces données vérifient les relations de Hodge-Riemann au sens où la restriction de la forme bilinéaire symétrique sur Hz−i (Bx By ) définie par (x, y) 7→ hx, Li yiBx By 1 est (−1) 2 (`(x)+`(y)−`(z)−i) -définie. (Ici, la forme h−, −iBx By est celle obtenue par le lemme 2.5 à partir des formes d’intersection sur Bx et By .)
(20)
Cette terminologie est bien sûr motivée par le cas des systèmes de Coxeter cristallographiques ‹ présenté au §1.6 : dans ce cas les bimodules pervers correspondent aux faisceaux pervers dans B.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
162
S. RICHE
La preuve procède encore par récurrence (sur `(x) + `(y), puis sur `(y) à `(x) + `(y) fixé) en utilisant les morphismes du lemme 2.9. Elle nécessite de considérer également des opérateurs de la forme a · Bx ρBs By + b · Bx Bs ρBy : Bx Bs By → Bx Bs By (2) où a, b ∈ R>0 , x, y ∈ W et s ∈ S, dont les auteurs montrent qu’ils vérifient encore des versions appropriées du théorème de Leftschetz difficile et des relations de HodgeRiemann. La première application du théorème 4.3 considérée dans [12] est de nature combinatoire. Par définition, les coefficients µzx,y considérés au §1.1 vérifient X µzx,y = dim Hzi (Bx By ) · v−i . i∈Z
On déduit donc du théorème 4.3 le résultat suivant, qui était une conjecture « de folklore » dans la combinatoire de Kazhdan-Lusztig appelée « unimodalité des constantes de structure » ; voir par exemple [8]. Corollaire 4.4. — Si pour tout m ∈ Z≥1 on pose vm − v−m = v−m+1 + v−m+3 + · · · + vm−3 + vm−1 , v − v−1 alors pour tous x, y, z ∈ W on a M µzx,y ∈ Z≥0 · [m]. [m] =
m≥1
Une autre application du théorème 4.3 est proposée dans [12]. Elle concerne certaines catégories monoïdales associées aux cellules bilatères dans W définies par Lusztig (voir [24] pour la définition en toute généralité (21), qui repose sur la conjecture 1.11, et pour des références à la définition initiale). Le théorème 4.3 permet de montrer que ces catégories sont rigides et pivotales ; voir [12, §5.2] pour plus de détails.
RÉFÉRENCES [1] J. Bernstein – Trace in categories, in Operator algebras, unitary representations, enveloping algebras, and invariant theory (Paris, 1989), Progr. Math., vol. 92, Birkhäuser, 1990, p. 417–423. (21)
La définition de cette catégorie est expliquée dans [24] sous certaines hypothèses techniques. Cependant, Elias-Williamson remarquent dans [12] que la définition a un sens, et produit une catégorie monoïdale, même quand ces hypothèses ne sont pas connues.
ASTÉRISQUE 414
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
163
[2] J. Bernstein & V. Lunts – Equivariant sheaves and functors, Lecture Notes in Math., vol. 1578, Springer, 1994. [3] A. Be˘ılinson & J. Bernstein – Localisation de g-modules, C. R. Acad. Sci. Paris Sér. I Math. 292 (1981), no 1, p. 15–18. [4] R. Bezrukavnikov & Z. Yun – On Koszul duality for Kac-Moody groups, Represent. Theory 17 (2013), p. 1–98. [5] N. Bourbaki – Éléments de mathématique. Fasc. XXXIV : Groupes et algèbres de Lie. Chapitre IV : Groupes de Coxeter et systèmes de Tits. Chapitre V : Groupes engendrés par des réflexions. Chapitre VI : Systèmes de racines, Actualités Scientifiques et Industrielles, vol. 1337, Hermann, 1968. [6] J.-L. Brylinski & M. Kashiwara – Kazhdan-Lusztig conjecture and holonomic systems, Invent. math. 64 (1981), no 3, p. 387–410. [7] M. A. A. de Cataldo & L. Migliorini – The decomposition theorem, perverse sheaves and the topology of algebraic maps, Bull. Amer. Math. Soc. (N.S.) 46 (2009), no 4, p. 535–633. [8] F. du Cloux – Positivity results for the Hecke algebras of noncrystallographic finite Coxeter groups, J. Algebra 303 (2006), no 2, p. 731–741. [9] C. S. Dodd – Equivariant Coherent Sheaves, Soergel Bimodules, and Categorification of Affine Hecke Algebras, Thèse, Massachusetts Institute of Technology, 2011, arXiv:1108.4028. [10] B. Elias & G. Williamson – The Hodge theory of Soergel bimodules, Ann. of Math. 180 (2014), no 3, p. 1089–1136. [11] , Kazhdan-Lusztig conjectures and shadows of Hodge theory, in Arbeitstagung Bonn 2013, Progr. Math., vol. 319, Birkhäuser, 2016, p. 105–126. [12] , Relative hard Lefschetz for Soergel bimodules, prépublication arXiv:1607.03271. [13] P. Fiebig – The combinatorics of Coxeter categories, Trans. Amer. Math. Soc. 360 (2008), no 8, p. 4211–4233. [14] T. Gobet – Twisted filtrations of Soergel bimodules and linear Rouquier complexes, J. Algebra 484 (2017), p. 275–309. [15] R. Gordon & E. L. Green – Graded Artin algebras, J. Algebra 76 (1982), no 1, p. 111–137. [16] M. Härterich – Kazhdan-Lusztig-Basen, unzerlegbare Bimoduln und die Topologie der Fahnenmannigfaltigkeit einer Kac-Moody-Gruppe, thèse de doctorat, Universität Freiburg, 1999, https://freidok.uni-freiburg.de/ data/18. [17] J. E. Humphreys – Representations of semisimple Lie algebras in the BGG category O, Graduate Studies in Math., vol. 94, Amer. Math. Soc., 2008.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
164
S. RICHE
[18] D. Kazhdan & G. Lusztig – Representations of Coxeter groups and Hecke algebras, Invent. math. 53 (1979), no 2, p. 165–184. [19] M. Khovanov – Triply-graded link homology and Hochschild homology of Soergel bimodules, Internat. J. Math. 18 (2007), no 8, p. 869–885. [20] J. Kübel – From Jantzen to Andersen filtration via tilting equivalence, Math. Scand. 110 (2012), no 2, p. 161–180. [21]
, Tilting modules in category O and sheaves on moment graphs, J. Algebra 371 (2012), p. 559–576.
[22] S. Kumar – Kac-Moody groups, their flag varieties and representation theory, Progress in Math., vol. 204, Birkhäuser, 2002. [23] N. Libedinsky – Sur la catégorie des bimodules de Soergel, J. Algebra 320 (2008), no 7, p. 2675–2694. [24] G. Lusztig – Truncated convolution of character sheaves, Bull. Inst. Math. Acad. Sin. (N.S.) 10 (2015), no 1, p. 1–72. [25] S. Riche – Geometric representation theory in positive characteristic, thèse d’habilitation, Université Blaise Pascal, 2016, https://tel. archives-ouvertes.fr/tel-01431526. [26] S. Riche & G. Williamson – Tilting modules and the p-canonical basis, Astérisque, vol. 397, 2018. [27] R. Rouquier – Categorification of sl2 and braid groups, in Trends in representation theory of algebras and related topics, Contemp. Math., vol. 406, Amer. Math. Soc., 2006, p. 137–167. [28]
, Categorification of the braid groups, arXiv:math/0409593, publié ultérieurement en tant que [27].
prépublication
[29] W. Soergel – Kategorie O, perverse Garben und Moduln über den Koinvarianten zur Weylgruppe, J. Amer. Math. Soc. 3 (1990), no 2, p. 421–445. [30]
, The combinatorics of Harish-Chandra bimodules, J. reine angew. Math. 429 (1992), p. 49–74.
[31]
, Kazhdan-Lusztig polynomials and a combinatoric[s] for tilting modules, Represent. Theory 1 (1997), p. 83–114.
[32]
, Langlands’ philosophy and Koszul duality, in Algebra—representation theory (Constanta, 2000), NATO Sci. Ser. II Math. Phys. Chem., vol. 28, Kluwer Acad. Publ., 2001, p. 379–414.
[33]
, Kazhdan-Lusztig-Polynome und unzerlegbare Bimoduln Polynomringen, J. Inst. Math. Jussieu 6 (2007), no 3, p. 501–525.
[34]
, Andersen filtration and hard Lefschetz, Geom. Funct. Anal. 17 (2008), no 6, p. 2066–2089.
ASTÉRISQUE 414
über
(1139)
LA THÉORIE DE HODGE DES BIMODULES DE SOERGEL
165
[35] T. A. Springer – Quelques applications de la cohomologie d’intersection, Séminaire Bourbaki, vol. 1981/1982, exposé no 589, Astérisque 92 (1982), p. 249– 273. [36] J. Tits – Groupes associés aux algèbres de Kac-Moody, Séminaire Bourbaki, vol. 1988/1989, exposé no 700, Astérisque 177-178 (1989), p. 7–31. [37] B. Webster & G. Williamson – A geometric model for Hochschild homology of Soergel bimodules, Geom. Topol. 12 (2008), no 2, p. 1243–1263. [38] G. Williamson – Singular Soergel bimodules, Int. Math. Res. Not. 2011 (2011), no 20, p. 4555–4632. [39]
, Local Hodge theory of Soergel bimodules, Acta Math. 217 (2016), no 2, p. 341–404.
[40]
, The Hodge theory of the decomposition theorem (after de Cataldo and Migliorini), Séminaire Bourbaki, vol. 2015/2016, exposé no 1115, Astérisque 390 (2017), p. 335–367.
[41]
, Schubert calculus and torsion explosion, J. Amer. Math. Soc. 30 (2017), n 4, p. 1023–1046. o
[42]
, The Hodge theory of the Hecke category, in European Congress of Mathematics, Eur. Math. Soc., 2018, p. 663–683.
Simon RICHE Laboratoire de Mathématiques Blaise Pascal UMR CNRS 6620 Université Clermont Auvergne Campus Universitaire des Cézeaux 3, place Vasarely TSA 60026 – CS 60026 F–63178 Aubière Cedex E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017-2018, no 1140, p. 167 à 204 doi:10.24033/ast.1084
Janvier 2018
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD [d’après Jacquet-Rallis, Waldspurger, W. Zhang, etc.] par Raphaël BEUZART-PLESSIS
INTRODUCTION Les conjectures de Gan-Gross-Prasad [17] ont deux aspects : local et global. Localement, celles-ci portent sur certaines lois de branchements entre représentations de groupes de Lie réels ou p-adiques tandis que globalement, elles caractérisent la non-annulation de certaines intégrales explicites de formes automorphes que l’on appelle communément des périodes (automorphes). Ce qui rend ces prédictions intéressantes est qu’elles font intervenir des invariants arithmétiques fins : facteurs epsilon locaux d’une part et valeurs de fonctions L automorphes en leur centre de symétrie d’autre part. Ces conjectures, qui portent sur tous les groupes classiques (unitaires d’espaces hermitiens ou antihermitiens, symplectiques et spéciaux orthogonaux ; ce dernier cas avait d’ailleurs été considéré bien avant par Gross et Prasad [25], [26]), ont connu de nombreux progrès récents. Plus précisément, la conjecture locale est maintenant démontrée dans presque tous les cas après le travail fondateur de Waldspurger [63], [66], [64], [65] et Mœglin-Waldspurger [45] suivi de l’auteur [7], [5], [6], [10], Gan-Ichino [19], Hiraku Atobe [4] et enfin Hongyu He [30]. La conjecture globale a quant à elle été établie pour les groupes unitaires d’espaces hermitiens sous certaines restrictions locales dans une percée de Wei Zhang [77] faisant suite aux travaux de Jacquet-Rallis [36] et Zhiwei Yun [75]. Des résutats analogues ont été obtenus pour les groupes unitaires d’espaces antihermitiens par Hang Xue [70] à la suite de Yifeng Liu [41]. Il existe aussi un raffinement de la conjecture globale, initialement dû à Ichino-Ikeda [34] dans le cas des groupes orthogonaux puis étendu aux groupes unitaires et symplectiques par Neal Harris [29] et Hang Xue [71] [73], sous la forme d’une identité reliant explicitement périodes et valeurs centrales de fonctions L automorphes. Ce ()
Ce travail a bénéficié d’une aide de l’Agence Nationale de la Recherche portant la référence ANR13-BS01-0012 FERPLAY.
© Astérisque 414, SMF 2019
168
R. BEUZART-PLESSIS
raffinement est maintenant lui aussi démontré pour les groupes unitaires sous certaines hypothèses locales après Wei Zhang [76], l’auteur [9] et Hang Xue [71], [72]. Dans ce texte, on se propose d’énoncer précisément ces conjectures et les résultats récents sus-mentionnés ainsi que de donner de brefs aperçus des preuves qu’il serait bien difficile de retranscrire fidèlement ici tant les techniques utilisées sont variées (formules des traces relatives, correspondance thêta, théorie de l’endoscopie...). De plus, comme nous l’avons déjà expliqué, ces conjectures portent sur tous les types de groupes classiques chacun ayant ses propres spécificités. Pour des raisons de place, on se concentrera sur le cas des groupes unitaires pour lesquels les résultats obtenus sont les plus exhaustifs. Enfin, on renvoie aussi à [16] pour une très bonne introduction à ce sujet (datant de 2013 cet article ne fait malheureusement pas mention des avancées les plus récentes). Les applications arithmétiques de ces conjectures ne seront pas discutées ici mais citons les travaux récents [27], [50] comme exemples de telles applications. On finit cette introduction en donnant deux exemples de résultats antérieurs qui sont des cas particuliers des conjectures de Gan-Gross-Prasad. Loi de branchement de U (n + 1) à U (n). — On commence par donner un exemple classique de loi de branchement (dû à H. Weyl [69]) constituant un cas particulier des conjectures locales. Pour tout entier k > 1, on notera U (k) := {g ∈ GLk (C); t gg = Ik } le groupe unitaire réel compact de rang k. Soit n > 1 un entier. On dispose d’un plongement naturel U (n) ,→ U (n + 1), g 7→ ( g 1 ) . Soit π une représentation complexe irréductible de U (n + 1). Une telle représentation est nécessairement de dimension finie (car U (n + 1) est compact) et on s’intéresse à la restriction de π à U (n). La description explicite de cette restriction, ou plutôt de sa décomposition en représentations irréductibles, constitue ce que l’on appelle une loi de branchement. Évidemment, toute réponse intelligible à ce problème nécessite de savoir paramétrer (ou nommer) de façon indépendante les représentations irréductibles (à isomorphisme près) de U (n) et U (n + 1). Une telle paramétrisation est précisément fournie par la théorie des plus hauts poids de Cartan-Weyl. Dans les cas qui nous intéressent cette théorie fournit des bijections naturelles Irr(U (n + 1)) ' {α = (α1 , . . . , αn+1 ) ∈ Zn+1 ; α1 > α2 > . . . > αn+1 } πα ←[ α Irr(U (n)) ' {β = (β1 , . . . , βn ) ∈ Zn ; β1 > β2 > . . . > βn } σβ ←[ β,
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
169
où Irr(U (n + 1)) et Irr(U (n)) désignent les ensembles de classes d’isomorphisme de représentations irréductibles complexes de U (n + 1) et U (n) respectivement. En utilisant ces paramétrisations, la solution au problème initial se formule ainsi (voir [24] Chap. 8 par exemple) : pour tout n + 1-uplet α = (α1 , . . . , αn+1 ) ∈ Zn avec α1 > α2 > . . . > αn+1 , on a M = πα | σβ . U (n)
β=(β1 ,...,βn )∈Zn α1 >β1 ...>αn >βn >αn+1
En d’autres termes : pour toute paire de représentations irréductibles (πα , σβ ) ∈ Irr(U (n + 1)) × Irr(U (n)) l’espace d’entrelacements HomU (n) (πα , σβ ) est de dimension au plus 1 et est non nul si et seulement si α et β satisfont la condition de branchement α1 > β1 . . . > βn > αn+1 . C’est sous cette forme que la conjecture locale de Gan-Gross-Prasad se généralise à des paires de groupes unitaires réels U (p, q) ⊂ U (p + 1, q) ou p-adiques U (W ) ⊂ U (V ) plus généraux. Plus précisément, on verra dans la section 1.3 que pour π et σ des représentations irréductibles (dans un sens à préciser) de U (p + 1, q) et U (p, q) l’espace d’entrelacements HomU (p,q) (π, σ) est toujours de dimension au plus un et qu’il en va de même si l’on considère des groupes unitaires p-adiques. La conjecture locale de Gan-Gross-Prasad donne alors (dans presque tous les cas) une condition nécessaire et suffisante, généralisant la relation de branchement ci-dessus, pour que cet espace soit non nul. La formule de Waldspurger pour les formes de Maass de niveau 1. — Énonçons maintenant un cas particulier d’un résultat de Waldspurger [61] dont les conjectures globales donnent une généralisation. Soit H := {z = x + iy ∈ C; y > 0} le demiplan de Poincaré et f : SL2 (Z)\H → C une forme de Maass propre de niveau 1. Rappelons ce que cela signifie : f est une fonction C ∞ (et même réelle) Ä 2 analytique ä ∂ ∂2 qui est vecteur propre du Laplacien hyperbolique ∆ := −y 2 ∂x + de valeur 2 ∂y 2 propre λ (i.e. ∆f = λf ), invariante pour l’action de SL2 (Z) par homographies (donnée N par ac db z := az+b pour cz+d ), à croissance modérée dans le sens où |f (x + iy)| Cy un certain N lorsque y → ∞ et propre pour tous les opérateurs de Hecke Tp , p un nombre premier, définis par p−1 X (Tp f )(z) = f ( p 1 ) z + f
1u p
z .
u=0
Puisque forme
( 10 11 ) z
= z + 1, une telle fonction admet un développement de Fourier de la f (x + iy) =
X
an (y)e2iπnx ,
x + iy ∈ H.
n∈Z
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
170
R. BEUZART-PLESSIS
De plus, l’équation différentielle vérifiée par f ainsi que la propriété de croissance modérée impliquent que les fonctions an (y) sont, pour n 6= 0, de la forme an (y) = √ an yKν (2π|n|y) où an ∈ C et Kν est une fonction de Bessel modifiée de deuxième espèce de paramètre ν ∈ C vérifiant λ = 14 − ν 2 . On suppose dorénavant f paire (i.e. f (−z) = f (z)) et cuspidale (i.e. a0 (y) = 0). On a alors a−n = an pour n 6= 0 et on définit la fonction L complétée de f par L(s, f ) = π −s Γ
∞ s + ν s − ν X an , Re(s) 1. Γ 2 2 ns n=1
Pour χ un caractère de Dirichlet quadratique vérifiant χ(−1) = −1 on définit aussi une fonction L complétée tordue par χ de la façon suivante L(s, f × χ) = π −s Γ
∞ s − 1 + ν s − 1 − ν X an χ(n) s , Re(s) 1. Γ 2 2 n n=1
Alors L(., f ) et L(., f × χ) admettent des prolongements holomorphes à C et satisfont les équations fonctionnelles L(1 − s, f ) = L(s, f ) et L(1 − s, f × χ) = L(s, f × χ). Soit F une extension quadratique imaginaire de Q de discriminant fondamental d (i.e. √ si F = Q[ d0 ] avec d0 un entier sans facteur carré alors d = d0 si d0 est congru à 1 modulo 4, 4d0 sinon). On appelle point de Heegner (relatif à F ) l’unique racine zd dans H d’un trinôme de la forme aX 2 + bX + c avec a, b, c ∈ Z vérifiant b2 − 4ac = d. On a alors la formule suivante, cas particulier d’un résultat de Waldspurger [61] : Ñ (1)
é2 X
f (zd )
zd /SL2 (Z)
p |d| 1 1 = L , f L , f × χd , 2 2 2
où la somme porte sur l’ensemble des orbites sous SL2 (Z) de points de Heegner et χd désigne l’unique caractère de Dirichlet quadratique de conducteur |d| vérifiant χd (−1) = −1. Appliquée à ce cas particulier la conjecture globale de Gan-Gross-Prasad prédit (à quelques nuances près) l’équivalence X zd /SL2 (Z)
1 1 f (zd ) 6= 0 ⇔ L( , f )L( , f × χd ) 6= 0, 2 2
tandis que le raffinement de la conjecture globale par Ichino et Ikeda permet de retrouver directement la formule (1).
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
171
1. LA CONJECTURE LOCALE 1.1. Les groupes Soit E/F une extension quadratique de corps locaux de caractéristique nulle. On a donc soit E/F = C/R soit que E et F sont des extensions finies du corps des nombres p-adiques Qp pour un certain nombre premier p (Qp est le complété de Q pour la valeur absolue p-adique |.|p définie par |pk ab |p = p−k pour a et b des entiers premiers à p). On note σ l’unique élément non trivial du groupe de Galois Gal(E/F ) et sgnE/F le caractère quadratique de F × associé à l’extension E/F par la théorie du corps de classe (c’est donc l’unique caractère quadratique de noyau l’image de la norme NE/F (E × )). Enfin, on fixera deux caractères additifs non triviaux ψ0 : F → S1 et ψ : E → S1 avec la propriété que ψ est trivial sur F . Soit V un espace vectoriel de dimension finie n sur E et ε ∈ {±1}. On suppose V muni d’une forme ε-hermitienne non dégénérée h., .i : V × V → E. Par définition une forme ε-hermitienne vérifie hλv + µw, ui = λhv, ui + µhw, ui hv, ui = εhu, viσ pour tous u, v, w ∈ V et λ, µ ∈ E. Suivant que ε = 1 ou −1 on parlera aussi d’espace hermitien ou antihermitien. On se donne un sous-espace W de V non dégénéré pour h., .i vérifiant la condition suivante ( 1, si ε = 1; dim(V ) − dim(W ) = 0, si ε = −1. Soient U (V ) ⊂ GL(V ) et U (W ) ⊂ GL(W ) les sous-groupes algébriques (définis sur F ) des automorphismes linéaires de V et W respectivement qui préservent la forme h., .i. Alors U (V ) et U (W ) sont des groupes unitaires et on dispose d’un plongement naturel U (W ) ,→ U (V ) où U (W ) agit trivialement sur W ⊥ (qui est de dimension au plus 1). Dans toute la suite on identifiera (abusivement) un groupe algébrique défini sur F avec le groupe des F -points lui correspondant. La discussion qui suit s’étend aussi au cas où E = F × F muni de l’involution σ(x, y) = (y, x), cas qu’il sera de toute façon nécessaire d’inclure lorsque l’on traitera la conjecture globale. Dans une telle situation, une forme non dégénérée h., .i comme ci-dessus identifie V et W à des sommes directes V0 ⊕V0∨ et W0 ⊕W0∨ où W0 ⊂ V0 sont des espaces vectoriels de dimensions finies sur F et V0∨ , W0∨ désignent leurs duaux. On a alors des identifications naturelles U (V ) ' GL(V0 ) et U (W ) ' GL(W0 ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
172
R. BEUZART-PLESSIS
Dans tous les cas, on pose G = U (W ) × U (V ), H = U (W ) et on plonge H dans G de façon diagonale. Les groupes H et G héritent du corps F de topologies qui en font des groupes de Lie dans le cas archimédien (i.e. lorsque F = R) et des groupes localement profinis dans le cas non archimédien (i.e. lorsque F est une extension finie de Qp ; rappelons qu’un groupe topologique est localement profini s’il possède une base de voisinages de l’élément neutre formée de sous-groupes compacts). 1.2. Le problème de restriction Soit (π, V ) une représentation complexe lisse et irréductible de G. Dans le cas p-adique, cela signifie que π est une représentation de G sur un C-espace vectoriel V (typiquement de dimension infinie) dont tous les vecteurs ont un stabilisateur ouvert, l’irréductibilité est alors une notion algébrique (i.e. aucun sous-espace non trivial stable par G). Dans le cas archimédien, cela signifie que V est un espace de Fréchet et que π est une représentation lisse (au sens C ∞ ), admissible (i.e. les représentations irréductibles d’un sous-groupe compact maximal apparaissent avec des multiplicités finies) sur V vérifiant une certaine condition de « croissance modérée » (qui a été introduite par Casselman et Wallach, voir [11] et [67] Chap. 11) ; l’irréductibilité est alors une notion topologique (i.e. pas de sous-espace fermé non trivial stable par G). Dans tous les cas, une telle représentation irréductible se décompose comme un produit tensoriel π = πW πV où πW et πV sont des représentations irréductibles (lisses) de U (W ) et U (V ) respectivement (et où le produit tensoriel est un produit tensoriel topologique dans le cas archimédien). On notera Irr(G) l’ensemble des classes d’isomorphisme de représentations irréductibles lisses de G. Pour définir le problème de restriction qui va nous intéresser on doit encore introduire une certaine « petite » représentation ν de H. Dans le cas hermitien (i.e. si ε = 1), ν est la représentation triviale que l’on notera 1 ou simplement C dans la suite. Dans le cas antihermitien (i.e. si ε = −1), on dispose d’une inclusion U (W ) ⊂ Sp(ResE/F W ) où ResE/F W désigne la restriction des scalaires de E à F de W munie de la forme symplectique TraceE/F ◦h., .i et Sp(ResE/F W ) désigne le groupe symplectique correspondant. Soit Mp(ResE/F W ) le groupe métaplectique associé à cet espace symplectique (il s’agit d’une Z/2Z-extension de Sp(ResE/F W )). Le revêtement metaplectique se scinde au-dessus de U (W ) mais ce scindage n’est pas unique (car il existe des caractères non triviaux U (W ) → {±1}). On peut cependant fixer un tel scindage par le choix d’un caractère µ : E × → S1 tel que µ| × = sgnE/F ce que F l’on fait dorénavant. Soit ωψ0 ,W la représentation de Weil de Mp(ResE/F W ) associée au caractère ψ0 (cf. [43] Chap. 2. II). Alors ν = ωψ0 ,W,µ est la restriction de cette représentation de Weil à U (W ) via le scindage que l’on vient de fixer.
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
173
Dans tous les cas, l’espace d’entrelacements qui nous intéressera est le suivant HomH (π, ν)
(2)
où implicitement dans le cas archimédien on ne considère que les entrelacements continus (pour les topologies d’espaces de Fréchet sous-jacentes). On notera m(π) la dimension de cet espace : m(π) := dim HomH (π, ν). Remarquons que dans le cas hermitien on a des identifications ∨ HomH (π, ν) = HomU (W ) (πW πV , C) = HomU (W ) (πV , πW ) ∨ désigne la contragrédiente (lisse) de πW . où πW
Un élément de l’espace (2) s’appelle une fonctionnelle de Bessel si ε = 1 et une fonctionnelle de Fourier-Jacobi si ε = −1. On parlera alors parallèlement des cas Bessel et Fourier-Jacobi de la conjecture.
1.3. Multiplicité 1 Le théorème suivant est dû à Aizenbud-Gourevitch-Rallis-Schiffmann [2] et Sun [57] dans le cas p-adique et à Sun-Zhu [58] dans le cas archimédien. Théorème 1.1. — Pour toute représentation irréductible lisse π de G on a m(π) 6 1. La conjecture locale de Gan-Gross-Prasad apporte alors essentiellement une réponse à la question simple suivante : quand a-t-on m(π) = 1 ? Tout comme pour la loi de branchement entre groupes unitaires réels compacts discutée dans l’introduction, toute réponse intelligible à cette question nécessite de savoir paramétrer les (classes d’isomorphisme de) représentations irréductibles de G. Une telle paramétrisation est précisément l’objet de la correspondance de Langlands locale (pour les groupes unitaires) dont nous rappelons maintenant les principales caractéristiques.
1.4. Correspondance de Langlands locale pour les groupes unitaires Dans cette section on se donne un espace hermitien ou antihermitien V de dimension finie n sur E et on note U (V ) le groupe unitaire correspondant.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
174
R. BEUZART-PLESSIS
1.4.1. Groupes de Weil-Deligne. — Soit WF le groupe de Weil de F . Si F est non archimédien, on a le diagramme commutatif suivant dont les lignes sont exactes 1
/ IF
/ Gal(F /F ) O
b / Gal(k F /kF ) ' Z O
/1
1
/ IF
/ WF
/Z
/1
où F est une clôture algébrique de F , kF est le corps résiduel de F , l’isomorphisme b correspond au choix du Frobénius géométrique FrobF comme Gal(k F /kF ) ' Z générateur topologique de Gal(k F /kF ) et IF est le sous-groupe d’inertie (i.e. le noyau de la flèche Gal(F /F ) → Gal(k F /kF )). On équipe alors WF de la topologie qui fait de IF un sous-groupe ouvert (muni de la topologie induite de celle de Gal(F /F )). Si F est archimédien, on a ( C× ∪ C× j, si F = R, WF = C× si F = C, où j 2 = −1 et jzj −1 = z pour tout z ∈ C× . Le groupe de Weil-Deligne W DF de F est défini par ( WF × SL2 (C), si F est non archimédien, W DF = WF si F est archimédien. 1.4.2. Paramètres de Langlands. — Langlands associe à U (V ), et plus généralement à tout groupe réductif connexe sur F , un L-groupe L U (V ) produit semi-direct d’un ’ ’ groupe réductif complexe connexe U (V ) par le groupe de Weil WF : L U (V ) = U (V ) o WF . ’ Ici, le L-groupe se décrit explicitement ainsi : on a U (V ) = GLn (C) et l’action de WF se factorise par WF → WF /WE = Gal(E/F ) avec σ agissant comme σ(g) = J t g −1 J −1 où á ë 1 . J= . .. (−1)n−1 Un paramètre de Langlands pour U (V ) est alors une classe de conjugaison sous ’ U (V ) d’homomorphismes « admissibles » (i.e. satisfaisant à certaines propriétés de continuité, semi-simplicité et d’algébricité) φ : W DF → L U (V ) commutant aux projections sur WF . On notera Φ(U (V )) l’ensemble des paramètres de Langlands pour U (V ). Pour les groupes unitaires on dispose de la description plus explicite suivante (cf. [17] Theorem 8.1) : la restriction à W DE induit une
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
175
bijection entre Φ(U (V )) et l’ensemble des classes d’isomorphisme de représentations complexes continues semi-simples et algébriques sur SL2 (C) de dimension n de W DE qui sont (−1)n+1 -conjuguées duales. Rappelons ce que ce dernier terme signifie. Fixons c ∈ WF \WE qui relève σ. Une représentation ϕ : W DE → GL(M ) est dite conjuguéeduale s’il existe une forme bilinéaire non dégénérée B :M ×M →C vérifiant B(ϕ(τ )u, ϕ(cτ c−1 )v) = B(u, v), ∀u, v ∈ M, τ ∈ W DE . Il est équivalent de demander que M est isomorphe à (M c )∨ où M c désigne la cconjuguée de M et (.)∨ le passage à la contragrédiente. On dit de plus que ϕ : W DE → GL(M ) est ε-conjuguée-duale, où ε ∈ {±1}, si on peut choisir une telle forme bilinéaire satisfaisant la condition supplémentaire B(u, ϕ(c2 )v) = εB(v, u), ∀u, v ∈ M. On appellera une telle forme une forme ε-conjuguée-duale. Pour énoncer la correspondance de Langlands dans sa version la plus complète, il faut introduire pour tout φ ∈ Φ(U (V )) un certain groupe fini Sφ . Ce dernier se ’ définit comme le groupe des composantes connexes du centralisateur dans U (V ) de l’image de φ. Si on identifie φ à une représentation (−1)n+1 -conjuguée-duale ϕ : W DE → GL(M ) on a la description plus concrète suivante de Sφ . Fixons B une forme conjuguée-duale de signe (−1)n+1 comme ci-dessus et notons Aut(ϕ, B) le groupe des automorphismes linéaires de M qui commutent à l’image de ϕ et préservent la forme B. On a alors (canoniquement) Sφ = Aut(ϕ, B)/ Aut(ϕ, B)0 où on a noté Aut(ϕ, B)0 la composante connexe de l’élément neutre. De plus, ce groupe est toujours abélien et isomorphe à un produit fini de copies de Z/2Z. 1.4.3. Formes intérieures pures. — Suivant une idée de Vogan [60], la correspondance de Langlands devrait se formuler plus simplement si on considère plusieurs groupes à la fois. Plus précisément, il faut prendre en compte les formes intérieures pures de U (V ). Ces formes sont naturellement paramétrées par l’ensemble de cohomologie galoisienne H 1 (F, U (V )) et admettent toutes le même L-groupe que U (V ) (de sorte qu’un paramètre de Langlands pour U (V ) peut aussi être considéré comme paramètre de Langlands de toutes ses formes intérieures pures). Pour les groupes unitaires on sait décrire les formes intérieures pures explicitement : H 1 (F, U (V )) classifie naturellement les classes d’isomorphisme d’espaces (anti)hermitiens de dimension n et les formes intérieures pures de U (V ) sont alors les groupes unitaires de ces derniers. Pour une
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
176
R. BEUZART-PLESSIS
classe α ∈ H 1 (F, U (V )), on notera Vα l’espace (anti)hermitien qu’elle détermine et U (Vα ) la forme intérieure pure correspondante. Dans le cas non archimédien, et pour n 6= 0, il existe exactement deux classes d’isomorphisme d’espaces (anti)hermitiens de dimension n, que l’on peut distinguer par leurs discriminants, et donc autant de formes intérieures pures. Dans le cas archimédien, il y a n + 1 formes intérieures pures de U (V ) correspondant aux U (p, q) pour p + q = n. Remarquons que deux formes intérieures pures distinctes de U (V ) peuvent être isomorphes (par exemple U (p, q) et U (q, p)) mais du point de vue de la correspondance de Langlands celles-ci doivent être considérées comme distinctes. 1.4.4. La correspondance. — On peut maintenant énoncer la correspondance de Langlands locale pour U (V ) (et ses formes intérieures pures) de la façon informelle suivante. Pour tout α ∈ H 1 (F, U (V )), il devrait exister une partition G Irr(U (Vα )) = ΠU (Vα ) (φ) φ∈Φ(U (V ))
en sous-ensembles finis (éventuellement vides) appelés L-paquets et pour tout φ ∈ Φ(U (V )) il devrait exister une bijection G cφ ΠU (Vα ) (φ) ' S 1 (F,U (V )) α∈H (3) π(ϕ, χ) ←[ χ cφ désigne le groupe des caractères du groupe abélien fini Sφ . Ces données où S doivent bien sûr satisfaire un certain nombre de propriétés. De fait, les fameuses relations endoscopiques, que nous n’expliciterons pas ici, caractérisent, si elle existe, la correspondance de Langlands locale pour les groupes unitaires à partir de la correspondance, connue ([28], [32], [53]), pour les groupes linéaires. Ces relations endoscopiques dépendent cependant d’un certain choix correspondant à la normalisation de facteurs de transfert. La composition des L-paquets ne dépend pas de ce choix mais la bijection (3) y est sensible. Nous donnerons plus de détails sur les choix impliqués dans cette normalisation dans la section 1.4.7. 1.4.5. Statut. — Dans le cas archimédien, la correspondance locale a été construite par Langlands lui-même [39] pour tous les groupes réductifs réels à partir de résultats d’Harish-Chandra. Que cette correspondance vérifie les relations endoscopiques attendues découle des travaux de Shelstad [54], [55], [56] et Mezo [42] (voir aussi [13] pour le cas des groupes unitaires). Dans le cas non archimédien, la correspondance a été obtenue bien plus récemment par Mok [47] pour les groupes unitaires quasi-déployés puis par Kaletha-MinguezShin-White [37] pour tous les groupes unitaires à la suite du travail fondateur d’Arthur [3] sur les groupes symplectiques et orthogonaux. Jusqu’à peu ces résultats
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
177
étaient encore conditionnels à la stabilisation de la formule des traces tordue maintenant établie en toute généralité par Waldspurger et Mœglin-Waldspurger dans une série impressionnante d’articles [46]. 1.4.6. Fonctions L et facteurs ε. — Étant donné un paramètre de Langlands φ : W DF → L U (V ) on peut lui associer certains invariants arithmétiques. Plus précisément, pour toute représentation algébrique ρ : L U (V ) → GL(M ) où M est un espace vectoriel complexe de dimension finie, la composée ρ ◦ φ est une représentation du groupe de Weil-Deligne W DF à laquelle on peut associer une fonction L locale L(s, ρ ◦ φ) = L(s, ρ, φ) et un facteur ε local ε(s, ρ ◦ φ, ψ0 ) = ε(s, φ, ρ, ψ0 ) qui dépend du caractère additif ψ0 : F → C× . Les fonctions L locales sont des fonctions méromorphes sur C sans zéro tandis que les facteurs epsilon locaux sont des fonctions holomorphes inversibles sur C. Dans le cas où F est non archimédien et ρ ◦ φ est trivial sur le facteur SL2 (C) la fonction L est définie par L(s, φ, ρ) =
1 , det(1 − q −s (ρ ◦ φ)(FrobF ) | M IF )
où on a noté q le cardinal du corps résiduel de F , M IF le sous-espace des invariants pour IF et FrobF un relèvement du Frobenius (géométrique) dans WF . On a une formule analogue dans le cas général si F est non archimédien (cf. [59] 4.1.6) et si F est archimédien les facteurs L locaux sont des produits explicites de fonctions gamma et de puissances de π et de 2 (cf. [59] §3). Les facteurs epsilon locaux sont des invariants bien plus subtils. En effet, ceux-ci doivent satisfaire un certain nombre de propriétés simples les caractérisant uniquement mais leur existence est un théorème difficile dû indépendamment à Langlands et Deligne ([14]). Mentionnons ici une propriété de ces facteurs dont nous aurons besoin. Soit ϕ : W DE → GL(M ) une représentation (−1)-conjuguée-duale du groupe de WeilDeligne de E. Alors, ε( 21 , ϕ, ψ) ∈ {±1} où on rappelle que le caractère ψ : E → S1 a été choisi trivial sur F . De plus, ce facteur epsilon ne dépend que de la N (E × )-orbite de ψ et ne dépend en fait pas du tout de ψ si dim(ϕ) est paire. 1.4.7. Données de Whittaker et normalisation de la correspondance. — Comme expliqué en 1.4.4, la bijection (3) dépend d’un choix permettant de normaliser certains facteurs de transfert. D’après [38], un tel choix peut être fait en fixant une donnée de Whittaker d’une forme intérieure pure de U (V ). Plus précisément, on choisit d’abord une forme intérieure pure U (Vα ) quasi-déployée de U (V ) c’est-à-dire possédant un sous-groupe de Borel B ⊂ U (Vα ) défini sur F . Un tel groupe existe et quitte à remplacer V par un Vα (ce qui ne modifie pas la famille des formes intérieures pures), on peut supposer que l’on a choisi U (V ) (que l’on suppose donc quasi-déployé). Une donnée de Whittaker sur U (V ) est alors une classe de conjugaison de couples (N, θ) où N est le radical unipotent d’un sous-groupe de Borel B = T N
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
178
R. BEUZART-PLESSIS
défini sur F et θ : N → S1 est un caractère générique c’est-à-dire dont le stabilisateur dans T est réduit au centre de U (V ). Il existe une seule classe de conjugaison de données de Whittaker si n = dim(V ) est impair tandis que si n est pair il en existe deux et on peut en fixer une à partir du caractère ψ : E/F → S1 dans le cas hermitien et ψ0 : F → S1 dans le cas antihermitien. 1.4.8. L-paquets génériques, tempérés et discrets. — Un paramètre de Langlands φ : W DF → L U (V ) est dit générique si L(s, φ, Ad) n’a pas de pôle en s = 1 où Ad désigne la représentation adjointe de L U (V ) sur son algèbre de Lie. Le L-paquet correspondant ΠU (V ) (φ) contient alors une et une seule représentation π admettant un modèle de Whittaker relativement à (N, θ) c’est-à-dire telle que HomN (π, θ) 6= 0 (on dit alors que π est générique relativement à (N, θ)) et de plus cette représentation correspond via la bijection (3) au caractère trivial de Sφ . Un paramètre de Langlands φ : W DF → L U (V ) est dit tempéré si la projection ’ de l’image de WF sur U (V ) est relativement compacte. Un paramètre tempéré est automatiquement générique et le L-paquet correspondant ΠU (V ) (φ) ne contient que des représentations tempérées c’est-à-dire des repésentations qui apparaissent faiblement dans L2 (U (V )) (il existe aussi une caractérisation des représentations tempérées par une condition de croissance des coefficients). En fait, on peut reconstruire la correspondance de Langlands pour U (V ) à partir de la correspondance restreinte aux paramètres tempérés de U (V ) et ses sous-groupes de Levi. Cela découle de la classification de Langlands qui permet d’obtenir toutes les représentations irréductibles d’un groupe réductif à partir des représentations tempérées de ses sous-groupes de Levi par un procédé classique appelé induction parabolique. Enfin, un paramètre de Langlands φ : W DF → L U (V ) est dit discret si ’ le centralisateur de son image dans U (V ) est fini. Un paramètre discret est automatiquement tempéré (donc aussi générique) et détermine un L-paquet de représentations de la série discrète c’est-à-dire apparaissant comme sous-modules de L2 (U (V )). 1.5. La conjecture On retourne à la situation introduite en 1.1 et 1.2. Appelons forme intérieure pure de (G, H) un couple (Gα , Hα ) analogue obtenu de la façon suivante. Soient α ∈ H 1 (F, H) = H 1 (F, U (W )) et Wα l’espace (anti)hermitien correspondant. On pose alors Vα = Wα ⊕⊥ L, où L est tel que V = W ⊕⊥ L, Hα = U (Wα ) et Gα = U (Wα ) × U (Vα ). On dispose à nouveau d’une injection Hα ,→ Gα et on définit comme dans le paragraphe 1.2 une « petite » représentation να de Hα (qui dépend, comme ν, dans le cas Fourier-Jacobi des choix de ψ0 et µ) ainsi qu’une fonction
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
179
multiplicité π ∈ Irr(Gα ) 7→ m(π) par m(π) = dim HomHα (π, να ). Notons que Gα est alors une forme intérieure pure de G mais que l’on n’obtient en général pas toutes les formes intérieures pures de G de cette façon. Les formes intérieures pures de G ainsi obtenues seront dites relevantes. Il se trouve qu’il existe toujours une forme intérieure pure relevante qui est quasi-déployée. Quitte à changer notre paire de départ, on supposera donc que G lui-même est quasi-déployé. On fixe alors la correspondance de Langlands pour U (V ) et U (W ) (et leurs formes intérieures pures) comme en 1.4.7. Soient φ : W DF → L U (V ) et φ0 : W DF → L U (W ) deux paramètres de Langlands que l’on identifie à des représentations complexes ϕ : W DE → GL(M ) et ϕ0 : W DE → GL(N ) de dimensions dV = dim(V ) et dW = dim(W ) et qui sont (−1)dV +1 - et (−1)dW +1 -conjuguées-duales respectivement. Suivant Gan, Gross et Prasad, on définit deux caractères χφ,φ0 : Sφ → {±1} et χφ0 ,φ : Sφ0 → {±1} de la façon suivante. Fixons des formes non dégénérées B et B 0 sur M et N qui sont respectivement (−1)dV +1 - et (−1)dW +1 -conjuguées-duales de sorte que l’on a des identifications Sφ = Aut(ϕ, B)/ Aut(ϕ, B)0 et Sφ0 = Aut(ϕ0 , B 0 )/ Aut(ϕ0 , B 0 )0 . Soient s ∈ Sφ et s0 ∈ Sφ0 , que l’on relève en des éléments de Aut(ϕ, B) et Aut(ϕ0 , B 0 ) respectivement. Dans le cas Bessel (i.e. ε = 1), on pose 0 1 1 χφ,φ0 (s) = ε( , ϕs=−1 ⊗ ϕ0 , ψ−2δ ) et χφ0 ,φ (s0 ) = ε( , ϕ ⊗ (ϕ0 )s =−1 , ψ−2δ ) 2 2 0
où ϕs=−1 (resp. (ϕ0 )s =−1 ) désigne la sous-représentation de ϕ (resp. ϕ0 ) où s (resp. s0 ) agit comme −1, δ est le discriminant de l’unique espace hermitien de dimension impaire du couple (W, V ) et ψ−2δ (x) = ψ(−2δx). Dans le cas Fourier-Jacobi (i.e. ε = −1), on pose 0 1 1 χφ,φ0 (s) = ε( , ϕs=−1 ⊗ ϕ0 ⊗ µ−1 , ψλ ) et χφ0 ,φ (s0 ) = ε( , ϕ ⊗ (ϕ0 )s =−1 ⊗ µ−1 , ψλ ) 2 2
où µ est le caractère multiplicatif de E × que l’on a fixé pour définir la représentation ν, λ = 1 dans le cas où dim(V ) est paire et λ est l’unique élément de F × tel que ψ(λx) = ψ0 (TraceE/F (ex)) pour tout x ∈ E avec e le discriminant de l’espace antihermitien V dans le cas où dim(V ) est impaire. Dans tous les cas, on montre que le résultat ne dépend pas des choix des relèvements de s et s0 et que l’on a bien ainsi défini des caractères de Sφ et Sφ0 ([17] Theorem 6.1).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
180
R. BEUZART-PLESSIS
Conjecture 1.2 (Gan-Gross-Prasad). — Supposons que φ et φ0 soient des paramètres de Langlands génériques. Alors P P 1. On a α∈H 1 (F,H) π∈ΠGα (φ×φ0 ) m(π) = 1. 2. Plus précisément, pour toute paire de caractères (χ, χ0 ) ∈ Sbφ × Sbφ0 de sorte que π(φ, χ) π(φ0 , χ0 ) soit une représentation d’une forme intérieure pure relevante de G, on a m(π(φ, χ) π(φ0 , χ0 )) = 1 ⇐⇒ χ = χφ,φ0 et χ0 = χφ0 ,φ . La première partie de la conjecture ci-dessus est souvent appelée la propriété de multiplicité un dans les L-paquets. La deuxième partie de la conjecture, qui raffine la première de façon évidente et fait intervenir des facteurs epsilon locaux, constitue sans doute l’aspect le plus subtil de la conjecture. 1.6. Statut 1.6.1. Cas Bessel. — Dans une série de quatre articles fondateurs ([63], [66], [64], [65]), Waldspurger a établi l’analogue de la conjecture 1.2 pour les groupes spéciaux orthogonaux (analogue qui n’existe que dans le cas Bessel) lorsque F est p-adique et dans le cas où φ et φ0 sont des paramètres de Langlands tempérés. Ce résultat a ensuite été étendu par Mœglin et Waldspurger [45] à tous les paramètres génériques. Dans ma thèse [7], [5], [6] j’ai adapté la méthode de Waldspurger afin de démontrer la conjecture 1.2 dans le cas Bessel et pour des paramètres de Langlands tempérés de groupes unitaires p-adiques. L’extension aux L-paquets génériques a été rédigée par Gan et Ichino dans [19] (section 9.3) en utilisant de façon cruciale un résultat d’Heiermann [31] qui généralise une partie de l’argument de Mœglin-Waldspurger. Toujours en suivant la méthode initiée par Waldspurger, j’ai établi dans [10] la propriété de multiplicité un dans les L-paquets (i.e. le 1 de la conjecture 1.2) toujours pour des paramètres tempérés et dans le cas Bessel mais cette fois pour des groupes unitaires réels. Le travail préliminaire effectué dans [10] devrait permettre d’adapter complètement la méthode de Waldspurger pour les corps archimédiens et ainsi d’obtenir une preuve complète de la conjecture dans le cas Bessel (pour les groupes unitaires). Malheureusement, la suite de [10] n’a pas encore été rédigée. Enfin, par une toute autre méthode utilisant la correspondance thêta et spécifique au cas archimédien, Hongyu He a obtenu dans [30] une preuve de la conjecture dans le cas Bessel pour les paramètres de Langlands discrets de groupes unitaires réels. 1.6.2. Cas Fourier-Jacobi. — Pour les corps p-adiques et peu après la preuve de la conjecture dans le cas Bessel, Gan et Ichino [19] ont montré comment, par une méthode utilisant la correspondance thêta locale, on pouvait en déduire la conjecture dans le cas Fourier-Jacobi. Cette méthode a par la suite été adaptée
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
181
par Hiraku Atobe [4] afin d’établir l’analogue de la conjecture 1.2 pour les groupes symplectiques/métaplectiques (analogue qui n’existe que dans le cas Fourier-Jacobi) sur un corps p-adique. Par contre, le cas Fourier-Jacobi de la conjecture reste complétement ouvert sur les corps archimédiens. 1.7. Bref aperçu des preuves 1.7.1. Le cas Bessel. — On présente ici un rapide survol de la méthode initiée par Waldspurger, et adaptée par l’auteur au cas des groupes unitaires, pour démontrer la conjecture locale dans le cas Bessel pour les représentations tempérées. Cette méthode se base sur une formule intégrale calculant la multiplicité m(π) lorsque π est tempérée. Présentons d’abord cette formule dans le cas le plus simple, c’est-à-dire lorsque les groupes G et H sont compacts (ceci peut arriver en tout rang pour les groupes réels mais sur les corps p-adiques cela impose dim(V ) 6 2). La représentation π est alors de dimension finie et possède un caractère θπ défini par θπ (g) := Trace π(g) pour tout g ∈ G. D’après les relations d’orthogonalité entre caractères on a alors directement Z m(π) = θπ (h)dh H
où dh est l’unique mesure de Haar sur H de masse totale 1. Par la formule d’intégration de Weyl, ceci peut se réécrire Z X −1 m(π) = (4) |W (H, T )| DH (t)θπ (t)dt T ∈T (H)
T
où T (H) désigne un ensemble de représentants des classes de conjugaison de tores maximaux dans H, W (H, T ) est le groupe de Weyl NormH (T )/T où NormH (T ) est le normalisateur de T dans H et DH (t) = |det(1 − Ad(t))h/t | est le discriminant de Weyl (avec h et t les algèbres de Lie de H et T respectivement). Dans le cas des groupes réels compacts, on connaît des formules explicites (aussi dues à Weyl) pour les caractères θπ et la formule ci-dessus permet alors de retrouver directement la loi de branchement présentée dans l’introduction (signalons que dans ce cas T (H) est réduit à un élément). La méthode de Waldspurger permet de généraliser la formule (4) à des groupes non nécessairement compacts. Plusieurs difficultés arrivent alors. Tout d’abord, le caractère θπ n’a plus de sens a priori puisque la représentation π est en général de dimension infinie et les opérateurs π(g), g ∈ G, ne sont pas traçables. Un résultat très profond d’Harish-Chandra permet néanmoins de définir un tel caractère θπ . Plus précisément, Harish-Chandra définit d’abord un caractèreR distribution f ∈ Cc∞ (G) 7→ θπ (f ) := Trace π(f ) où π(f ) = G f (g)π(g)dg (on montre sans trop de difficultés que ces opérateurs sont traçables ; ils sont même de rang fini pour les groupes p-adiques) et démontre que cette distribution est représentable
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
182
R. BEUZART-PLESSIS
par une fonction localement intégrable θπ sur G ayant de bonnes propriétés. En particulier, cette fonction est lisse (c’est-à-dire localement constante dans le cas p-adique) sur le lieu ouvert Greg des éléments semi-simples réguliers et HarishChandra a même décrit les singularités que θπ peut avoir au voisinage des éléments singuliers. Puisque les tores maximaux de H coupent tous Greg suivant un ouvert de complémentaire négligeable, on pourrait donc donner un sens à la formule (4) en général (modulo des questions de convergence). La formule de Waldspurger diffère cependant de (4) par deux aspects. Premièrement, tous les tores maximaux n’y contribuent pas mais seulement ceux qui sont compacts (ce qui règle, essentiellement, les questions de convergence). Deuxièmement, y contribuent aussi certains tores non maximaux (mais toujours compacts). Cette dernière propriété implique notamment l’existence de contributions non négligeables de certaines classes de conjugaison singulières ce qui nécessite de définir une régularisation x 7→ cπ (x) du caractère θπ en ces points. Dans le cas particulier où dim(V ) = 2 (de sorte que dim(W ) = 1 et H est lui-même un tore) mais où le groupe G n’est pas compact la formule prend par exemple la forme suivante Z (5) m(π) = θπ (t)dt + cπ (1). H
Ainsi, ici la seule contribution singulière provient de la classe de conjugaison triviale. On renvoie aux introductions de [63] (pour le cas des groupes orthogonaux) et [7] pour plus de détails sur la formule dans le cas général. Expliquons maintenant brièvement comment on peut déduire des formules (4) et (5) la première partie de la conjecture 1.2 dans le cas dim(V ) = 2 et F p-adique. Notons plus précisément dans ce cas (Gi , Hi ) l’unique forme intérieure pure avec Gi quasi-déployé (et donc non compact) et (Ga , Ha ) l’unique autre forme intérieure pure qui elle, par contre, est compacte. Soit φ : W DF → L Gi = L Ga un paramètre de Langlands tempéré. Les L-paquets ΠGi (φ) et ΠGa (φ) contiennent alors chacun au plus deux P G éléments (et ΠGa (φ) peut éventuellement être vide). Posons θφ,] = θ R π∈Π ] (φ) π P pour ] ∈ {i, a}. D’après (4) et (5), on a θ (h)dh π∈ΠGa (φ) m(π) = Ha φ,a R P et π∈ΠGi (φ) m(π) = Hi θφ,i (h)dh + cφ,i (1) où cφ,i (1) est une certaine régularisation de θφ,i en 1. Les groupes Hi et Ha étant des groupes unitaires de rang un, on a un isomorphisme naturel Hi ' Ha et de plus via cet isomorphisme on a l’égalité θφ,i (h) = −θφ,a (h) (c’est la plus simple de toutes les fameuses relations endoscopiques). En sommant les deux formules, on obtient donc X m(π) = cφ,i (1). π∈ΠGi (φ)∪ΠGa (φ)
Enfin, d’après un résultat de Rodier [52] et la définition de cφ,i (1) (que nous n’avons pas donnée ici), ce dernier terme compte le nombre de représentations génériques
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
183
dans le L-paquet ΠGi (φ) correspondant à une certaine donnée de Whittaker. Puisque φ est générique ce dernier nombre vaut 1, ce qui conclut la preuve. La même idée (légèrement plus élaborée) conduit à une preuve en tout rang de la première partie de la conjecture 1.2 à partir de la formule de Waldspurger. Pour obtenir la deuxième partie de la conjecture, Waldspurger introduit un deuxième ingrédient essentiel : une formule intégrale, analogue à la précédente, exprimant certains facteurs epsilon de paires. Dans le cadre de la conjecture pour les groupes unitaires, cette formule exprime plus précisément un facteur de la forme ε( 21 , π × π 0 , ψ), où π et π 0 sont des représentations tempérées irréductibles de GLk (E) et GLl (E) qui sont conjuguées-duales (i.e. π σ ' π ∨ et (π 0 )σ ' (π 0 )∨ ) avec k 6≡ l mod 2 en fonction de caractères « tordus » associés à π et π 0 (plus précisément la restriction à la composante connexe non neutre des caractères d’extensions de π et π 0 −1 à GL+ = t (g σ )−1 pour i = k, l). Ici, ε(s, π × π 0 , ψ) i (E) = GLi (E) o hθi i où θi gθi désigne un certain facteur epsilon défini par Jacquet, Piatetski-Shapiro et Shalika ([35]) et qui est égal au facteur epsilon d’Artin ε(s, φ ⊗ φ0 , ψ) où φ : W DE → GLk (C) et φ0 : W DE → GLl (C) sont les paramètres de Langlands de π et π 0 obtenus via la correspondance de Langlands locale pour les groupes linéaires (démontrée par Harris-Taylor [28], Henniart [30] et plus récemment Scholze [53] ; cette compatibilité aux facteurs ε de paires est d’ailleurs un ingrédient essentiel pour caractériser cette correspondance). Nous ne donnerons pas plus de détails sur cette formule (ni sur sa preuve) et nous contenterons de renvoyer le lecteur aux introductions de [64] et [5] pour plus de précisions. C’est cette formule pour les facteurs epsilon de paires qui n’a pas été démontrée dans le cas archimédien et qui manque pour finir la preuve de la conjecture 1.2 en général. Enfin, la dernière partie de la démonstration pour les représentations tempérées [65], [6] consiste à relier les deux formules précédentes, pour la multiplicité m(π) et pour les facteurs epsilon de paires, via les relations endoscopiques entre caractères. En effet, ces relations qui, rappelons-le, caractérisent la correspondance locale pour les groupes unitaires, permettent essentiellement d’exprimer le caractère de n’importe quelle représentation tempérée de G à partir de caractères « tordus » sur des groupes linéaires comme ci-dessus. On tombe alors, assez miraculeusement, sur une expression de m(π), pour π une représentation tempérée de G, en termes de facteurs epsilon de paires qui est très exactement celle prévue par la conjecture de Gan-Gross-Prasad. 1.7.2. Le cas Fourier-Jacobi. — On explique ici les grandes lignes de la preuve par Gan et Ichino [19] de la conjecture 1.2 dans le cas Fourier-Jacobi. On a besoin pour cela de faire quelques rappels sur la correspondance thêta locale pour les groupes unitaires. Pour simplifier, on se restreindra au cas des représentations tempérées.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
184
R. BEUZART-PLESSIS
Rappelons qu’une paire réductive duale d’un goupe symplectique Sp(W ) est un couple (U1 , U2 ) formé de deux sous-groupes réductifs de Sp(W ) qui sont les centralisateurs l’un de l’autre. Soient Wn un espace antihermitien de dimension n, Vn+1 un espace hermitien de dimension n + 1, Vn ⊂ Vn+1 un hyperplan non dégénéré et V1 l’orthogonal de Vn dans Vn+1 . On dispose alors dans le groupe symplectique Sp(ResE/F Wn ⊗ Vn+1 ) des deux paires réductives duales suivantes (U (Wn ), U (Vn+1 )) et (U (Wn ) × U (Wn ), U (Vn ) × U (V1 )) où l’action du premier couple sur Wn ⊗ Vn+1 est l’action évidente tandis que l’action du deuxième couple respecte la décomposition Wn ⊗ Vn+1 = Wn ⊗ Vn ⊕ Wn ⊗ V1 . De plus, on a des inclusions U (Wn ) ⊂ U (Wn ) × U (Wn ) et U (Vn ) × U (V1 ) ⊂ U (Vn+1 ). On résume la situation sous la forme du diagramme suivant, dit diagramme « see-saw » (ou diagramme en ciseaux), (6)
U (Wn ) × U (Wn )
U (Vn+1 )
U (Wn )
U (Vn ) × U (V1 ).
Le caractère µ : E × → C× que l’on a fixé, et dont la restriction à F × coïncide avec sgnE/F , permet de relever tous ces groupes dans le revêtement métaplectique Mp(ResE/F Wn ⊗ Vn+1 ). Notons ωψ0 ,Wn ,Vn+1 la représentation de Weil de Mp(ResE/F Wn ⊗ Vn+1 ) associée au caractère additif ψ0 . Pour toute représentation irréductible σ de U (Wn ), le quotient σ-isotypique maximal de ωψ0 ,Wn ,Vn+1 est de la forme σ ΘWn ,Vn+1 (σ) où ΘWn ,Vn+1 (σ) est une représentation de U (Vn+1 ) qui se trouve être toujours de longueur finie. De plus, si cette représentation est non nulle alors elle admet un unique quotient irréductible d’après [62] et [20] (il s’agit de la fameuse « conjecture de dualité de Howe »). Notons θWn ,Vn+1 (σ) ce quotient irréductible lorsqu’il existe. Alors, l’application partiellement définie σ 7→ θWn ,Vn+1 (σ) réalise une bijection entre une partie de Irr(U (Wn )) et une partie de Irr(U (Vn+1 )) : c’est ce qu’on appelle la correspondance thêta locale. On définit de la même façon une application π ∈ Irr(U (Vn )) 7→ ΘWn ,Vn (π) à valeurs dans les représentations de longueurs finies de U (Wn ) et une application partiellement définie π ∈ Irr(U (Vn )) 7→ θWn ,Vn (π) ∈ Irr(U (Wn )) en réalisant (U (Vn ), U (Wn )) comme une paire réductive duale dans Sp(ResE/F Vn ⊗ Wn ) (relevée comme précédemment dans le revêtement métaplectique). La restriction de la représentation de Weil ωψ0 ,Wn ,Vn+1 à Mp(ResE/F Wn ⊗ Vn ) × Mp(ResE/F Wn ⊗ V1 ) via le morphisme naturel Mp(ResE/F Wn ⊗ Vn ) × Mp(ResE/F Wn ⊗ V1 ) → Mp(ResE/F Wn ⊗ Vn+1 ) est isomorphe au produit tensoriel ωψ0 ,Wn ,Vn ωψ0 ,Wn ,V1 . Il s’ensuit par le diagramme (6)
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
185
que l’on a un isomorphisme naturel (dit identité de « see-saw ») (7)
HomU (Wn ) (ΘWn ,Vn (π) ⊗ ωψ0 ,Wn ,V1 , σ) ' HomU (Vn ) (ΘWn ,Vn+1 (σ), π)
pour toutes représentations π ∈ Irr(U (Vn )) et σ ∈ Irr(U (Wn )). La contragrédiente de la représentation de Weil ωψ0 ,Wn ,V1 étant ωψ−1 ,Wn ,V1 , l’espace de gauche ci-dessus 0 est essentiellement l’espace des fonctionnelles de Fourier-Jacobi sur la représentation ΘWn ,Vn (π) σ ∨ du groupe U (Wn ) × U (Wn ) tandis que l’espace de droite est l’espace des fonctionnelles de Bessel sur la représentation π ∨ ΘWn ,Vn+1 (σ) du groupe U (Vn ) × U (Vn+1 ). L’identité (7) relie ainsi les cas Bessel et Fourier-Jacobi de la conjecture et pour en déduire le cas Fourier-Jacobi à partir du cas Bessel, au moins pour les représentations tempérées, il suffit grosso modo de – Montrer que pour π et σ tempérées les représentations ΘWn ,Vn (π) et ΘWn ,Vn+1 (σ) sont nulles ou irréductibles (auquel cas elles coïncident avec θWn ,Vn (π) et θWn ,Vn+1 (σ) respectivement). – Expliciter les correspondances thêta locales π 7→ θWn ,Vn (π) et σ 7→ θWn ,Vn+1 (σ) en termes de la correspondance de Langlands locale. – Montrer que quitte à faire varier l’espace hermitien Vn , la correspondance thêta locale π 7→ θWn ,Vn (π) restreinte aux représentations tempérées est surjective. Le premier et le troisième points avaient déjà été établis par Gan et Ichino en [18] dans un autre but. Par ailleurs, Prasad ([48], [49]) avait énoncé des conjectures précises concernant le deuxième point. Ce sont ces conjectures qui sont démontrées dans [19] par Gan et Ichino par des méthodes que nous ne décrirons pas ici.
2. LES CONJECTURES GLOBALES Dans toute cette partie on fixe une extension quadratique k 0 /k de corps de nombres. On notera |k| l’ensemble des places de k et pour toute v ∈ |k| par kv le complété correspondant. On posera aussi kv0 = k 0 ⊗k kv . Ainsi, kv0 ' kv × kv si v est déployée dans k 0 et kv0 est une extension quadratique de kv sinon. Soit A l’anneau des adèles de k. Rappelons qu’il s’agit du produit restreint des kv sur toutes les places v ∈ |k| c’est-à-dire l’ensemble des familles (xv )v∈|k| avec xv ∈ kv pour tout v et xv ∈ Ov pour presque toute place non archimédienne v où Ov désigne l’anneau des entiers de kv . On dispose d’un plongement diagonal k ,→ A et on notera aussi Af l’anneau des adèles finis (c’est-à-dire le produit restreint des complétés non archimédiens de k) Q et k∞ = k ⊗Q R ' v|∞ kv la partie archimédienne de A. On notera sgnk0 /k le caractère quadratique du groupe des classes d’idèles A× /k × associé, par la théorie du corps de classe, à l’extension k 0 /k. Pour toute v ∈ |k|, la restriction de sgnk0 /k à kv×
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
186
R. BEUZART-PLESSIS
coïncide avec sgnkv0 /kv (et donc est triviale si v est déployée dans k 0 ). On se donne enfin deux espaces W ⊂ V hermitiens ou antihermitiens sur k 0 avec ( 1, dans le cas hermitien, dim(V ) − dim(W ) = 0, dans le cas antihermitien, et on pose G = U (W ) × U (V ), H = U (W ) (des groupes algébriques définis sur k). Comme dans le cas local on dispose d’une inclusion « diagonale » H ,→ G et le groupe des points adéliques G(A) est un groupe localement compact admettant la description plus explicite suivante. Fixons un modèle de G sur Ok [1/N ] pour un certain entier N > 1 où Ok désigne l’anneau des entiers algébriques de k. Alors pour presque toute place v ∈ |k|, le groupe des points G(Ov ) de ce modèle sur Ov est un sous-groupe compact maximal de G(kv ) et G(A) est le produit restreint des G(kv ), v ∈ |k|, par rapport aux G(Ov ) c’est-à-dire l’ensemble des familles (gv )v∈|k| avec gv ∈ G(kv ) pour toute v ∈ |k| et gv ∈ G(Ov ) pour presque toute v ∈ |k|. Une description similaire vaut bien entendu pour H(A). 2.1. Formes automorphes et périodes On rappelle qu’une forme automorphe sur G(A) est une fonction ϕ : G(A) → C vérifiant les conditions suivantes : – ϕ est invariante à gauche par G(k). – ϕ est invariante à droite par un sous-groupe compact-ouvert Kf ⊂ G(Af ). – Pour tout g ∈ G(A) la fonction g∞ ∈ G(k∞ ) 7→ ϕ(gg∞ ) est C ∞ , on en déduit en particulier une action de l’algèbre de Lie g∞ de G(k∞ ) sur ϕ par (X.ϕ)(g) = d tX )| action qui s’étend à l’algèbre enveloppante complexifiée U (g∞ ). dt ϕ(ge t=0 – Si Z (g∞ ) désigne le centre de U (g∞ ) alors l’espace vectoriel Z (g∞ )ϕ est de dimension finie. – ϕ vérifie une certaine propriété de croissance modérée à l’infini (cf. [44] §1.2.3). On notera A (G) l’espace des formes automorphes sur G(A). Signalons que la définition ci-dessus diffère de celle usuellement admise qui impose une condition supplémentaire de K∞ -finitude où K∞ est un sous-groupe compact maximal de G(k∞ ) fixé à l’avance. Cette définition a cependant l’avantage de fournir un espace A (G) stable pour l’action par translation à droite de G(A) (alors qu’avec la définition usuelle on obtient seulement une structure de (g∞ , K∞ )-module aux places archimédiennes) et semble plus naturelle pour les questions que nous allons aborder. On notera Acusp (G) ⊂ A (G) le sous-espace des formes cuspidales c’est-à-dire des formes automorphes qui sont à décroissance rapide ainsi que toutes leurs dérivées (dans un sens que l’on ne rendra pas précis ici). Cet espace est stable sous l’action
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
187
par translation à droite de G(A) et admet une décomposition M Acusp (G) = π π
en somme directe de représentations irréductibles de G(A). Chacune de ces représentations irréductibles se décompose comme un certain type de produit N0 tensoriel π = v∈|k| πv dit produit tensoriel restreint. Plus précisément, il existe une famille de représentations irréductibles lisses (πv )v∈|k| des groupes locaux G(kv ) G(O )
qui sont non ramifiées en presque toute place v ∈ |k| (ce qui signifie que πv v 6= 0 G(O ) auquel cas πv v est une droite par l’isomorphisme de Satake) et des vecteurs non G( O ) nuls ϕ◦v ∈ πv v tels que π est isomorphe à la représentation naturelle de G(A) sur O lim πv −→ S v∈S
où la limite porte sur les ensembles finis suffisamment « gros » de places de k (i.e. contenant toutes les places archimédiennes et les places finies ramifiées) et N N les applications de transition πv → v∈S v∈T πv pour S ⊂ T sont données par N ϕS 7→ ϕS ⊗ v∈T \S ϕ0v (pour être entièrement précis, il faudrait considérer des produits tensoriels topologiques aux places archimédiennes). Les constructions de la section 1.2 fournissent en toute place v une représentation νv du groupe local H(kv ) (la représentation triviale dans le cas hermitien et une certaine représentation de Weil dans le cas antihermitien). On peut former leur N0 produit tensoriel restreint ν = v νv et il se trouve qu’il existe une réalisation naturelle ν ,→ A (H) de ν dans l’espace des formes automorphes sur H (dans le cas hermitien la représentation triviale se réalise comme l’espace des fonctions constantes sur H(k)\H(A) tandis que dans le cas antihermitien ν est une certaine représentation de Weil globale et le plongement ν ,→ A (H) s’obtient via les séries thêta). Plus particulièrement, dans le cas antihermitien on doit choisir des données locales (ψ0,v , µv ) pour toute v ∈ |k| comme en 1.2 afin de spécifier les représentations νv . Pour obtenir le plongement ν ,→ A (H) on doit supposer que ces données locales proviennent par localisation de caractères globaux ψ0 : A/k → C× 0 × × × et µ : A× k0 /(k ) → C où la restriction de µ à A coïncide avec sgnk0 /k . On définit une période automorphe PH : Acusp (G) ⊗ ν → C, où ν désigne la conjuguée complexe de la réalisation de ν dans A (H), par Z PH (ϕ ⊗ θ) := ϕ(h)θ(h)dh H(k)\H(A)
pour tous ϕ ∈ Acusp (G) et θ ∈ ν. L’intégrale est absolument convergente en raison de la décroissance rapide de ϕ et la mesure dh pour laquelle on intègre est une mesure
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
188
R. BEUZART-PLESSIS
H(A)-invariante que l’on peut obtenir comme quotient d’une mesure de Haar sur H(A) car H(k) en est un sous-groupe discret. Pour la conjecture globale de Gan-GrossPrasad le choix précis de cette mesure de Haar importe peu car on ne s’intéresse qu’à des questions de non-annulation de la période. En revanche, ce choix importe pour la conjecture d’Ichino-Ikeda qui prédit une formule explicite pour (le carré de) la période ci-dessus. Notons que dans le cas hermitien, la représentation ν étant triviale, la période PH est simplement la forme linéaire Acusp (G) → C donnée par Z PH (ϕ) = ϕ(h)dh. H(k)\H(A)
Dans tous les cas, si π ⊂ Acusp (G) est une représentation cuspidale irréductible, la restriction de la période PH à π définit un élément de l’espace d’entrelacements HomH(A) (π ⊗ ν, C) = HomH(A) (π, ν) qui lui-même se décompose en produit tensoriel (restreint) des espaces d’entrelacements locaux HomHv (πv , νv ) pour toute v ∈ |k|. Ainsi, une condition nécessaire pour que cette restriction soit non nulle est que ces espaces d’entrelacements locaux soient non triviaux (condition qui elle-même est explicitée par la conjecture locale). 2.2. Fonctions L automorphes et changement de base Soit π ⊂ Acusp (G) une représentation cuspidale irréductible que l’on suppose presque partout générique c’est-à-dire qu’en presque toute place v ∈ |k| la représentation πv est générique au sens du §1.4.8. On dit alors aussi que π est de type Ramanujan car ce sont les représentations pour lesquelles on espère avoir une conjecture de Ramanujan généralisée (i.e. πv tempérée pour toute v ∈ |k|). Cette hypothèse permet aussi de définir les fonctions L globales seulement en termes de la correspondance de Langlands locale (alors qu’en général il faudrait considérer des paquets plus généraux de représentations appelés paquets d’Arthur). De plus les deux conjectures qui vont nous intéresser ne portent, pour l’instant, que sur ce type de représentations cuspidales. Soit ρ : L G → GL(M ) une représentation algébrique du L-groupe de G. D’après la section 1.4.6, on peut associer, en toute place v ∈ |k|, à la représentation πv une fonction L locale L(s, πv , ρ). On définit alors une fonction L globale L(s, π, ρ) par Y L(s, π, ρ) = L(s, πv , ρ). v∈|k|
Le produit converge pour Re(s) 1 et conjecturalement L(s, π, ρ) admet un prolongement méromorphe au plan complexe et une équation fonctionnelle reliant L(s, π, ρ) à L(1 − s, π, ρ∨ ). Dans la suite, on ne verra apparaître que deux fonctions L globales. La première, qui joue un rôle mineur, est la fonction L adjointe L(s, π, Ad)
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
189
associée à la représentation adjointe de L G. La deuxième fonction L, celle qui nous intéressera le plus, est associée à la représentation R suivante de L G : IndL G (MW ⊗ MV ) dans le cas hermitien; “ G×W k0 R= −1 IndL G ((MW ⊗ MV ) ⊗ µ ) dans le cas antihermitien, “ G×W k0
÷ ’ où MW et MV désignent les représentations standards de U (W ) et U (V ) (rappelons qu’il s’agit de groupes linéaires sur C) respectivement et on a identifié µ à un caractère du groupe de Weil Wk0 via la théorie du corps de classe. On peut aussi décrire les facteurs locaux de cette fonction L de la façon explicite suivante. Puisque G = U (W ) × U (V ), on peut décomposer π comme un produit tensoriel π = π1 π2 où π1 (resp. π2 ) est une représentation cuspidale irréductible de U (W ) (resp. U (V )). D’après la section 1.4.2, en toute place v ∈ |k| non déployée dans k 0 les paramètres de Langlands de π1,v et π2,v peuvent être identifiés avec des représentations ϕ1,v : W Dkv0 → GL(M1 ) et ϕ2,v : W Dkv0 → GL(M2 ) conjuguées-duales d’un certain signe. On a alors L(s, πv , R) = L(s, ϕ1,v ⊗ ϕ2,v ) dans le cas hermitien et L(s, πv , R) = L(s, ϕ1,v ⊗ ϕ2,v ⊗ µ−1 v ) dans le cas antihermitien. En une place v déployée dans k 0 , les groupes U (W )v et U (V )v sont des groupes linéaires sur kv et les paramètres de Langlands de π1,v et π2,v peuvent être identifiés à des représentations ∨ ϕ1,v et ϕ2,v de W Dkv . On a alors L(s, πv , R) = L(s, ϕ1,v ⊗ ϕ2,v )L(s, ϕ∨ 1,v ⊗ ϕ2,v ) dans ∨ 0 −1 ) dans le cas hermitien et L(s, πv , R) = L(s, ϕ1,v ⊗ ϕ2,v ⊗ µ0v )L(s, ϕ∨ 1,v ⊗ ϕ2,v ⊗ (µv ) 0 −1 0 0 le cas antihermitien où on a écrit µv = (µv ) µv via une identification kv ' kv ×kv . Par les résultats de Mok [47] et Kaletha-Minguez-Shin-White [37] sur la classification des représentations automorphes de groupes unitaires ainsi que les travaux de Jacquet, Piatetski-Shapiro et Shalika [35] et Shahidi sur les fonctions L de paires et d’Asai pour les groupes linéaires respectivement, on sait que L(s, π, Ad) et L(s, π, R) admettent des prolongements holomorphes à C et vérifient les équations fonctionnelles attendues. Pour être plus précis, d’après [47] et [37] il existe, avec les notations ci-dessus, des représentations automorphes irréductibles BC(π1 ) et BC(π2 ) (BC pour changement de base) de GLdW (Ak0 ) et GLdV (Ak0 ) respectivement (où on a noté Ak0 l’anneau des adèles de k 0 , dW = dim(W ) et dV = dim(V )) dont les composantes locales en v ∈ |k| ont pour paramètres de Langlands ϕ1,v , ϕ2,v ∨ respectivement si v est non déployée dans k 0 et ϕ1,v × ϕ∨ 1,v , ϕ2,v × ϕ2,v respectivement 0 0 si v est déployée dans k (auquel cas GLdW (kv ) ' GLdW (kv ) × GLdW (kv ) et GLdV (kv0 ) ' GLdV (kv ) × GLdV (kv )). De plus, L(s, π, R) coïncide alors avec la fonction L de paire L(s, BC(π1 ) × BC(π2 )) définie par Jacquet, PiatetskiiShapiro et Shalika [35] dans le cas hermitien et avec L(s, BC(π1 ) × BC(π2 ) ⊗ µ−1 ) dans le cas antihermitien tandis que L(s, π, Ad) coïncide avec un produit de certaines fonctions L d’Asai de BC(π1 ) et BC(π2 ) définies par Shahidi. On
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
190
R. BEUZART-PLESSIS
note BC(π) = BC(π1 ) BC(π2 ). Il s’agit d’une représentation automorphe de G(Ak0 ) ' GLdW (Ak0 ) × GLdV (Ak0 ) appelée le changement de base (quadratique) de π, et on posera L(s, BC(π)) = L(s, BC(π1 )×BC(π2 )). Ainsi, dans le cas hermitien on a simplement L(s, π, R) = L(s, BC(π)). 2.3. La conjecture On a maintenant tous les ingrédients pour énoncer la conjecture globale de GanGross-Prasad. Conjecture 2.1 (Gan-Gross-Prasad). — Soit π ⊂ Acusp (G) une représentation cuspidale irréductible presque partout générique. Alors, les assertions suivantes sont équivalentes 1. La restriction de la période PH à π est non nulle. 2. On a L( 21 , π, R) 6= 0 et pour toute place v ∈ |k| on a HomHv (πv , νv ) 6= 0. 2.4. Le raffinement d’Ichino-Ikeda Il existe un raffinement de la conjecture 2.1 sous la forme d’une identité reliant directement L( 21 , π, R) à la période PH . Cette conjecture est due à Ichino et Ikeda [34] dans le cas des groupes orthogonaux et a été étendue aux groupes unitaires par N. Harris [29] (dans le cas hermitien) et H. Xue [71] (dans le cas antihermitien). Pour simplifier l’exposition, on se limitera ici au cas Bessel de la conjecture (i.e. W et V sont des espaces hermitiens). Soient v ∈ |k| et πv une représentation irréductible lisse et tempérée de G(kv ). En particulier, πv est unitaire et on peut fixer un produit scalaire G(kv )-invariant (., .)v sur (l’espace de) πv . Grâce à ce produit scalaire, on définit une période locale PH,v : πv × πv → C par PH,v (ϕv , ϕ0v ) =
Z
(πv (hv )ϕv , ϕ0v )v dhv ,
ϕv , ϕ0v ∈ πv ,
H(kv )
où dhv est une mesure de Haar sur H(kv ). L’intégrale ci-dessus est absolument convergente par l’hypothèse que πv est tempérée et de plus PH,v induit une forme hermitienne H(kv ) × H(kv )-invariante sur πv . En particulier, si la période locale PH,v est non nulle sur πv alors HomH(kv ) (πv , C) 6= 0. Une étape importante dans la preuve de la conjecture locale de Gan-Gross-Prasad est de montrer l’implication inverse (cf. [10] Theorem 8.2.1) : PH,v est non nulle sur πv si et seulement si HomH(kv ) (πv , C) 6= 0. Soit maintenant π ⊂ Acusp (G) une représentation cuspidale irréductible. On peut munir les groupes adéliques G(A) et H(A) de mesures de Haar canoniques dgTam , dhTam appelées mesures de Tamagawa (cf. [68] Chap.II). On normalise la période
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
191
globale PH grâce à la mesure de Tamagawa sur H(A) et on normalise les périodes locales PH,v par des mesures locales qui factorisent la mesure de Tamagawa : Y dhTam = dhv . v∈|k|
On munit π du produit scalaire suivant (dit produit scalaire de Petersson) Z (ϕ1 , ϕ2 ) ∈ π × π 7→ hϕ1 , ϕ2 iPet = ϕ1 (g)ϕ2 (g)dgTam G(k)\G(A)
et on choisit les produits scalaires locaux (, )v , v ∈ |k|, de sorte qu’ils factorisent globalement h., .iPet : Y O O 0 0 hϕ, ϕiPet = (ϕv , ϕv )v , ∀ϕ = ϕv ∈ π = πv . v
v∈|k|
v
On associe à π le quotient suivant de fonctions L L (s, π)
:= ∆n+1
L(s, BC(π)) L(s + 1/2, π, Ad)
où ∆n+1 :=
n+1 Y
L(i, sgnik0 /k )
i=1
est un produit fini de valeurs spéciales de fonctions L de Hecke. On définit de même pour toute place v ∈ |k| un analogue local L (s, πv ) de L (s, π). Supposons π partout tempérée c’est-à-dire que πv tempérée pour toute v ∈ |k|. Alors, pour presque toute G(O ) place v ∈ |k| et pour tout vecteur ϕ◦v ∈ πv v , on a (cf. [29] Theorem 2.12) 1 PH,v (ϕ◦v , ϕ◦v ) = L ( , πv ) vol(H(Ov ))(ϕ◦v , ϕ◦v )v . 2 Ce qui nous amène à définir des périodes locales normalisées par 1 \ PH,π := L ( , πv )−1 PH,v | , v ∈ |k|. v πv 2 On peut maintenant énoncer la conjecture d’Ichino-Ikeda pour les groupes unitaires dans le cas hermitien de la façon légèrement informelle suivante : Conjecture 2.2 (Ichino-Ikeda, N. Harris). — Soit π ⊂ Acusp (G) une représentation cuspidale irréductible partout tempérée. Alors pour tout vecteur factorisable N0 ϕ = v ϕv ∈ π, on a Y \ 1 1 |PH (ϕ)|2 = L ( , π) PH,πv (ϕv , ϕv ) |Sπ | 2 v∈|k|
où Sπ est le centralisateur du « paramètre de Langlands » de π (il s’agit d’un analogue global du groupe Sφ introduit dans la section 1.4.2 que nous ne tenterons pas de définir ici).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
192
R. BEUZART-PLESSIS
Remarque 2.3. —
– D’après l’équivalence sus-mentionnée PH,v |
πv
6= 0 ⇔ HomH(kv ) (πv , C) 6= 0,
et puisque L(s, π, Ad) n’a pas de pôle en s = 1, la conjecture ci-dessus implique la conjecture 2.1 dans le cas où π est tempérée partout. – D’après la conjecture de Ramanujan généralisée on s’attend à pouvoir remplacer l’hypothèse « π tempérée partout » par l’hypothèse « π est presque partout générique ». Cependant, même si la conjecture de Ramanujan généralisée est loin d’être établie en toute généralité, on peut énoncer une conjecture similaire sous l’hypothèse (a priori ) plus faible « π presque partout générique » à \ condition d’étendre la définition des périodes locales normalisées PH,π (qui ne v sont plus définies a priori par des intégrales absolument convergentes) par un certain « prolongement holomorphe ». Qu’un tel prolongement existe découle des résultats principaux de [9] et [8]. Sous cette forme plus générale (que nous n’énoncerons pas) la conjecture 2.2 devient alors strictement plus forte que la conjecture 2.1. – Dans le cas où dim(W ) = 1 (et donc dim(V ) = 2), la conjecture 2.2 est essentiellement équivalente à une formule bien connue de Waldspurger [61] pour les périodes toriques sur les algèbres de quaternions (voir [29] Sect.3 pour une réduction formelle) dont nous avons donné un exemple dans l’introduction. Il semble d’ailleurs que cette formule de Waldspurger fut une des inspirations principales d’Ichino et Ikeda pour énoncer leur conjecture. 2.5. Statuts Avant même que les conjectures de Gan-Gross-Prasad aient été étendues à tous les groupes classiques dans [17], Ginzburg, Jiang et Rallis ont montré dans une série de papiers [21], [22], [23] l’implication 1 ⇒ 2 de la conjecture 2.1 sous l’hypothèse que π est globalement générique c’est-à-dire qu’il existe une donnée de Whittaker globale (N, θ) de G avec θ trivial sur N (k) et ϕ ∈ π tels R que N (k)\N (A) ϕ(u)θ(u)du 6= 0, en particulier cela implique que le groupe G est quasi-déployé (car sinon G ne possède pas de donnée de Whittaker). Il n’est actuellement pas clair si l’approche de Ginzburg-Jiang-Rallis pourrait permettre d’établir l’implication inverse (au moins dans le cas globalement générique). Comme nous l’avons déjà indiqué, dans le cas hermitien et où dim(W ) = 1 les conjectures 2.1 et 2.2 découlent d’une formule de Waldspurger [61]. Cette même formule de Waldspurger recouvre d’ailleurs aussi les analogues de ces conjectures pour une paire de groupes spéciaux orthogonaux SO(W ) ⊂ SO(V ) avec dim(W ) = 2 et dim(V ) = 3. Toujours pour les groupes spéciaux orthogonaux et cette fois dans le cas où dim(W ) = 3 et dim(V ) = 4, l’analogue de la conjecture 2.2 a été établi
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
193
par Ichino [33] (la fonction L qui apparaît alors au numérateur du membre de droite de la formule est essentiellement associée au produit triple de trois représentations cuspidales de P GL2 ). Plus récemment, suivant une approche proposée par Jacquet-Rallis [36] de comparaison de formules des traces relatives et grâce au lemme fondamental adéquat qui a été démontré par Z. Yun [75], W. Zhang a démontré la conjecture 2.1 dans le cas hermitien sous les hypothèses simplificatrices suivantes ([77] Theorem 1.1) : – Toutes les places archimédiennes de k sont déployées dans k 0 . – Il existe deux places non archimédiennes distinctes v0 , v1 ∈ |k| déployées dans k 0 telles que πv0 est supercuspidale et πv1 est tempérée. Les travaux ultérieurs de H. Xue [74] d’une part et de Chaudouard-Zydor [12] d’autre part permettent maintenant de lever toutes ces restrictions sauf l’existence d’une place déployée dans k 0 en laquelle π est supercuspidale. Cette dernière hypothèse semble inévitable par la méthode de Zhang qui utilise des versions simples des formules des traces de Jacquet-Rallis. Les travaux en cours de M. Zydor et P.-H. Chaudouard pour établir des versions complètes de ces formules des traces relatives (travaux déjà initiés dans [78], [79], [80]) devraient permettre de lever cette dernière hypothèse. À la suite de son premier papier, Zhang [76] s’est attaqué à la conjecture 2.2. Son résultat principal est une preuve de cette conjecture essentiellement sous les hypothèses suivantes (nous laissons de côté un détail technique) : – Toutes les places archimédiennes de k sont déployées dans k 0 . – Il existe une place non archimédienne v0 ∈ |k| déployée dans k 0 en laquelle π est supercuspidale. – Pour toute place v ∈ |k| non déployée dans k 0 la représentation πv est soit supercuspidale soit non ramifiée. Cette troisième hypothèse est bien plus restrictive que les autres et provient du problème suivant : outre la comparaison globale de formules des traces relatives proposée par Jacquet et Rallis, Zhang doit aussi comparer certaines périodes locales ce qu’il n’arrive à faire aux places non déployées que pour les représentations non ramifiées ou supercuspidales. Dans [9], l’auteur est parvenu à étendre cette comparaison à toutes les représentations tempérées aux places non archimédiennes ce qui permet finalement de lever la troisième hypothèse. De plus, dans un travail en cours de rédaction [8], l’auteur a obtenu, par une autre méthode, la comparaison cherchée entre périodes locales aux places archimédiennes modulo un signe indéterminé ce qui devrait permettre d’établir sans la première hypothèse la formule conjecturée par Ichino-Ikeda à un signe près. Finalement, signalons que modulo ce problème de signe les travaux en cours de Chaudouard-Zydor devraient aussi permettre de lever la deuxième hypothèse.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
194
R. BEUZART-PLESSIS
À la suite des travaux de Zhang, les conjectures 2.1 et 2.2 ont aussi été partiellement établies dans le cas Fourier-Jacobi (i.e. antihermitien). Plus précisément, dans [41] Y. Liu a proposé une comparaison de formules des traces relatives analogue à celle de Jacquet-Rallis pour attaquer ces conjectures. Suivant la méthode de Zhang, Hang Xue [70], [71], [72] a alors pu démontrer les conjectures 2.1 et 2.2 dans le cas Fourier-Jacobi toujours sous la même hypothèse d’existence de deux places déployées distinctes en lesquelles π est supercuspidale et tempérée respectivement (ce qui lui permet, comme Zhang, de ne considérer que des formes simples de formules des traces relatives). 2.6. Survol de la preuve de la conjecture globale dans le cas hermitien Dans cette section, on donne les grandes lignes de la preuve par Zhang [77] de la conjecture de Gan-Gross-Prasad (Conjecture 2.1) sous certaines hypothèses locales dans le cas hermitien. En particulier, on ne parlera pas de la preuve de la conjecture d’Ichino-Ikeda (Conjecture 2.2) ni du cas antihermitien. 2.6.1. L’approche de Jacquet-Rallis. — Dans [36] Jacquet et Rallis proposent une approche à la conjecture 2.1 via une comparaison de « formules des traces relatives ». Ces dernières, qui généralisent la célèbre formule des traces d’Arthur-Selberg, ont été introduites et étudiées dans de nombreux cas par Jacquet et ses coauteurs (voir [40] pour une introduction à ce sujet). Dans sa version la plus épurée, une formule des traces relative consiste à exprimer de deux façons une intégrale de la forme suivante Z (8) Kf (h1 , h2 )η1 (h1 )η2 (h2 )dh1 dh2 H1 (k)\H1 (A)×H2 (k)\H2 (A)
où G0 est un groupe réductif connexe sur k, H1 et H2 sont des sous-groupes algébriques de G0 définis sur k, η1 : H1 (k)\H1 (A) → C× et η2 : H2 (k)\H2 (A) → C× sont des caractères automorphes, f est une fonction lisse à support compact sur G0 (A) et X Kf (x, y) = Kf (x−1 γy), x, y ∈ G0 (A) γ∈G0 (k)
est le noyau de l’action par convolution à droite de f sur L2 (G0 (k)\G0 (A)). Les formules des traces relatives introduites par Jacquet et Rallis correspondent aux deux cas suivants : – G0 = G = U (W ) × U (V ) où W ⊂ V sont des espaces hermitiens sur k 0 avec dim(W ) = dim(V ) − 1, H1 = H2 = H = U (W ) (muni de l’inclusion diagonale H ,→ G) et η1 , η2 sont triviaux. – G0 = G0 = Rk0 /k GLn × Rk0 /k GLn+1 où Rk0 /k désigne la restriction des scalaires à la Weil et n = dim(W ), H1 = H10 = Rk0 /k GLn muni de l’inclusion diagonale H10 ,→ G0 , H2 = H20 = GLn × GLn+1 muni de l’inclusion naturelle H20 ,→ G0 , η1 trivial et η2 = η un certain caractère quadratique de H20 (A).
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
195
Même dans ces cas particuliers, l’expression (8) n’est pas à prendre au sens littéral car l’intégrale est en général divergente et il faut la régulariser (par exemple en introduisant des troncations comme le fait Arthur). Pour contourner ce problème Zhang ne considère que de « bonnes » fonctions f pour lesquelles l’expression (8) est absolument convergente et qui lui permettent aussi d’obtenir des développements géométriques et spectraux absolument convergents. C’est ce qu’on appelle une formule des traces simple (en raison de la restriction sur les fonctions tests). Notons J(f ) et I(f 0 ) les formules des traces relatives de Jacquet-Rallis appliquées à de « bonnes » fonctions f ∈ Cc∞ (G(A)) et f 0 ∈ Cc∞ (G0 (A)) respectivement. De simples manipulations formelles qui sont justifiées par le choix de « bonnes » fonctions tests fournissent alors les égalités X X (9) O(γ, f ) = J(f ) = Jπ (f ) γ∈H(k)\Grs (k)/H(k)
(10)
X
π⊂Acusp (G)
O(δ, f 0 ) = I(f 0 ) =
δ∈H10 (k)\G0rs (k)/H20 (k)
X Π⊂Acusp (G0 ),ωΠ
IΠ (f 0 ) |A× ×A× =1
où – Grs ⊂ G désigne l’ouvert de Zariski des éléments semi-simples réguliers pour l’action par bimultiplication de H × H i.e. g ∈ Grs si et seulement si la double classe HgH est fermée pour la topologie de Zariski et g −1 Hg ∩ H = {1} (c’està-dire que le stabilisateur de g dans H × H est trivial). On définit de même l’ouvert G0rs ⊂ G0 des éléments semi-simples réguliers pour l’action de H10 × H20 par bimultiplication. – Pour γ ∈ Grs (k), Z O(γ, f ) = f (h−1 1 γh2 )dh1 dh2 H(A)×H(A)
désigne l’intégrale orbitale relative correspondante. Pour δ ∈ G0rs (k), on définit O(δ, f 0 ) de façon similaire en tordant par le caractère η sur H20 (A). – La somme de droite de la première formule porte sur toutes les représentations cuspidales irréductibles de G(A) et la somme de droite de la deuxième formule porte sur l’ensemble des représentations cuspidales irréductibles Π de G0 (A) dont le caractère central (noté ici ωΠ ) est trivial sur A× × A× = ZH20 (A) (le centre de H20 (A)). – Les distributions f 7→ Jπ (f ) et f 0 7→ IΠ (f 0 ) sont les caractères relatifs définis par X Jπ (f ) = PH (π(f )ϕ)PH (ϕ) ϕ∈Bπ
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
196
R. BEUZART-PLESSIS
IΠ (f 0 ) =
X
PH10 (Π(f 0 )ϕ)PH20 ,η (ϕ)
ϕ∈BΠ
où Bπ , BΠ désignent de (bonnes) bases orthonormées de π, Π respectivement pour les produits scalaires de Peterssen, PH est la période de Gan-Gross-Prasad déjà introduite et PH10 (resp. PH20 ,η ) est la période qui envoie une forme cuspidale sur son intégrale sur H10 (k)\H10 (A) (resp. sur ZH20 (A)H20 (k)\H20 (A) contre le caractère η). Les caractères relatifs Jπ et IΠ sont bien sûr intimement liés aux périodes PH d’une part et PH10 , PH20 ,η d’autre part. En fait, on montre sans trop de difficultés que Jπ 6= 0 ⇔ PH | 6= 0 π
IΠ 6= 0 ⇔ PH10 | 6= 0 et PH20 ,η | 6= 0. Π
Π
D’après les travaux de Rallis et Flicker [15] sur la période PH20 ,η et la classification des représentations automorphes de groupes unitaires par Mok [47] et Kaletha-MinguezShin-White [37], la période PH20 ,η | est non nulle si et seulement si Π provient par Π changement de base d’un produit de groupes unitaires U (W 0 )×U (V 0 ). D’un autre côté, d’après les travaux de Jacquet, Piatetski-Shapiro et Shalika [35] sur la convolution de Rankin-Selberg, la période PH10 | est non nulle si et seulement si L( 21 , Π) 6= 0 (où, Π rappelons-le, L(s, Π) désigne une fonction L de paire). Pour prouver la conjecture 2.1, il suffit donc de montrer que Jπ 6= 0 ⇔ IBC(π) 6= 0 et la stratégie proposée par Jacquet-Rallis pour établir cette équivalence consiste à comparer les formules (9) et (10). Plus précisément, il s’agit de comparer les côtés géométriques (i.e. les membres de gauche) pour en déduire une identité entre les côtés spectraux (i.e. les membres de droite). À cette fin, Jacquet et Rallis commencent par définir une injection H(k)\Grs (k)/H(k) ,→ H10 (k)\G0rs (k)/H20 (k) et plus généralement (11)
H(F )\Grs (F )/H(F ) ,→ H10 (F )\G0rs (F )/H20 (F )
pour toute extension F de k (en particulier pour les complétés kv de k). On dira alors que deux éléments (γ, δ) ∈ Grs (F ) × G0rs (F ) se correspondent si H10 (F )δH20 (F ) est l’image de la double classe H(F )γH(F ) par (11). Afin de comparer les formules (9) et (10), on cherche des fonctions f ∈ Cc∞ (G(A)) et f 0 ∈ Cc∞ (G0 (A)) telles que O(γ, f ) = O(δ, f 0 ) pour tout couple (γ, δ) ∈ Grs (k) × G0rs (k) d’éléments se correspondant. Lorsque f Q Q (resp. f 0 ) se décompose en produit f = v fv (resp. f 0 = v fv0 ) de fonctions locales
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
197
fv ∈ Cc∞ (G(kv )) (resp. fv0 ∈ Cc∞ (G0 (kv )) ; on a alors fv = 1G(Ov ) , resp. fv0 = 1G0 (Ov ) , pour presque toute v ∈ |k|), on a une factorisation correspondante des intégrales orbitales : Y Y O(γ, f ) = O(γ, fv ) (resp. O(δ, f 0 ) = O(δ, fv0 )) v
v
et on peut d’abord chercher à comparer les intégrales orbitales locales O(γ, fv ) et O(δ, fv0 ). Pour cela, Jacquet et Rallis introduisent une famille de « facteurs de transfert » ∆v : Grs (kv ) × G0rs (kv ) → C pour toute place v ∈ |k| qui sont définis par des formules explicites et dont les propriétés essentielles sont les suivantes : – ∆v (γ, δ) = 0 sauf si γ et δ se correspondent. – ∆v (h1 γh2 , h01 δh02 ) = ηv (h02 )∆v (γ, δ) pour tous h1 , h2 ∈ H(kv ), h01 ∈ H10 (kv ), h02 ∈ H20 (kv ) et où ηv désigne la composante locale en v du caractère η. – Si γ ∈ Grs (k) et δ ∈ G0rs (k) se correspondent alors Y ∆v (γ, δ) = 1. v∈|k|
Suivant Jacquet et Rallis on dit alors que deux fonctions (fv , fv0 ) ∈ Cc∞ (G(kv )) × Cc∞ (G0 (kv )) se correspondent ou encore qu’elles sont des transferts l’une de l’autre si O(γ, fv ) = ∆v (γ, δ)O(δ, fv0 ) pour tout couple (γ, δ) ∈ Grs (kv ) × G0rs (kv ) d’éléments se correspondant. Afin de construire suffisamment de couples de fonctions globales (f, f 0 ) permettant de comparer les formules (9) et (10) de façon effective, on est donc naturellement amené à considérer les deux problèmes locaux suivants : – Lemme fondamental : Montrer qu’en presque toute place v les fonctions fv = 1G(Ov ) et fv0 = 1G0 (Ov ) se correspondent. – Existence du transfert : Montrer que pour toute fonction fv ∈ Cc∞ (G(kv )) il existe une fonction fv0 ∈ Cc∞ (G0 (kv )) lui correspondant et réciproquement. Ces deux énoncés sont faciles à établir aux places v ∈ |k| déployées dans k 0 et le problème essentiel se situe donc aux places non déployées. Signalons au passage qu’une fois la comparaison effectuée, il faut encore séparer les contributions du côté spectral (afin d’obtenir une identité reliant directement Jπ et IBC(π) ). Pour cela, outre la conjecture locale (qui assure qu’étant donné Π il existe au plus une représentation cuspidale π vérifiant HomH(kv ) (πv , C) 6= 0 partout et Π = BC(π)) on a besoin a priori d’une version étendue du lemme fondamental pour tous les éléments de certaines algèbres de Hecke sphériques (c’est ce qui permet vraiment de séparer les contibutions spectrales via une application du théorème de Stone-Weierstrass). Cependant, ce
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
198
R. BEUZART-PLESSIS
lemme fondamental pour les algèbres de Hecke sphériques est lui aussi très facile à établir aux places déployées et Zhang a remarqué que cela était en fait suffisant pour isoler tous les termes spectraux d’après un résultat récent de Ramakhrishnan [51]. 2.6.2. Travail de Z. Yun. — Dans [75], Zhiwei Yun établit le lemme fondamental de Jacquet-Rallis pour les corps de fonctions. Sa preuve utilise des méthodes géométriques proches de celles introduites par Ngô Bao Châu dans sa thèse pour démontrer le lemme fondamental de Jacquet-Ye (qui est le lemme fondamental issu d’une autre formule des traces relative). Dans l’appendice de [75] et par des méthodes de théorie des modèles, Julia Gordon montre comment l’on peut transférer ce résultat aux corps de nombres et en déduire le lemme fondamental en toute place v de caractéristique résiduelle suffisamment grande. 2.6.3. Travail de W. Zhang. — Le résultat principal démontré par Zhang dans [77] est l’existence du transfert aux places non archimédiennes. Les étapes principales sont les suivantes : – En utilisant des partitions de l’unité et une descente inspirée d’HarishChandra, Zhang localise le problème aux voisinages d’éléments semi-simples (pas nécessairement réguliers) γ ∈ G(kv ) et δ ∈ G0 (kv ). Il montre alors que si γ et δ ne sont pas centraux on se ramène à un problème de transfert pour des groupes plus petits, ce qui permet de traiter ce cas par récurrence. – Aux voisinages d’éléments centraux, via une transformation de Cayley adéquate on se ramène à un problème analogue sur les algèbres de Lie. Plus précisément, on se ramène à comparer des intégrales orbitales pour l’action adjointe de U (W ) sur u(V ) (l’algèbre de Lie de U (V )) à des intégrales orbitales pour l’action adjointe de GLn sur gln+1 . – La même méthode de descente inspirée d’Harish-Chandra permet de montrer le résultat voulu pour les fonctions sur ces algèbres de Lie qui sont à support disjoint du cône nilpotent (i.e. l’ensemble des éléments dont les orbites contiennent l’origine dans leur fermeture). – Zhang montre que si f et f 0 sont des fonctions sur u(V ) et gln+1 respectivement, dont les intégrales orbitales se correspondent alors il en va de même de certaines de leurs transformées de Fourier partielles à une constante multiplicative explicite près (il faut en fait considérer quatre transformées de Fourier, y compris l’identité). Il s’agit du cœur de la preuve et cette étape se base sur des analogues locaux pour les algèbres de Lie des formules des traces de Jacquet-Rallis ainsi qu’une récurrence ingénieuse qui utilise le fait que les représentations adjointes de U (W ) et GLn sur u(V ) et gln+1 respectivement sont réductibles.
ASTÉRISQUE 414
(1140)
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
199
– Enfin, d’après un résultat d’Aizenbud [1], on peut écrire n’importe quelle fonction lisse à support compact sur les algèbres de Lie concernées comme une somme d’images par les diverses transformées de Fourier de fonctions dont les supports sont disjoints du cône nilpotent et d’une fonction dont toutes les intégrales orbitales sont nulles. D’après les étapes précédentes, cela conclut la preuve de l’existence du transfert. 2.6.4. Travaux de H. Xue et Chaudouard-Zydor. — Dans [74], H. Xue a adapté la preuve de Zhang aux places archimédiennes et obtenu l’existence du transfert pour un sous-espace dense de l’espace des fonctions tests. En effet, dans ce cas seule l’assertion duale du résultat d’Aizenbud est connue (i.e. il n’existe pas de distribution invariante sur l’algèbre de Lie dont toutes les transformées de Fourier sont à support dans le cône nilpotent) ce qui entraîne seulement que toute fonction test est approximable par des sommes de transformées de Fourier de fonctions à support disjoint du cône nilpotent et d’une fonction d’intégrales orbitales nulles. Outre cette différence, la preuve de Xue est similaire à celle dans le cas non archimédien et permet de lever l’hypothèse de Zhang aux places archimédiennes. Parallèlement, Zydor [78], [79] et Chaudouard-Zydor [12] ont commencé à développer les formules des traces de Jacquet-Rallis en toute généralité (i.e. sans restriction sur les fonctions tests). Comme corollaire de leurs premiers résultats, on peut appliquer et comparer ces formules des traces pour de « bonnes » fonctions un peu plus générales que celles de Zhang ce qui permet notamment de se passer de l’hypothèse de l’existence d’une place déployée en laquelle la représentation π est tempérée.
RÉFÉRENCES [1] A. Aizenbud – A partial analog of the integrability theorem for distributions on p-adic spaces and applications, Israel J. Math. 193 (2013), no 1, p. 233–262. [2] A. Aizenbud, D. Gourevitch, S. Rallis & G. Schiffmann – Multiplicity one theorems, Ann. of Math. 172 (2010), no 2, p. 1407–1434. [3] J. Arthur – The endoscopic classification of representations, American Mathematical Society Colloquium Publications, vol. 61, Amer. Math. Soc., 2013. [4] H. Atobe – The local theta correspondence and the local Gan-Gross-Prasad conjecture for the symplectic-metaplectic case, Math. Ann. 371 (2018), nos 1-2, p. 225–295. [5] R. Beuzart-Plessis – Expression d’un facteur epsilon de paire par une formule intégrale, Canad. J. Math. 66 (2014), no 5, p. 993–1049.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
200
[6] [7] [8] [9]
[10]
[11] [12] [13] [14]
[15] [16] [17]
[18] [19] [20]
[21]
R. BEUZART-PLESSIS
, Endoscopie et conjecture locale raffinée de Gan-Gross-Prasad pour les groupes unitaires, Compos. Math. 151 (2015), no 7, p. 1309–1371. , La conjecture locale de Gross-Prasad pour les représentations tempérées des groupes unitaires, Mém. Soc. Math. Fr. (N.S.) (2016), no 149, p. 191. , Factorisations de périodes et formules de Plancherel, Cours Peccot, Collège de France, Paris, 21 avril-12 mai 2017, 2017. , Comparison of local spherical characters and the Ichino-Ikeda conjecture for unitary groups, prépublication arXiv:1602.06538, à paraître dans J. Inst. math. Jussieu. , A local trace formula for the local Gan-Gross-Prasad conjecture for unitary groups : The archimedean case, prépublication arXiv:1506.01452, à paraître dans Astérisque. W. Casselman – Canonical extensions of Harish-Chandra modules to representations of G, Canad. J. Math. 41 (1989), no 3, p. 385–438. P.-H. Chaudouard & M. Zydor – Le transfert singulier pour la formule des traces de Jacquet-Rallis, prépublication arXiv:1611.09656. L. Clozel – Changement de base pour les représentations tempérées des groupes réductifs réels, Ann. Sci. École Norm. Sup. 15 (1982), no 1, p. 45–115. P. Deligne – Les constantes des équations fonctionnelles des fonctions L, in Modular functions of one variable, II (Proc. Internat. Summer School, Univ. Antwerp, Antwerp, 1972), Lecture Notes in Math., vol. 349, 1973, p. 501–597. Y. Z. Flicker – Twisted tensors and Euler products, Bull. Soc. Math. France 116 (1988), no 3, p. 295–313. W. T. Gan – Recent progress on the Gross-Prasad conjecture, Acta Math. Vietnam. 39 (2014), no 1, p. 11–33. W. T. Gan, B. H. Gross & D. Prasad – Symplectic local root numbers, central critical L values, and restriction problems in the representation theory of classical groups, Astérisque 346 (2012), p. 1–109. W. T. Gan & A. Ichino – Formal degrees and local theta correspondence, Invent. math. 195 (2014), no 3, p. 509–672. , The Gross-Prasad conjecture and local theta correspondence, Invent. math. 206 (2016), no 3, p. 705–799. W. T. Gan & S. Takeda – On the Howe duality conjecture in classical theta correspondence, in Advances in the theory of automorphic forms and their Lfunctions, Contemp. Math., vol. 664, Amer. Math. Soc., 2016, p. 105–117. D. Ginzburg, D. Jiang & S. Rallis – On the nonvanishing of the central value of the Rankin-Selberg L-functions, J. Amer. Math. Soc. 17 (2004), no 3, p. 679–722.
ASTÉRISQUE 414
(1140)
[22]
[23]
[24] [25] [26] [27] [28]
[29] [30] [31] [32] [33] [34]
[35] [36]
[37]
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
201
, On the nonvanishing of the central value of the Rankin-Selberg Lfunctions. II, in Automorphic representations, L-functions and applications : progress and prospects, Ohio State Univ. Math. Res. Inst. Publ., vol. 11, de Gruyter, 2005, p. 157–191. , Models for certain residual representations of unitary groups, in Automorphic forms and L-functions I. Global aspects, Contemp. Math., vol. 488, Amer. Math. Soc., 2009, p. 125–146. R. Goodman & N. R. Wallach – Symmetry, representations, and invariants, Graduate Texts in Math., vol. 255, Springer, 2009. B. H. Gross & D. Prasad – On the decomposition of a representation of SOn when restricted to SOn−1 , Canad. J. Math. 44 (1992), no 5, p. 974–1002. , On irreducible representations of SO2n+1 × SO2m , Canad. J. Math. 46 (1994), no 5, p. 930–950. M. Harris, H. Grobner & J. Lin – Deligne’s conjecture for automorphic motives over CM-fields, Part I : factorisation, prépublication arXiv:1802.02958. M. Harris & R. Taylor – The geometry and cohomology of some simple Shimura varieties, Annals of Math. Studies, vol. 151, Princeton Univ. Press, 2001. R. N. Harris – A Refined Gross-Prasad Conjecture for Unitary Groups, Thèse, University of California, San Diego, 2011. H. He – On the Gan-Gross-Prasad conjecture for U (p, q), Invent. math. 209 (2017), no 3, p. 837–884. V. Heiermann – A note on standard modules and Vogan L-packets, Manuscripta Math. 150 (2016), nos 3-4, p. 571–583. G. Henniart – Une preuve simple des conjectures de Langlands pour GL(n) sur un corps p-adique, Invent. math. 139 (2000), no 2, p. 439–455. A. Ichino – Trilinear forms and the central values of triple product L-functions, Duke Math. J. 145 (2008), no 2, p. 281–307. A. Ichino & T. Ikeda – On the periods of automorphic forms on special orthogonal groups and the Gross-Prasad conjecture, Geom. Funct. Anal. 19 (2010), no 5, p. 1378–1425. H. Jacquet, I. I. Piatetskii-Shapiro & J. A. Shalika – Rankin-Selberg convolutions, Amer. J. Math. 105 (1983), no 2, p. 367–464. H. Jacquet & S. Rallis – On the Gross-Prasad conjecture for unitary groups, in On certain L-functions, Clay Math. Proc., vol. 13, Amer. Math. Soc., 2011, p. 205–264. T. Kaletha, A. Minguez, S. W. Shin & P. J. White – Endoscopic classification of representations : Inner forms of unitary groups, prépublication arXiv:1409.3731.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
202
R. BEUZART-PLESSIS
[38] R. E. Kottwitz & D. Shelstad – Foundations of twisted endoscopy, Astérisque, vol. 255, 1999. [39] R. P. Langlands – On the classification of irreducible representations of real algebraic groups, in Representation theory and harmonic analysis on semisimple Lie groups, Math. Surveys Monogr., vol. 31, Amer. Math. Soc., 1989, p. 101–170. [40] E. Lapid – The relative trace formula and its applications, in Automorphic Forms and Automorphic L-Functions, Surikaisekikenkyusho Kokyuroku, vol. 1468, 2006, p. 76–87. [41] Y. Liu – Relative trace formulae toward Bessel and Fourier-Jacobi periods on unitary groups, Manuscripta Math. 145 (2014), nos 1-2, p. 1–69. [42] P. Mezo – Tempered spectral transfer in the twisted endoscopy of real groups, J. Inst. Math. Jussieu 15 (2016), no 3, p. 569–612. [43] C. Mœglin, M.-F. Vignéras & J.-L. Waldspurger – Correspondances de Howe sur un corps p-adique, Lecture Notes in Math., vol. 1291, Springer, 1987. [44] C. Mœglin & J.-L. Waldspurger – Décomposition spectrale et séries d’Eisenstein, Progress in Math., vol. 113, Birkhäuser, 1994. [45]
, La conjecture locale de Gross-Prasad pour les groupes spéciaux orthogonaux : le cas général, Astérisque 347 (2012), p. 167–216.
[46]
, Stabilisation de la formule des traces tordue. Vol. 1, Progress in Math., vol. 316, Birkhäuser, 2016.
[47] C. P. Mok – Endoscopic classification of representations of quasi-split unitary groups, vol. 235, Mem. Amer. Math. Soc., no 1108, 2015. [48] D. Prasad – On the local Howe duality correspondence, Int. Math. Res. Not. 1993 (1993), no 11, p. 279–287. [49]
, Theta correspondence for unitary groups, Pacific J. Math. 194 (2000), no 2, p. 427–438.
[50] K. Prasanna & A. Venkatesh – Automorphic cohomology, motivic cohomology and the adjoint L-function, prépublication arXiv:1609.06370. [51] D. Ramakrishnan – A mild Tchebotarev theorem for GL(n), J. Number Theory 146 (2015), p. 519–533. [52] F. Rodier – Modèle de Whittaker et caractères de représentations, in Non-commutative harmonic analysis (Actes Colloq., Marseille-Luminy, 1974), Lecture Notes in Math., vol. 466, 1975, p. 151–171. [53] P. Scholze – The local Langlands correspondence for GLn over p-adic fields, Invent. math. 192 (2013), no 3, p. 663–715. [54] D. Shelstad – L-indistinguishability for real groups, Math. Ann. 259 (1982), no 3, p. 385–430.
ASTÉRISQUE 414
(1140)
[55]
[56]
[57] [58] [59]
[60]
[61] [62]
[63] [64] [65] [66]
[67] [68] [69]
PROGRÈS RÉCENTS SUR LES CONJECTURES DE GAN-GROSS-PRASAD
203
, Tempered endoscopy for real groups. I. Geometric transfer with canonical factors, in Representation theory of real reductive Lie groups, Contemp. Math., vol. 472, Amer. Math. Soc., 2008, p. 215–246. , Tempered endoscopy for real groups. II. Spectral transfer factors, in Automorphic forms and the Langlands program, Adv. Lect. Math. (ALM), vol. 9, Int. Press, 2010, p. 236–276. B. Sun – Multiplicity one theorems for Fourier-Jacobi models, Amer. J. Math. 134 (2012), no 6, p. 1655–1678. B. Sun & C.-B. Zhu – Multiplicity one theorems : the Archimedean case, Ann. of Math. 175 (2012), no 1, p. 23–44. J. Tate – Number theoretic background, in Automorphic forms, representations and L-functions (Proc. Sympos. Pure Math., Oregon State Univ., Corvallis, Ore., 1977), Part 2, Proc. Sympos. Pure Math., XXXIII, Amer. Math. Soc., 1979, p. 3– 26. D. A. J. Vogan – The local Langlands conjecture, in Representation theory of groups and algebras, Contemp. Math., vol. 145, Amer. Math. Soc., 1993, p. 305– 379. J.-L. Waldspurger – Sur les valeurs de certaines fonctions L automorphes en leur centre de symétrie, Compos. math. 54 (1985), no 2, p. 173–242. , Démonstration d’une conjecture de dualité de Howe dans le cas p-adique, p 6= 2, in Festschrift in honor of I. I. Piatetski-Shapiro on the occasion of his sixtieth birthday, Part I (Ramat Aviv, 1989), Israel Math. Conf. Proc., vol. 2, Weizmann, Jerusalem, 1990, p. 267–324. , Une formule intégrale reliée à la conjecture locale de Gross-Prasad, Compos. Math. 146 (2010), no 5, p. 1180–1290. , Calcul d’une valeur d’un facteur par une formule intégrale, Astérisque 347 (2012), p. 1–102. , La conjecture locale de Gross-Prasad pour les représentations tempérées des groupes spéciaux orthogonaux, Astérisque 347 (2012), p. 103–165. , Une formule intégrale reliée à la conjecture locale de Gross-Prasad, 2e partie : extension aux représentations tempérées, Astérisque 346 (2012), p. 171– 312. N. R. Wallach – Real reductive groups. II, Pure and Applied Mathematics, vol. 132, Academic Press, 1992. A. Weil – Adeles and algebraic groups, Progress in Math., vol. 23, Birkhäuser, 1982. H. Weyl – The classical groups, Princeton Landmarks in Mathematics, Princeton Univ. Press, 1997.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
204
R. BEUZART-PLESSIS
[70] H. Xue – The Gan-Gross-Prasad conjecture for U(n) × U(n), Adv. Math. 262 (2014), p. 1130–1191. [71]
, Fourier-Jacobi periods and the central value of Rankin-Selberg Lfunctions, Israel J. Math. 212 (2016), no 2, p. 547–633.
[72]
, Fourier-Jacobi periods and local spherical character identities, prépublication https://www.math.arizona.edu/~xuehang/simple_rtf.pdf, 2017.
[73]
, Refined global Gan-Gross-Prasad conjecture for Fourier-Jacobi periods on symplectic groups, Compos. Math. 153 (2017), no 1, p. 68–131.
[74]
, On the global Gan-Gross-Prasad conjecture for unitary groups : approximating smooth transfer of Jacquet-Rallis, J. reine angew. Math. 756 (2019), p. 65–100.
[75] Z. Yun – The fundamental lemma of Jacquet and Rallis, Duke Math. J. 156 (2011), no 2, p. 167–227. [76] W. Zhang – Automorphic period and the central value of Rankin-Selberg Lfunction, J. Amer. Math. Soc. 27 (2014), no 2, p. 541–612. [77]
, Fourier transform and the global Gan-Gross-Prasad conjecture for unitary groups, Ann. of Math. 180 (2014), no 3, p. 971–1049.
[78] M. Zydor – La variante infinitésimale de la formule des traces de Jacquet-Rallis pour les groupes unitaires, Canad. J. Math. 68 (2016), no 6, p. 1382–1435. [79]
, La variante infinitésimale de la formule des traces de Jacquet-Rallis pour les groupes linéaires, J. Inst. Math. Jussieu 17 (2018), no 4, p. 735–783.
[80]
, Les formules des traces relatives de Jacquet-Rallis grossières, prépublication arXiv:1510.04301, à paraître dans J. reine angew. Math.
Raphaël BEUZART-PLESSIS Université d’Aix-Marseille I2M - CNRS (UMR 7373) Campus de Luminy 13288 Marseille Cédex 9, France E-mail : [email protected]
ASTÉRISQUE 414
Séminaire BOURBAKI 70e année, 2017–2018, no 1141, p. 205 à 250
Janvier 2018
doi:10.24033/ast.1085
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES [Travaux de Katz] par Javier FRESÁN
1. INTRODUCTION Cent ans se sont écoulés depuis la parution de l’article de Weyl [48] sans que les résultats d’équirépartition en théorie des nombres cessent de faire florès, révélant des liens profonds avec la géométrie algébrique et la théorie des représentations. L’interaction de ces domaines est particulièrement riche dans les travaux de Katz dont il sera question ici. Ce sont des théorèmes, anciens et récents, d’équirépartition de sommes exponentielles sur les corps finis, le plus souvent à caractéristique fixée. Les sommes concernées s’obtiennent par transformation de Fourier, relative à un caractère, de la fonction trace d’un faisceau `-adique sur un groupe algébrique commutatif, et il s’agit de comprendre leur répartition lorsque le faisceau est fixe mais que l’on fait varier le caractère.
1.1. L’exemple des sommes de Gauss et des sommes de Kloosterman Soient p un nombre premier, q une puissance de p et Fq un corps fini à q éléments. Étant donnés un caractère additif non trivial ψ : Fq → C× et un caractère × multiplicatif χ : F× q → C , on définit la somme de Gauss g(ψ, χ) comme l’entier algébrique X g(ψ, χ) = ψ(x)χ(x). x∈F× q
Par exemple, si q = p et si l’on prend pour ψ le caractère x 7→ exp(2πix/p) et pour χ le symbole de Legendre, il s’agit de la somme considérée par Gauss dans sa quatrième preuve de la loi de réciprocité quadratique [12].
© Astérisque 414, SMF 2019
206
J. FRESÁN
Si χ est trivial, la somme de Gauss vaut −1 ; sinon, sa valeur absolue est égale √ à q. Choisissons, pour chaque p, un caractère non trivial ψp de Fp et notons ψq le caractère de Fq obtenu par composition avec la trace. Gardant ψq fixe et faisant varier χ parmi les caractères multiplicatifs non triviaux, on obtient q − 2 points θq,χ =
g(ψq , χ) √ q
dans le cercle unité S 1 . Comment ces points se répartissent-ils quand q tend vers l’infini ? Soient (X, µ) un espace topologique compact muni d’une mesure de probabilité µ et (SN ) une suite (1) d’ensembles finis non vides avec des applications θN : SN → X. Rappelons que les (SN , θN ) sont dits équirépartis selon µ si la suite de mesures P |SN |−1 x∈SN δθN (x) converge vaguement vers µ lorsque N tend vers l’infini, c’est-à-dire si, pour toute fonction continue f : X → C, on a l’égalité Z 1 X f (x)µ(x) = lim f (θN (x)). N →∞ |SN | X x∈SN
Il suffit en fait de la vérifier pour une classe de fonctions test dont les combinaisons linéaires finies sont denses dans l’espace C (X) des fonctions continues à valeurs complexes muni de la topologie de la convergence uniforme. Dans le cas qui nous occupe, Katz remarqua dans [17, §1.3.3] que la majoration des sommes de Kloosterman obtenue par Deligne comme conséquence de ses travaux sur la conjecture de Weil entraînait le résultat d’équirépartition suivant : Théorème 1.1 (Deligne). — Lorsque q tend vers l’infini, les points {θq,χ }χ6=1 s’équirépartissent selon la mesure de Haar normalisée sur le cercle unité. Autrement dit, pour toute fonction continue f : S 1 → C on a l’égalité Z 2π 1 1 X (1) f (eiθ ) dθ = lim f (θq,χ ). q→∞ q − 2 2π 0 χ6=1
Comme les polynômes de Laurent sont denses dans C (S 1 ), il suffit de considérer les fonctions f (z) = z n avec n entier. Le cas n = 0 est évident. Le membre gauche de (1) étant nul pour n 6= 0, il faut démontrer que la suite X 1 1 X f (θq,χ ) = n g(ψq , χ)n 2 (q − 2) q−2 q χ6=1 χ6=1 (1) Bien que l’on utilise N comme paramètre, dans les énoncés qui suivent la suite n’est pas forcément indexée par des entiers mais par des caractères, des points d’une variété algébrique, etc.
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
207
converge vers zéro lorsque q tend vers l’infini (c’est le critère d’équirépartition de Weyl ). Grâce à la relation g(ψq , χ)−1 = g(ψ¯q , χ)q ¯ −1 , on peut se ramener à n > 1, auquel cas les puissances des sommes de Gauss sont égales à X g(ψq , χ)n = ψq (x1 + · · · + xn )χ(x1 · · · xn ) x1 ,...,xn ∈F× q
(2)
X
=
a∈F× q
χ(a)
X
ψq (x1 + · · · + xn ).
x1 ,...,xn ∈F× q x1 ···xn =a
Il s’ensuit que χ 7→ g(ψq , χ)n est la transformée de Fourier, au sens du groupe × abélien fini F× q , de la fonction qui à un élément a ∈ Fq associe la somme de Kloosterman X ψq (x1 + . . . + xn ). Kln (a, q) = x1 ,...,xn ∈F× q x1 ···xn =a
Pour n = 2, ces sommes font un caméo dans l’article posthume de Poincaré sur les formes modulaires, où il « se borne à constater » qu’elles ne sont pas nulles en général (2) [39, p. 148]. Kloosterman les introduisit de manière indépendante en 1926, en raffinant la méthode du cercle pour étudier l’asymptotique du nombre de représentations d’un entier par une forme quadratique définie positive en quatre variables [29]. Un point clé de son travail est la majoration |Kl2 (a, q)| < 2q 3/4 , qu’il obtint en calculant le quatrième moment X Kl2 (a, q)4 = 2q 3 − 3q 2 − 3q − 1. (3) a∈F× q
Quelques années plus tard, Salié [43] et Davenport [7] purent améliorer l’exposant de 3/4 à 2/3 en estimant le sixième moment. Puis en 1934 Hasse observa, en comparant la somme de Kloosterman au nombre de solutions de l’équation y q − y = x + ax−1 , √ que la borne optimale 2 q découlait de l’hypothèse de Riemann pour les courbes sur les corps finis [15] ; avec la preuve de Weil entre 1940 et 1948, elle fut enfin établie [46]. Trouver la majoration optimale pour les sommes de Kloosterman en plusieurs variables est une tâche significativement plus compliquée qui requiert l’analogue de l’hypothèse de Riemann pour la cohomologie à coefficients dans un faisceau `-adique. En la démontrant dans l’article [9], auquel on se référera comme « Weil II » par la suite, Deligne ouvrit la voie à de nombreuses applications à l’étude des sommes Les sommes de Poincaré portent sur (Z/qZ)× et peuvent être nulles. Celles que l’on considère ici ne le sont jamais, car Kl2 (a, q) appartient au sous-anneau de C engendré par une racine primitive p-ème de l’unité ζp et l’on a Kl2 (a, q) ≡ −1 modulo l’idéal premier 1 − ζp . (2)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
208
J. FRESÁN
exponentielles que nous sommes encore loin d’avoir épuisées. Lui-même exposa le principe de la méthode dans [8], où il montre comment en déduire l’estimée |Kln (a, q)| 6 nq
n−1 2
pour n’importe quels n > 2 et a ∈ F× q . C’est ce qu’il fallait pour conclure la preuve. Fin de la démonstration. — En sommant la formule (2) sur les caractères multiplicatifs non triviaux, il vient X X X g(ψq , χ)n = −g(ψ, 1)n + Kln (a, q) χ(a) = (−1)n+1 + (q − 1)Kln (1, q) χ6=1
a∈F× q
χ
par orthogonalité des caractères. D’après la majoration de Deligne, nous avons donc X 2n + 1 1 n n g(ψq , χ) 6 √ q 2 (q − 2) q χ6=1 pour tout q > 2 et la limite du membre gauche est bien zéro lorsque q → ∞. Remarque 1.2. — Le théorème s’applique tant à la situation où p est fixe et l’on fait tendre q vers l’infini parmi les puissances de p qu’à la situation où p varie aussi, ce qui est possible car la constante dans la majoration des moments (en l’occurrence 2n + 1) est indépendante de p. En théorie analytique des nombres, on parle souvent d’équirépartition verticale ou horizontale pour distinguer ces deux cas. Revenons maintenant aux sommes de Kloosterman. Comme appliquer la conjugaison complexe revient à échanger xi et −xi dans l’expression de Kl2 (a, q), ce sont des nombre réels (il en va de même pour tout n pair). Au vu de la borne de Weil, pour chaque a ∈ F× q , il existe un unique angle θq,a ∈ [0, π] tel que √ Kl2 (a, q) = 2 q cos θq,a . Comment ces q − 1 angles varient-ils avec q ? En s’appuyant sur l’interprétation de la somme Kl2 (a, q) comme la trace de Frobenius en a ∈ Gm (Fq ) d’un système local `-adique sur Gm et sur un théorème de Deligne affirmant que la répartition de telles traces est gouvernée par le groupe de monodromie, Katz démontra dans [18] que les angles {θq,a }a∈F× se répartissent comme les classes de conjugaison de matrices q aléatoires dans le groupe spécial unitaire SU(2). Plus précisément, si l’on identifie l’intervalle [0, π]Äà l’espace ä de ces classes par l’application qui envoie θ sur la classe de iθ 0 conjugaison de e0 e−iθ , l’image directe de la mesure de Haar normalisée sur SU(2) par la projection canonique est la mesure (2/π) sin2 θ dθ sur [0, π]. Elle porte en théorie des nombres le nom de mesure de Sato-Tate, d’après leur célèbre conjecture sur la répartition du terme d’erreur dans l’approximation par p + 1 du nombre de points de la réduction modulo p d’une courbe elliptique sur Q sans multiplication complexe.
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
209
Théorème 1.3 (Katz). — Lorsque q tend vers l’infini, les angles {θq,a }a∈F× q s’équirépartissent selon la mesure de Sato-Tate, c’est-à-dire pour toute fonction continue f : [0, π] → C on a l’égalité Z 1 X 2 π f (θ) sin2 θ dθ = lim f (θq,a ). q→∞ π 0 q−1 × a∈Fq
À nouveau, ce résultat est valable pour n’importe quelle suite de corps finis de cardinaux croissants. On conjecture également que, pour un entier fixe a, les angles {θp,a }p6N s’équirépartissent selon la mesure de Sato-Tate lorsque p tend vers l’infini parmi les nombres premiers ne divisant pas a, mais même des conséquences faibles de cet énoncé paraissent hors de portée à l’heure actuelle (3). 1.2. Les sommes d’Evans et de Rudnick Autour de 2003, Evans et Rudnick trouvèrent d’autres exemples de sommes exponentielles dépendant d’un caractère multiplicatif qui, d’après leurs expériences numériques, semblaient s’équirépartir selon la mesure de Sato-Tate. D’un côté, Evans étudia les sommes 1 X S(χ) = − √ χ(x)ψq x − x−1 , q × x∈Fq
qui sont des nombres réels de valeur absolue au plus 2 par l’hypothèse de Riemann sur les courbes. Ils s’écrivent donc S(χ) = 2 cos θq,χ pour un unique θq,χ ∈ [0, π]. Est-il vrai que les angles {θq,χ }χ s’équirépartissent selon la mesure de Sato-Tate quand q tend vers l’infini ? Ou, ce qui revient au même, les sommes S(χ) s’équirépartissent-elles √ selon la mesure du demi-cercle (1/2π) 4 − x2 dx sur l’intervalle [−2, 2] ? À la même époque, Rudnick rencontra des sommes semblables dans ses travaux sur le chaos quantique. Décrivons brièvement le contexte, en nous référant à [32], [33] et [42] pour plus de détails. Il s’agit de quantifier le système dynamique obtenu en itérant la transformation du tore T 2 = R2 /Z2 définie par une matrice hyperbolique A ∈ SL(2, Z), des applications connues comme « cat maps » dans la littérature. Soient N > 1 un entier et HN l’espace de Hilbert L2 (Z/N Z). On pense à N comme à l’inverse de la constante de Planck ~, de sorte que la limite semiclassique ~ → 0 devienne N → ∞. Après avoir associé à chaque observable classique (3) Mentionnons, à titre d’exemple, la conjecture du changement de signe : puisque sin2 θ est symétrique par rapport à θ = π/2 et que les Kl2 (a, p) sont tous non nuls, il devrait y avoir asymptotiquement autant de premiers p pour lesquels la somme de Kloosterman est positive que négative. On n’en sait rien ! Dans [10], Fouvry et Michel démontrent des résultats dans cette direction quand la suite des p est remplacée par une suite de nombres « presque premiers », c’est-à-dire non premiers, sans facteur carré et ayant un nombre de facteurs premiers borné uniformément.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
210
J. FRESÁN
f : T 2 → R de classe C ∞ un opérateur autoadjoint OpN (f ) sur HN (l’observable quantique), une quantification de A est une suite d’opérateurs unitaires UN (A) sur HN vérifiant la formule d’Egoroff UN (A)∗ OpN (f )UN (A) = OpN (f ◦ A) pour toute observable f . Si ϕ1 , . . . , ϕN est une base orthonormale de HN formée de vecteurs propres pour l’opérateur UN (A), on sait que la moyenne des espéR rances hOpN (f )ϕi , ϕi i converge vers T 2 f (x)dx lorsque N tend vers l’infini. Est-ce encore vrai pour chaque terme pris individuellement ? Dans [32], Kurlberg et Rudnick observent que A admet une quantification qui ne dépend que de la réduction de la matrice modulo 2N , ce qui leur permet d’introduire une classe d’opérateurs d’origine arithmétique sur HN qu’ils appellent opérateurs de Hecke. Le théorème d’unique ergodicité quantique est l’énoncé que, si les ϕi sont simultanément des fonctions propres pour UN (A) et les opérateurs de Hecke, on a Z lim hOpN (f )ϕi , ϕi i = f (x) dx N →∞
T2
pour tout i. Comment les espérances hOpN (f )ϕi , ϕi i fluctuent-elles autour de la limite ? Puisque l’on s’attend à ce que le terme d’erreur soit génériquement √ d’ordre 1/ N , il est naturel de considérer les fluctuations définies par Z ã √ Å (N ) Fi = N hOpN (f )ϕi , ϕi i − f (x) dx . T2
Prenons pour N un nombre premier p > 3 tel que la matrice A soit diagonalisable modulo p, disons par une matrice de passage P . Dans ce cas, chaque caractère multiplicatif χ de Fp donne lieu à une fonction propre ϕχ = UN (P )χ pour UN (A) et les opérateurs de Hecke. À un facteur près, les fluctuations des ϕχ sont les sommes X 1 E(χ) = − √ χ(x)ψp ((x + 1)/(x − 1)). p x∈Fp \{0,1}
Si χ n’est pas trivial, E(χ) est encore un nombre réel compris entre −2 et 2. Des expériences numériques (figure 1) suggèrent que les {E(χ)}χ6=1 s’équirépartissent selon la mesure du demi-cercle lorsque p tend vers l’infini. Peut-on le démontrer ? Dans ce texte, nous expliquerons comment un théorème de Katz [22] permet entre autres d’apporter une réponse positive aux questions d’Evans et de Rudnick. Leur difficulté vient du fait que, n’étant pas les traces de Frobenius d’un même système local `-adique, ces familles de sommes exponentielles indexées par des caractères multiplicatifs ne rentrent pas dans le cadre du théorème d’équirépartition de Deligne. Il faut notamment trouver un substitut du groupe de monodromie : c’est là que le
ASTÉRISQUE 414
(1141)
211
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
1 0.9
Sato−Tate CDF Numeric CDF
0.8 0.7 0.6 0.4
0.5
0.3 0.4
0.2 0.1
0.3
0 −2
0.2
0
2
0.1 0 −2
−1.5
−1
−0.5
0
0.5
1
1.5
2
Figure 1. Comparaison entre la fonction de répartition des fluctuations pour la matrice A = 74 −2 −1 et le premier p = 1997 et celle d’une variable aléatoire pour la mesure du demi-cercle, d’après Rosenzweig [41].
formalisme tannakien nous viendra en aide. Avant d’énoncer le théorème principal, nous illustrerons la démarche par les sommes de Gauss (4). 1.3. La méthode `-adique Posons k = Fq et fixons une clôture algébrique k¯ de k. Soient ` un nombre premier distinct de p et Q` une clôture algébrique du corps des nombres `-adiques. Le choix d’un plongement ι : Q` ,→ C induit un isomorphisme entre les clôtures algébriques de Q dans Q` et dans C par le biais duquel on peut voir les caractères × × à valeurs dans Q` . Soit donc ψ : k → Q` un caractère additif non trivial. Considérons une clôture séparable k(T )sep du corps des fractions rationnelles et une solution U ∈ k(T )sep de l’équation d’Artin-Schreier U − U q = T . L’extension k(T, U ) est galoisienne sur k(T ) de groupe k, un élément a ∈ k opérant par U 7→ U + a. (4)
La recension [30] est un excellent point d’entrée aux idées de la preuve. L’exemple des sommes de Gauss est certes très particulier, en ce sens que pour déterminer leur répartition il suffit d’estimer leurs puissances n-ièmes et que l’on arrive à identifier celles-ci avec les sommes de Kloosterman, mais en l’interprétant géométriquement on y voit déjà apparaître tous les ingrédients essentiels.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
212
J. FRESÁN
Notons Lψ la représentation × ψ Gal(k(T )sep /k(T )) −→ Gal(k(T, U )/k(T )) ∼ = k −→ Q`
obtenue par composition de la surjection canonique avec le caractère ψ. Identifiant k(T ) au corps de fonctions de la droite projective P1k , on voit que Lψ est non ramifiée en dehors de l’infini. Par suite, pour chaque point x de la droite affine A1k à valeurs dans une extension finie E de k, la classe de conjugaison FrobE,x dans le ¯ groupe Gal(k(T )sep /k(T )) définie par le Frobenius géométrique de Gal(k/E) agit × sur Q` au travers de la représentation Lψ . Pour calculer cette action, notons n le j j−1 j−1 degré de E sur k. Si y ∈ k¯ satisfait à l’équation y − y q = x, alors y q = y q − xq pour tout entier j > 1 ; sommant sur les j = 1, . . . , n, on trouve que la substitution n de Frobenius est donnée par y 7→ y q = y − TrE/k (x). Le Frobenius géométrique étant son inverse, on en déduit après application du caractère ψ que la classe de conjugaison FrobE,x agit sur l’espace de la représentation Lψ comme la multiplication par ψ(TrE/k (x)). De même, à partir de l’équation de Kummer U 1−q = T , on peut associer à chaque × caractère multiplicatif χ : k × → Q` une représentation Lχ de Gal(k(T )sep /k(T )) × à valeurs dans Q` , cette fois-ci ramifiée en zéro et l’infini, telle que la classe de conjugaison FrobE,x agisse par multiplication par χ(NE/k (x)) pour tout x ∈ E × . En termes de ces représentations, la somme de Gauss s’écrit X g(ψ, χ) = Tr(FrobE,x |Lψ ⊗ Lχ ). x∈F× q
Dans le langage plus géométrique que l’on adoptera ici, Lψ et Lχ sont des systèmes locaux `-adiques de rang un sur A1k et sur Gm,k respectivement ; on notera encore Lψ la restriction à Gm,k . Pour des raisons pour l’instant mystérieuses, il est préférable de travailler avec l’objet M = Lψ (1/2)[1]. Le symbole (1/2) désigne une demi-torsion √ à la Tate, dont l’effet est de multiplier les traces de Frobenius par 1/ q, et le décalage [1] indique que l’on regarde Lψ (1/2) non pas comme un faisceau mais comme un complexe concentré en degré −1, ce qui change le signe des traces. Ainsi M est un objet de la catégorie dérivée Dcb (Gm,k , Q` ) de faisceaux `-adiques sur Gm,k . Grâce au décalage, il appartient en fait à une sous-catégorie abélienne formée d’objets avec des propriétés remarquables que l’on appelle faisceaux pervers, même s’il s’agit plutôt de complexes. ×
Étant donnés une extension finie E de k et un caractère multiplicatif χ : E × → Q` , l’objet M ⊗ Lχ est encore un faisceau pervers sur Gm,E dont les groupes de cohomologie à support compact s’annulent en degré non nul. En degré zéro, ωχ (M ) = Hc0 (Gm,k¯ , M ⊗ Lχ )
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
213
¯ en particulier du Frobenius est une Q` -droite munie d’une action du groupe Gal(k/E), géométrique FE . La formule des traces de Grothendieck est dans ce cas l’égalité X X 1 (4) Tr(FE |ωχ (M )) = ψ(x)χ(x). Tr(FrobE,x |M ⊗ Lχ ) = − p |E| x∈E × x∈E × La distinction selon que le caractère χ soit trivial ou non se reflète dans l’action de Frobenius sur ωχ (M ), qui est en l’occurrence réduite à la multiplication par le nombre `-adique (4). À travers le plongement ι : Q` ,→ C, on peut parler de sa valeur absolue : elle est égale à 1 si et seulement si χ n’est pas trivial. Pour des objets M plus généraux, on dira qu’un caractère multiplicatif χ est bon pour M si toutes les valeurs propres de FE agissant sur ωχ (M ) sont unitaires. 1.4. Convolution et équirépartition L’étape suivante consiste à introduire une opération sur les faisceaux relevant le produit des sommes exponentielles ; c’est là que la structure de groupe sur Gm,k intervient. Pour ce faire, on définit sur la catégorie dérivée Dcb (Gm,k , Q` ) un produit de convolution M ?! N = Rm! (pr∗1 M ⊗ pr?2 N ), où pr1 et pr2 désignent les projections de Gm,k × Gm,k sur les deux facteurs et m la loi de multiplication. Un premier obstacle est que ce produit ne préserve pas les faisceaux pervers, à moins de se restreindre à une sous-catégorie convenable P(Gm,k ). Un second point technique est que l’objet M ?! N doit être remplacé par un quotient M ?int N que l’on appelle convolution intermédiaire. Si M et N sont des faisceaux pervers dans P(Gm,k ) pour lesquels un caractère χ est bon, on a un isomorphisme ωχ (M ?int N ) ∼ = ωχ (M ) ⊗ ωχ (N ) compatible à l’action de Frobenius. D’après Gabber et Loeser [11], avec la convolution intermédiaire pour produit tensoriel, P(Gm,k ) a la structure d’une catégorie tannakienne dans laquelle l’objet neutre est le faisceau gratte-ciel supporté en 1, le dual M ∨ est le tiré en arrière du dual de Verdier D(M ) par l’inversion x 7→ x−1 et les objets ont pour dimension leur caractéristique d’Euler. Concrètement, on se servira de cette information de la manière suivante. Soit hM i⊗ la sous-catégorie de P(Gm,k ) formée des objets qui s’obtiennent à partir de M en itérant les opérations produit tensoriel, dual, somme directe et sous-quotient, autrement dit qui sont des sous-quotients d’une construction tensorielle L M ¯r,¯s = M ⊗ri ⊗ (M ∨ )⊗si ; c’est la plus petite sous-catégorie tannakienne de P(Gm,k ) contenant l’objet M . De plus, ωχ est un foncteur fibre sur hM i⊗ pour tout bon
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
214
J. FRESÁN
caractère χ et les automorphismes linéaires de ωχ (M ) agissent naturellement sur tous les ωχ (M ¯r,¯s ). Soit GM,χ ⊆ GL(ωχ (M )) le sous-groupe de ceux laissant globalement stables les images par ωχ de n’importe quel sous-quotient de M ¯r,¯s . C’est un sous-groupe algébrique défini sur Q` dont la catégorie des représentations de dimension finie est, par la théorie tannakienne, équivalente à hM i⊗ . On aura également besoin de prendre en compte le faisceau pervers Mk¯ sur Gm,k¯ déduit de M par extension des scalaires. Comme ses constructions tensorielles ont plus de sous-quotients à respecter, le groupe correspondant est a priori plus petit ; pour les distinguer, on notera Garith, M,χ celui de M et Ggeom, M,χ celui de Mk¯ et on les appellera arithmétique et géométrique respectivement. Le Frobenius FE est un automorphisme de ωχ (M ) vérifiant la propriété de stabilité ci-dessus et définit ainsi un élément FrobE,χ dans le groupe Garith, M,χ . Si l’on change de caractère, on change de groupe, la dépendance en χ étant la même que celle du groupe fondamental d’un espace topologique en le point base : tous les Garith, M,χ sont isomorphes entre eux par des isomorphismes uniques à des automorphismes intérieurs près. On peut alors fixer un caractère χ0 et voir les différents FrobE,χ comme des classes de conjugaison dans le même groupe Garith, M,χ0 , que l’on notera simplement Garith, M . On ne sait pas si FrobE,χ est diagonalisable mais, quitte à prendre sa semisimplification Frobss E,χ au sens de la décomposition de Jordan, on obtient une classe de conjugaison semisimple dans Garith, M (Q` ) avec des valeurs propres unitaires, que l’on peut ensuite regarder dans Garith, M (C) via le plongement ι : Q` ,→ C. Les propriétés des objets d’une catégorie tannakienne se traduisent en des propriétés de leurs groupes et vice versa. Par exemple, si M est somme directe d’objets simples, alors le groupe Garith, M est réductif car il possède une représentation fidèle et complètement réductible. Supposons que c’est le cas et choisissons un sous-groupe compact maximal K du groupe de Lie complexe Garith, M (C). Chaque élément dans Frobss E,χ est alors conjugué à un élément dans K, qui est à son tour bien défini à conjugaison près par un élément de K. On en déduit une classe de conjugaison θE,χ dans K dont les traces Tr(θE,χ ) ne sont rien d’autre que les sommes exponentielles X S(M, E, χ) = χ(x)Tr(FrobE,x |M ) x∈E ×
que l’on souhaite étudier. On y pense comme aux transformées de Fourier, relatives aux caractères χ, de la fonction trace x 7→ Tr(FrobE,x |M ) sur le groupe multiplicatif E × . Comment varient-elles lorsque le degré des extensions E/k tend vers l’infini ?
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
215
Voici le résultat principal de cet exposé : Théorème 1.4 (Katz). — Soit M un faisceau pervers dans P(Gm,k ). Supposons que M est ι-pur de poids zéro, semisimple, et que les groupes Ggeom, M et Garith, M coïncident. Lorsque le degré des extensions E/k tend vers l’infini, les éléments {θE,χ }χ bon s’équirépartissent dans l’espace des classes de conjugaison dans K selon la mesure induite par la mesure de Haar normalisée. En particulier, les sommes S(M, E, χ) varient comme les traces de matrices aléatoires dans K. Il ne reste plus qu’à calculer le groupe Garith, M . L’avantage du point de vue tannakien est que l’on dispose de maintes techniques pour le faire. On cherche d’abord des bornes par le haut en étudiant la géométrie de M et de ses constructions tensorielles, puis des bornes par le bas en exhibant des éléments explicites dans Garith, M . Une fois ces contraintes obtenues, la théorie des représentations permet souvent de conclure qu’il n’y a qu’un seul groupe les satisfaisant. Dans le cas des sommes de Gauss, Ggeom, M est par définition un sous-groupe de GL(1) ; comme aucune puissance de convolution de M n’est égale à l’objet neutre, il s’agit forcément de GL(1) tout entier, si bien que l’on retrouve le théorème 1.1. Quant aux objets associés aux sommes d’Evans et de Rudnick, on verra que leurs groupes arithmétiques et géométriques sont dans les deux cas égaux à SL(2) ; l’équirépartition des angles θq,χ selon la mesure de Sato-Tate en découle. Le texte est organisé comme suit. Le numéro 2 contient des rappels des résultats sur les faisceaux `-adiques qui seront utilisés au long du texte ; j’ai essayé de les rendre aussi accessibles que possible. Dans le numéro 3, on présente le théorème d’équirépartition de Deligne et ses applications aux sommes de Kloosterman, puis on explique pourquoi ce résultat permet d’établir la variante additive de l’équirépartition des sommes S(M, E, χ). Enfin, le numéro 4 est consacré aux résultats de la monographie [22], notamment le théorème 1.4, une version horizontale et les trois exemples ci-dessus. J’aurais voulu aussi parler des applications du théorème de Katz en théorie analytique des nombres ([3], [14], [23], [25], [28], [49]), du cas des courbes elliptiques ([5], [24]), de l’approche tannakienne aux conjectures d’équirépartition horizontale [44] et des théorèmes d’annulation générique pour les faisceaux pervers sur les variétés abéliennes ([31], [47]), mais cela aurait fait de ce texte un séminaire-fleuve... Remerciements — Ils vont tout d’abord à Nick Katz pour la joie des livres orange (renouvelée à chaque lecture !), puis à Henryk Iwaniec et à Emmanuel Kowalski, qui m’ont demandé en premier de présenter ces résultats dans un séminaire informel à l’ETH. Je tiens à remercier aussi Olivier Benoist, Brian Conrad, Nick Katz, Arthur
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
216
J. FRESÁN
Forey, Emmanuel Kowalski, Corentin Perret-Gentil, Lior Rosenzweig et Zeév Rudnick pour l’aide qu’ils m’ont apportée au cours de la rédaction de ce texte.
2. RAPPELS SUR LES FAISCEAUX `-ADIQUES Dans ce numéro, on fait un tour rapide de la théorie des systèmes locaux et des faisceaux constructibles `-adiques. On rappelle notamment la notion de poids et le théorème principal de Weil II, qui sera l’outil essentiel pour obtenir les majorations des sommes exponentielles requises par le critère d’équirépartition de Weyl. 2.1. Groupe fondamental étale Pour tout schéma connexe X, notons FétX la catégorie des revêtements finis étales Y → X. Soit ξ : Spec(Ω) → X un point géométrique de X, où Ω est un corps algébriquement clos. En associant à chaque Y → X l’ensemble sous-jacent à la fibre Yξ = Y ×X Spec(Ω), on obtient un foncteur Fibξ : FétX −→ Ensembles finis. Dans [1], Grothendieck définit le groupe fondamental étale avec point base ξ comme le groupe π1 (X, ξ) des automorphismes de Fibξ , c’est-à-dire les familles (σYξ )Y →X de permutations σYξ des ensembles finis Yξ telles que σYξ0 = f ◦ σYξ pour tout morphisme de X-schémas f : Y → Y 0 . Par suite, π1 (X, ξ) est un groupe profini, muni en particulier d’une topologie. Comme en théorie de Galois classique, on a π1 (X, ξ) ∼ AutX (Y ), = lim ←− la limite étant prise sur les revêtements finis étales galoisiens, pour lesquels le schéma Y est connexe et le groupe AutX (Y ) agit transitivement sur Yξ . Puisque X est supposé connexe, les foncteurs fibre Fibξ1 et Fibξ2 définis par deux points géométriques ξ1 et ξ2 sont isomorphes. Le choix d’un isomorphisme, que l’on appelle parfois chemin par analogie avec la topologie, induit un isomorphisme continu π1 (X, ξ1 ) ' π1 (X, ξ2 ) qui ne dépend du chemin qu’à un automorphisme intérieur près. De plus, la formation du groupe fondamental est covariante : un morphisme de schémas f : X → X 0 induit un homomorphisme continu f∗ : π1 (X, ξ) → π1 (X 0 , f ◦ ξ). Pour un autre choix de point base ξ 0 sur X 0 , on peut encore parler de l’homomorphisme f∗ : π1 (X, ξ) → π1 (X 0 , ξ 0 ),
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
217
mais celui-ci n’a un sens qu’à conjugaison près. Exemple 2.1. — Si X est le spectre d’un corps k, un point géométrique ξ est un corps algébriquement clos L contenant k, et le groupe fondamental π1 (X, ξ) s’identifie au groupe de Galois Gal(k sep /k) de la clôture séparable k sep de k dans L. En particulier, si k est un corps fini à q éléments, ce groupe est canoniquement isomorphe à la b de Z, avec générateur la substitution de Frobenius x 7→ xq . On complétion profinie Z appellera Frobenius géométrique l’inverse Fk de ce générateur. Pour une extension E de degré n sur k, l’homomorphisme induit par Spec(E) → Spec(k) envoie FE sur Fkn . Soient k un corps, k¯ une clôture algébrique de k, X une variété géométriquement ¯ Pour tout ξ : Spec(k) ¯ → X¯ , on connexe sur k et Xk¯ son extension des scalaires à k. k a d’après un théorème de Grothendieck [1] la suite exacte (5)
¯ 1 −→ π1 (Xk¯ , ξ) −→ π1 (X, ξ) −→ Gal(k/k) −→ 1,
où les flèches non triviales sont induites par Xk¯ → X et X → Spec(k). En particulier, b si k est un corps fini, on dispose d’une application degré π1 (X, ξ) → Z. Voici la description galoisienne du groupe fondamental d’une courbe. Soit C une courbe projective, lisse et géométriquement connexe sur un corps parfait k, avec corps de fonctions K = k(C) et point générique η : Spec(K) → C. Fixons une clôture algébrique K de K et notons η le point géométrique au-dessus de η qu’elle définit. Chaque point fermé x de C donne lieu à une valuation discrète v : K × → Z de corps résiduel κ(x), qui se prolonge en une valuation discrète v¯ sur K sep (deux tels prolongements sont conjugués sous l’action de Gal(K sep /K), et choisir v¯ revient à choisir un point géométrique x ¯ au-dessus de x). Soient Kv¯sep et Kv les complétés par rapport aux valuations v¯ et v. Le groupe de décomposition de v¯ est le stabilisateur Dx¯ = {g ∈ Gal(K sep /K) | v¯ ◦ g = v¯}, que l’on peut identifier au groupe de Galois de l’extension locale Kv¯sep /Kv . Par passage ¯ aux corps résiduels, on obtient une surjection Dx¯ → Gal(k/κ(x)), où k¯ est la clôture algébrique de k dans K. Son noyau est par définition le groupe d’inertie Ix¯ . Proposition 2.2. — Soit U un ouvert non vide de C. Le groupe fondamental étale de U avec point base η¯ est le quotient de Gal(K sep /K) par le plus petit sous-groupe fermé distingué contenant Ix¯ pour tout x dans U . En particulier, le groupe fondamental d’un ouvert de la droite projective P1k s’identifie à un quotient de Gal(k(T )sep /k(T )); c’est le point de vue que l’on a adopté dans l’introduction pour définir les représentations Lψ et Lχ .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
218
J. FRESÁN
2.2. Systèmes locaux `-adiques et traces de Frobenius Dorénavant, k désigne un corps fini à q éléments, ` un nombre premier différent de la caractéristique de k et X une variété lisse et géométriquement connexe sur k, de point générique η. Pour tout point fermé x : Spec(E) → X, l’homomorphisme continu ¯ x∗ : Gal(k/E) −→ π1 (X, η¯) est bien défini à conjugaison près. L’image du Frobenius géométrique FE par x∗ est une classe de conjugaison (5) dans π1 (X, η¯), que l’on notera FrobE,x . Définition 2.3. — Un système local `-adique L de rang r sur X est la donnée d’un espace vectoriel Lη¯ de dimension r sur Q` et d’un homomorphisme continu ρ : π1 (X, η¯) → GL(Lη¯). Soit L un système local `-adique de rang r sur X. Puisque le groupe profini π1 (X, η¯) est compact, moyennant le choix d’une base de Lη¯, l’image de ρ est un sous-groupe compact de GL(r, Q` ). Un tel sous-groupe est toujours contenu dans GL(r, Eλ ) pour une extension finie Eλ de Q` , et l’on peut même choisir la base de sorte que ρ prenne des valeurs dans l’anneau des entiers de cette extension [27, §9.0.7]. L’image de FrobE,x par la représentation ρ est une classe de conjugaison dans GL(Lη¯). Sa trace est donc un élément bien défini de Q` , d’où une fonction trace tL : X(E) −→ Q` ,
x 7−→ Tr(FrobE,x |L )
pour toute extension finie E de k. Les opérations usuelles sur les représentations (produit tensoriel, dual, etc.) fournissent de nouveaux systèmes locaux dont les fonctions trace s’expriment en termes des anciennes. Par exemple, on a tL1 ⊗L2 = tL1 · tL2 pour le produit tensoriel et, si f : Y → X est un morphisme de k-variétés lisses, le système local f ∗ L sur Y défini par la représentation ρ ◦ f∗ a fonction trace tf ∗ L = tL ◦ f . Exemple 2.4. — Soit α une unité dans l’anneau des entiers de Q` . L’unique b → Q× qui envoie 1 sur α définit un système local homomorphisme continu Z ` `-adique de rang un sur Spec(k) ; d’après la remarque après la définition 2.3, ils b sont tous de cette forme. Par composition avec l’application degré π1 (X, ξ) → Z, on obtient un système local `-adique de rang un sur X. Comme l’image de FrobE,x par la représentation associée est α[E : k] , il sera noté αdeg . Au vu de la suite exacte (5), les αdeg sont précisément les caractères du groupe fondamental dont la (5)
Avec les notations du paragraphe précédent, quand X est une courbe, il s’agit de l’image de FE ¯ ¯ ∼ par Gal(k/E) → Gal(k/κ(x)) = Dx¯ /Ix¯ ,→ Gal(K sep /K)/Ix¯ → π1 (X, η¯). Comme l’on a dû choisir un point géométrique x ¯ au-dessus de x pour définir Dx¯ , on obtient seulement une classe de conjugaison.
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
219
restriction à π1 (Xk¯ , ξ) est triviale. Si α = q n pour un entier n, on écrit Q` (−n) plutôt que (q n )deg . Si α ∈ Q` est une racine carrée de 1/q, les traces du système p local L ⊗ αdeg , que l’on notera L (1/2), sont celles de L multipliées par 1/ |E| ; c’est la demi-torsion à la Tate de l’introduction. Exemple 2.5. — Soit G un schéma en groupes commutatifs lisse et connexe sur k, la loi de groupe étant notée additivement. Soit FG le morphisme de Frobenius absolu, c’est-à-dire le morphisme de k-schémas FG : G → G qui est l’identité sur l’espace topologique sous-jacent et x 7→ xq sur le faisceau structural OG . L’isogénie de Lang id − FG : G → G est un revêtement fini étale galoisien de groupe G(k). Si G est le groupe additif, c’est le revêtement d’Artin-Schreier x 7→ x − xq de la droite affine A1k et, si G est le groupe multiplicatif, c’est le revêtement de Kummer x 7→ x1−q de Gm,k . ×
Étant donné un caractère ϕ : G(k) → Q` , la représentation ϕ
×
π1 (G, η¯) −→ G(k) −→ Q`
obtenue en composant la surjection canonique associée à l’isogénie de Lang avec le caractère ϕ définit un système local `-adique Lϕ de rang un sur G. Plus généralement, pour tout morphisme de k-schémas f : X → G, on obtient un système local de rang un f ∗ Lϕ sur X qu’il est coutumier de noter Lϕ(f ) . Pour chaque point de X à valeurs dans E, en raisonnant comme dans le paragraphe 1.3 de l’introduction, on trouve tLϕ(f ) (x) = Tr(FrobE,x | Lϕ(f ) ) = ϕ(TrG E/k f (x)), où TrG E/k désigne la trace au sens du groupe abélien G(E), c’est-à-dire la trace TrE/k si G est le groupe additif, la norme NE/k si G est le groupe multiplicatif, etc. Exemple 2.6. — Soit f : Gm → A1 la fonction x 7→ x − x−1 . Le système local Lψq (f ) ×
induit par le caractère additif ψq : Fq → Q a trace de Frobenius ψq (x − x−1 ) en le point x ∈ F× q . Les sommes d’Evans sont donc égales à X S(χ) = − Tr(FrobFq ,x |Lχ ⊗ Lψq (1/2)). x∈F× q
De même, en prenant pour f : Gm \ {1} → A1 la fonction (x + 1)/(x − 1), les sommes de Rudnick peuvent se récrire en termes du système local Lψq (f ) . Le cadre des systèmes locaux `-adiques, par opposition aux faisceaux constructibles que l’on introduira dans le paragraphe suivant, est peu adapté aux méthodes × cohomologiques. Par exemple, si χ : k × → Q` est un caractère et f : X → Gm,k un
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
220
J. FRESÁN
morphisme de k-variétés, χ(f (x)) est bien la trace de Frobenius en x du système local Lχ(f ) sur X, mais il est souvent plus commode d’utiliser l’égalité X x∈X(k)
χ(f (x)) =
X
χ(t)|f −1 (t)|
t∈k×
et de voir t 7→ |f −1 (t)| comme une fonction trace sur Gm,k . Ceci correspond à étudier la variation en t de la cohomologie des fibres f −1 (t) et l’on doit s’attendre à ce que seule la restriction à un ouvert de lissité de f soit la trace d’un système local.
2.3. Faisceaux constructibles, poids et cohomologie Vers la fin des années 50, Grothendieck définit une « topologie » sur les schémas où la notion classique d’ouvert d’une variété X est remplacée par les morphismes étales vers X. Si A est un anneau de torsion, par exemple Z/`n Z, on peut parler de faisceaux localement constants (aussi appelés lisses) et de faisceaux constructibles de A-modules sur X, ces derniers ayant la propriété qu’il existe une stratification de X telle que la restriction à chaque strate soit un faisceau lisse. Par un double passage à la limite, d’abord sur les entiers n, puis sur les extensions finies de Q` , on dégage la notion de Q` -faisceau constructible. On ne se contentera ici que de quelques aperçus. Soit F un faisceau constructible sur X. La fibre Fξ en un point géométrique ξ est un espace vectoriel de dimension finie sur Q` . Si F est lisse, le groupe fondamental π1 (X, η¯) agit continument sur la fibre Fη¯ en un point géométrique générique η¯ et le foncteur F 7→ Fη¯ induit une équivalence de catégories entre les Q` -faisceaux lisses et les systèmes locaux `-adiques sur X. En général, quel que soit F , la fibre Fx¯ en un point géométrique x ¯ au-dessus de x ∈ X(E) est un système local `-adique sur Spec(E), d’où une action du Frobenius FE qui permet d’étendre la définition de fonction trace à tout faisceau constructible. Soit C une courbe projective, lisse et géométriquement connexe sur k. Si F est un faisceau lisse sur un ouvert non vide V ⊆ C, pour tout point fermé x ∈ C, le groupe de décomposition Dx¯ agit sur Fη¯ au travers de la flèche Dx¯ → π1 (V, η¯). On en déduit une action du groupe d’inertie Ix¯ pour tout x ∈ C \ V , celle de Ix¯ pour x ∈ V étant triviale par la description galoisienne du groupe fondamental (proposition 2.2). Concrètement, un Q` -faisceau constructible F sur une courbe U est la donnée : • d’un ouvert non vide V ,→ U et d’un faisceau `-adique lisse Fη¯ sur V correspondant à une représentation continue π1 (V, η¯) → GL(Fη¯), ¯ • pour chaque point fermé u ∈ U \V , d’une représentation continue de Gal(k/κ(u)) dans un Q` -espace vectoriel de dimension finie Fu¯ ,
ASTÉRISQUE 414
(1141)
221
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
¯ • des flèches de spécialisation Gal(k/κ(u))-équivariantes spu¯,¯η : Fu¯ → Fη¯Iu¯ (les données de recollement). Exemple 2.7. — Quelques opérations naturelles sur les faisceaux constructibles, par exemple les images directes par une immersion ouverte, admettent aussi une description en ces termes. Si F est un faisceau constructible sur U et j : U ,→ U 0 une immersion ouverte, le prolongement par zéro j! F (resp. l’image directe j∗ F ) est le faisceau constructible sur U 0 qui coïncide avec F sur U et qui a fibre (j! F )x¯ = 0 (resp. (j∗ F )x¯ = Fη¯Ix¯ , avec flèche de spécialisation l’identité) en tout point fermé x dans le complémentaire. L’image directe supérieure R1 j∗ F est le faisceau constructible supporté dans U 0 \ U et ayant pour fibre en un point x les coinvariants sous l’inertie (R1 j∗ F )x = (Fη¯)Ix¯ (−1). Soit X une variété lisse et géométriquement connexe, purement de dimension d, sur un corps fini k. À un Q` -faisceau constructible F sur X on associe des groupes de cohomologie H i (Xk¯ , F ) et de cohomologie à support compact Hci (Xk¯ , F ). Ce sont des ¯ espaces vectoriels de dimension finie sur Q` , munis d’une action continue de Gal(k/k), qui s’annulent en degrés i < 0 et i > 2d. Pour chaque i, il y a une flèche canonique d’« oubli des supports » Hci (Xk¯ , F ) → H i (Xk¯ , F ) qui est un isomorphisme lorsque X est propre. Si le faisceau F est lisse sur X, on a H 0 (Xk¯ , F ) = (Fη¯)π1 (Xk¯ ,¯η) ,
Hc2d (Xk¯ , F ) = (Fη¯)π1 (Xk¯ ,¯η) (−d)
et le groupe de Galois opère sur ces espaces par le biais de l’action de π1 (X, η¯) sur Fη¯ ¯ et de l’identification Gal(k/k) = π(X, η¯)/π1 (Xk¯ , η¯) donnée par la suite exacte (5). En général, un faisceau constructible F peut avoir des sections globales ponctuelles non nulles (elles correspondent aux éléments dans le noyau des flèches de spécialisation). Le lien entre les sommes exponentielles et l’action du Frobenius géométrique Fk sur la cohomologie à support compact est fourni par la formule des traces [13] : Théorème 2.8 (Formules des traces de Grothendieck). — Pour finie E de k, on a l’égalité X x∈X(E)
Tr(FrobE,x | F ) =
toute
extension
2d X (−1)i Tr(FE | Hci (Xk¯ , F )). i=0
Cette formule n’acquiert toute sa force qu’en combinaison avec des estimées sur les valeurs propres de l’endomorphisme FE : le formalisme des poids de la cohomologie. Pour pouvoir parler de la taille de ces valeurs propres, qui sont des éléments dans Q` , on fixe un plongement ι : Q` ,→ C. Définition 2.9. — Soient w un entier et F un faisceau constructible sur X.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
222
J. FRESÁN
(a) On dit que F est ι-pur de poids w si, pour toute extension finie E de k et pour tout point x ∈ X(E), les valeurs propres de FrobE,x agissant sur la fibre Fx¯ , où x ¯ est un point géométrique quelconque au-dessus de x, ont valeur absolue |E|w/2 quand on les regarde dans C à travers le plongement ι. (b) On dit que F est ι-mixte s’il admet une filtration finie croissante par des sous-faisceaux constructibles (Fi )i∈Z dont les gradués gri = Fi /Fi−1 sont ι-purs de poids i. Si les poids des gri sont majorés (resp. minorés) par w, on dira que F est ι-mixte de poids 6 w (resp. > w). Le poids d’un faisceau dépend a priori fortement du plongement ι ; on dira que F est pur de poids w s’il est ι-pur de poids w pour tout ι : Q` ,→ C. Pour des questions concernant les faisceaux purs, quitte à les demi-tordre à la Tate, on pourra toujours supposer que le poids est zéro. Le théorème principal de Weil II relie le poids d’un faisceau constructible au sens de la définition ci-dessus aux valeurs propres de Frobenius agissant sur sa cohomologie et sa cohomologie à support compact. Théorème 2.10 (Deligne, [9]). — Soit F un faisceau constructible sur X. Si F est ι-mixte de poids 6 w, alors chaque H i (Xk¯ , F ) est ι-mixte de poids > w + i et chaque Hci (Xk¯ , F ) est ι-mixte de poids 6 w + i. En particulier, si la flèche d’oubli des supports est un isomorphisme, H i (Xk¯ , F ) ∼ = Hci (Xk¯ , F ) est ι-pur de poids w + i. On renvoie aux travaux de Laumon [35] et de Katz [21] pour des simplifications de la preuve originale, basées sur l’incarnation faisceautique de la transformation de Fourier. Voici un exemple frappant d’application de ces résultats qui reviendra dans la preuve du théorème d’équirépartition de Deligne : Exemple 2.11 (Inégalités de Lang-Weil, [34]). — En prenant pour F le faisceau constant Q` , on trouve que le nombre de points E-rationnels de X est donné par |X(E)| =
2d X
(−1)i Tr(FE |Hci (Xk¯ , Q` )).
i=0
Comme Q` est pur de poids zéro, Hci (Xk¯ , Q` ) est mixte de poids 6 i d’après le théorème 2.10, ce qui signifie que les valeurs propres de FE agissant sur cet espace ont toutes valeur absolue au plus |E|i/2 quel que soit le plongement de Q` dans C. Posons bic (X) = dimQ` Hci (Xk¯ , Q` ),
A(X) =
2d−1 X i=0
ASTÉRISQUE 414
bic (X).
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
223
On a vu que Hc2d (Xk¯ , Q` ) est le Q` -espace vectoriel de dimension un sur lequel FE agit par multiplication par |E|d , d’où les inégalités (6)
2d−1 X bic (X)|E|i/2 6 A(X)|E|(2d−1)/2 . |X(E)| − |E|d 6 i=0
En particulier, la variété X a un point E-rationnel dès que |E| > A(X)2 . 2.4. Un peu de ramification Dans ce qui suit, on rappelle une formule due à Grothendieck-Ogg-Shafarevich qui exprime la caractéristique d’Euler d’un faisceau constructible sur une courbe en termes de sa ramification à l’infini. Soit C une courbe projective, lisse et géométriquement connexe sur un corps parfait k de caractéristique p > 0. Pour chaque point fermé x de C et chaque point géométrique x ¯ au-dessus de x, nous avons une suite exacte ¯ 1 −→ Ix¯ −→ Dx¯ −→ Gal(k/k) −→ 1. Le groupe d’inertie Ix¯ contient un unique p-sous-groupe de Sylow Px¯ , sa partie sauvage, et le quotient Ix¯mod = Ix¯ /Px¯ (l’inertie moderée) est canoniquement isomorphe à ¯ = lim E × . b 0 (1) = lim µN (k) Z ←− ←− (N,p)=1
E/k finie
(r)
Il s’agit du premier cran d’une filtration décroissante (Ix¯ )r∈Q>0 par des sous-groupes fermés distingués de Ix¯ que l’on appelle la filtration de ramification en numérotation (0) supérieure [45, Ch. IV] : on a Ix¯ = Ix¯ , la partie sauvage Px¯ est l’adhérence S T (r) (r) (s) de r>0 Ix¯ dans Ix¯ , et Ix¯ = 00
indexée par des nombres rationnels, en des sous-espaces vectoriels W (r) ⊆ W stables sous l’action de Px¯ et vérifiant les propriétés suivantes : W (0) = W Px¯ ,
(r)
W (r)Ix¯ = 0 si r > 0,
(r 0 )
W (r)Ix¯
= W (r) si r0 > r.
Cette décomposition ne comporte qu’un nombre fini de valeurs de r pour lesquelles W (r) n’est pas nul, que l’on appellera les sauts. De plus, r dim W (r) est un entier positif. On définit le conducteur de Swan de la représentation W comme l’entier positif X Sw(W ) = r dim W (r). r>0
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
224
J. FRESÁN
Soient V un ouvert non vide de C et F un faisceau lisse sur V , vu comme représentation `-adique de π1 (V, η¯). Par restriction, on en déduit une représentation du groupe d’inertie Ix¯ pour tout point fermé x ∈ C\V . On notera Swx¯ (F ) son conducteur de Swan. Il s’agit d’un entier positif qui est nul si et seulement si la représentation de Ix¯ est modérée, auquel cas on dira que F a ramification modérée en x. Si V = Gm,k , les systèmes locaux modérément ramifiés à l’infini sont les représentations du groupe fondamental modéré π1mod (Gm,k ), qui s’insère dans une suite exacte ¯ b 0 (1) −→ π mod (Gm,k ) −→ Gal(k/k) 1 −→ Z −→ 1. 1 Exemple 2.12. — Soit k un corps fini. Le faisceau d’Artin-Schreier Lψ sur A1k a ramification totalement sauvage à l’infini et son conducteur de Swan vaut 1. Le faisceau de Kummer Lχ sur Gm,k a ramification modérée en 0 et ∞. Par extension, on appelera faisceau de Kummer tout système local `-adique de rang un sur Gm,k correspondant à un caractère de π1mod (Gm,k ). Soient maintenant U ⊆ C un ouvert contenant V et F un faisceau constructible sur U . Pour tout point fermé u ∈ U \ V , on définit l’entier dru¯ (F ) = dim(Fη¯) − dim(Fu¯ ). Si F n’a pas de sections globales ponctuelles non nulles, alors toutes les flèches de spécialisation Fu¯ → Fη¯Iu¯ sont injectives ; dans ce cas, dru¯ (F ) est positif et le faisceau F est lisse en u ¯ si et seulement si dru¯ (F ) = 0. La formule de Grothendieck-Ogg-Shafarevich, exposée dans ce séminaire par Raynaud [40], est l’énoncé que la caractéristique d’Euler de F s’exprime ainsi : Théorème 2.13 (Grothendieck-Ogg-Shafarevich). — Soient F un faisceau `-adique constructible sur U et V ⊆ U un ouvert non vide sur lequel F est lisse. Alors X X Swx¯ (F ) − dru¯ (F ). χ(Uk¯ , F ) = rg(F )χ(Uk¯ ) − ¯ x∈(C\V )(k)
¯ u∈(U \V )(k)
2.5. Catégorie dérivée et faisceaux pervers Dans ce paragraphe, k désigne ou bien un corps fini, ou bien la clôture algébrique d’un corps fini. Soit π : X → Spec(k) une variété sur k. Grothendieck a défini la catégorie dérivée Dcb (X, Q` ) des complexes bornés de Q` -faisceaux sur X à cohomologie constructible et l’a munie d’un formalisme des six opérations : • Pour tout morphisme f : X → Y , on dispose des foncteurs image directe et image directe à support compact Rf∗ , Rf! : Dcb (X, Q` ) −→ Dcb (Y, Q` )
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
225
et des foncteurs image inverse et image inverse exceptionnelle f ∗ , f ! : Dcb (Y, Q` ) −→ Dcb (X, Q` ). En particulier, on obtient pour tout objet M dans Dcb (X, Q` ) des complexes de Q` -espaces vectoriels Rπ∗ M et Rπ! M que l’on notera RΓ(X, M ) et RΓc (X, M ). Si M est de la forme F [n], la cohomologie en degré i de ces complexes s’identifie à la cohomologie H i+n (Xk¯ , F ) et à la cohomologie à support compact Hci+n (Xk¯ , F ). • On dispose d’un bifoncteur produit tensoriel − ⊗ − : Dcb (X, Q` ) × Dcb (X, Q` ) −→ Dcb (X, Q` ) et d’un bifoncteur Hom interne RHom(−, −) : Dcb (X, Q` )op × Dcb (X, Q` ) −→ Dcb (X, Q` ). Le produit extérieur des objets M dans Dcb (X, Q` ) et N dans Db (Y, Q` ) est l’objet M N = pr∗X M ⊗ pr∗Y N dans Dcb (X × Y, Q` ), où prX et prY désignent les projections de X × Y sur X et Y respectivement. • On définit le complexe dualisant comme ωX = π ! Q` et le foncteur de dualité de Verdier D : Dcb (X, Q` )op → Dcb (X, Q` ) comme D(M ) = RHom(M, π ! Q` ). La dualité échange Rf∗ et Rf! (resp. f ∗ et f ! ) pour tout morphisme f : X → Y . Si X est lisse et purement de dimension d, le complexe dualisant est égal à ωX = Q` (d)[2d] et l’on retrouve comme cas particulier la dualité de Poincaré H i (X, Q` ) ∼ = Hc2d−i (X, Q` )∗ (−d). Plus généralement, f ! = f ∗ (d)[2d] si f est lisse de dimension relative d. Dans le cas où k est un corps fini, on définit la fonction trace d’un objet M de la P catégorie dérivée comme la somme alternée tM = (−1)i tH i (M ) des fonctions trace de ses faisceaux de cohomologie. La formule des traces de Grothendieck est alors l’égalité X (8) tRf! M (y) = tM (x). f (x)=y
De même, la notion de poids s’étend à la catégorie dérivée comme suit : un objet M dans Dcb (X, Q` ) est dit ι-mixte de poids 6 w si tous ses faisceaux de cohomologie H i (M ) sont ι-mixtes de poids 6 w + i, au sens de la définition 2.9, et ι-mixte de poids > w si son dual de Verdier D(M ) est ι-mixte de poids 6 −w. On dit enfin
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
226
J. FRESÁN
que M est ι-pur de poids w s’il est en même temps ι-mixte de poids 6 w et > w. Le théorème principal de Weil II peut alors se formuler ainsi : Théorème 2.14 (Deligne). — Si f : X → Y est un morphisme de k-variétés, le foncteur Rf! envoie les objets ι-mixtes de poids 6 w sur des objets ι-mixtes de poids 6 w. Par dualité de Verdier, le foncteur Rf∗ envoie les objets ι-mixtes de poids > w sur des objets ι-mixtes de poids > w. En s’inspirant des travaux de Goresky et MacPherson sur l’homologie d’intersection d’un espace topologique singulier, Beilinson, Bernstein, Deligne et Gabber ont introduit la notion de faisceau pervers dans [2]. Définition 2.15. — Un objet M de Dcb (X, Q` ) est dit semipervers si tous ses faisceaux de cohomologie H i (M ) satisfont à la condition de support dim supp(H i (M )) 6 −i. On appelle M un faisceau pervers si tant M que D(M ) sont semipervers. Par exemple, si X est lisse de dimension d et L est un système local `-adique sur X, l’objet L [d] est un faisceau pervers car la condition de support est vérifiée trivialement et son dual D(L [d]) = L ∨ (d)[d] est encore de la même forme. La sous-catégorie pleine Perv(X, Q` ) de Dcb (X, Q` ) formée des faisceaux pervers est abélienne et tout objet est extension successive d’un nombre fini d’objets simples [2]. Qui plus est, la catégorie dérivée de complexes bornés dans Perv(X, Q` ) est équivalente à Dcb (X, Q` ), d’où des foncteurs de cohomologie perverse H 0 : Dcb (X, Q` ) −→ Perv(X, Q` )
p
et pH i = pH 0 [i] pour tout entier i. Si f : X → Y est un morphisme affine, alors Rf∗ préserve la semiperversité (théorème d’annulation d’Artin) et si f : X → Y est un morphisme lisse de dimension relative d, le foncteur f ∗ [d] préserve la perversité. La plupart du temps nous travaillerons avec des faisceaux pervers sur une courbe, auquel cas les objets admettent une description plus élémentaire. Exemple 2.16 (Faisceaux pervers sur les courbes). — Soit X une courbe lisse et géométriquement connexe sur un corps fini k. Un faisceau pervers sur X est un complexe de faisceaux constructibles M dans Dcb (X, Q` ) satisfaisant aux conditions suivantes : H i (M ) = 0 pour tout i ∈ / {−1, 0}, le faisceau constructible H −1 (M ) n’a pas de sections globales ponctuelles non nulles, et le faisceau constructible H 0 (M )
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
227
est supporté dans des points. En posant Mpct = H 0 (M ) et Mnpct = H −1 (M )[1], on trouve une suite exacte (9)
0 −→ Mnpct −→ M −→ Mpct −→ 0.
De plus, les objets simples de la catégorie Perv(X, Q` ) sont d’un de ces deux types : • ponctuels : de la forme αdeg ⊗ δx pour un point fermé x de X et une unité `-adique α ; • non ponctuels : de la forme (j∗ L )[1], où j : U ,→ X est l’inclusion d’un ouvert non vide et L est un système local `-adique simple sur U . On les appelle extensions intermédiaires.
3. LE THÉORÈME D’ÉQUIRÉPARTITION DE DELIGNE Dans ce numéro, on expose le théorème d’équirépartition de Deligne [9, §3.5] suivant les variantes qu’en ont données Katz [18, Ch. 3] et Katz-Sarnak [27, §9.2]. Sous des hypothèses assez faibles, il affirme que le groupe de monodromie d’un système local `-adique gouverne la répartition de ses traces de Frobenius. Ces groupes sont en général difficiles à calculer, mais Katz a réussi à les déterminer complètement pour les faisceaux associés aux sommes de Kloosterman ; combiné avec le résultat de Deligne, ceci permet d’obtenir le théorème 1.3 dans l’introduction, ainsi que de l’étendre à un énoncé d’équirépartition pour les sommes Kln (a, q) en plusieurs variables. Dans le dernier paragraphe, on analyse la répartition des traces de la transformée de Fourier d’un faisceau pervers sur la droite affine à l’aide du théorème de Deligne, puis on explique pourquoi cette approche est vouée à l’échec pour le groupe multiplicatif. 3.1. Préliminaires sur les représentations Dans le théorème d’équirépartition de Deligne, les groupes de monodromie sont des groupes algébriques réductifs G sur Q` et l’on définit des classes de conjugaison dans des sous-groupes compacts maximaux K de leurs points complexes. Pour appliquer le critère d’équirépartition de Weyl, on aura besoin de relier les représentations continues de K à des systèmes locaux `-adiques, vus comme des Q` -représentations algébriques de G. Théorème 3.1. — Soit G un groupe réductif (pas nécessairement connexe) sur Q` . Pour chaque choix d’un plongement ι : Q` ,→ C et d’un sous-groupe compact maximal K de G(C), les foncteurs extension des scalaires, évaluation dans les
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
228
J. FRESÁN
points complexes et restriction à K induisent des bijections entre les classes d’isomorphisme de (a) (b) (c) (d)
Q` -représentations du Q` -groupe algébrique G, C-représentations du C-groupe algébrique GC , représentations holomorphes du groupe de Lie complexe G(C), représentations continues du groupe compact K,
toutes les représentations étant supposées de dimension finie. Démonstration. — Les catégories (b), (c) et (d) sont en fait équivalentes. Pour démontrer l’équivalence entre (b) et (c), on se ramène facilement au cas où G est connexe, qui est traité dans [6, Prop. D.2.1]. L’équivalence entre (c) et (d), sans des hypothèses de connexité, est le contenu de la proposition D.3.2 et de l’exemple D.3.3 dans loc. cit. Quant à (a), on a tautologiquement une équivalence de catégories si le plongement ι est un isomorphisme de corps. En général, étant donnée une représentation complexe ρ0 : GC → GL(V 0 ), il existe un espace vectoriel V sur Q` et une représentation ρ : G → GL(V ), unique à isomorphisme près, telle que ρ0 ' ρC . 3.2. Le théorème d’équirépartition de Deligne Soient k un corps fini à q éléments, k¯ une clôture algébrique de k, X une variété lisse et géométriquement connexe sur k et Xk¯ la variété sur k¯ qui s’en déduit par extension des scalaires. Fixons un nombre premier ` distinct de la caractéristique de k, une clôture algébrique Q` de Q` et un plongement ι : Q` ,→ C. Soit L un faisceau `-adique lisse de rang r sur X, correspondant à une représentation continue ρ : π1 (X, η¯) → GL(r, Q` ). Définition 3.2. — Les groupes de monodromie arithmétique Garith, L et géométrique Ggeom, L de L sont les groupes algébriques sur Q` obtenus comme l’adhérence de Zariski de ρ(π1 (X, η¯)) et de ρ(π1 (Xk¯ , η¯)) dans GL(r, Q` ). En particulier, Ggeom, L est un sous-groupe de Garith, L . Comme les classes de conjugaison de Frobenius sont denses dans le groupe fondamental par une forme du théorème de Cebotarev, Garith, L est aussi le plus petit sous-groupe algébrique contenant leurs images par la représentation. Dans Weil II, Deligne démontre que, si L est ι-pur d’un certain poids, la représentation de π1 (Xk¯ , η¯) associée est complètement réductible [9, Thm. 3.4.1 (iii)] et le groupe de monodromie géométrique Ggeom, L est donc réductif. Qui plus est, la composante neutre du groupe de monodromie géométrique Ggeom, L est semisimple d’après [9, Cor. 1.3.9].
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
229
Supposons que L est ι-pur de poids zéro et Ggeom, L = Garith, L , de sorte que la représentation ρ se factorise par Ggeom, L (Q` ). Choisissons un sous-groupe compact maximal K de Ggeom, L (C) et notons K # l’ensemble de ses classes de conjugaison. Le but est d’associer à chaque point de X à valeurs dans une extension finie E de k un élément de K # dont la trace soit égale à Tr(FrobE,x |L ). Soient x un tel point et FrobE,x la classe de conjugaison qu’il définit dans π1 (X, η¯). Son image par la représentation ρ est une classe de conjugaison ρ(FrobE,x ) ∈ Ggeom, L (Q` )# ⊂ Ggeom, L (C)# . Soit ρ(FrobE,x )ss sa semisimplification au sens de la décomposition de Jordan. Puisque L est ι-pur de poids zéro, chaque élément g dans ρ(FrobE,x )ss est semisimple avec des valeurs propres unitaires, et l’adhérence de hgi est donc un sous-groupe compact de Ggeom, L (C). Il s’ensuit que g appartient à un sous-groupe compact maximal et, comme ils sont tous conjugués, qu’il existe des éléments h dans K et s dans Ggeom, L (C) tels que g = s−1 hs. On affirme que h est bien défini à conjugaison près par un élément de K. En effet, par le théorème de Peter-Weyl, les traces des représentations irréductibles de dimension finie ΛK de K séparent les classes de conjugaison. Or ΛK correspond d’après le théorème 3.1 à une unique représentation Λ du Q` -groupe algébrique Ggeom, L et, quel que soit le choix de h, on a Tr(ΛK (h)) = Tr(Λ(ρ(FrobE,x )ss )) = Tr(Λ(ρ(FrobE,x )). On notera θE,x la classe de conjugaison dans K ainsi obtenue. Finalement, soit π : K → K # la projection canonique. Muni de la topologie quotient, l’espace K # est compact et l’application f 7→ fcent = f ◦ π permet d’identifier C (K # ) aux fonctions centrales continues sur K. L’image directe par π de la mesure de Haar normalisée µK est une mesure de probabilité µK # sur K # telle que Z Z f µK # = K#
fcent µK . K
Théorème 3.3 (Deligne). — Soit L un faisceau `-adique lisse sur X. Supposons que L est ι-pur de poids zéro et que les groupes Garith, L et Ggeom, L coïncident. Lorsque le degré des extensions E/k tend vers l’infini, les classes de conjugaison {θE,x }x∈X(E) s’équirépartissent dans K # selon la mesure µK # . Démonstration. — Soit f : K → C une fonction centrale continue. Il faut démontrer que, quand E parcourt les extensions de k de degré assez grand pour que l’ensemble X(E) soit non vide, on a l’égalité Z X 1 f (θE,x ). (10) f µK = lim |E|→∞ |X(E)| K x∈X(E)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
230
J. FRESÁN
D’après le théorème de Peter-Weyl, f est limite uniforme de combinaisons linéaires finies de traces de représentations irréductibles de dimension finie ΛK de K ; il suffit de traiter le cas d’une telle représentation. Comme µK a masse totale un, la fonction constante f = 1 vérifie (10) même sans passer à la limite. On peut donc supposer que ΛK n’est pas triviale, auquel cas l’intégrale du membre gauche s’annule : Z TrΛK µK = 0. K
Démontrons que le membre droit de (10) est également nul (critère d’équirépartition de Weyl). Invoquant à nouveau le théorème 3.1, ΛK correspond à une unique représentation irréductible non triviale Λ du groupe algébrique Ggeom, L sur Q` . Compte tenu de l’hypothèse Garith, L = Ggeom, L , on peut composer Λ avec ρ
π1 (X, η¯) −→ Ggeom, L (Q` ) et penser à Λ ◦ ρ comme à un système local `-adique sur X. Notons-le Λ(L ) et regardons ses traces de Frobenius dans C via le plongement ι. On a alors l’égalité TrΛK (θE,x ) = Tr(FrobE,x |Λ(L )) et la formule des traces de Grothendieck donne X x∈X(E)
TrΛK (θE,x ) =
2d X (−1)i Tr(FE |Hci (Xk¯ , Λ(L ))). i=0
Comme le groupe Ggeom, L est réductif, ρ est une représentation fidèle et Λ est une représentation irréductible, il existe des entiers a, b > 0 tels que Λ(L ) soit sous-objet du système local L ⊗a ⊗ (L ∨ )⊗b . On en déduit que Λ(L ) est encore ι-pur de poids zéro. La cohomologie à support compact Hci (Xk¯ , Λ(L )) est donc ι-mixte de poids 6 i d’après le théorème principal de Weil II. Par ailleurs, on a l’annulation Hc2d (Xk¯ , Λ(L )) = (Λ(L )η¯)π1 (Xk¯ ,¯η) = 0 car Λ(L )η¯ est une représentation irréductible non triviale de π1 (Xk¯ , η¯). Combinant ces informations, il vient 2d−1 X X Tr (θ ) dimQ` Hci (Xk¯ , Λ(L )) · |E|i/2 ΛK E,x 6 x∈X(E) i=0 ! 2d−1 X (11) 6 dimQ` Hci (Xk¯ , Λ(L )) |E|(2d−1)/2 . i=0
Par les inégalités de Lang-Weil, on a 2|X(E)| > |E|d dès que le degré de P l’extension E est assez grand pour que |E|1/2 > 2 i62d−1 bic (X) et, en particulier,
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
231
l’ensemble X(E) n’est pas vide. Joint à ce qui précède, ceci fournit la majoration 2d−1 X 1 2 X p Tr (θ ) 6 dimQ` Hci (Xk¯ , Λ(L )). ΛK E,x |X(E)| |E| i=0 x∈X(E) La limite du membre gauche est donc zéro lorsque le degré de E tend vers l’infini. Remarque 3.4. — Dans [27, Thm. 9.2.6 (3)], Katz et Sarnak démontrent qu’il existe une constante C(Xk¯ , L ), ne dépendant que de la variété Xk¯ et du système local L , telle que (12)
2d X
dimQ` Hci (Xk¯ , Λ(L )) 6 dim(Λ)C(Xk¯ , L )
i=0
pour toute Q` -représentation de dimension finie Λ de Ggeom, L . Si X est une courbe, on peut d’après [18, (3.6.2.1)] prendre C(Xk¯ , L ) = 2g − 2 + N +
N X
ri
i=1
¯ où g est le genre de la compactification lisse de X, N le nombre de k-points x1 , . . . , x N à l’infini et ri le plus grand saut dans la décomposition (7) de la monodromie locale de L en xi . Remarque 3.5. — Le théorème 3.3 est un énoncé d’équirépartition verticale. Supposons maintenant que l’on se donne un schéma lisse X sur un ouvert S de Spec(Z[1/`]) et un système local `-adique ι-pur de poids zéro L sur X tel que, pour chaque premier p dans S, les groupes de monodromie géométrique et arithmétique du système local Lp sur XFp obtenu par réduction modulo p coïncident et qu’ils sont tous égaux à un même groupe réductif. Au vu de la borne (12), la question si les classes de conjugaison {θFp ,x }x∈X(Fp ) s’équirépartissent horizontalement est intimement liée au difficile problème de trouver des estimées explicites de la constante C(XFp , Lp ), par exemple de la majorer indépendamment de p, cf. [19, App.] et [27, §9.6]. 3.3. Retour aux sommes de Kloosterman On donne maintenant l’application du théorème d’équirépartition de Deligne aux sommes de Kloosterman. En plus des références originales de Deligne [8] et Katz [18], × le lecteur pourra consulter avec profit le survol [37] de Laumon. Soient ψ : Fq → Q` un caractère additif non trivial et Lψ le faisceau d’Artin-Schreier correspondant. Pour un entier n > 2, notons σ : Gnm → A1 et π : Gnm → Gm les morphismes somme et produit des coordonnées, respectivement, et posons Kln = Rn−1 π! σ ∗ Lψ .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
232
J. FRESÁN
D’après Deligne, Kln est un faisceau `-adique lisse de rang n sur Gm,Fq ayant pour trace de Frobenius en un point a ∈ F× q la somme de Kloosterman au signe près : Tr(FrobFq ,a |Kln ) = (−1)n−1 Kln (a, q). De plus, la flèche d’oubli des supports Rn−1 π! σ ∗ Lψ → Rn−1 π∗ σ ∗ Lψ est un isomorphisme [8, Thm. 7.8]. Comme σ ∗ Lψ est ι-pur de poids zéro, le théorème principal de Weil II entraîne que Kln est ι-pur de poids n − 1, d’où la majoration qui nous a permis de démontrer l’équirépartition des angles des sommes de Gauss dans l’introduction : |Kln (a, q)| 6 nq
n−1 2
.
obtenu en Soit Ln = Kln ( n−1 2 ) le système local `-adique ι-pur de poids zéro Vn Ln est le demi-tordant Kln à la Tate. On sait que le déterminant det Ln = système local trivial de rang un sur Gm,Fq et que, pour n pair ou pour p = 2 et n impair, on dispose d’un accouplement parfait Ln ⊗ Ln → Q` qui est alterné dans le premier cas et symétrique dans le second. Il s’ensuit que le groupe de monodromie arithmétique Garith, Ln est inclus dans SL(n). Si n est pair, c’est un sous-groupe du groupe symplectique Sp(n) et, si p = 2 et n est impair, du groupe spécial orthogonal SO(n). Dans [18, Thm. 11.1], Katz démontre que la monodromie est aussi grande que possible (6) en calculant Sp(n) n pair, SL(n) n impair et p 6= 2, Ggeom, Ln = SO(n) n impair 6= 7 et p = 2, G n = 7 et p = 2, 2 où G2 ⊂ SO(7) est l’un des groupes algébriques exceptionnels, défini comme le stabilisateur d’une certaine forme trilinéaire dans la représentation standard de dimension 7 de SO(7). Avec un petit argument additionnel pour traiter le dernier cas [18, §11.3], on en déduit l’égalité des groupes Ggeom, Ln = Garith, Ln . Supposons p 6= 2 et notons G le groupe de monodromie de Ln , qui est donc égal à Sp(n) si n est pair et à SL(n) si n est impair. L’intersection K = G(C) ∩ U (n) avec le groupe unitaire est un sous-groupe compact maximal de G(C). Pour le système local Ln , le nombre C(Gm,k¯ , Ln ) de la remarque 3.4 vaut 1/n car Ln a ramification
(6)
D’après un théorème récent de Perret-Gentil [38], améliorant des résultats de Gabber [18, Ch. 12], c’est encore le cas pour les groupes de monodromie entière, qui sont des sous-groupes de Sp(n) ou SL(n) sur la complétion de l’anneau des entiers d’un corps cyclotomique en une place au-dessus de `, pourvu que ` soit plus grand qu’une constante effective dependant de n.
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
233
modérée en 0 et ramification sauvage en ∞ avec Sw∞ (Ln ) = 1 et tous les sauts égaux à 1/n. Par conséquent, (11) et (12) donnent la majoration 1 X dim(Λ ) √q K TrΛK (θFq ,a ) 6 q − 1 n q−1 a∈F× q pour toute représentation continue irréductible non triviale ΛK de K. Le résultat suivant, qui généralise le théorème 1.3 dans l’introduction, en découle : Théorème 3.6 (Katz). — Lorsque q tend vers l’infini parmi n’importe quelle suite de puissances de nombres premiers impairs, les sommes de Kloosterman normalisées {Kln (a, q)/q
n−1 2
}a∈F× q
se répartissent comme les traces de matrices aléatoires dans K. Il résulte de ce théorème que, pour chaque entier r > 1, la limite des moments X 1 Kln (a, q)r lim r(n−1) q→∞ q 2 (q − 1) a∈F× q
est égale à la multiplicité de la représentation triviale dans la puissance tensorielle r-ième de la représentation standard de G correspondant à Ln . Par exemple, cette multiplicité vaut 2 si n = 2 et r = 4, ce qui explique le terme dominant dans le calcul (3) du quatrième moment des sommes de Kloosterman en une variable. 3.4. Le cas du groupe additif Dans ce paragraphe, on explique comment le théorème 3.3 permet d’étudier la répartition des transformées de Fourier, relatives à des caractères variables, de la fonction trace d’un faisceau `-adique sur la droite affine ; c’est le pendant du théorème d’équirépartition de Katz pour le groupe additif. Soit A1k = Spec k[x] et soit M un objet de la catégorie dérivée Dcb (A1k , Q` ). Pour × chaque extension finie E de k et chaque caractère additif ρ : E → Q` , on pose X S(M, E, ρ) = ρ(x)Tr(FrobE,x |M ). x∈E
Comment ces sommes se répartissent-elles lorsque le degré de E tend vers l’infini ? ×
Moyennant le choix d’un caractère non trivial ψ : k → Q` , tous les caractères additifs de E sont de la forme x 7→ ψ(TrE/k (xy)) pour un seul y ∈ E, de sorte que l’on peut récrire les sommes ci-dessus comme X S(M, E, y) = ψ(TrE/k (xy))Tr(FrobE,x |M ) x∈E
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
234
J. FRESÁN
et les regarder comme étant paramétrées par la droite affine duale A1k = Spec k[y]. L’avantage de ce point de vue est que y 7→ −S(M, E, y) devient alors la fonction trace de la transformation de Fourier FTψ : Dcb (A1k , Q` ) −→ Dcb (A1k , Q` ) M 7−→ Rpr2,! (pr∗1 M ⊗ Lψ(xy) [1]), où pr1 et pr2 désignent les projections de A2k = Spec k[x, y] sur les deux facteurs. Introduite par Deligne dans les années 70, cette construction a été systematiquement étudiée par Brylinski, Katz et Laumon [4], [16], [26], [35], [36]. À l’instar de la transformation de Fourier classique, le foncteur FTψ est essentiellement involutif (13)
FTψ−1 ◦ FTψ = (−1)
et échange le produit de convolution additive M ? N = Rs! (M N ), où s : A2k → A1k désigne l’application somme, et le produit tensoriel : (14)
FTψ (M ? N ) = FTψ (M ) ⊗ FTψ (N )[−1].
On a défini la transformation de Fourier à l’aide de l’image directe à support compact car c’est celle-ci qui s’interprète en termes de sommes exponentielles par le biais de la formule des traces, mais on aurait pu également utiliser l’image directe usuelle. Le « miracle de la transformation de Fourier » [26, Thm. 2.1.3] est qu’il n’y en a qu’une seule, c’est-à-dire que la flèche d’oubli des supports Rpr2,! (pr∗1 M ⊗ Lψ(xy) [1]) −→ Rpr2,∗ (pr∗1 M ⊗ Lψ(xy) [1]) est un isomorphisme. Voici quelques propriétés qui en résultent aussitôt : (a) Le foncteur FTψ commute à la dualité : D ◦ FTψ = FTψ−1 ◦ D(1). (b) Le foncteur FTψ induit une équivalence de catégories sur le faisceaux pervers : ∼
FTψ : Perv(A1k , Q` ) −→ Perv(A1k , Q` ). (c) Le foncteur FTψ augmente de 1 le poids des objets ι-purs. Démonstration. — La propriété (a) découle du fait que la dualité échange Rpr2,! et Rpr2,∗ , ainsi que pr∗1 et pr!1 = pr∗1 (1)[2]. Grâce à l’involutivité (13), pour établir (b) il suffit de démontrer que la transformation de Fourier préserve les faisceaux pervers. Si M est pervers, alors pr∗1 M [1] ⊗ Lψ(xy) est un faisceau pervers sur A2k , et FTψ (M ), vu comme image directe usuelle, est semipervers car le morphisme pr2 est affine ; puisque son dual est égal à FTψ−1 (D(M )(1)), il est aussi semipervers. Enfin, si M est ι-pur de poids w, alors pr∗1 M ⊗ Lψ(xy) [1] est ι-pur de poids w + 1 et, comme les images directe usuelle et à support compact par la projection pr2 sont isomorphes, (c) résulte du théorème principal de Weil II.
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
235
La propriété (b) implique en particulier que la transformation de Fourier envoie des objets simples vers des objets simples. De plus, si M n’est pas géométriquement isomorphe à un faisceau d’Artin-Schreier décalé Lψ(ax) [1], sa transformée de Fourier est de la forme (j∗ L )[1] pour un système local `-adique sur un ouvert j : U ,→ A1k et S(M, E, y) = Tr(FrobE,y |L ) pour tout y ∈ U (E). Compte tenu de tout ce qui précède, le théorème d’équirépartition de Deligne se traduit en l’énoncé suivant : Théorème 3.7. — Soit M un faisceau pervers géométriquement simple et ι-pur de poids zéro sur A1k qui n’est pas de la forme Lψ(ax) [1] et soit (j∗ L )[1] sa transformée de Fourier, où L est un système local `-adique sur un ouvert U de la droite affine duale. Supposons que les groupes de monodromie arithmétique et géométrique de L coïncident et choisissons un sous-groupe compact maximal K de ce groupe. Alors, les sommes {S(M, E, y)}y∈U (E) se répartissent comme les traces de matrices aléatoires dans K lorsque le degré des extensions E/k tend vers l’infini. Si l’on essaye d’adapter ces techniques à l’étude de la répartition des transformées de Fourier des fonctions trace d’un faisceau pervers sur le groupe multiplicatif Gm,k , on est tout de suite confronté à l’obstacle qu’il n’y a pas de variété algébrique sur k dont les E-points paramètrent les caractères multiplicatifs χ : E × → Q` , ni a fortiori de système local `-adique incarnant la transformation de Fourier relative à ces caractères (7). Par ailleurs, on a vu avec les sommes de Gauss que leur répartition peut être gouvernée par des groupes comme GL(1) qui, contrairement aux groupes de monodromie géométrique d’un système local, ne sont pas semisimples. Katz a eu la belle idée de remplacer les points sur une variété algébrique par des foncteurs fibre sur une catégorie tannakienne comme espace de paramètres. Se rappelant que les systèmes locaux forment une catégorie tannakienne dans laquelle le groupe associé à un objet n’est rien d’autre que son groupe de monodromie, l’égalité (14) suggère de considérer à la place la catégorie des faisceaux pervers sur Gm,k munie du produit de convolution multiplicative.
Par contre, le groupe des caractères `-adiques continus de π1mod (Gm,k¯ ) est muni d’une structure de Q` -schéma à une infinité dénombrable de composantes connexes, toutes isomorphes à Spec(Q` ⊗Z` Z` [[X]]), et l’on dispose d’un foncteur de Dcb (Gm,k¯ , Q` ) vers la catégorie des modules à cohomologie bornée et cohérente sur ce schéma envoyant M vers un objet dont la fibre en un caractère χ est RΓ(Gm,k¯ , M ⊗Lχ ). C’est ce point de vue qui permet à Gabber et Loeser de démontrer certains des résultats du numéro suivant. (7)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
236
J. FRESÁN
4. LE THÉORÈME D’ÉQUIRÉPARTITION DE KATZ Ce numéro est consacré aux résultats de la monographie [22]. On introduit d’abord une catégorie tannakienne de faisceaux pervers sur le groupe multiplicatif Gm suivant Gabber et Loeser [11], ce qui permettra d’associer à ces objets des groupes algébriques sur Q` jouant le rôle des groupes de monodromie. Sous les bonnes hypothèses, il s’agit de groupes réductifs et l’on peut définir des classes de conjugaison θE,χ dans un sous-groupe compact maximal K de leurs points complexes. Le théorème de Katz affirme que les θE,χ s’équirépartissent selon la mesure induite par la mesure de Haar normalisée. Après l’avoir démontré, on donnera quelques exemples de calcul du groupe tannakien. 4.1. Bons caractères Dans ce paragraphe et le suivant, on se place sur un corps algébriquement clos de caractéristique p, que l’on omettra de la notation. Soit j : Gm ,→ P1 l’inclusion. Définition 4.1. — Soient M un faisceau pervers sur Gm et Lχ le faisceau de Kummer associé à un caractère continu χ du groupe fondamental modéré π1mod (Gm ). On dit que χ est bon pour M si la flèche canonique d’oubli des supports Rj! (M ⊗ Lχ ) −→ Rj∗ (M ⊗ Lχ ) est un isomorphisme dans Dcb (P1 , Q` ). Autrement, on dira que χ est mauvais pour M . Lemme 4.2. — Pour un objet donné M , il y a au plus 2rg(M ) mauvais caractères, où rg(M ) désigne le rang générique du faisceau constructible H −1 (M ). Démonstration. — Si M est ponctuel, tous les caractères sont bons. En dévissant M en sa partie ponctuelle et non ponctuelle comme dans (9), on peut donc supposer que M est de la forme F [1] pour un faisceau constructible F sur Gm qui n’a pas de sections ponctuelles. Posons G = F ⊗ Lχ . Comme le foncteur j! est exact, le caractère χ est bon pour F si et seulement si j! G ∼ = j∗ G et R1 j∗ G = 0. Compte tenu de la description des foncteurs j! , j∗ et R1 j∗ dans l’exemple 2.7, ces isomorphismes reviennent à dire que G , en tant que représentation des groupes d’inertie I¯0 et I∞ , n’a pas d’invariants ni de coinvariants. Or, si j0 : Gm ,→ A1 désigne l’inclusion, les suites exactes (15) (16)
0 −→ G I¯0 −→ H 0 (A1 , j0! G [1]) −→ H 0 (Gm , G [1]) −→ GI¯0 −→ 0, 0 −→ G I∞ −→ Hc0 (Gm , G [1]) −→ H 0 (A1 , j0! G [1]) −→ GI∞ −→ 0
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
237
montrent que ces invariants et coinvariants ont même dimension [22, p. 22]. Il suffit donc d’éviter les inverses des caractères modérés χ apparaissant dans la monodromie locale de F autour de 0 et ∞ et il y en a au plus 2rg(M ). 4.2. Une catégorie tannakienne de faisceaux pervers sur Gm Soit m : Gm × Gm → Gm la loi de multiplication. La catégorie dérivée Dcb (Gm , Q` ) est munie de deux produits de convolution M ?! N = Rm! (M N ),
M ? N = Rm∗ (M N ),
qui sont échangés par la dualité de Verdier. En combinant la suite spectrale de Leray pour le morphisme m, l’identité m∗ Lχ = Lχ ⊗Lχ et la formule de Künneth [20, §2.5], on obtient des isomorphismes (17)
RΓc (Gm , (M ?! N ) ⊗ Lχ ) = RΓc (Gm , M ⊗ Lχ ) ⊗ RΓc (Gm , N ⊗ Lχ ),
(18)
RΓ(Gm , (M ? N ) ⊗ Lχ ) = RΓ(Gm , M ⊗ Lχ ) ⊗ RΓ(Gm , N ⊗ Lχ ).
En général, aucun des produits de convolution ne préserve les objets pervers. Par exemple, le carré de convolution d’un objet de Kummer Lχ [1] est égal à Lχ [2] qui n’est pas pervers ; dans un sens que l’on précisera ci-dessous, c’est la seule obstruction. Si M et N sont pervers, il en va de même pour M N et, le morphisme m étant affine, l’objet M ? N est semipervers. Comme D(M ?! N ) = D(M )?D(N ) est également semipervers, si la flèche d’oubli des supports M ?! N → M ? N est un isomorphisme, le produit de convolution de M et N est pervers. Nous allons introduire une localisation de la catégorie Perv(Gm , Q` ) sur laquelle cette flèche devient toujours un isomorphisme. Lemme 4.3. — Soit M un faisceau pervers sur Gm . (a) On a χ(Gm , M ) > 0. (b) Si χ(Gm , M ) = 0, alors M est de la forme F [1] pour un faisceau lisse F qui est extension successive de faisceaux de Kummer Lχ . Démonstration. — La caractéristique d’Euler étant additive par rapport aux suites exactes, le dévissage (9) de M en sa partie ponctuelle et non ponctuelle donne χ(Gm , M ) = χ(Gm , Mpct ) + χ(Gm , Mnpct ). Le premier terme est la dimension de H 0 (Gm , Mpct ). Puisque Mnpct = F [1] pour un faisceau constructible F sur Gm et que la caractéristique d’Euler de Gm est nulle, la formule de Grothendieck-Ogg-Shafarevich est dans ce cas l’égalité X (19) χ(Gm , Mnpct ) = Sw0 (F ) + Sw∞ (F ) + [drx (F ) + Swx (F )] ¯ x∈Gm (k)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
238
J. FRESÁN
dont tous les termes sont positifs car F n’a pas de sections ponctuelles.
Supposons maintenant χ(Gm , M ) = 0. On a alors H 0 (Gm , Mpct ) = 0, d’où Mpct = 0 vu qu’un faisceau ponctuel sans sections globales est nul. Par suite, M = F [1] et tous les termes du membre droit de (19) s’annulent. Puisque F n’a pas de sections ponctuelles et que drx (F ) = 0 pour tout x, il s’agit d’un faisceau lisse sur Gm . Comme les conducteurs de Swan Sw0 (F ) et Sw∞ (F ) sont nuls, F a ramification modérée à l’infini et correspond donc à une représentation continue de π1mod (Gm ). Or ce groupe est abélien, comme on l’a vu dans le paragraphe 2.4, et ses caractères sont précisément les faisceaux de Kummer Lχ . On dira qu’un faisceau pervers est négligeable si sa caractéristique d’Euler est nulle. Soit Nég(Gm ) la sous-catégorie pleine de Perv(Gm , Q` ) formée des objets négligeables. Par le lemme 4.3 ci-dessus, elle est épaisse : dans une suite exacte 0 → A → B → C → 0, l’objet B est négligeable si et seulement si A et C sont négligeables. On peut donc, d’après Gabber et Loeser, réaliser la construction suivante : soit Nég la sous-catégorie pleine de Dcb (Gm , Q` ) formée des objets M dont tous les faisceaux pervers de cohomologie pH i (M ) sont négligeables. Alors Nég est une sous-catégorie épaisse, et la localisation (20)
Perv(Gm , Q` )/Nég(Gm )
est équivalente à une sous-catégorie abélienne de la localisation de Dcb (Gm , Q` ) relativement à Nég, en fait le cœur d’une t-structure [11, §3.6]. Proposition 4.4. — Soient M et N deux faisceaux pervers sur Gm . La flèche naturelle M ?! N → M ? N dans Db (Gm , Q` ) est un isomorphisme modulo Nég. Démonstration. — Grâce au lemme 4.2, il existe un caractère modéré χ tel que les complexes RΓc (Gm , ·) et RΓ(Gm , ·) soient isomorphes pour les trois objets M ⊗ Lχ , N ⊗ Lχ et (M ?! N ) ⊗ Lχ . En particulier, la flèche naturelle RΓc (Gm , M ⊗ Lχ ) ⊗ RΓc (Gm , N ⊗ Lχ ) → RΓ(Gm , M ⊗ Lχ ) ⊗ RΓ(Gm , N ⊗ Lχ ) est un isomorphisme. Or cette flèche s’identifie à RΓc (Gm , (M ?! N ) ⊗ Lχ ) −→ RΓ(Gm , (M ? N ) ⊗ Lχ ) d’après (17) et (18) et, comme la source est isomorphe à RΓ(Gm , (M ?! N ) ⊗ Lχ ) par le choix de χ, on en déduit que l’oubli des supports induit un isomorphisme RΓ(Gm , (M ?! N ) ⊗ Lχ ) −→ RΓ(Gm , (M ? N ) ⊗ Lχ ).
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
239
Soit C le cône du morphisme M ?! N → M ? N . Quitte à remplacer C par C ⊗ Lχ , ce qui précède implique l’annulation RΓ(Gm , C) = 0. Dans la suite spectrale E2a,b = H a (Gm , pH b (C)) =⇒ H a+b (Gm , C ⊗ Lχ ), qui calcule la cohomologie d’un objet de la catégorie dérivée à partir de celle de ses faisceaux pervers de cohomologie, tous les termes E2a,b avec a 6= 0, 1 s’annulent car Gm est une courbe affine. La suite spectrale dégénère donc à la deuxième page, et la condition RΓ(Gm , C) = 0 équivaut à RΓ(Gm , pH b (C)) = 0 pour tout b. Par conséquent, les faisceaux pervers pH b (C) sont négligeables. Il sera utile de disposer de représentants explicites des classes d’équivalence dans (20). Katz considère la sous-catégorie P(Gm ) de Perv(Gm , Q` ) formée des faisceaux pervers n’ayant pas de sous-objets ni de quotients du type Kummer décalé Lχ [1]. Dans [20, §2.6], il démontre que, pour un tel M , les objets M ?! N et M ?N sont pervers quel que soit le faisceau pervers N sur Gm . On peut alors parler de l’image de la flèche d’oubli des supports dans P(Gm ) et définir la convolution intermédiaire M ?int N = im(M ?! N −→ M ? N ). En composant l’inclusion de P(Gm ) dans Perv(Gm , Q` ) avec le passage à la localisation on obtient, d’après [11, §3.7], une équivalence de catégories P(Gm ) ∼ = Perv(Gm , Q` )/Nég(Gm ) qui envoie la convolution intermédiaire ?int sur le produit de convolution. En particulier, chaque classe d’équivalence dans la localisation a un unique représentant dans P(Gm ). Théorème 4.5 (Gabber-Loeser, Katz, Deligne) (a) Munie du produit de convolution intermédiaire ?int , de l’objet neutre δ1 et de la dualité M ∨ = [x 7→ x−1 ]∗ D(M ), la catégorie P(Gm ) est tannakienne. (b) Notons j0 : Gm ,→ A1m l’inclusion. Pour n’importe quel faisceau de Kummer Lχ sur Gm , la correspondance M 7−→ H 0 (A1 , j0! (M ⊗ Lχ )) définit un foncteur fibre ωχ sur la catégorie tannakienne P(Gm ). Démonstration. — La première assertion est le théorème 3.7.5 de Gabber-Loeser [11] et la deuxième, que Katz attribue à Deligne, est démontrée dans l’appendice à [22]. Remarque 4.6. — Quel que soit le faisceau pervers M sur Gm , la cohomologie H i (A1 , j0! M ) s’annule en degré non nul. En effet, on peut supposer que M est ou bien ponctuel, auquel cas l’assertion est évidente, ou bien extension
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
240
J. FRESÁN
intermediaire F [1], auquel cas les groupes H i (A1 , j0! M ) = H i+1 (A1 , j0! F ) s’annulent en degré i = 1 car A1 est une courbe affine et en degré i = −1 car F n’a pas de sections globales ponctuelles non nulles. Comme les caractéristiques d’Euler usuelle et à support compact d’un faisceau `-adique coïncident, on en déduit l’égalité dim H 0 (A1 , j0! M ) = χ(Gm , M ). En particulier, la dimension tannakienne d’un objet M de P(Gm ) est donnée par sa caractéristique d’Euler. 4.3. Les classes de conjugaison θE,χ Plaçons-nous maintenant sur un corps fini k. Soit Parith (Gm ) la sous-catégorie pleine de Perv(Gm,k , Q` ) formée des objets M tels que le faisceau pervers Mk¯ sur Gm,k¯ déduit de M par extension des scalaires appartienne à la sous-catégorie P(Gm ) du paragraphe précédent. La convolution intermédiaire et le foncteur fibre M 7→ ω(M ) = H 0 (A1k¯ , j0! M ) munissent Parith (Gm ) d’une structure de catégorie tannakienne. Lemme 4.7. — La sous-catégorie pleine de Parith (Gm ) formée des faisceaux pervers ι-purs de poids zéro est stable par le produit de convolution intermédiaire. Démonstration. — Si M et N sont des faisceaux ι-purs de poids zéro sur Gm,k , leur produit extérieur M N est également ι-pur de poids zéro sur Gm,k × Gm,k . D’après le résultat principal de Weil II (théorème 2.14), M ?! N = Rm! (M N ) est ι-mixte de poids 6 0. Puisque tout quotient d’un tel faisceau pervers est encore ι-mixte de poids 6 0 par [2, Prop. 5.3.1], on en déduit que M ?int N est ι-mixte de poids 6 0. Or le dual D(M ?int N ) s’identifie à la convolution intermédiaire D(M ) ?int D(N ) et est donc ι-mixte de poids 6 0 aussi. Par conséquent, M ?int N est ι-pur de poids zéro. Soit M un faisceau pervers dans Parith (Gm ) semisimple et ι-pur de poids zéro. En combinant les suites exactes (15) et (16) dans la preuve du lemme 4.2, on voit que Rj! M → Rj∗ M est un isomorphisme si et seulement si les applications Hc0 (Gm,k¯ , M ) −→ ω(M ) −→ H 0 (Gm,k¯ , M ) d’oubli des supports et de restriction sont des isomorphismes [22, Thm. 4.1]. Si c’est le cas, ω(M ) est ι-pur de poids zéro d’après le théorème principal de Weil II, c’est-à-dire que les valeurs propres de Frobenius agissant sur ω(M ) sont unitaires. ×
Étant donnés une extension finie E de k et un caractère mutiplicatif χ : E × → Q` , notons Lχ le système local de Kummer sur Gm,E défini dans l’exemple 2.5. Si L est une extension finie de E, le tiré en arrière de Lχ sur Gm,L est le faisceau de Kummer
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
241
associé au caractère χ ◦ NL/E . Vus comme des faisceaux lisses sur Gm,k¯ , les Lχ sont donc les caractères d’ordre fini du groupe fondamental modéré π1mod (Gm,k¯ ) =
lim ←−
E×,
E/k finie
où les applications de transition sont données par la norme. On dira que le caractère χ est bon ou mauvais pour M si χ est bon ou mauvais pour l’objet Mk¯ sur Gm,k¯ au sens de la définition 4.1. Quitte à identifier (E, χ) avec (L, χ ◦ NL/E ) pour toute extension finie L de E, le lemme 4.2 entraîne qu’il y au plus 2rg(M ) mauvais caractères pour M . En remplaçant M par M ⊗ Lχ dans ce qui précède, la caractérisation de bons caractères en termes du foncteur ω implique le résultat suivant : Proposition 4.8. — Soient M un faisceau pervers dans Parith (Gm ) et hM i⊗ la sous-catégorie tannakienne qu’il engendre. Supposons que M est semisimple et ι-pur × de poids zéro. Si un caractère χ : E × → Q` est bon pour M , alors χ est bon pour n’importe quel objet N dans hM i⊗ et la correspondance N 7→ ωχ (N ) = Hc0 (Gm,k¯ , M ⊗ Lχ ) définit un foncteur fibre sur hM i⊗ . Le groupe ωχ (N ) est ι-pur de poids zéro et le Frobenius géométrique FE est un automorphsime tensoriel de ωχ . Fixons un foncteur fibre ω sur la catégorie tannakienne P(Gm ), par exemple ω(M ) = H 0 (A1k¯ , j0! M ). Soient M un faisceau pervers dans Parith (Gm ) et Mk¯ l’objet correspondant de P(Gm ). Par le théorème principal des catégories tannakiennes, ω induit des équivalences hM i⊗ ∼ = RepQ` (Garith, M )
hMk¯ i⊗ ∼ = RepQ` (Ggeom, M )
entre la catégorie engendrée par M (resp. Mk¯ ) et la catégorie des Q` -représentations de dimension finie du groupe des automorphismes tensoriels Garith, M (resp. Ggeom, M ) de la restriction de ω à hM i⊗ (resp. à hMk¯ i⊗ ). Il s’agit dans les deux cas de sous-groupes de GL(ω(M )). Concrètement, Garith, M est le sous-groupe des automorphismes L ⊗ri linéaires γ tels que, pour toute construction tensorielle M ¯r,¯s = M ⊗ (M ∨ )⊗si , l’action de γ sur ω(M ¯r,¯s ) laisse globalement stables toutes les images des sousquotients de M ¯r,¯s . Comme l’objet Mk¯ a plus de sous-quotients à respecter, on a l’inclusion Ggeom, M ⊆ Garith, M . Le corps de coefficients Q` étant algébriquement clos, n’importe quel autre choix de foncteur fibre sur Parith (Gm ) donne lieu à un groupe isomorphe à Garith, M par un isomorphisme unique à un automorphisme intérieur près. Tout élément dans le groupe
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
242
J. FRESÁN
associé à un autre foncteur fibre définit donc une classe de conjugaison dans Garith, M . En particulier, pour une extension finie E de k et un caractère multiplicatif × χ : E × → Q` , le Frobenius géométrique FE est un automorphisme tensoriel de ωχ , d’où des classes de conjugaison dans le groupe Garith, M (Q` ) ⊂ Garith, M (C) que l’on notera FrobE,χ . Si le faisceau pervers M est ι-pur de poids zéro, alors il est géométriquement semisimple d’après [2, Thm. 5.3.8]. Comme la représentation fidèle Ggeom, M → GL(ω(M )) correspondant à Mk¯ est complètement réductible, Ggeom, M est un groupe algébrique réductif. Dorénavant, on supposera que M est arithmétiquement semisimple, c’est-à-dire semisimple en tant qu’objet de Parith (Gm ). Ceci signifie que M est un faisceau pervers semisimple sur Gm,k qui, géométriquement, n’admet pas de faisceaux de Kummer décalés comme sous-objets ni comme quotients. Dans ce cas, le groupe Garith, M est réductif aussi. Si le caractère χ est bon pour M , la classe de conjugaison FrobE,χ a des valeurs propres unitaires d’après la proposition 4.8. Choisissons un sous-groupe compact maximal K du groupe de Lie réductif Garith, M (C). Reprenant mot par mot l’argument du paragraphe 3.2, on associe à chaque FrobE,χ une classe de conjugaison θE,χ dans K # . 4.4. Le théorème principal Théorème 4.9 (Katz). — Soit M un faisceau pervers dans Parith (Gm ). Supposons que M est ι-pur de poids zéro, semisimple, et que les groupes Ggeom, M et Garith, M sont égaux. Choisissons un sous-groupe compact maximal K de Garith, M (C). Lorsque le degré des extensions E/k tend vers l’infini, les classes de conjugaison {θE,χ }χ bon s’équirépartissent dans K # selon la mesure µK # induite par la mesure de Haar sur K. ×
Démonstration. — Soit Bon(E, M ) l’ensemble de bons caractères χ : E × → Q` pour l’objet M ; d’après le lemme 4.2, il est non vide dès que le degré de E est assez grand. Démontrons que, pour toute fonction centrale continue f : K → C, on a Z X 1 (21) f (θE,χ ) −→ f µK |Bon(E, M )| K χ∈Bon(E,M )
lorsque le degré de E tend vers l’infini. En utilisant le théorème de Peter-Weyl, on se réduit à prouver que le membre gauche de (21) converge vers zéro lorsque f est la trace d’une représentation irréductible non triviale de dimension finie ΛK de K. Soit Λ la seule Q` -représentation irréductible non triviale de Garith, M associée à ΛK par le théorème 3.1. Par le biais de l’équivalence hM i⊗ ' RepQ` (Garith, M ), elle correspond à un faisceau pervers simple N dans la sous-catégorie tannakienne de Parith (Gm ) engendrée par M . De plus, l’hypothèse Ggeom, M = Garith, M entraîne
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
243
que N est géométriquement simple et la non-trivialité de Λ se traduit par le fait que Nk¯ n’est pas isomorphe à l’objet neutre δ1 . En termes de N , la trace TrΛK (θE,χ ) est égale à X S(N, E, χ) = χ(x)Tr(FrobE,x |N ) x∈E ×
par la formule des traces de Grothendieck. Le résultat découlerait donc de l’estimée suivante lorsque le degré de E tend vers l’infini : » X 1 S(N, E, χ) = O 1/ |E| . |Bon(E, M )| χ∈Bon(E,M )
Pour la démontrer, remarquons d’abord qu’il suffit d’estimer la moyenne des sommes S(N, E, χ) sur tous les caractères multiplicatifs. En effet, en notant Mauv(E, M ) le complémentaire de Bon(E, M ) dans E × , on a : Å ã X 1 1 X |Mauv(E, M )| S(N, E, χ) = 1 + S(N, E, χ) |Bon(E, M )| |Bon(E, M )| |E × | χ χ∈Bon(E,M )
−
(22)
1 |Bon(E, M )|
X
S(N, E, χ).
χ∈Mauv(E,M )
Or il y a au plus 2rg(M ) mauvais caractères pour l’objet M et la majoration |S(N, E, χ)| 6 dim ω(N ) est valable quel que soit χ. En effet, comme N appartient à la catégorie tannakienne engendrée par M , c’est un faisceau pervers semisimple et ι-pur de poids zéro dans Parith (Gm ) ; il en va de même pour N ⊗ Lχ . La cohomologie à support compact d’un tel faisceau est concentrée en degré zéro et Hc0 (Gm,k¯ , N ⊗ Lχ ) est ι-mixte de poids 6 0, d’où l’inégalité voulue par la formule des traces et la remarque 4.6. Estimons donc la moyenne des S(N, E, χ). Par orthogonalité des caractères, X 1 X 1 X S(N, E, χ) = × Tr(FrobE,x |N ) χ(x) = Tr(FrobE,1 |N ). × |E | χ |E | × χ x∈E
D’après la classification des faisceaux pervers simples sur une courbe (exemple 2.16), on sait que N est de l’un de ces deux types : • Si N est ponctuel, alors il existe un point t ∈ k × \ {1} et une unité `-adique α tels que N = αdeg ⊗ δt , la possibilité t = 1 étant exclue par l’hypothèse que Nk¯ n’est pas isomorphe à δ1 . Dans ce cas, Tr(FrobE,1 |N ) = 0. • Si N n’est pas ponctuel, alors il est de la forme F [1] pour un faisceau extension intermédiaire F sur Gm . Comme N est ι-pur de poids zéro, F est ι-pur de
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
244
J. FRESÁN
poids −1, d’où les inégalités |Tr(FrobE,1 |N )| = | − Tr(FrobE,1 |F )| 6
dim(F¯1 ) rg(F ) p 6 p , |E| |E|
où la dernière provient du fait que, le faisceau F étant une extension intermédiaire, la fibre F¯1 = (Fη¯)I¯1 a dimension plus petite ou égale au rang générique de F . p Dans les deux cas, on a |Tr(FrobE,1 |N )| 6 rg(N )/ |E|. Compte tenu de (22), on en déduit la majoration X 2(rg(N ) + dim ω(N )) 1 6 p (23) S(N, E, χ) |Bon(E, M )| |E| χ∈Bon(E,M ) p pour toute extension E/k de degré assez grand pour que |Mauv(E, M )| 6 |E| − 1. C’est ce qu’il fallait pour conclure la démonstration. En prenant l’image directe de la mesure de Haar normalisée par la trace Tr : K → C, on trouve immédiatement le corollaire suivant : Corollaire 4.10. — Sous les hypothèses du théorème 4.9, les sommes exponentielles {S(M, E, χ)}χ bon se répartissent comme les traces de matrices aléatoires dans K lorsque le degré des extensions E/k tend vers l’infini. Remarque 4.11. — Dans [22, Thm. 7.2], Katz établit un résultat un peu plus général. Si M est semisimple, Ggeom, M est un sous-groupe distingué de Garith, M et il suffit de supposer que le quotient Garith, M /Ggeom, M est isomorphe à un groupe cyclique Z/nZ. Dans ce cas, on choisit un sous-groupe compact maximal Karith de Garith, M (C) et l’on note Kgeom son intersection avec Ggeom, M (C). C’est un sous-groupe distingué # de Karith avec quotient Karith /Kgeom = Z/nZ, d’où une application Karith → Z/nZ. # # Étant donné un entier d modulo n, soient Karith,d ⊂ Karith l’image inverse de d par # cette application et µ# d la mesure de probabilité sur Karith,d déduite de la mesure de Haar normalisée sur Kgeom . Le résultat est le suivant : pour n’importe quelle suite d’extensions E/k de degré congru à d modulo n dont les cardinaux tendent vers # l’infini, les classes de conjugaison {θE,χ }χ bon s’équirépartissent dans Karith,d selon la
mesure µ# d . En présence de bornes uniformes pour les constantes intervenant dans l’estimée (23), le théorème d’équirépartition de Katz admet la variante horizontale suivante : Théorème 4.12 (Katz). — Soient G un groupe réductif sur Q` muni d’une représentation fidèle de dimension n et K un sous-groupe compact maximal de G(C). Soit (ki ) une suite de corps finis de caractéristique distincte de ` dont les cardinaux
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
245
tendent vers l’infini. Pour chaque i, soit Mi un objet semisimple et ι-pur de poids zéro de la catégorie Parith (Gm,ki ) ayant dimension tannakienne n. Supposons que l’égalité Ggeom,Mi = Garith,Mi = G soit satisfaite, l’objet Mi correspondant à la représentation fidèle de G, et qu’il existe un nombre réel C > n tel que rg(Mi ) 6 C pour tout i. Alors les classes de conjugaison {θki ,χ }χ∈Bon(ki ,Mi ) s’équirépartissent dans K # . Esquisse de démonstration. — Soient Λ une représentation irréductible non triviale de G et Ni l’objet correspondant dans la sous-catégorie hMi i⊗ de Parith (Gm,ki ). D’après le critère d’équirépartition de Weyl, il suffit de démontrer que X 1 S(Ni , ki , χ) |Bon(ki , Mi )| χ∈Bon(ki ,Mi )
converge vers zéro lorsque i tend vers l’infini. Comme il y a au plus 2rg(Mi ) mauvais caractères, (23) donne l’inégalité X 2(rg(Ni ) + dim ω(Ni )) 1 p (24) S(Ni , ki , χ) 6 |Bon(k , M )| |ki | i i χ∈Bon(ki ,Mi ) p pour tout i tel que 2C 6 |ki | − 1. Le groupe G ⊂ GL(V ) étant réductif, il existe des entiers a et b tels que Λ soit sous-représentation de V ⊗a ⊗ (V ∨ )⊗b . Chaque faisceau pervers Ni est donc sous-objet de la construction tensorielle Mi⊗a ⊗ (Mi∨ )⊗b et dim ω(Ni ) 6 dim(Mi⊗a ⊗ (Mi∨ )⊗b ) = na+b 6 C a+b . Par ailleurs, une analyse fine de la formule de Grothendieck-Ogg-Shafarevich montre que, pour tous faisceaux pervers semisimples K et L dans Parith (Gm,ki ), l’inégalité rg(K ?int L) 6 rg(K) dim ω(L) + rg(L) dim ω(K) est satisfaite [22, Thm. 28.2]. Par récurrence sur a + b, on en déduit l’inégalité rg(Mi⊗a ⊗ (Mi∨ )⊗b ) 6 (a + b)(dim ω(Mi ))a+b−1 rg(Mi ) et donc rg(Ni ) 6 (a+b)C a+b , ce qui permet de conclure que le membre gauche de (24) converge vers zéro lorsque i tend vers l’infini. 4.5. Exemples Dans ce dernier paragraphe, nous expliquons comment déduire du théorème d’équirépartition de Katz les résultats annoncés dans l’introduction. ×
Exemple 4.13 (Sommes de Gauss). — Soit ψ : k → Q` un caractère additif non trivial. Alors M = j0∗ Lψ (1/2)[1] est un faisceau pervers simple sur Gm,k , pur de poids zéro, qui n’est pas géométriquement isomorphe à un faisceau de Kummer
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
246
J. FRESÁN
décalé (par exemple, car il a ramification sauvage à l’infini). Par la formule de Grothendieck-Ogg-Shafarevich, sa dimension tannakienne vaut χ(Gm , M ) = −χ(Gm , j0∗ Lψ ) = Sw∞ (Lψ ) = 1, d’où des inclusions Ggeom, M ⊆ Garith, M ⊆ GL(1). Comme aucune puissance de convolution de Mk¯ n’est l’objet neutre, le groupe Ggeom, M est égal à GL(1) tout entier. Il s’ensuit que M est un objet de Parith (Gm ) vérifiant les hypothèses du théorème. Soit E une extension de k à q éléments et posons ψq = ψ ◦ TrE/k . Pour tout caractère ×
multiplicatif χ : E × → Q` , on a g(ψq , χ) 1 X χ(x)ψq (x) = − √ S(M, E, χ) = − √ , q q × x∈E
de sorte que ωχ (M ) est pur de poids zéro si χ n’est pas trivial et de poids −1 si χ est trivial. Les bons caractères pour M sont donc les caractères non triviaux. Comme le compact maximal est K = S 1 , le corollaire 4.10 est l’énoncé que les sommes de Gauss normalisées sont équiréparties dans S 1 selon la mesure de Haar. Pour traiter les exemples des sommes d’Evans et de Rudnick, on aura besoin d’un résultat en théorie des représentations [22, Thm. 14.1] : Proposition 4.14. — Soit M un faisceau pervers dans Parith (Gm ) de dimension tannakienne deux. Supposons que M est pur de poids zéro, autodual et géométriquement semisimple. Si M n’est géométriquement isomorphe à aucun de ses translatés non triviaux [x 7→ ax]∗ M , où a ∈ k¯ \ {1}, alors Ggeom, M = Garith, M = SL(2). ×
Exemple 4.15 (Sommes d’Evans). — Soit ψ : k → Q` un caractère additif non trivial. L’objet M = Lψ(x−x−1 ) (1/2)[1] est pur de poids zéro. Comme Lψ(x−x−1 ) est un faisceau de rang un à ramification sauvage à l’infini, M est un objet géométriquement simple dans Parith (Gm ). Par la formule de Grothendieck-Ogg-Shafarevich, il a dimension χ(Gm,k¯ , M ) = Sw0 (Lψ(x−x−1 ) ) + Sw∞ (Lψ(x−x−1 ) ) = 2. En écrivant Lψ(x−x−1 ) comme Lψ(x) ⊗ Lψ(−1/x) , on voit que le dual de ce système local est Lψ(x−1 −x) , d’où M ∨ = M pour le dual tannakien. De plus, le translaté [x 7→ ax]∗ M = Lψ(ax−(ax)−1 ) (1/2)[1] n’est géométriquement isomorphe à M pour aucun a 6= 1 (si tel était le cas, l’objet Lψ((a−1)x+(1−a−1 )x−1 ) (1/2)[1] serait géométriquement trivial, mais le système local sous-jacent a ramification sauvage à l’infini pour tout a 6= 1). Les hypothèses de la proposition 4.14 sont donc satisfaites et Ggeom, M = Garith, M = SL(2). Comme Lψ(x−x−1 ) a ramification totalement sauvage en 0 et ∞, il résulte de
ASTÉRISQUE 414
(1141)
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
247
la preuve du lemme 4.2 que tous les caractères sont bons pour M . Le théorème d’équirépartition de Katz est dans ce cas l’énoncé que les angles {θq,χ }χ des sommes d’Evans s’équirépartissent dans l’intervalle [0, π] selon la mesure de Sato-Tate lorsque q tend vers l’infini. Exemple 4.16 (Sommes de Rudnick). — Dans cet exemple, on suppose que la caractéristique de k est impaire et on note j1 : Gm,k \ {1} ,→ Gm,k l’inclusion. Les sommes de Rudnick sont associées à l’objet M = j1! Lψ( x+1 ) (1/2)[1] x−1
de la catégorie Parith (Gm ), qui est géométriquement simple et pur de poids zéro, par exemple parce que le faisceau Lψ( x+1 ) a ramification totalement sauvage en 1 et x−1 son prolongement par zéro coïncide donc avec l’image directe usuelle. La formule de Grothendieck-Ogg-Shafarevich donne dans ce cas l’égalité χ(Gm,k¯ , M ) = dr1 (j! Lψ( x+1 ) ) + Sw1 (j! Lψ( x+1 ) )) = 1 + 1 = 2 x−1
x−1
car j! Lψ( x+1 ) s’étend en un faisceau lisse en 0 et ∞. De plus, l’identité x−1
x−1 +1 x−1 −1
x+1 = − x−1
¯ en lequel le implique que M est autodual. Comme 1 est le seul point de Gm (k) faisceau j! Lψ( x+1 ) n’est pas lisse, M n’est géométriquement isomorphe à aucun x−1 translaté non trivial, d’où Ggeom, M = Garith, M = SL(2) par la proposition 4.14. La monodromie de j! Lψ( x+1 ) autour de 0 et ∞ étant triviale, tout caractère non trivial χ x−1 est bon pour M et le théorème d’équirépartition de Katz répond positivement à la question de Rudnick.
RÉFÉRENCES [1] Revêtements étales et groupe fondamental (SGA 1) – Documents Mathématiques, vol. 3, Soc. Math. France, 2003, Séminaire de géométrie algébrique du Bois Marie 1960–61 dirigé par A. Grothendieck. [2] A. A. Be˘ılinson, J. Bernstein, P. Deligne & O. Gabber – Faisceaux pervers, in Analysis and topology on singular spaces, I (Luminy, 1981), Astérisque, vol. 100, Soc. Math. France, 1982, p. 5–171. [3] V. Blomer, E. Fouvry, E. Kowalski, P. Michel, D. Milićević & W. F. Sawin – The second moment theory of families of L-functions the case of twisted Hecke L-functions, https://arxiv.org/abs/1804.01450. [4] J.-L. Brylinski – Transformations canoniques, dualité projective, théorie de Lefschetz, transformations de Fourier et sommes trigonométriques, Astérisque 140-141 (1986), p. 3–134.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
248
J. FRESÁN
[5] B. Collas, M. Dettweiler, S. Reiter & W. F. Sawin – Monodromy of elliptic curve convolution, seven-point sheaves of G2 -type and motives of Beauville type, https://arxiv.org/abs/1803.05883. [6] B. Conrad – Reductive group schemes, in Autour des schémas en groupes. Vol. I, Panor. Synthèses, vol. 42/43, Soc. Math. France, 2014, p. 93–444. [7] H. Davenport – On certain exponential sums, J. reine angew. Math. 169 (1933), p. 158–176. [8] P. Deligne – Applications de la formule des traces aux sommes trigonométriques, in Cohomologie étale, Lecture Notes in Math., vol. 569, Springer, 1977, Séminaire de Géométrie Algébrique du Bois-Marie SGA 4 12 . , La conjecture de Weil. II, Publ. Math. IHÉS 52 (1980), p. 137–252. [9] [10] E. Fouvry & P. Michel – Sur le changement de signe des sommes de Kloosterman, Ann. of Math. 165 (2007), no 3, p. 675–715. [11] O. Gabber & F. Loeser – Faisceaux pervers `-adiques sur un tore, Duke Math. J. 83 (1996), no 3, p. 501–606. [12] C. Gauss – Summatio serierum quarundam singularium, Comment. Soc. regiae sci. Gottingen (1811), Werke II, p. 9–45. [13] A. Grothendieck – Formule de Lefschetz et rationalité des fonctions L, in Dix exposés sur la cohomologie des schémas, vol. 3, North-Holland, 1968, p. 31–45. [14] C. Hall, J. P. Keating & E. Roditty-Gershon – Variance of arithmetic sums and L-functions in Fq [t], Algebra Number Theory 13 (2019), no 1, p. 19–92. [15] H. Hasse – Theorie der relativ-zyklischen algebraischen Funktionenkörper, insbesondere bei endlichem Konstantenkörper, J. reine angew. Math. 172 (1935), p. 37–54. [16] L. Illusie – Deligne’s `-adic Fourier transform, in Algebraic geometry, Bowdoin, 1985 (Brunswick, Maine, 1985), Proc. Sympos. Pure Math., vol. 46, Amer. Math. Soc., 1987, p. 151–163. [17] N. M. Katz – Sommes exponentielles, Astérisque, vol. 79, Soc. Math. France, 1980, Cours à Orsay, automne 1979 rédigé par G. Laumon. [18] , Gauss sums, Kloosterman sums, and monodromy groups, Annals of Math. Studies, vol. 116, Princeton Univ. Press, 1988. [19] , Exponential sums over finite fields and differential equations over the complex numbers : some interactions, Bull. Amer. Math. Soc. 23 (1990), no 2, p. 269–309. , Rigid local systems, Annals of Math. Studies, vol. 139, Princeton Univ. [20] Press, 1996. [21] , L-functions and monodromy : four lectures on Weil II, Adv. Math. 160 (2001), no 1, p. 81–132.
ASTÉRISQUE 414
(1141)
[22]
[23]
[24] [25] [26] [27]
[28]
[29] [30]
[31] [32] [33] [34] [35] [36]
[37]
ÉQUIRÉPARTITION DE SOMMES EXPONENTIELLES
249
, Convolution and equidistribution. Sato-Tate theorems for finite-field Mellin transforms, Annals of Math. Studies, vol. 180, Princeton Univ. Press, 2012. , On a question of Keating and Rudnick about primitive Dirichlet characters with squarefree conductor, Int. Math. Res. Not. 14 (2013), p. 3221– 3249. , Elliptic convolution, G2 , and elliptic surfaces, Astérisque 370 (2015), p. 197–205. , On two questions of Entin, Keating, and Rudnick on primitive Dirichlet characters, Int. Math. Res. Not. 15 (2015), p. 6044–6069. N. M. Katz & G. Laumon – Transformation de Fourier et majoration de sommes exponentielles, Publ. Math. IHÉS 62 (1985), p. 361–418. N. M. Katz & P. Sarnak – Random matrices, Frobenius eigenvalues, and monodromy, American Mathematical Society Colloquium Publications, vol. 45, Amer. Math. Soc., 1999. J. P. Keating & Z. Rudnick – The variance of the number of prime polynomials in short intervals and in residue classes, Int. Math. Res. Not. 1 (2014), p. 259–288. H. D. Kloosterman – On the representation of numbers in the form ax2 + by 2 + cz 2 + dt2 , Acta Math. 49 (1927), nos 3-4, p. 407–464. E. Kowalski – Book review of Convolution and equidistribution : Sato-Tate theorems for finite fields Mellin transforms, Bull. Amer. Math. Soc. 51 (2014), no 1, p. 141–149. T. Krämer & R. Weissauer – Vanishing theorems for constructible sheaves on abelian varieties, J. Algebraic Geom. 24 (2015), no 3, p. 531–568. P. Kurlberg & Z. Rudnick – Hecke theory and equidistribution for the quantization of linear maps of the torus, Duke Math. J. 103 (2000), no 1, p. 47–77. , On the distribution of matrix elements for the quantum cat map, Ann. of Math. 161 (2005), no 1, p. 489–507. S. Lang & A. Weil – Number of points of varieties in finite fields, Amer. J. Math. 76 (1954), p. 819–827. G. Laumon – Transformation de Fourier, constantes d’équations fonctionnelles et conjecture de Weil, Publ. Math. IHÉS 65 (1987), p. 131–210. , La transformation de Fourier géométrique et ses applications, in Proceedings of the International Congress of Mathematicians, Vol. I, II (Kyoto, 1990), Math. Soc. Japan, Tokyo, 1991, p. 437–445. , Exponential sums and `-adic cohomology : A survey, Israel Journal of Mathematics 120 (2000), no 1, p. 225–257.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
250
J. FRESÁN
[38] C. Perret-Gentil – Integral monodromy groups of Kloosterman sheaves, Mathematika 3 (2018), p. 652–678. [39] H. Poincaré – Fonctions modulaires et fonctions fuchsiennes, Ann. Fac. Sci. Toulouse Sci. Math. Sci. Phys. 3 (1911), p. 125–149. [40] M. Raynaud – Caractéristique d’Euler-Poincaré d’un faisceau et cohomologie des variétés abéliennes, Séminaire Bourbaki, 17e année, vol. 1964/1965, exp. no 286 (1966), p. 129–147. [41] L. Rosenzweig – On the fluctuations of matrix elements of the quantum cat map, Int. Math. Res. Not. 21 (2011), p. 4884–4933. [42] Z. Rudnick – The arithmetic theory of quantum maps, in Equidistribution in number theory, an introduction, NATO Sci. Ser. II Math. Phys. Chem., vol. 237, Springer, 2007, p. 331–342. [43] H. Salié – Über die Kloostermanschen Summen S(u, v; q), Math. Z. 34 (1932), no 1, p. 91–109. [44] W. F. Sawin – A tannakian category and a horizontal equidistribution conjecture for exponential sums, Thèse, Princeton University, 2016. [45] J-P. Serre – Local fields, Graduate Texts in Math., vol. 67, Springer-Berlin, 1979. [46] A. Weil – On some exponential sums, Proc. Nat. Acad. Sci. U. S. A. 34 (1948), p. 204–207. [47] R. Weissauer – Vanishing theorems for constructible sheaves on abelian varieties over finite fields, Math. Ann. 365 (2016), nos 1-2, p. 559–578. [48] H. Weyl – Über die Gleichverteilung von Zahlen mod. Eins, Math. Ann. 77 (1916), no 3, p. 313–352. [49] P. Xi – Large sieve inequalities for algebraic trace functions, Int. Math. Res. Not. 16 (2017), p. 4840–4881, avec un appendice de É. Fouvry, E. Kowalski et P. Michel.
Javier FRESÁN CMLS, École polytechnique F-91128 Palaiseau Cedex E-mail : [email protected]
ASTÉRISQUE 414
Séminaire BOURBAKI 70e année, 2017–2018, no 1142, p. 251 à 288 doi:10.24033/ast.1086
Janvier 2018
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI [d’après Hochman, Shmerkin, Breuillard, Varjú] par Sébastien GOUËZEL
1. INTRODUCTION L’exemple le plus classique d’ensemble autosimilaire dans R, l’ensemble triadique de Cantor C1/3 , peut être décrit comme suit. Pour λ = 1/3, considérons l’ensemble Φ = Φλ = {x 7→ λx, x 7→ 1+λ(x−1)} des deux contractions affines de rapport λ et de points fixes respectifs 0 et 1. Alors l’unique compact non vide de R invariant par les éléments de Φ est C1/3 . Cette description se prête à une reformulation dynamique : partons d’un compact non vide K0 de R, par exemple K0 = [0, 1], et définissons une S suite par Kn+1 = Φ(Kn ) = ϕ∈Φ ϕ(Kn ). Alors cette suite converge (en topologie de Hausdorff) vers C1/3 , quel que soit le compact de départ K0 , puisque l’application K 7→ Φ(K) est contractante d’un facteur λ pour la distance de Hausdorff et a C1/3 pour point fixe. Pour K0 = [0, 1], alors K1 = [0, 1/3] ∪ [1/3, 2/3], et Kn correspond à la n-ième étape dans la description géométrique habituelle de C1/3 , où l’on retire le tiers central des intervalles conservés à l’étape précédente. Cette construction fonctionne en fait pour tout λ ∈ ]0, 1[. Lorsque λ ∈ ]0, 1/2[, l’ensemble Cλ obtenu est encore un ensemble de Cantor, tout à fait analogue à C1/3 . En revanche, si λ ∈ [1/2, 1[, on a Cλ = [0, 1]. En effet, si l’on part de K0 = [0, 1], alors K1 = [0, λ] ∪ [1 − λ, 1] coïncide avec K0 (il y a même un recouvrement). Il en va donc de même de tous les Kn , et de leur limite. La situation devient plus intéressante si l’on remplace les ensembles par des mesures de probabilité. Partons d’une mesure de probabilité arbitraire κ0 à support P compact, et définissons κn+1 = 21 ϕ∈Φλ ϕ∗ (κn ). En notant K0 le support de κ0 , alors le support de κn est l’ensemble Kn défini ci-dessus. De plus, comme l’application P κ 7→ 21 ϕ∈Φλ ϕ∗ (κ) est contractante de rapport λ pour une distance adaptée sur les mesures de probabilité à support compact (la distance de Wasserstein W1 ), la suite κn converge vers une mesure limite µ ¯λ , de support égal à Cλ et indépendante du
© Astérisque 414, SMF 2019
252
S. GOUËZEL
choix de κ0 . C’est l’unique mesure de probabilité sur R qui est stationnaire pour P µλ ). Lorsque l’action de Φλ : elle est caractérisée par l’égalité µ ¯λ = 12 ϕ∈Φλ ϕ∗ (¯ λ < 1/2, c’est la mesure uniforme classique sur l’ensemble de Cantor Cλ , donnant une mesure 2−n à chacun des 2n intervalles de n-ième génération dans la construction géométrique de Cλ (c’est aussi la mesure de Hausdorff de dimension log 2/|log λ| sur Cλ ). Pour λ = 1/2, c’est exactement la mesure de Lebesgue sur [0, 1] puisque, si l’on part de κ0 = Leb[0,1] , alors toutes les mesures κn coïncident avec Leb[0,1] . En revanche, la situation est plus complexe pour λ ∈ ]1/2, 1[ : le recouvrement dans la décomposition K1 = [0, λ] ∪ [1 − λ, 1] rend la mesure κ1 inhomogène, donnant proportionnellement plus de poids à l’intervalle central [1 − λ, λ] qu’aux deux bouts. Cette inhomogénéité se transfère ensuite, par itération, à toutes les échelles. Le problème central auquel cet exposé est consacré est l’exploration de la régularité de la mesure µ ¯λ , et en particulier des paramètres λ ∈ [1/2, 1[ pour lesquels µ ¯λ est absolument continue (par rapport à la mesure de Lebesgue) : les seuls paramètres pour lesquels on sait que µ ¯λ n’est pas absolument continue sont les inverses des nombres de Pisot, et il est bien possible que ce soit les seuls, même si ce problème est encore ouvert. Les résultats récents que l’on décrira plus bas indiquent que les paramètres exceptionnels λ pour lesquels µ ¯λ n’est pas absolument continue forment un petit ensemble, en un sens que l’on précisera. En sus de leur description géométrique, les mesures µ ¯λ admettent une description équivalente plus probabiliste, et souvent plus pratique pour les démonstrations, qui explique le nom de convolutions de Bernoulli qu’on leur donne. Soit ξ0 , ξ1 , ξ2 , . . . une suite de variables aléatoires indépendantes identiquement distribuées de type Bernoulli, i.e., qui valent 1 ou −1 avec probabilité 1/2 (on peut prendre par exemple les fonctions coordonnées sur l’espace Ω = {−1, 1}N muni de la mesure P n P = ((δ−1 + δ1 )/2)⊗N ). Formons la somme X∞ = n>0 ξn λ , c’est une série aléatoire convergente dont la loi µλ est une mesure de probabilité sur R, donnée par Ñ é X µλ (A) = P ξn λn ∈ A . n>0
On peut aussi écrire µλ = (X∞ )∗ P si l’on souhaite éviter complètement le langage probabiliste. Comme la loi d’une somme de variables indépendantes est la convolution des lois de ces variables, la définition précédente permet aussi d’écrire µλ comme un produit de convolution infini de lois de Bernoulli : (1.1)
µλ =
∗
δ−λn + δλn . 2 n>0
En isolant la variable ξ0 (qui vaut −1 ou 1 avec probabilité 1/2) et en notant que la P loi de n>1 ξn λn coïncide avec µλ à une contraction de facteur λ près, on obtient
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
253
l’égalité 1 (x 7→ −1 + λx)∗ µλ + (x 7→ 1 + λx)∗ µλ . 2 C’est la même équation que celle satisfaite par µ ¯λ , à un changement affine de coordonnées près (envoyant −1/(1 − λ) sur 0 et 1/(1 − λ) sur 1). Ce changement de P coordonnées envoie donc µλ sur µ ¯λ (il envoie aussi la loi de XN = n 1 dont tous les conjugués (distincts de β) sont de module < 1. √ Pensons par exemple au nombre d’or (1+ 5)/2 ou à la racine maximale de x3 −x−1 (ce dernier est le plus petit nombre de Pisot). De manière surprenante, les nombres de Pisot forment un sous-ensemble fermé de R. Le nombre d’or est le plus petit point d’accumulation des nombres de Pisot [1]. Par conséquent, il y a une infinité de nombres de Pisot dans ]1, 2[. Théorème 3.5 (Erdős [4], Garsia [8]). — Soit λ ∈ ]1/2, 1[ tel que λ−1 soit un nombre de Pisot. Alors µλ est singulière par rapport à la mesure de Lebesgue, et on a même Dim(µλ ) < 1. Conjecturalement, les inverses des nombres de Pisot sont les seuls paramètres pour lesquels µλ est singulière par rapport à la mesure de Lebesgue. Un cas particulier d’un théorème de Hochman (énoncé plus loin comme le théorème 4.12) montre que, pour beaucoup de nombres algébriques, la dimension de la mesure µλ est maximale : Proposition 4.13 (Hochman [10]). — Soit λ ∈ [1/2, 1[ algébrique sur Q, mais qui n’est pas racine d’un polynôme à coefficients dans {−1, 0, 1}. Alors Dim(µλ ) = 1. Ce théorème s’applique par exemple à tout λ rationnel. Avec le théorème 3.5, ceci implique qu’un inverse dans ]1/2, 1[ d’un nombre de Pisot est racine d’un polynôme à coefficients dans {−1, 0, 1}. On donnera une démonstration directe de ce fait plus loin, après le lemme 3.3. P n Les convolutions de Bernoulli font apparaître les sommes avec n 1. j
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
257
On rappelle la conjecture de Lehmer sur les mesures de Mahler : Conjecture 2.5 (Lehmer). — Il existe c > 1 tel que la mesure de Mahler de tout nombre algébrique est soit égale à 1, soit supérieure ou égale à c. Plus précisément, il est même conjecturé qu’on peut prendre c = 1,1762 . . . , correspondant à λ racine du polynôme X 10 + X 9 − X 7 − X 6 − X 5 − X 4 − X 3 + X + 1. La mesure de Mahler des nombres algébriques peut être utilisée pour contrôler la dimension de la convolution de Bernoulli correspondante : Théorème 4.14 (Breuillard-Varjú [3]). — Il existe c0 avec la propriété suivante (c0 = 0,44 fonctionne). Soit λ ∈ [1/2, 1[ un nombre algébrique sur Q tel que λ > min(2, Mλ )−c0 . Alors Dim(µλ ) = 1. Si la conjecture de Lehmer est vraie, on en déduit que, pour tout λ algébrique assez proche de 1, alors Dim(µλ ) = 1 puisque la condition du théorème est satisfaite. Des raffinements supplémentaires permettent même de garantir l’absolue continuité de la mesure, sous des conditions beaucoup plus restrictives. Théorème 5.6 (Varjú [20]). — Pour tout ε > 0, il existe c(ε) > 0 avec la propriété suivante. Soit λ ∈ [1/2, 1[ un nombre algébrique sur Q tel que λ > 1 − c(ε) min(log Mλ , (log Mλ )−1−ε ). Alors µλ est absolument continue. Toutes les constantes dans l’article de Varjú peuvent être explicitées. Cela lui permet d’obtenir l’énoncé suivant : si a et b sont des entiers positifs premiers entre eux, alors µ1−a/b est absolument continue dès que a < 10−37
b . log(b + 1)(log log(b + 2))3
Résultats pour les paramètres génériques Considérons l’ensemble des polynômes de degré au plus n à coefficients dans {−1, 0, 1} (de cardinal 3n+1 ), et notons Zn l’ensemble des racines (complexes) de ces polynômes. C’est un ensemble de cardinal majoré par n3n+1 . On définit l’ensemble de Hochman H ⊆ [1/2, 1[ comme l’ensemble des paramètres approchés superexponentiellement par des éléments de Zn . Formellement, pour A > 0 et N0 > 0, posons HA,N0
= {λ ∈ [1/2, 1[ : ∀n > N0 , d(λ, Zn ) 6 e−An },
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
258
S. GOUËZEL
où d désigne la distance euclidienne dans C. Alors H est défini par \ [ HA,N0 . (2.2) H = A>0 N0
Cet ensemble est extrêmement mince. En effet, si l’on fixe A > log 3 et N0 , alors pour tout n > N0 l’ensemble HA,N0 est contenu dans n3n+1 intervalles de taille 2e−An . Comme n3n+1 · 2e−An → 0, l’ensemble HA,N0 est donc de mesure nulle, mais on a plus. On dit qu’un ensemble est de dimension de boîte (ou de Minkowski) au plus d si, pour tout ε, pour tout r assez petit, on peut le recouvrir par r−d−ε intervalles de longueur r. Alors HA,N0 est de dimension de Minkowski au plus (log 3)/A. La dimension de Minkowski n’est pas stable par réunion dénombrable croissante, mais c’est le cas d’une notion de dimension un tout petit peu plus faible appelée dimension S de packing (voir par exemple [6] pour ces notions de dimensions). Ainsi, N0 HA,N0 a dimension de packing au plus (log 3)/A. Finalement, H a dimension de packing nulle. Ceci implique par exemple que H a dimension de Hausdorff nulle, mais c’est plus fort. Si l’on tire uniformément n3n+1 points indépendants dans le disque de rayon 2 (qui contient tous les points de Zn ), alors avec très grande probabilité la distance minimale entre deux points est minorée par 10−n . On s’attend naïvement à ce que le comportement de l’ensemble non aléatoire Zn soit analogue. En particulier, la conjecture suivante (qu’Hochman pose comme question dans [10]) est très naturelle : Conjecture 2.6. — Il existe M > 0 tel que la distance entre deux points distincts de Zn est minorée par M −n , pour n assez grand. S Proposition 2.7. — Si la conjecture 2.6 est vraie, alors H est inclus dans n Zn , il est donc dénombrable et composé de nombres algébriques. Démonstration. — Si la conjecture est vraie, on peut fixer M = eA > 0 tel que la distance entre deux éléments distincts de Zn soit au moins M −n pour tout n > N0 . Soit x ∈ H2A,N0 . Pour tout n > N0 , il existe alors zn ∈ Zn tel que |x − zn | 6 e−2An . Pour n > N0 , les points zn et zn−1 sont deux éléments de Zn , à distance au plus e−2An + e−2A(n−1) = (1 + e−2A )e−2An , qui est < e−An si n est assez grand. Ceci implique que zn = zn−1 au vu de la séparation minimale entre les éléments distincts S de Zn . Ainsi, la suite zn stationne, en un point z appartenant à n Zn . Comme elle S converge vers x, on obtient x ∈ n Zn . La meilleure borne démontrée sur la séparation des éléments de Zn est un petit peu plus faible qu’une borne exponentielle : deux points distincts de Zn sont à distance au moins 2e−4n log n d’après [14] (voir [2, Theorem 21]). Le théorème suivant, dû à Hochman, montre que les paramètres pour lesquels la dimension de la convolution de Bernoulli µλ n’est pas maximale appartiennent
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
259
nécessairement à l’ensemble de Hochman H . Ainsi, ces paramètres sont extrêmement rares, et très probablement tous algébriques d’après la proposition 2.7 – cela justifie de s’intéresser tout particulièrement aux paramètres algébriques comme nous l’avons fait plus haut. Théorème 4.15 (Hochman [10]). — Soit λ tel que Dim(µλ ) < 1. Alors λ ∈ H . En particulier, les paramètres pour lesquels Dim(µλ ) < 1 ont dimension de packing nulle et donc aussi dimension de Hausdorff nulle. Cet énoncé peut être reformulé ainsi : si Dim(µλ ) < 1, alors pour tout A > 0 il existe pour tout n assez grand λn ∈ Zn avec |λ−λn | 6 e−An . Ainsi, λ est extrêmement bien approché par des éléments de Zn (qui sont en particulier des entiers algébriques). Lorsque Dim(µλ ) < 1, le théorème 4.15 donne pour tout n assez grand une bonne approximation λn de λ dans Zn . Cependant, il ne garantit pas que λn soit réel, et même si λn est réel il ne dit rien sur les propriétés de la mesure de Bernoulli µλn . Avec des techniques plus fines, Breuillard et Varjú montrent que, pour une infinité de valeurs de n, on peut garantir que λn soit réel et que µλn ait elle-même une dimension < 1. De plus, ils obtiennent une meilleure vitesse de convergence de λn vers λ : Théorème 5.7 (Breuillard-Varjú [2]). — Soit λ ∈ [1/2, 1[ tel que Dim(µλ ) < 1. Il existe alors une suite ni → ∞ et une suite d’approximations λni ∈ Zni ∩ [1/2, 1[ telles log log log ni que |λ − λni | 6 e−ni et Dim(µλni ) → Dim(µλ ). En particulier, on déduit de cet énoncé que, pour tout intervalle ouvert I ⊆ [1/2, 1[, (2.3)
{λ ∈ I : Dim(µλ ) < 1} ⊆ {λ ∈ Q ∩ I : Dim(µλ ) < 1}.
Ce résultat permet de déduire, à partir des résultats démontrés pour les paramètres algébriques, des résultats qui sont valables pour tous les paramètres. Par exemple, si la conjecture de Lehmer est vraie, on obtient directement que tous les paramètres λ assez proches de 1 (algébriques ou non) vérifient Dim(µλ ) = 1, puisque le théorème 4.14 donne cette assertion pour les nombres algébriques et que l’inclusion (2.3) permet de l’étendre à tous les paramètres. De même, si on savait que les seuls paramètres algébriques avec Dim(µλ ) < 1 étaient les inverses des nombres de Pisot, alors on en déduirait immédiatement que les seuls paramètres (algébriques ou non) avec Dim(µλ ) < 1 seraient les inverses des nombres de Pisot, puisque l’ensemble des nombres de Pisot est fermé. Le théorème 5.7 implique aussi des résultats inconditionnels qui reposent sur des résultats quantitatifs de transcendance : si on sait qu’un paramètre λ n’est pas approché suffisamment rapidement par des nombres algébriques, on en déduit que Dim(µλ ) = 1. C’est par exemple vrai pour λ = 2 log 2, e−1/2 ou π/4 [20].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
260
S. GOUËZEL
Les méthodes de preuve de Hochman ne permettent pas directement de montrer l’absolue continuité des mesures pour les paramètres hors de H . Cependant, en combinant ces arguments avec des techniques d’analyse de Fourier (moins explicites, et qui en particulier ne permettent pas de décrire l’ensemble de paramètres exceptionnels), Shmerkin a pu aller plus loin : Théorème 2.8 (Shmerkin [17, 18]). — Il existe un ensemble (non explicite) S ⊆ [1/2, 1[ de dimension de Hausdorff nulle tel que, pour λ ∈ / S , la mesure µλ est absolument continue par rapport à la mesure de Lebesgue, et de plus sa densité est dans Lp pour tout p ∈ [1, ∞[. Ainsi, même pour le problème de l’absolue continuité, l’ensemble des paramètres exceptionnels est extrêmement petit (toutefois dans un sens moins fort que plus haut, car on parle ici de dimension de Hausdorff et non de dimension de packing). Il y a en fait deux énoncés dans ce théorème : d’une part l’absolue continuité pour la plupart des paramètres [17], et d’autre part le fait que la densité soit dans Lp pour tout p [18]. Le second point est nettement plus délicat que le premier, et fait appel à des généralisations profondes des résultats de Hochman dont nous ne parlerons pas ici (disons seulement qu’il s’agit de remplacer l’entropie par d’autres quantités analogues mais reliées à la norme Lp dans tous les arguments). Esquissons rapidement la preuve de l’absolue continuité dans le théorème de Shmerkin, car les arguments n’ont rien à voir avec les techniques entropiques qu’on développera dans la suite. Esquisse de démonstration. — Le point clé de la preuve est la remarque (élémentaire) suivante : si une mesure µ s’écrit comme µ(1) ∗µ(2) où µ(1) a des coefficients de Fourier qui décroissent polynomialement à l’infini et Dim(µ(2) ) = 1, alors µ est absolument continue [17, Lemma 2.1]. P (1) n Fixons k un entier assez grand. On prend pour µλ la loi de n≡0 [k] ξn λ , et P (2) (1) (2) (1) pour µλ la loi de n6≡0 [k] ξn λn , de telle sorte que µλ = µλ ∗ µλ . La mesure µλ est en fait égale à µλk . Un théorème de Erdős et Kahane assure que les coefficients de Fourier de cette mesure décroissent polynomialement à l’infini, en dehors d’un ensemble de paramètres de dimension de Hausdorff nulle [17, Proposition 2.3]. (2) La mesure µλ , quant à elle, n’est pas une convolution de Bernoulli, mais elle y ressemble suffisamment pour que des variantes des résultats qu’on a énoncés plus haut s’y appliquent. En particulier, en dehors d’un ensemble de paramètres de dimension (2) de packing nulle, on a Dim(µλ ) = 1 lorsque λ > 2−1+1/k . On obtient ainsi que, dans l’intervalle [2−1+1/k , 1[, les paramètres exceptionnels pour lesquels µλ n’est pas absolument continue ont dimension de Hausdorff nulle. La même conclusion dans [1/2, 1[ s’obtient en faisant tendre k vers l’infini.
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
261
Ce théorème est le dernier en date d’une longue série de raffinements successifs garantissant l’absolue continuité de la mesure µλ pour des ensembles de paramètres λ de plus en plus grands. Historiquement, on peut mentionner les résultats intermédiaires suivants : 1. Méthodes de Fourier [5, 12]. Il existe a < 1 tel que µλ est absolument continue pour presque tout λ ∈ [a, 1[. Plus généralement, pour tout k, il existe ak < 1 tel que µλ est absolument continue avec densité C k pour presque tout λ ∈ [ak , 1[. Mieux, la dimension de Hausdorff des paramètres λ ∈ [a, 1[ pour lesquels µλ n’est pas absolument continue avec une densité C k tend vers 0 lorsque a tend vers 1. 2. Méthodes de transversalité [19, 15]. La mesure µλ est absolument continue pour presque tout λ ∈ [1/2, 1[. De plus, pour tout a > 1/2, la dimension de Hausdorff des paramètres exceptionnels dans [a, 1[ est < 1. Pour tous ces résultats, antérieurs à l’introduction par Hochman de méthodes liées à la combinatoire additive et dont nous ne parlerons pas ici, le survol de Peres, Schlag et Solomyak [16] est une référence incontournable. Signalons juste que toutes ces approches ne donnent jamais des ensembles explicites de paramètres. En ce sens, les arguments de Hochman sont un progrès décisif.
3. ENTROPIE ET NOMBRES DE PISOT Dans ce paragraphe, on démontre de manière détaillée le fait que la convolution de Bernoulli de paramètre λ inverse d’un nombre de Pisot est de dimension < 1. La preuve est classique et élémentaire, c’est surtout l’occasion de nous familiariser avec l’entropie dans un cas simple, et de voir quelles sont les difficultés qu’il faudra surmonter pour des paramètres λ généraux. Si X est une variable aléatoire prenant un nombre fini de valeurs, on définit son entropie H(X) par la formule X (3.1) H(X) = − P(X = x) · log P(X = x). x
On interprète habituellement cette formule en disant que l’entropie mesure l’information contenue par une variable aléatoire. L’entropie d’une variable pouvant prendre N valeurs est majorée par log N , et vaut log N si et seulement si la variable est uniforme (cela résulte de la convexité de x 7→ − log x). Dès que X prend N valeurs de manière à peu près équiprobable, l’entropie H(X) mesure donc (le logarithme de) la taille N de cet ensemble de valeurs. De manière plus générale, si X est à peu près uniforme sur un ensemble de grande mesure (on appellera les valeurs qu’elle y prend les valeurs typiques de X) et le reste des valeurs est négligeable, on s’attend à ce que
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
262
S. GOUËZEL
l’entropie mesure le (logarithme du) nombre de valeurs typiques de X. C’est faux en général (si X n’a pas de bonnes propriétés), mais c’est souvent vrai quand X est engendrée par un processus « naturel ». C’est l’intuition sur laquelle je vais insister dans ce texte : l’entropie d’une variable discrète X mesure le logarithme du nombre de valeurs typiques prises par X. P n Fixons λ ∈ [1/2, 1[. La variable aléatoire XN = est une variable n0 H(XN )/N,
(3.2) appelée l’entropie de λ.
Cette quantité mesure la taille des atomes typiques de XN : pour presque tout ω, (3.3)
P{ω 0 : XN (ω 0 ) = XN (ω)} ∼log e−N h(λ) .
Enfin, le cardinal des valeurs typiques de XN croît comme eN h(λ) , dans le sens suivant. Fixons un seuil s ∈ ]0, 1[, par exemple s = 1/2. Alors (3.4) min Card A : P(XN ∈ A) > s ∼log eN h(λ) . Démonstration. — On travaille sur l’espace Ω = {−1, 1}N muni de la mesure P, produit des mesures de Bernoulli, et on note ξn la fonction n-ième coordonnée. Ces fonctions forment une suite de variables i.i.d. de Bernoulli. Notons ( ) X X (3.5) QN (ω) = ω 0 : ξn (ω 0 )λn = ξn (ω)λn , n0 . Alors on a (3.7)
ASTÉRISQUE 414
QN (ω) ∩ σ −N QM (σ N ω) ⊆ QN +M (ω).
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
263
En effet, si un point ω 0 vérifie les deux égalités X X X X ξn (ω 0 )λn = ξn (ω)λn et ξm+N (ω 0 )λi = ξm+N (ω)λi , n s. De plus, X X X Card A = 16 P(Q)/e−N (h+ε) 6 eN (h+ε) P(Q) = eN (h+ε) . Q∈Qn ,Q∩K6=∅
Q∈Qn ,Q∩K6=∅
Q∈Qn
Ainsi, le terme de gauche de (3.4) est borné par e en eN (h−ε) est analogue.
N (h+ε)
. La borne inférieure
Corollaire 3.2. — La dimension Dim(µλ ) vérifie toujours l’inégalité Å ã h(λ) (3.9) Dim(µλ ) 6 min 1, . |log λ| Démonstration. — L’inégalité Dim(µλ ) 6 1 est évidente puisqu’on est en dimension 1. P Pour l’autre inégalité, fixons un aléa ω typique. Alors x = X∞ (ω) = ξn (ω)λn est typique pour µλ = (X∞ )∗ P. En particulier, le théorème 2.2 assure que
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
264
S. GOUËZEL
µλ ([x − CλN , x + CλN ]) ∼log λN Dim(µλ ) , pour tout C > 0. Si ω 0 vérifie P XN (ω 0 ) = XN (ω), alors X∞ (ω 0 ) et X∞ (ω) diffèrent au plus de n>N λn = C0 λN pour C0 = 1/(1 − λ). Ainsi, pour tout ω 0 ∈ QN (ω) défini en (3.5), on a X∞ (ω 0 ) ∈ [x − C0 λN , x + C0 λN ]. On obtient donc (3.10)
e−N Dim(µλ )|log λ| = λN Dim(µλ ) ∼log µλ ([x − C0 λN , x + C0 λN ]) > P(QN (ω)) ∼log e−N h(λ) ,
le dernier équivalent découlant de (3.3). Ainsi, Dim(µλ ) · |log λ| 6 h(λ) comme annoncé. On voit dans la preuve que l’inégalité (3.9) risque d’être stricte si beaucoup de valeurs de XN sont regroupées dans un intervalle très court, car l’inégalité dans (3.10) est alors très grossière. Conjecturalement, cependant, on a toujours égalité dans (3.9) : ce phénomène de regroupement excessif ne pourrait se produire que lorsque XN prend de très nombreuses valeurs, i.e., h(λ)/|log λ| > 1. Si cette conjecture était vraie, on aurait par exemple Dim(µλ ) = 1 dès que λ est transcendant (ou plus généralement dès que λ n’est pas racine d’un polynôme à coefficients dans {−1, 0, 1}) puisqu’alors XN est distribué uniformément sur 2N points, et H(XN ) = N log 2. On discutera plus loin les méthodes sophistiquées de Hochman permettant de montrer cette conjecture pour une très grande majorité de paramètres λ ; elle est par exemple vraie pour tout λ algébrique, voir le théorème 4.12. Pour l’instant, nous allons nous restreindre à un cas où l’égalité est élémentaire, celui des inverses des nombres de Pisot (voir la définition 2.4). Le lemme suivant assure que, dans ce cas, les valeurs de XN sont toutes bien séparées. Lemme 3.3. — Soit β > 1 un nombre de Pisot. Considérons deux sommes P P n 0 n et avec εn , ε0n ∈ {−1, 1}. Si ces sommes sont distinctes, ne−N h+N ε
Q,P(ϕ(Q))>e−N h+N ε
X
6
P(Q0 ) · Card{Q : Q0 = ϕ(Q)}
Q0 ,P(Q0 )>e−N h+N ε
6 D(C)
X
P(Q0 ) = D(C)δN .
Q0 ,P(Q0 )>e−N h+N ε
Par conséquent, avec grande probabilité, toutes les valeurs de XN dans [XN (ω) − CλN , XN (ω) + CλN ] sont prises avec probabilité au plus e−N h+N ε .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
266
S. GOUËZEL
Ceci donne, avec grande probabilité, P{ω 0 : |XN (ω 0 ) − XN (ω)| 6 CλN } 6 D(C)e−N h+N ε . Finalement, X∞ (ω 0 ) et X∞ (ω) ne peuvent être λN -proches que si XN (ω 0 ) et XN (ω) étaient distants de au plus C0 λN pour C0 = 1 + 2/(1 − λ), puisque |XN − X∞ | 6 λN /(1 − λ). Ainsi, avec grande probabilité, µλ ([x − λN , x + λN ]) 6 D(C0 )e−N h+N ε . De plus, pour presque tout x µλ ([x − λN , x + λN ]) ∼log λN Dim(µλ ) = e−N Dim(µλ )|log λ| . Cela donne l’inégalité recherchée Dim(µλ ) · |log λ| > h − ε. Théorème 3.5 (Erdős [4], Garsia [8]). — Soit λ ∈ ]1/2, 1[ tel que λ−1 soit un nombre de Pisot. Alors µλ est singulière par rapport à la mesure de Lebesgue, et on a même Dim(µλ ) < 1. Démonstration. — On commence par montrer que la mesure µλ est singulière, en calculant sa transformée de Fourier. En partant de l’expression (1.1) de µλ comme convolution infinie, et en utilisant le fait que la transformée de Fourier d’une convolution est le produit des transformées de Fourier, on obtient l’identité Z Y eitx dµλ (x) = cos(λn t). n
Si µλ était absolument continue, alors sa transformée de Fourier tendrait vers 0 en l’infini d’après le lemme de Riemann-Lebesgue. On va voir que ce n’est pas le cas en estimant la transformée de Fourier pour t = 2πβ N où β = λ−1 est Pisot. On décompose le produit ci-dessus comme Y Y Y Y cos(2πλn β N ) · cos(2πλn β N ) = cos(2πβ n ) · cos(2πλn ). n>N
n6N
n>0
n6N
Le produit n>0 cos(2πλn ) est convergent et non nul car cos(2πλn ) tend exponentiellement vite vers 1. Notons (βk )k6K les conjugués de β, ils sont de module < 1. Alors P P β n + k βkn est entier, donc cos(2πβ n ) = cos(2π k βkn ). Ainsi, Ñ é Y Y X cos(2πβ n ) −−−−→ cos 2π βkn , Q
n6N
N →∞
n
k6K
qui est également un produit convergent non nul. Cela conclut la preuve de la singularité de µλ . D’après la proposition 2.1, la mesure µλ est même purement singulière. On va en déduire le fait suivant : pour tout M > 0, (3.11)
ASTÉRISQUE 414
P{ω : P(QN (ω)) < M λN } → 0.
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
267
Autrement dit, la mesure (XN )∗ P, qui est concentrée sur au plus D0 λ−N points d’après le lemme 3.3, est en fait loin d’être la mesure uniforme sur cet ensemble, elle est nettement plus concentrée. Pour montrer (3.11), remplaçons (XN )∗ P par une mesure à densité νN , dont la densité autour d’une valeur x prise par XN est donnée par 1[x−cλN ,x+cλN ] P(XN = x)/(2cλN ), où c est fixé assez petit pour que ces intervalles soient deux à deux disjoints. Comme νN est proche de (XN )∗ P, elle converge également vers la mesure purement singulière µλ . En particulier, la probabilité que sa densité soit bornée par une constante donnée tend vers 0. Cela donne (3.11). Montrons maintenant que, pour N assez grand, on a H(XN ) < N |log λ|. Comme Dim(µλ ) = (Inf H(XN )/N )/|log λ| d’après le corollaire 3.4 et la définition de h(λ), cela prouvera que Dim(µλ ) < 1, comme annoncé. On décompose QN comme union disjointe de deux ensembles, PN et SN , correspondant respectivement aux atomes principaux, c’est-à-dire ceux pour lesquels P(QN (ω)) > M λN , et aux atomes secondaires pour lesquels P(QN (ω)) < M λN (où M est fixé assez grand, M = 2 suffira). On notera PN et SN les unions des atomes principaux et secondaires respectivement. Il y a peu d’atomes principaux, ce qui va permettre de montrer que leur contribution à l’entropie est assez petite. Et la probabilité des atomes secondaires est petite d’après (3.11), donc ils auront aussi une petite contribution. Le calcul se fait comme suit. Estimons tout d’abord la contribution des atomes principaux. Puisqu’ils vérifient tous P(Q) > M λN , on a X X − P(Q) log P(Q) 6 − P(Q) log(M λN ) = P(PN )(N |log λ| − log M ) Q∈PN
Q∈PN
6 P(PN )N |log λ| − log M/2, la dernière inégalité étant valide si N est assez grand car P(PN ) → 1 d’après (3.11). Pour les atomes secondaires, on fait apparaître la mesure de probabilité P/P(SN ) sur SN . Comme il y a au plus D0 λ−N atomes, l’entropie de cette mesure est bornée par log(D0 λ−N ). Comme P(SN ) → 0, on obtient Ñ é Å ã X X P(Q) P(Q) − P(Q) log P(Q) = P(SN ) − log P(SN ) − log P(SN ) P(SN ) Q∈SN Q∈SN (3.12) 6 −P(SN ) log P(SN ) + P(SN ) · log(D0 λ−N ) = o(1) + P(SN )N |log λ|. En sommant les deux inégalités, et comme P(PN ) + P(SN ) = 1, on trouve (3.13)
H(XN ) 6 N |log λ| + o(1) − log M/2.
Cela donne bien H(XN ) < N |log λ| si N est assez grand.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
268
S. GOUËZEL
Remarque 3.6. — La preuve de la dimension < 1 est un peu subtile, car (3.13) ne donne pas une asymptotique de la forme H(XN ) 6 (1 − ε)N |log λ| mais une inégalité plus faible, sans décroissance en N (qui implique toutefois le résultat recherché par sous-additivité). En particulier, cette preuve n’est pas quantitative, elle transforme une assertion de singularité en une assertion plus forte mais sans borne explicite. Je ne connais pas de preuve directe de l’assertion sur la dimension, qui ne passe pas d’abord par le calcul de la transformée de Fourier pour obtenir la singularité de µλ .
4. ENTROPIE À PETITE ÉCHELLE POUR LES CONVOLUTIONS DE BERNOULLI La discussion précédente montre que, en général, h(λ) risque de ne pas capturer la dimension lorsqu’il y a des sommes XN qui sont très proches, mais distinctes. Une manière plus sûre de calculer la dimension devrait être de regrouper toutes les sommes assez proches par paquets, et de calculer l’entropie ainsi produite. C’est ce qu’on va faire maintenant. 4.1. Compléments sur l’entropie On doit tout d’abord introduire un peu plus de matériel autour de la notion d’entropie. Si µ est une mesure de probabilité et Q est une partition finie, on notera H(µ, Q) (ou simplement H(Q) si µ est implicite) l’entropie de la partition, donnée par X H(µ, Q) = − µ(Q) log µ(Q). Q∈Q
C’est l’information moyenne donnée par la connaissance de l’élément de Q dans laquelle on se trouve (où l’information est I(x) = − log µ(Q(x)), avec Q(x) l’atome de Q contenant x). Ainsi, l’entropie d’une variable aléatoire discrète X sur un espace (Ω, P), définie en (3.1), est l’entropie de la partition formée des atomes où X est constante, de la forme X −1 ({x}). L’entropie des partitions admet aussi une version relative : si R est une partition plus fine que Q (i.e., chaque atome de Q est union d’atomes de R ), on pose Ñ é Å ã X X µ(R) µ(R) H(µ, R | Q) = µ(Q) − log . µ(Q) µ(Q) Q∈Q
R∈R ,R⊆Q
Dans cette définition, le terme entre parenthèses à droite est l’entropie de la partition R pour la mesure de probabilité µ|Q /µ(Q), il est donc positif et majoré
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
269
par log Card{R ∈ R : R ⊆ Q}. En développant log(µ(R)/µ(Q)) = log µ(R)−log µ(Q) et en regroupant les termes, on obtient l’égalité H(µ, R | Q) = H(µ, R ) − H(µ, Q). Ceci fournit donc le lemme suivant : Lemme 4.1. — Si R est une partition finie sur un espace probabilisé (Ω, µ), plus fine qu’une partition Q, alors 0 6 H(µ, R ) − H(µ, Q) 6 max log Card{R ∈ R : R ⊆ Q}. Q∈Q
Notons que le calcul (3.12) reposait déjà implicitement sur cette notion d’entropie relative. Plus généralement, si Q et R sont deux partitions finies mais non comparables, on peut considérer la partition Q ∨ R dont les atomes sont formés des intersections des atomes de Q et de R (qui est plus fine que Q et R ) et lui appliquer le résultat précédent. On obtient donc : |H(µ, Q) − H(µ, R )| 6 max max log Card{R ∈ R : Q ∩ R 6= ∅}, Q∈Q (4.1) max log Card{Q ∈ Q : Q ∩ R 6= ∅} . R∈R
Ainsi, deux partitions qui se ressemblent ont des entropies comparables. Donnons quelques résultats faciles sur l’entropie dont nous aurons besoin plus loin. Lemme 4.2. — L’entropie d’une variable aléatoire X sur un espace probabilisé, à valeurs dans un ensemble fini, vérifie les propriétés suivantes : 1. Pour toute fonction f , la variable aléatoire discrète f (X) vérifie H(f (X)) 6 H(X). 2. Si Y est définie sur le même espace que X, alors la variable aléatoire discrète (X, Y ) vérifie H(X, Y ) 6 H(X) + H(Y ), avec égalité si et seulement si X et Y sont indépendantes. 3. Si Y et X sont toutes deux à valeurs réelles (ou dans un groupe commutatif ), alors |H(X) − H(Y )| 6 H(X − Y ). Démonstration. — Pour la première assertion, les ensembles où f (X) est constante sont union d’ensembles où X est constante. La partition correspondante a donc une entropie plus petite, d’après le lemme 4.1.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
270
S. GOUËZEL
Pour le deuxième point, on calcule comme suit. X H(X, Y ) = − P(X = x, Y = y) log P(X = x, Y = y) x,y
=−
X
−
X
Å P(X = x, Y = y) log
x,y
P(X = x, Y = y) P(X = x)P(Y = y)
ã
P(X = x, Y = y)(log P(X = x) + log P(Y = y)).
x,y
La dernière somme donne H(X) + H(Y ) en séparant les deux termes, il s’agit donc de voir que le premier terme est négatif. On le réécrit comme Å ã X P(X = x)P(Y = y) P(X = x, Y = y) log P(X = x, Y = y) x,y ! X P(X = x)P(Y = y) 6 log P(X = x, Y = y) = log 1 = 0, P(X = x, Y = y) x,y l’inégalité découlant de la concavité du logarithme et de l’inégalité de Jensen. Pour le troisième point, X = (X − Y ) + Y est une fonction de X − Y et Y . Ainsi, H(X) 6 H(X − Y, Y ) par le premier point. Cette entropie est bornée par H(X − Y ) + H(Y ) d’après le deuxième point. Ainsi, H(X) − H(Y ) 6 H(X − Y ). On contrôle de même H(Y ) − H(X), pour obtenir l’inégalité recherchée. 4.2. Entropie pour les convolutions de Bernoulli On note Dn la partition dyadique de R en intervalles de taille 2−n , de la forme [k2−n , (k + 1)2−n [ pour k ∈ Z. On note Dn (x) l’intervalle de Dn qui contient x. On rappelle qu’on a défini la notion de mesure dimensionnellement exacte dans le théorème 2.2. Proposition 4.3. — Soit µ une mesure réelle dimensionnellement exacte de dimension α > 0. Alors, pour presque tout x, µ(Dn (x)) ∼log 2−αn . Démonstration. — La fonction r 7→ log µ([x−r, x+r])/ log r converge pour µ-presque tout x vers α, par définition d’une mesure dimensionnellement exacte. Elle converge uniformément sur un ensemble K de mesure arbitrairement grande. On va commencer par voir que presque tout point est éloigné des bords des éléments de Dn . Fixons δ > 0. Montrons qu’il existe alors ρ > 0 tel que, pour n assez grand, pour tout x ∈ ∂ Dn , (4.2)
µ(K ∩ [x − 2−(1+δ)n , x + 2(1−δn) ]) 6 e−ρn µ([x − 2−n−2 , x + 2−n−2 ]).
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
271
Si l’ensemble à gauche est vide, il n’y a rien à faire. Sinon, prenons y ∈ K ∩ [x − 2−(1+δ)n , x + 2(1−δn) ]. Alors K ∩ [x − 2−(1+δ)n , x + 2−(1+δ)n) ] ⊆ [y − 2−(1+δ)n+1 , y + 2−(1+δn)+1 ]. Ce dernier ensemble a mesure au plus 2−α(1+δ)n+εn si n est assez grand, par définition de K (où ε > 0 est fixé, assez petit). De plus, [x − 2−n−2 , x + 2−n−2 ] contient [y − 2−n−3 , y + 2−n−3 ], qui a mesure au moins 2−αn−εn par définition de K. Si ε est assez petit, on a −(1 + δ)α + ε < −α − ε, ce qui donne alors (4.2). En sommant l’inégalité (4.2) sur les x ∈ ∂ Dn , on en déduit que {y ∈ K : d(y, ∂ Dn ) 6 2−(1+δ)n } a mesure au plus e−ρn (car les intervalles apparaissant à droite de (4.2) sont deux à deux disjoints), qui est sommable. Ainsi, par le lemme de Borel-Cantelli, presque tout x ∈ K vérifie d(x, ∂ Dn ) > 2−(1+δ)n pour n assez grand. Alors Dn (x) contient [x − 2−(1+δ)n , x + 2−(1+δ)n ] et est contenu dans [x − 21−n , x + 21−n ]. Le premier intervalle a une mesure au moins 2−α(1+δ)n−εn , le second une mesure au plus 2−αn+εn . Les deux exposants étant arbitrairement proches de α, on en déduit que µ(Dn (x)) ∼log 2−αn pour presque tout x ∈ K. Comme la mesure de K est arbitrairement proche de 1, cela conclut la preuve. On déduit de cette proposition que le nombre d’atomes de Dn nécessaires pour couvrir une proportion significative de µ croît comme 2αn , exactement comme dans la preuve de la proposition 3.1. Cela pointe vers une interprétation entropique de la dimension de la mesure µ. Si µ est une mesure à support compact sur R et Dn est la partition dyadique, alors H(µ, Dn ) peut aussi être vu comme l’entropie de la variable discrète b2n Xc, où X est distribuée suivant µ. Cette entropie mesure la complexité de µ à l’échelle 2−n . Il découle de la proposition 4.3 que cette entropie calcule la dimension de la mesure µ : Proposition 4.4. — Soit µ une mesure réelle dimensionnellement exacte à support compact. Alors H(µ, Dn )/ log(2n ) → Dim(µ) lorsque n → ∞. Démonstration. — Cette proposition se déduit de la proposition 4.3 en utilisant les mêmes techniques que dans la partie 3. On sépare les atomes de Dn dont la mesure est proche de 2−n Dim(µ) (ils ont une probabilité proche de 1 d’après la proposition 4.3), et les autres atomes (de probabilité presque nulle). Les premiers donnent une contribution à l’entropie de l’ordre de n Dim(µ) log 2, les seconds ont une contribution négligeable (comme dans (3.12)).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
272
S. GOUËZEL
Les travaux de Hochman [10] sont formulés en termes de l’entropie dyadique. Cependant, il est apparu plus tard chez Breuillard et Varjú qu’il était techniquement plus efficace de rajouter une moyennisation supplémentaire : quand on utilise la partition dyadique Dn , on fixe arbitrairement et inutilement un point de référence 0. Étant données une mesure réelle µ et une échelle r > 0 (le cas dyadique correspond à r = 2−n ), on notera dans la suite Z 1 (4.3) H(µ, r) = H(µ, {[tr + kr, tr + (k + 1)r[, k ∈ Z}) dt, t=0
l’entropie de µ par rapport à une partition de R en intervalles de taille r, dont le point base tr est choisi aléatoirement. Notons que le choix de différents points base donne lieu à des partitions qui se ressemblent beaucoup (chaque intervalle de la nouvelle partition rencontre au plus deux intervalles de l’ancienne, et inversement), si bien que les entropies de ces deux partitions diffèrent au plus de log 2 d’après (4.1). Ainsi, (4.4)
|H(µ, r) − H(µ, {[kr, (k + 1)r[, k ∈ Z})| 6 log 2.
En particulier, les comportements asymptotiques sont les mêmes. En revanche, quand on voudra faire des estimées fines, la quantité moyennée se comportera mieux (avec des inégalités valables en permanence, sans terme d’erreur). C’est ce langage qu’on utilisera dans la suite. La proposition 4.4 se reformule ainsi : Proposition 4.5. — Soit µ une mesure réelle dimensionnellement exacte à support compact. Alors H(µ, r)/|log r| → Dim(µ) lorsque r → 0. Démonstration. — Si rn tend exponentiellement vite vers 0, alors on peut faire fonctionner les arguments à base de Borel-Cantelli dans la preuve de la proposition 4.3, et démontrer ainsi que H(µ, {[krn , (k + 1)rn [, k ∈ Z})/|log rn | tend vers Dim(µ). La convergence de H(µ, rn )/|log rn | vers Dim(µ) en découle d’après (4.4). Enfin, si H(µ, r)/|log r| ne convergeait pas vers Dim(µ), on pourrait trouver une soussuite rn tendant vers 0 arbitrairement vite le long de laquelle cette convergence n’aurait pas lieu, ce qui donnerait une contradiction. P Une convolution de Bernoulli µλ ressemble à l’échelle λN à la loi de XN = n Dim(µλ ).
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
275
Démonstration. — On suit la preuve de [2, Lemma 16]. On vérifie (en utilisant le lemme 4.7) pour k ∈ N que la fonction k
fk (λ) =
(4.8)
H(µλ , λ2 | 1) − 2 log 2 2k |log λ|
dépend continûment de λ. Lorsque k tend vers l’infini, fk (λ) converge vers Dim(µλ ) d’après la proposition 4.5. Comme une limite croissante de fonctions continues est semi-continue inférieurement, il suffit donc de vérifier que fk+1 (λ) > fk (λ) pour conclure. On écrit (4.9)
k+1
H(µλ , λ2
| 1) = H(µλ , λ2
k+1
k
On veut comparer le premier terme à H(µλ , λ2 k I = [0, λ2 ], on obtient k
[0,λ2 ]
H(µλ
k+1
, λ2
k
| λ2 ) + H(µλ , λ2 | 1).
k
k
| λ2 ) 6 H(µλ , λ2
| 1). En appliquant (4.6) avec
k+1
k
| λ2 ) + 2 log 2. k
Dans le terme de gauche de cette équation, si l’on dilate tout d’un facteur λ−2 comme k en (4.7), on retrouve l’entropie de la mesure initiale µλ vue entre les échelles λ2 et 1. Ainsi, k k+1 k H(µλ , λ2 | 1) 6 H(µλ , λ2 | λ2 ) + 2 log 2. Par conséquent, en utilisant la décomposition (4.9), on obtient l’inégalité k
2H(µλ , λ2 | 1) 6 H(µλ , λ2
k+1
| 1) + 2 log 2.
Cela donne directement l’inégalité fk+1 (λ) > fk (λ), comme on le voulait. 4.3. Le théorème de Hochman, et applications On a pour l’instant deux notions d’entropie : H(XN ) capture toute l’entropie de la variable XN , tandis que H(XN , λN ) regroupe les valeurs de XN qui sont distantes de moins de λN , et contient donc moins d’information. La première est assez facile à calculer car c’est une quantité purement algébrique, tandis que la seconde donne la dimension de la mesure d’après la proposition 4.6 mais elle est nettement plus difficile à estimer car elle requiert de comprendre quelles sommes coïncident presque, ce qui nous fait sortir du monde algébrique. Les deux quantités diffèrent typiquement, à moins que les valeurs de XN ne soient séparées de cλN comme dans le cas exceptionnel des nombres de Pisot. On peut dire que H(XN , λN ) ne voit pas encore toute l’entropie de XN . Si on regarde H(XN , s) avec s 6 λN , on commence à voir plus d’entropie, et lorsque s → ∞ on finit par épuiser toute l’entropie de XN . Le théorème principal de Hochman, qui a lancé tous les progrès récents sur les convolutions de Bernoulli, est le renforcement suivant de la proposition 4.6. Il affirme qu’au lieu de regarder XN à l’échelle λN dans la discussion précédente on peut la
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
276
S. GOUËZEL
regarder à n’importe quelle échelle exponentiellement petite s = e−AN (ou s = λAN ) sans perte, dès lors que Dim(µλ ) < 1. Théorème 4.11. — Soit µλ une convolution de Bernoulli de paramètre λ ∈ [1/2, 1[. ]r,1] Supposons Dim(µλ ) < 1. Soit A > 1. Alors H(µλ , rA )/|log r| → Dim(µλ ) lorsque r → 0. De manière équivalente, H(XN , λAN )/(N |log λ|) → Dim(µλ ). Ce théorème a l’air d’un énoncé purement technique, mais il est en fait fondamental. ]r,1] Par rapport à la proposition 4.6, il affirme que la mesure µλ n’est pas plus A compliquée si on la regarde à l’échelle r qu’à l’échelle r dès que Dim(µλ ) < 1 (ce qui implique qu’il y a beaucoup de trous dans la distribution de µλ ). Autrement PN −1 n N dit, les valeurs typiques de n=0 ξn λ sont soit séparées de cλ , soit à distance AN au plus λ , et ce pour tout A > 0. C’est un phénomène qu’on a déjà vu avec les inverses des nombres de Pisot, où la coïncidence est même exacte d’après le lemme 3.3. Il est remarquable que, sans aucune hypothèse algébrique sur le paramètre λ, Hochman arrive à une conclusion pratiquement aussi forte que pour les nombres de Pisot, simplement sous une hypothèse géométrique de dimension non maximale sur la mesure. Avant de parler dans la section 5 de la démonstration de ce théorème, montrons comment il implique plusieurs des résultats que nous avons évoqués dans l’introduction. Tout d’abord, on en déduit que l’inégalité dans le corollaire 3.2 est une égalité pour les nombres algébriques. On rappelle que h(λ) est définie dans l’équation (3.2). Théorème 4.12. — Soit λ ∈ [1/2, 1[ algébrique sur Q. Alors on a Å ã h(λ) (4.10) Dim(µλ ) = min 1, . |log λ| Démonstration. — On commence par montrer une version faible du lemme d’espacement 3.3 pour les nombres de Pisot. Si λ est algébrique sur Q, montrons P P n 0 n qu’il existe B > 0 et c > 0 tels que deux sommes et n 0 avec la propriété suivante. Considérons deux échelles r 6 s avec s/r suffisamment grand. Soient µ et ν deux mesures réelles à support compact. On suppose que : – La mesure µ est δ1 -poreuse. – On a H(ν, r | s) > δ2 log(s/r). Alors H(µ ∗ ν, r | s) > H(µ, r | s) + ε log(s/r). L’hypothèse sur ν indique qu’elle ne ressemble pas du tout à un Dirac entre les échelles r et s : elle a une entropie qui n’est pas ridicule (rappelons que l’entropie maximale entre les échelles r et s est log(s/r)). Alors le théorème affirme que l’entropie de µ ∗ ν est quantitativement plus grande que celle de µ. Cet énoncé est démontré (sous une forme légèrement différente) par Hochman dans [10, Theorem 8]. Sa preuve, délicate, occupe la majeure partie de son article. Nous utiliserons cet énoncé comme une boîte noire, et allons voir qu’il implique le théorème 4.11. Disons seulement que les techniques de preuve trouvent leur origine dans un domaine a priori complètement distinct de celui des convolutions de Bernoulli, la combinatoire additive. Le thème général de ce domaine est, étant données deux parties A et B d’un groupe additif, de comprendre dans quelle mesure A + B = {a + b : a ∈ A, b ∈ B} est plus grand que A et B. Par exemple, si A est une progression arithmétique {kx : k ∈ {0, . . . , n − 1}} de cardinal n, alors A + A est de cardinal 2n − 1, comparable à Card A. Dans le cas où A n’a pas une telle structure, on s’attend plutôt à ce que A + A ait un cardinal de l’ordre de (Card A)2 . Il existe de nombreux énoncés et théorèmes profonds dans cette direction, affirmant que si Card(A + A) 6 K Card A où K est une constante fixée, ou si Card(A + A) 6 (Card A)1+δ avec δ assez petit, alors A doit ressembler à une progression arithmétique, ou à une de ses variantes (des progressions arithmétiques à différentes échelles, par exemple). Le théorème 5.2 relève de ce domaine si l’on pense à l’analogie comme quoi l’entropie compte le (logarithme du) cardinal des valeurs typiques de la mesure. En effet, si A représente l’ensemble des valeurs typiques de µ et B celles de ν, les valeurs typiques de µ ∗ ν sont essentiellement données par A + B. Le théorème affirme bien que A + B est quantitativement plus gros que A, sous certaines hypothèses qui excluent que µ ressemble à une progression arithmétique à quelque échelle que ce soit (c’est l’hypothèse de porosité) et que ν ait trop peu de valeurs typiques (tous les énoncés de combinatoire additive n’ont de sens que si les ensembles sont suffisamment gros).
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
281
L’apport de Hochman est double : – D’une part, comprendre que des techniques de combinatoire additive pouvaient avoir un rôle à jouer dans l’étude des convolutions de Bernoulli, et que le théorème 5.2 était donc un énoncé pertinent dans ce contexte (on va voir plus bas qu’il implique facilement le théorème 4.11, et donc toutes les conséquences qu’on a décrites dans le paragraphe 4.3). – D’autre part, démontrer ce théorème 4.11 : les résultats de combinatoire additive classique ne s’appliquent pas directement, et la preuve est difficile (bien qu’élémentaire). 5.2. Démonstration du théorème de Hochman Pour montrer le théorème 4.11 à partir du théorème 5.2, la première étape est de voir qu’une mesure de dimension < 1 est δ1 -poreuse pour un certain δ1 > 0. Lemme 5.3 (Breuillard-Varjú [2]). — Soit λ ∈ [1/2, 1[ tel que Dim(µλ ) < 1. Alors il existe δ > 0 tel que, pour toute échelle t, on ait H(µλ , t | 2t) 6 (1−δ) log 2. Autrement dit, µλ est δ-poreuse. Démonstration. — On admet l’estimée suivante sur l’entropie [2, Lemma 15] : pour toute mesure réelle µ à support compact, on a log 2 − H(µ, 2r | 4r) 6 4(log 2 − H(µ, r | 2r)).
(5.1)
Autrement dit, si µ est presque d’entropie maximale entre les échelles r et 2r, i.e., elle est presque uniforme, alors elle est aussi presque uniforme entre les échelles 2r et 4r (avec une légère perte). Supposons que µλ n’est pas poreuse, on va voir que Dim(µλ ) = 1. Fixons un grand entier K. Par hypothèse de non-porosité, on peut choisir t tel que H(µλ , t | 2t) est très proche de log 2. D’après (5.1), il en va de même de H(µλ , 2k t | 2k+1 t) pour k fixé. En sommant, on obtient que H(µλ , t | 2K t) est proche de K log 2, et donc au moins K log 2 − log 2. Approchons t et 2K t par deux puissances de λ, soient λa+b et λa , avec une erreur multiplicative au plus 2. En particulier, K log 2 = b|log λ| ± 2 log 2. Grâce au lemme 4.7, on obtient H(µλ , λa+b | λa ) > H(µλ , t | 2K t) − 4 log 2 > K log 2 − 5 log 2 > b|log λ| − 7 log 2. D’après (4.7), si l’on contracte tout d’un facteur λnb , on obtient la même borne [0,λnb ]
pour H(µλ
[0,1]
, λa+(n+1)b | λa+nb ), puisque µλ = µλ
. Avec (4.6), cela donne
H(µλ , λa+(n+1)b | λa+nb ) > b|log λ| − 9 log 2. En sommant ces inégalités de 0 à N − 1, on obtient H(µλ , λa+N b | λa ) > N b|log λ| − 9N log 2.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
282
S. GOUËZEL
Le terme de gauche de cette équation est équivalent à N b|log λ| Dim(µλ ) lorsque N tend vers l’infini, d’après la proposition 4.5. Ainsi, Dim(µλ ) > 1 − 9 log 2/(b|log λ|). Comme K (et donc b) est arbitrairement grand, cela donne Dim(µλ ) = 1. On peut maintenant démontrer le théorème 4.11. Démonstration du théorème 4.11 à partir du théorème 5.2. — Soit strictement positif. Il s’agit de voir que ]λN ,1]
H(µλ
(5.2)
A
un
entier
, λAN | λN ) = o(N ), ]λN ,1]
puisqu’on sait déjà par la proposition 4.6 que H(µλ , λN )/N |log λ| → Dim(µλ ). N PA−1 ]λ ,1] On décompose l’entropie dans (5.2) comme a=1 H(µλ , λ(a+1)N | λaN ), il suffit de voir que chaque terme est o(N ). D’après la proposition 4.5, on a (5.3)
A−1 X
H(µλ , λ(a+1)N | λaN ) = H(µλ , λAN ) ∼ AN |log λ| Dim(µλ ).
a=0 [0,λaN ]
Comme µλ s’écrit comme la convolution de µλ d’après (4.6) (5.4)
[0,λaN ]
H(µλ , λ(a+1)N | λaN ) > H(µλ
et d’une autre mesure, on a
, λ(a+1)N | λaN ) − 2 log 2
= H(µλ , λN | 1) − 2 log 2 ∼ N |log λ| Dim(µλ ), où l’égalité s’obtient en dilatant tout d’un facteur λ−aN comme en (4.7), ce qui envoie [0,λaN ]
µλ sur µλ par auto-similarité, et où le dernier équivalent vient de la proposition 4.5. En sommant les termes extrêmes de (5.4), on retrouve les termes de (5.3). Cela montre que l’inégalité dans (5.4) ne peut pas être trop stricte : on a (5.5)
[0,λaN ]
H(µλ , λ(a+1)N | λaN ) = H(µλ
, λ(a+1)N | λaN ) + o(N ).
Autrement dit, l’entropie de µλ entre les échelles λ(a+1)N et λaN vient de son [0,λaN ] facteur µλ , et les autres facteurs ne contribuent donc pas à l’entropie. Cela ]λN ,1]
va permettre de conclure que µλ n’a presque pas d’entropie entre ces échelles, comme annoncé, grâce au théorème 5.2. [0,λaN ]
]λaN ,λN ]
]λN ,1]
[0,λaN ]
Écrivons µλ comme µλ ∗ µλ ∗ µλ . Notons que la mesure µλ (similaire par dilatation à la mesure µλ ) est δ1 -poreuse d’après le lemme 5.3. ]λN ,1]
Supposons par l’absurde que H(µλ
ASTÉRISQUE 414
, λ(a+1)N | λaN ) ne soit pas o(N ), elle
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
283
est donc > δ2 N pour une infinité de valeurs de N , pour un certain δ2 > 0. Soit ε = ε(δ1 , δ2 ) donné par le théorème 5.2. On a alors [0,λaN ]
H(µλ , λ(a+1)N | λaN ) = H(µλ
[0,λaN ]
> H(µλ
[0,λaN ]
> H(µλ
]λaN ,λN ]
∗ µλ
]λN ,1]
∗ µλ
]λN ,1]
∗ µλ
, λ(a+1)N | λaN )
, λ(a+1)N | λaN ) − 2 log 2
, λ(a+1)N | λaN ) − 2 log 2 + εN |log λ|,
où la première inégalité provient de (4.6) et la seconde du théorème 5.2. C’est absurde car cela contredit (5.5). 5.3. Versions quantitatives Si l’on veut obtenir des résultats plus forts, on a besoin de raffiner le théorème 5.2, et en particulier de comprendre comment ε dépend de δ1 et δ2 . Dans cette direction, Varjú a démontré dans [20] les deux théorèmes quantitatifs suivants : Théorème 5.4. — Soient α ∈ ]0, 1/2] et r > 0. On considère deux mesures réelles µ et ν à support compact, telles que H(µ, s | 2s) > log 2 − α et H(ν, s | 2s) > log 2 − α, pour tout s avec |log s − log r| < 3|log α|. Alors H(µ ∗ ν, r | 2r) > log 2 − 109 |log α|3 α2 . Autrement dit, si deux mesures ont des entropies presque maximales, leur convolée est encore plus uniforme, le défaut d’entropie se comportant presque multiplicativement. Théorème 5.5. — Soient δ1 , δ2 ∈ ]0, 1/2] et r < s. On considère deux mesures réelles µ et ν à support compact. On suppose que H(µ, t | 2t) 6 log 2(1 − δ1 ) pour tout t ∈ [r, s] (c’est une hypothèse de porosité sur µ) et que H(ν, r | s) > δ2 log(s/r) (c’est une hypothèse d’entropie non négligeable sur ν). Alors H(µ ∗ ν, r | s) > H(µ, r | s) + 10−8
δ1 δ2 log(s/r) − 3 log 2. |log δ1 | |log δ2 |
Ainsi, dans le théorème 5.2, on peut prendre ε(δ1 , δ2 ) presque linéaire en δ1 et δ2 . Ces théorèmes permettent d’aller plus loin que le théorème 4.11 de Hochman. Ils sont utilisés dans la démonstration des résultats suivants : Théorème 5.6 (Varjú [20]). — Pour tout ε > 0, il existe c(ε) avec la propriété suivante. Soit λ ∈ [1/2, 1[ algébrique sur Q avec λ > 1 − c(ε) min(log Mλ , (log Mλ )−1−ε ). Alors µλ est absolument continue.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
284
S. GOUËZEL
Théorème 5.7 (Breuillard-Varjú [2]). — Soit λ ∈ [1/2, 1[ tel que Dim(µλ ) < 1. Il existe alors une suite ni → ∞ et une suite d’approximations λni ∈ Zni ∩ [1/2, 1[ telles log log log ni que |λ − λni | 6 e−ni et Dim(µλni ) → Dim(µλ ). On rappelle que l’ensemble Zn est formé des zéros des polynômes de degré au plus n à coefficients dans {−1, 0, 1}. Les preuves de ces résultats reposent fondamentalement sur des idées similaires à ce qu’on a déjà exposé : écrire µλ comme le produit de convolution d’un certain nombre de mesures µIλk (où les Ik forment une partition de [0, 1]), et contrôler l’entropie des µIλk et/ou de µλ en utilisant l’auto-similarité d’une part, et les contrôles de croissance de l’entropie d’autre part. Les décompositions à utiliser sont toutefois beaucoup plus sophistiquées que celles que nous avons expliquées plus haut. Nous ne rentrerons pas dans les détails, et renvoyons le lecteur vers les articles originaux.
6. UNE BORNE INFÉRIEURE RIGOUREUSE SUR LA DIMENSION DES CONVOLUTIONS DE BERNOULLI La proposition suivante utilise toute la force des énoncés précédents, en particulier les théorèmes 4.12 et 5.7. Proposition 6.1 (Hare et Sidorov [9]). — Pour tout λ dans l’intervalle [1/2, 1[, on a Dim(µλ ) > 0,82. Esquisse de démonstration. — L’entropie provient d’un phénomène sous-additif comme énoncé dans la proposition 3.1. Obtenir des bornes supérieures sur l’entropie (et la dimension) est donc facile (il suffit de regarder ce qui se passe en un temps fixé), mais il est beaucoup plus délicat d’obtenir des bornes inférieures, comme dans cette proposition. Notons tout d’abord qu’il suffit de montrer, pour tout λ ∈ [1/2, 1[, l’inégalité (6.1)
h(λ)/|log λ| > 0,82.
En effet, si cette inégalité est vraie, on déduit que pour λ algébrique on a Dim(µλ ) > 0,82 grâce à la formule Dim(µλ ) = min(1, h(λ)/|log λ|) donnée dans le théorème 4.12 pour les paramètres algébriques. L’inégalité Dim(µλ ) > 0,82 s’étend ensuite aux paramètres non algébriques en les approchant par des paramètres algébriques de dimension proche, grâce au théorème 5.7.
ASTÉRISQUE 414
(1142)
MÉTHODES ENTROPIQUES POUR LES CONVOLUTIONS DE BERNOULLI
285
Expliquons maintenant comment montrer (6.1). Notons MN (λ) le suprémum en x de (
)
Card (ε0 , . . . , εN −1 ) ∈ {−1, 1}
N
:
X
i
N
N
εi λ ∈ [x − λ /(1 − λ), x + λ /(1 − λ)] .
i N , le facteur combinatoire est compensé par le factoriel (2k)!. On a en effet l’identité 1 (2k)!
Z ρ¯N Πd N
2k N 1 X φ(xi , xj ) dX N ≤ e2k M 2k N i,j=1
X
1,
a1 +···+aN =2k, a1 ≥0,···aN ≥0
en utilisant la formule de Stirling.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
304
L. SAINT-RAYMOND
Il suffit alors de compter le nombre de N -uplets (a1 , a2 , . . . , aN ) d’entiers positifs P dont la somme est 2k, ou de façon équivalente en posant ci = i+ j≤i aj , de dénombrer Ç å N + 2k − 1 |{(c1 , c2 , . . . , cN −1 ) | 1 ≤ c1 < c2 < · · · < cN −1 ≤ N + 2k − 1}| = . N −1 On conclut finalement, de nouveau grâce à la formule de Stirling, que 2k Z N 1 X 1 ρ¯N φ(xi , xj ) dX N ≤ C k M 2k . (2k)! Πd N N i,j=1 • Si 4 ≤ 4k ≤ N , cette estimation simple ne fonctionne pas car on obtient un majorant qui diverge comme N 2k /(2k)!. Il faut alors utiliser les hypothèses d’annulation Z Z φ(x, z) ρ¯(x) dx = 0 ∀z, φ(x, z) ρ¯(z) dz = 0 ∀x. Πd
Πd
pour se débarrasser de la plupart des termes dans la somme. La majoration s’obtient alors par un comptage (approximatif) des multi-indices I2k = (i1 , . . . , i2k ), J2k = (j1 , . . . , j2k ) qui peuvent donner des termes Z ρ¯N φ(xi1 , xj1 ) · · · φ(xi2k , xj2k ) dX N 6= 0. Πd N
Ce comptage est présenté brièvement dans le paragraphe qui suit. 3.3. Combinatoire On note (a1 , a2 , . . . , aN ) les multiplicités de I2k , al = |{1 ≤ ν ≤ 2k|iν = l}|,
l = 1, 2, . . . , N,
et (b1 , . . . , bN ) les multiplicités de J2k . Pour l’étude des annulations, le paramètre critique est le nombre de multiplicités dans I2k qui sont exactement égales à 1. On définit alors (9)
mI = |{l | al = 1}|,
nI = |{l | al > 1}|.
• La première étape est de réduire le problème en utilisant la symétrie par permutations. On dit qu’un multi-indice I2k est sous forme réduite si 0 < a1 ≤ a2 ≤ · · · ≤ an et an+1 = · · · = aN = 0, et on note I2k ∈ RN,2k . Autrement dit, si I2k ∈ RN,2k , on a al = 1 for l = 1, . . . , mI , al > 1 for l = mI + 1, . . . , mI + nI , al = 0 for l > mI + nI .
ASTÉRISQUE 414
(1143)
DES POINTS VORTEX AUX ÉQUATIONS DE NAVIER-STOKES
305
• On exhibe ensuite un ensemble d’indices de J2k qui vont donner une intégrale nulle, et peuvent donc être retirés de la somme. Pour tous m, n, on définit Jm,n l’ensemble des indices J2k de multiplicités (b1 , . . . , bN ) satisfaisant – bl ≥ 1 pour tout l = 1 . . . m ; – bl = 6 1 pour tout l > m + n. L’hypothèse Z
Z φ(x, z) ρ¯(x) dx = 0 ∀z,
Πd
φ(x, z) ρ¯(z) dz = 0 ∀x. Πd
implique clairement que Lemme 3.4. — Pour tout I2k ∈ RN,2k et tout J2k 6∈ JmI ,nI , il existe au moins un indice qui n’est pas répété. On a alors Z ρ¯N φ(xi1 , xj1 ) · · · φ(xi2k , xj2k ) dX N = 0. Πd N
On note que cette condition ne détermine pas tous les indices qui donnent une intégrale nulle, mais elle s’écrit assez simplement en fonction des deux entiers mI , nI , ce qui simplifie un peu le comptage. • La partie la plus technique consiste à estimer le nombre de termes qu’on a alors gardés dans la somme. Lemme 3.5. — Il existe une constante C > 0 telle que |Jm,n | ≤ C k N k−m/2 k k+m/2 .
Démonstration. — Un multi-indice J2k appartient à Jm,n si et seulement si bl ≥ 1 pour l ≤ m et bl = 0, 2, 3, . . . pour l > m + n. On distingue alors les l > m + n pour lesquels bl = 0 et ceux pour lesquels bl ≥ 2. On note p le nombre d’indices pour lesquels bl ≥ 2. N −m−n – Pour p = 0, 1, . . . , b 2k−m choix de p indices l1 , . . . , lp appartenant p 2 c, il y a à [m + n + 1, N ]. – Une fois que ces indices l1 , . . . , lp sont fixés, l’ensemble des J2k ∈ Jm,n est donné par n Bm,n,p,l1 ,...,lp = (b1 , . . . , bN ) | b1 , . . . , bm ≥ 1, bl1 , . . . , blp ≥ 2, bl = 0 si l > m + n et l 6= l1 , . . . , lp , et b1 + b2 + · · · + bN = 2k}.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
306
L. SAINT-RAYMOND
– Quand toutes les multiplicités sont connues, on peut compter le nombre de J2k dans Jm,n , en utilisant la relation multinomiale n o p! p . (i1 , . . . , ip ) ∈ {1, . . . , q} | ∀l al = |{k, ik = l}| = a1 ! · · · aq ! On obtient finalement que c b 2k−m 2
|Jm,n | =
X p=0
X
X
l1 ,...,lp =m+n+1,...,N (b1 ,...,bN )∈Bm,n,p,l1 ,...,lp
(2k)! . b1 ! · · · bN !
Des calculs basés notamment sur la formule de Stirling permettent alors d’obtenir le lemme 3.5. • En utilisant la borne uniforme pour les termes non nuls Z ρ¯N (sup |φ(x1 , z)|)a1 . . . (sup |φ(xN , z)|)aN dX N ≤ e2k M 2k a1 ! · · · aN !, Πd N
z
z
et le comptage de ces termes non nuls, on a finalement pour 4 ≤ 4k ≤ N 2k Z N 1 X 1 ρ¯N φ(xi , xj ) dX N ≤ C k M 2k . (2k)! Πd N N i,j=1
3.4. Conclusion En combinant l’estimation par l’information de Fisher (6), l’inégalité de convexité du lemme 2.2 et les lois des grands nombres à échelle exponentielle des théorèmes 3.1 ¯ A, ˜ B ¯ sont contrôlés par l’entropie modulée, et 3.2, on montre que les termes de flux A, modulo des termes d’erreur de l’ordre de 1/N . En insérant cette estimation dans l’inégalité du lemme 2.1, on obtient finalement Å ã 1 1 d HN (fN | ρ ¯N )(t) ≤ HN (fN | ρ¯N )(t) + O(|σ − σN |) + O dt λ N N Z Z 1 X t fN 2 − fN ∇xi log dX N ds. 2N i=1 0 Π2 N ρ¯N On conlut alors en appliquant le lemme de Gronwall. L’inégalité de stabilité ainsi obtenue donne une vitesse de convergence vers la limite de champ moyen en O(1/N ), qui est l’échelle attendue pour les fluctuations. Une question naturelle est alors de savoir si cette méthode permet de caractériser les fluctuations, pour lesquelles on s’attend à voir apparaître des corrélations et donc de l’irréversibilité.
ASTÉRISQUE 414
(1143)
DES POINTS VORTEX AUX ÉQUATIONS DE NAVIER-STOKES
307
RÉFÉRENCES [1] G. Ben Arous & M. Brunaud – Méthode de Laplace : étude variationnelle des fluctuations de diffusions de type “champ moyen”, Stochastics Stochastics Rep. 31 (1990), nos 1-4, p. 79–144. [2] T. Bodineau & A. Guionnet – About the stationary states of vortex systems, Ann. Inst. H. Poincaré Probab. Statist. 35 (1999), no 2, p. 205–237. [3] G. Borot, A. Guionnet & K. K. Kozlowski – Large-N asymptotic expansion for mean field models with Coulomb gas interaction, Int. Math. Res. Not. 2015 (2015), no 20, p. 10451–10524. [4] F. Bouchut, F. Golse & M. Pulvirenti – Kinetic equations and asymptotic theory, Series in Applied Mathematics (Paris), vol. 4, Gauthier-Villars, Éditions Scientifiques et Médicales Elsevier, 2000. [5] J. Bourgain & H. Brezis – On the equation div Y = f and application to control of phases, J. Amer. Math. Soc. 16 (2003), no 2, p. 393–426. [6] E. Caglioti, P.-L. Lions, C. Marchioro & M. Pulvirenti – A special class of stationary flows for two-dimensional Euler equations : a statistical mechanics description, Comm. Math. Phys. 143 (1992), no 3, p. 501–525. [7] C. M. Dafermos – The second law of thermodynamics and stability, Arch. Rational Mech. Anal. 70 (1979), no 2, p. 167–179. [8] R. J. DiPerna – Uniqueness of solutions to hyperbolic conservation laws, Indiana Univ. Math. J. 28 (1979), no 1, p. 137–188. [9] N. Fournier, M. Hauray & S. Mischler – Propagation of chaos for the 2D viscous vortex model, J. Eur. Math. Soc. (JEMS) 16 (2014), no 7, p. 1423–1466. [10] F. Golse, C. D. Levermore & L. Saint-Raymond – La méthode de l’entropie relative pour les limites hydrodynamiques de modèles cinétiques, in Séminaire : Équations aux Dérivées Partielles, 1999–2000, Sémin. Équ. Dériv. Partielles, École polytech., Palaiseau, 2000, Exp. XIX. [11] F. Golse, C. Mouhot & T. Paul – On the mean field and classical limits of quantum mechanics, Comm. Math. Phys. 343 (2016), no 1, p. 165–205. [12] J. Goodman, T. Y. Hou & J. Lowengrub – Convergence of the point vortex method for the 2-D Euler equations, Comm. Pure Appl. Math. 43 (1990), no 3, p. 415–430. [13] P.-E. Jabin & Z. Wang – Quantitative estimates of propagation of chaos for stochastic systems with W −1,∞ kernels, Invent. math. 214 (2018), no 1, p. 523– 591. [14] M. K.-H. Kiessling – Statistical mechanics of classical particles with logarithmic interactions, Comm. Pure Appl. Math. 46 (1993), no 1, p. 27–56.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
308
L. SAINT-RAYMOND
[15] T. Leblé, S. Serfaty & O. Zeitouni – Large deviations for the twodimensional two-component plasma, Comm. Math. Phys. 350 (2017), no 1, p. 301– 360. [16] S. Mischler & C. Mouhot – Kac’s program in kinetic theory, Invent. math. 193 (2013), no 1, p. 1–147. [17] H. Osada – A stochastic differential equation arising from the vortex problem, Proc. Japan Acad. Ser. A Math. Sci. 61 (1985), no 10, p. 333–336. [18] N. C. Phuc & M. Torres – Characterizations of the existence and removable singularities of divergence-measure vector fields, Indiana Univ. Math. J. 57 (2008), no 4, p. 1573–1597. [19] S. Serfaty – Mean field limits of the Gross-Pitaevskii and parabolic GinzburgLandau equations, J. Amer. Math. Soc. 30 (2017), no 3, p. 713–768. [20] H.-T. Yau – Relative entropy and hydrodynamics of Ginzburg-Landau models, Lett. Math. Phys. 22 (1991), no 1, p. 63–80.
Laure SAINT-RAYMOND École normale supérieure de Lyon U.M.P.A., UMR 5669 du CNRS 46, allée d’Italie 69364 Lyon Cedex 07 E-mail : [email protected]
ASTÉRISQUE 414
Séminaire BOURBAKI 70e année, 2017–2018, no 1144, p. 309 à 338 doi:10.24033/ast.1088
Mars 2018
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES [d’après K. Adiprasito, J. Huh et E. Katz] par Antoine CHAMBERT-LOIR
... alors que le savant classe hors du temps vécu, situe et fixe à l’écart de la vie. Philippe Jaccottet, La semaison
1. MATROÏDES Inventée par Whitney [50], la notion de matroïde est une abstraction de la propriété d’indépendance linéaire. Elle admet plusieurs formalisations équivalentes, en termes de bases, de parties libres, de circuits, d’une fonction rang, etc. Nous utiliserons ici celle qui met en jeu le concept de plat. Définition 1.1. — Soit E un ensemble fini. (1) Un matroïde M sur E est la donnée d’une partie PM de P(E) — les plats de M — vérifiant les propriétés suivantes : (i) L’intersection de toute famille de plats de M est un plat. (ii) Pour tout plat P de M, distinct de M, l’ensemble des plats de M qui sont minimaux parmi ceux contenant strictement P recouvre E. On notera en général |M|, voire M, l’ensemble sous-jacent à un matroïde M.
(1)
Dans ce texte, il sera uniquement question de matroïdes finis. En fait, la formalisation des matroïdes sur un ensemble infini est récente : une condition naturelle consiste à imposer à la propriété d’être une partie libre d’être de caractère fini, mais Bruhn at al. [13] mettent en évidence qu’on obtient une classe plus intéressante de matroïdes infinis en imposant un axiome d’existence de parties libres maximales.
© Astérisque 414, SMF 2019
310
A. CHAMBERT-LOIR
1.2. — Rappelons brièvement les autres formalisations de la notion de matroïde. en renvoyant à Welsh [47], White [48, 49] ou Oxley [38] pour plus de détails. Soit M un matroïde sur un ensemble E. Muni de la relation d’inclusion sur P(E), l’ensemble des plats de M est un ensemble ordonné. C’est un treillis : toute partie possède une borne inférieure (notée ∧), l’intersection de ses membres, et une borne supérieure (notée ∨), l’intersection de la famille des plats de M qui contiennent chacun de ses membres. Si X est une partie de E, on note hXi le plat engendré par X, c’est-àdire le plus petit plat de M qui contient X. Au matroïde M, on associe naturellement deux fonctions rang et corang : le rang rgM (P) d’un plat P est la plus grande longueur d’une chaîne de plats de sommet P, son corang corgM (P) est la plus grande longueur d’une chaîne de plats de base P. On définit plus généralement le rang (resp. le corang) d’une partie A de M comme celui du plat qu’elle engendre. Une partie L de E est dite liée s’il existe une partie L0 ( L telle que hL0 i = hLi ; elle est dite libre sinon. L’ensemble des parties libres vérifient les propriétés suivantes : (i) ∅ est libre ; (ii) Toute partie d’une partie libre est libre ; (iii) Si A et B sont des parties libres de M telles que Card(B) > Card(A), il existe x ∈ B A tel que A ∪ {x} soit libre (variante du « lemme d’échange »). Inversement, toute partie de P(E) vérifiant ces trois propriétés est l’ensemble des parties libres d’un unique matroïde sur E. Une base de M est une partie libre maximale. Il en existe ; on déduit du lemme d’échange que toutes les bases de M ont même cardinal et que toutes les chaînes maximales de plats ont même cardinal, égal au rang de M (c’est-à-dire du plat E de M). Autrement dit, pour tout plat P de M, on a rgM (P) + corgM (P) = rgM (|M|) (le treillis associé à M est « caténaire »). De plus, pour tout couple (P, Q) de plats de M, on a la relation (1.3)
rgM (P) + rgM (Q) > rgM (P ∧ Q) + rgM (P ∨ Q) ;
le treillis associé à M est dit sous-modulaire. Inversement, tout treillis caténaire sousmodulaire est le treillis des plats d’un matroïde. Exemple 1.4. — Soit V un espace vectoriel (resp. un espace affine, resp. un espace projectif) sur un corps K et soit Φ = (ve )e∈E une famille finie d’éléments de V. Il existe un matroïde M dont les plats sont les parties de E de la forme {e ∈ E ; ve ∈ W}, où W parcourt l’ensemble des sous-espaces vectoriels (resp. affines, resp. projectifs) de V. Les parties libres de ce matroïde sont les sous-familles libres (resp. affinement libres, resp. projectivement libres) de Φ. Dans le cas vectoriel, le rang d’un plat P est la dimension de l’espace vectoriel engendré par la famille (ve )e∈P ; dans le cas affine
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
311
resp. (projectif), on a rgM (∅) = 0 et rgM (P)−1 est la dimension du sous-espace affine (resp. projectif) de V engendré par la famille (ve )e∈P . De tels matroïdes sont dits représentables sur K. Lorsqu’on prend pour Φ l’ensemble des points de l’espace projectif P2 (F2 ), on obtient le matroïde de Fano. Il n’est représentable que sur un corps de caractéristique 2. Les matroïdes représentables apparaissent naturellement via l’arrangement d’hyperplans qu’ils définissent dans l’espace vectoriel dual V∨ (resp. l’espace affine, resp. projectif). Les plats sont alors les intersections d’hyperplans de l’arrangement et leur rang est leur codimension. D’après [37], lorsque n tend vers l’infini, la proportion du nombre de matroïdes sur l’ensemble {1, . . . , n} qui sont représentables (sur un corps non précisé) tend vers 0. Exemple 1.5. — Soit G un graphe fini et soit E l’ensemble des arêtes de G. Il existe un unique matroïde M(G) sur E dont les parties libres sont les forêts de G. De manière équivalente, ses circuits, c’est-à-dire les parties liées minimales, sont les cycles dans le graphe G ; ses plats sont les parties P telles que les extrémités de toute arête e ∈ E P n’appartiennent pas à la même composante connexe du sous-graphe de G ayant même ensemble de sommets que G et P pour ensemble d’arêtes. Si GP est le plus grand sous-graphe de G dont l’ensemble d’arêtes est P, rgM(G) (P) + Card(π0 (GP )) est le nombre de sommets de G. Le matroïde M(G) est représentable sur tout corps. Soit S l’ensemble des sommets de G. Soit K un corps et notons (xs ) la base canonique du K-espace vectoriel KS . Fixons une orientation F de G et identifions une flèche f ∈ F à l’arête correspondante {f, f }. Pour toute flèche f ∈ F d’origine o et de terme t, posons vf = xt − xo ∈ KS . Alors le matroïde associé à la famille (vf )f ∈F s’identifie au matroïde M(G). 1.6. — Mentionnons quelques autres constructions de matroïdes. a) Soit M1 et M2 des matroïdes. Il existe alors un unique matroïde M sur ` l’ensemble |M1 | |M2 | dont les plats sont les réunions d’un plat de M1 et d’un plat de M2 . On le note M1 ⊕ M2 . b) Soit M un matroïde. Il existe, sur l’ensemble |M|, une unique structure de matroïde dont les bases sont les complémentaires des bases de M. On l’appelle le matroïde dual M∗ de M. Sa fonction rang est liée à celle de M par la relation rgM∗ (A) − rgM (|M|
A) = Card(|M|) − rM (|M|),
pour toute partie A de |M|.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
312
A. CHAMBERT-LOIR
c) Soit M un matroïde et soit F une partie de |M|. L’ensemble des plats de M qui sont contenus dans F est une structure de matroïde sur F, que l’on note M | F ; c’est la restriction de M à F ; on la voit aussi comme la suppression de |M| F dans M et on la note alors M\(|M| F). Sa fonction rang est la restriction à P(F) de la fonction rang de M. d) Soit M un matroïde et soit F une partie de |M|. L’ensemble des parties P de |M| F telles que P ∪ F soit un plat de M est une structure de matroïde sur l’ensemble |M| F ; autrement dit, le treillis de ses plats est le sous-treillis de PM formé des plats de M qui contiennent F. On l’appelle la contraction de F dans M et on la note M/F. Sa fonction rang vérifie rgM/F (A) = rgM (A ∪ F) − rgM (A), pour toute partie A de |M| F. 1.7. — Soit M un matroïde. Une boucle de M est un point e ∈ |M| qui appartient à tout plat. Soit m = h∅i le plus petit plat de M. Le matroïde contracté M/m est sans boucle et a même treillis des plats que M. Supposons M sans boucle. La relation hxi = hyi dans E est une relation d’équivalence dont les classes d’équivalence sont les plats de M de rang 1. Lorsque ces classes d’équivalence sont réduites à un élément, on dit que le matroïde est une géométrie combinatoire. En général, le matroïde M induit une géométrie combinatoire M sur l’ensemble quotient E ; la surjection canonique de E sur E induit un isomorphisme du treillis des plats de M sur celui de M. Définition 1.8. — Soit M un matroïde. Le polynôme caractéristique de M est défini par X χM (T) = (−1)Card(A) TcorgM (hAi) . A⊂|M|
C’est un polynôme unitaire de degré 6 rg(M). Lorsque |M| est vide, on a χM (T) = 1. Il y a deux matroïdes sur un ensemble {e} de cardinal 1 : si PM = {∅, |M|}, on a rg(M) = 1 et χM (T) = T − 1 ; si PM = {|M|}, on a rg(M) = 0 et χM (T) = 0. En général, le polynôme χM (T) se calcule par récurrence à partir des deux règles : χM1 ⊕M2 (T) = χM1 (T)χM2 (T) et χM (T) = χM\e (T) − χM/e (T) pour tout point e ∈ |M| qui n’appartient pas à toute base de M. (Ces deux règles généralisent celles qui régissent le polynôme chromatique d’un graphe.) Si |M| n’est pas vide, on a χM (1) = 0 ; on définit alors le polynôme caractéristique réduit par : χM (T) = χM (T)/(T − 1).
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
313
Exemple 1.9. — Supposons que M soit le matroïde M(G) associé à un graphe fini G. Alors, pour tout entier q, χG (T) = TCard(π0 (G)) χM (T) est le polynôme chromatique de G : pour tout entier q, χG (q) est le nombre de coloriages de l’ensemble des sommets de G avec q couleurs tels que deux sommets reliés par une arête soient de couleurs distinctes. Exemple 1.10. — Soit K un corps, soit n un entier, soit (v1 , . . . , vr ) une famille libre de Kn et soit V le sous-espace vectoriel de Kn qu’elle engendre. Notons M le matroïde représentable correspondant. Le polynôme caractéristique de M s’interprète géométriquement dans l’anneau de Grothendieck K0 (VarK ) des K-variétés. Rappelons que cet anneau est défini comme le quotient du groupe abélien libre sur l’ensemble VarK des classes d’isomorphie de K-variétés (= K-schémas de type fini) par la relation de découpage [X] = [X Y] + [Y] si X est une K-variété et Y un fermé de X, muni du produit [X][Y] = [X ×K Y]. Si X est une K-variété, on note e(X) sa classe dans K0 (VarK ). L’application e est une caractéristique d’Euler universelle. En particulier, lorsque K = C, l’application qui, à une C-variété V, associe son polynôme de Hodge-Deligne EV (u, v), se factorise par un homomorphisme d’anneaux de K0 (VarC ) dans Z[u, v]. De même, lorsque K est un corps fini, l’application qui, à une K-variété V, associe le cardinal de V(K), se factorise par un homomorphisme d’anneaux de K0 (VarK ) dans Z. Notons L = e(A1K ) la classe de la droite affine. Dans l’anneau de Grothendieck K0 (VarK ) des K-variétés, on a alors la relation e(V ∩ Gnm,K ) = χM (L). (Cela se déduit de la formule d’inversion de Möbius dans le treillis des plats du matroïde M et de la formule (2.7) ; voir plus bas.) Comme l’unique homomorphisme d’anneaux de Z[T] dans K0 (VarK ) qui applique T sur L est injectif, cette relation caractérise χM . Lorsque K = C, le polynôme de Hodge-Deligne de la variété quasi-projective V ∩ (C× )n est donc égal à χM (uv). Lorsque K = Fq est un corps fini de cardinal q, on a de même Card(V ∩ (K× )n ) = χM (q). En passant au quotient par l’action par homothéties de Gm,K sur l’espace affine AnK , on en déduit aussi une interprétation géométrique du polynôme caractéristique réduit de M : e(P(V ∩ Gnm,K )) = χM (L). Voici le théorème principal de cet exposé :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
314
A. CHAMBERT-LOIR
Théorème 1.11 (Adiprasito, Huh & Katz [2]). — Soit M un matroïde de rang > 0 ; posons r = rg(M) − 1 et définissons des nombres entiers µk (M), pour 0 6 k 6 r, par χM (T) =
r X
(−1)k µk (M)Tr−k .
k=0
Alors, la suite (µ0 (M), . . . , µr (M)) est log-concave : (i) Pour tout entier k tel que 0 6 k 6 r, on a µk (M) > 0 ; (ii) Pour tout entier k tel que 0 < k < r, on a µk−1 (M)µk+1 (M) 6 µk (M)2 . En particulier, cette suite est unimodale : (iii) Il existe un entier ` tel que µ0 (M) 6 µ1 (M) 6 · · · 6 µ` (M) > µ`+1 (M) > · · · > µr (M). Plusieurs corollaires de ce théorème avaient été conjecturés dans les années 1970, (Rota [41], Heron [26], Mason [35] et Welsh [47]), parfois d’abord dans le cas des graphes et de leurs polynômes chromatiques (Read [39], Hoggar [27]) : Corollaire 1.12 (conjecture de Heron-Rota-Welsh). — Soit M un matroïde et soit r = rg(M). Définissons des nombres entiers wk (M), pour 0 6 k 6 r, par χM (T) =
r X
(−1)k wk (M)Tr−k .
k=0
Alors, la suite (w0 (M), . . . , wr (M)) est log-concave et unimodale. Les entiers wk (M) sont appelés nombres de Whitney de première espèce du matroïde M ; ils sont positifs ou nuls (voir plus bas). Corollaire 1.13 (conjecture de Welsh-Mason). — Soit M un matroïde et soit r = rg(M). Pour tout entier k, notons fk (M) le nombre de parties libres de M de cardinal k. La suite (f0 (M), . . . , fr (M)) est log-concave. Suivant Lenz [34], ce corollaire se déduit du théorème 1.11 en considérant le ` {e} dont les plats sont la partie vide et les matroïde M0 sur l’ensemble E0 = E parties P ∪ {e}, pour tout plat P de M (« coextension libre » de M). Ce matroïde est de rang r +1 et, d’après Brylawski [15, Remark 6.15.3c], son polynôme caractéristique réduit vérifie r X χM0 (T) = (−1)k fk (M)Tr−k . k=0
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
315
1.14. — Bien que de nature purement combinatoire, la démonstration du théorème 1.11 est inspirée par la géométrie algébrique. Supposons en effet que le matroïde M soit représentable sur un corps K, associé à l’arrangement d’hyperplans défini par la trace, sur un sous-espace projectif V de dimension r, des hyperplans de coordonnées de Pn (K). L’involution ι de Cremona est l’automorphisme birationnel de Pn,K donné par [x0 : · · · : xn ] 7→ [x−1 : · · · : x−1 n ]. 0 L’adhérence de Zariski dans Pn,K × Pn,K du graphe de la restriction de ι à V est alors ˜ de V ∩ Gn dont le bord est un diviseur à croisements une compactification lisse V m,K normaux stricts. (Cette construction est due à De Concini & Procesi [17].) Théorème 1.15 (Huh & Katz [29]). — On a l’égalité ˜ = [V]
r X
µk (M)[Pr−k × Pk ]
k=0
dans le groupe Ar (Pn × Pn ) des classes de cycles de dimension r sur Pn × Pn . De manière équivalente, on a ˜ µk (M) = deg(c1 (L1 )r−k c1 (L2 )k ∩ [V]), où L1 et L2 sont les fibrés en droites sur Pn × Pn déduits du fibré en droites OPn (1) par la première et la seconde projection. La log-concavité de la suite (µ0 (M), . . . , µr (M)) se déduit alors du théorème de l’indice de Hodge, sous la forme des inégalités de Khovanskii-Teissier (Khovanskii [33], Teissier [45]). Lorsque K est de caractéristique zéro, Huh [28] avait donné une première démonstration de la log-concavité de la suite (µk (M)), dans laquelle les coefficients µk (M) apparaissent comme les nombres de Milnor de la trace, sur un sous-espace général de dimension k, de la réunion des hyperplans de l’arrangement définissant M. L’inégalité de log-concavité se déduit alors de l’inégalité de Teissier pour les multiplicités (Eisenbud & Levine [21, Appendice]). On trouve par ailleurs dans [28] un très joli théorème qui caractérise les classes de cycles dans Pm × Pn qui sont, à un scalaire près, représentés par une sous-variété irréductible : Théorème 1.16. — Soit r un entier tel que 0 6 r 6 inf(m, n) et soit (a0 , . . . , ar ) une suite d’entiers relatifs. Pour que la classe de cycle α=
r X
ak [Pr−k × Pk ] ∈ Ar (Pm × Pn )
k=0
soit un multiple positif de la classe d’une sous-variété irréductible V de Pm × Pn , il faut et il suffit que l’une des deux conditions suivantes soit satisfaite :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
316
A. CHAMBERT-LOIR
– La classe α est un multiple positif de [Pm × Pn ], [Pm × P0 ], [P0 × Pn ] ou [P0 × P0 ]. – La suite (a0 , . . . , ar ) est log-concave et l’ensemble des entiers k tels que ak = 0 est un intervalle. Autrement dit, les inégalités de Khovanskii-Teissier caractérisent précisément les classes de cycles effectifs. Dans un esprit similaire, mentionnons le contre-exemple de Babaee & Huh [5] à une version de la conjecture de Hodge pour les courants positifs : un courant fortement positif de type (2, 2) sur une variété complexe torique de dimension 4, lisse et projective, qui n’appartient pas au cône convexe fermé engendré par les courants d’intégration sur les sous-variétés. 1.17. — Ainsi, pour démontrer le théorème 1.11, Adiprasito, Huh & Katz [2] associent à une géométrie combinatoire M une R-algèbre graduée A(M)R qui vérifie les énoncés analogues à la dualité de Poincaré, le théorème de Lefschetz difficile et les inégalités de Hodge-Riemann. De fait, A(M)R sera l’anneau de Chow (à coefficients réels) d’une variété torique lisse XM (sur un corps K arbitraire) introduite par Feichtner & Yuzvinsky [23]. En général, la variété XM n’est pas propre, et elle est de dimension > rgM (M), de sorte que son anneau de Chow A(M), ou son anneau de cohomologie H(M), n’a aucune raison de se comporter comme celui d’une variété projective lisse de dimension rg(M). Lorsque le matroïde M est représentable, XM admet une sous-variété projective ˜ du paragraphe précédent) telle que l’application lisse YM (c’est d’ailleurs la variété V z 7→ z ∩ [YM ] induise un isomorphisme de A(XM ) sur A(YM ). En revanche, lorsque M n’est pas représentable sur K, il n’existe pas de K-variété propre et lisse Y et de morphisme de variétés f : Y → XM tel que f ∗ induise un isomorphisme de A(XM ) sur A(Y) (Adiprasito, Huh & Katz [2, th. 5.12]). 1.18. — Le principe n’est bien sûr pas nouveau de puiser l’inspiration d’une preuve de résultats de nature combinatoire dans la géométrie algébrique, par exemple via le dictionnaire qui, à tout polytope P de Rr , à sommets entiers et de dimension r, associe une variété torique projective polarisée (XP , L). Dans ce dictionnaire, la dimension h0 (XP , L⊗n ) de l’espace de sections globales de la puissance n-ième de L correspond au nombre de points entiers du polytope nP et, via la formule de Hilbert-Samuel, relie le degré de XP au volume de P. Plus généralement, les volumes mixtes correspondent à des nombres d’intersection. C’est ainsi que Khovanskii [33] et Teissier [45] déduisent les inégalités d’Alexandrov-Fenchel et de Brunn-Minkowski du théorème de l’indice de Hodge sur les surfaces et du théorème de Bertini.
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
317
Citons ainsi la conjecture de McMullen décrivant ce que peut être le nombre fi de faces de dimension i donnée d’un polytope simple P de dimension d. McMullen considère une suite (h0 , . . . , hd ) obtenue par combinaisons linéaires adéquates des fi et postule trois familles de conditions sur cette suite pour que la suite initiale (f0 , . . . , fd ) soit la suite des nombres de faces d’un polytope simple ; les premières, hk = hd−k , sont les relations de Dehn-Sommerville ; la seconde famille s’écrit h0 6 h1 6 · · · 6 hbd/2c ; la troisième est un peu technique et ce n’est pas la peine de la recopier ici. Billera & Lee [10] ont prouvé qu’elles sont suffisantes, et leur nécessité est démontrée par Stanley [42] à l’aide de la géométrie algébrique. Lorsque le polytope est à sommets entiers, il observe en effet que l’entier hk est la dimension de l’espace de cohomologie Hk (XQ )R de la variété torique XQ (sur C, disons) associée au polytope Q polaire de P, de sorte que les conditions de McMullen découlent respectivement de trois propriétés cohomologiques de la cohomologie de XQ : la dualité de Poincaré, le théorème de Lefschetz difficile, et le fait que l’algèbre de cohomologie H(YQ )Q à coefficients rationnels soit engendrée par H2 (YQ ). La variété YQ est projective, mais n’est pas nécessairement lisse, mais l’hypothèse que le polytope P est simple assure que la variété YQ est une « orbifolde », c’est-à-dire localement le quotient d’une variété lisse par l’action d’un groupe fini, de sorte que ces énoncés cohomologiques restent valides. Par homothéties et approximation, on peut parfois déduire du cas d’un polytope à sommets entiers le cas d’un polytope à sommets réels quelconques, mais il existe des polytopes dont la combinatoire ne peut pas être obtenue par une déformation en un polytope à sommets rationnels. Cette complication ne se produit pas dans les deux exemples précédents ; pour la conjecture de McMullen, l’hypothèse que le polytope est simple est essentielle. Ultérieurement, Stanley [43] a généralisé cette étude aux polytopes non nécessairement simples : lorsque P est à sommets entiers, l’entier hk est alors la dimension de l’espace de cohomologie d’intersection IHk (XQ )R . L’extension de cette relation aux polytopes à sommets arbitraires a motivé d’une part une approche combinatoire de McMullen [36], et d’autre part le développement d’une « cohomologie d’intersection des polytopes » et la preuve du théorème de Lefschetz difficile dans ce contexte (Karu [32]). 1.19. — Le titre de ce rapport mentionne les inégalités de Hodge-Riemann. Comme on le verra plus tard, ces inégalités renforcent le théorème de Lefschetz difficile : si ce dernier signifie qu’une certaine forme bilinéaire est non dégénérée, les inégalités de Hodge-Riemann en précisent la signature. En géométrie kählérienne le théorème de Lefschetz difficile est démontré avant les inégalités de Hodge-Riemann. C’est a fortiori le cas en géométrie algébrique, en
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
318
A. CHAMBERT-LOIR
particulier sur un corps de caractéristique positive où les inégalités de Hodge-Riemann sont encore une conjecture. En revanche, il semble que les approches combinatoires du théorème de Lefschetz difficile ne puissent faire l’économie des inégalités de Hodge-Riemann. Outre le théorème de Karu [32] déjà mentionné, mentionnons le rôle crucial que jouent ces inégalités dans la preuve du théorème de décomposition que proposent de Cataldo, Migliorini [16] (voir aussi l’exposé de Williamson [51] dans ce séminaire). Citons enfin la preuve par Elias & Williamson [22] de la positivité des coefficients des polynômes de Kazhdan-Lusztig associés à un système de Coxeter général ; cf. également le rapport de Riche [40] dans ce séminaire. Les travaux dont il est question dans ce rapport suggèrent l’intérêt d’un analogue de la théorie de Hodge en géométrie tropicale. Je me contente ici de renvoyer à l’article d’Itenberg, Katzarkov, Mikhalkin & Zharkov [31] où sont construits des espaces de (p, q)-formes sur les variétés tropicales. 1.20. — L’unimodalité et la log-concavité sont des thèmes prégnants de la combinatoire énumérative. L’article de Stanley [44], complété par celui de Brenti [12], en fournit une excellente introduction. À propos des résultats de cet exposé, je renvoie aussi au bref survol (Adiprasito, Huh & Katz [1]) et surtout à l’article d’exposition de Baker [6]. Je remercie enfin Karim Adiprasito, Matt Baker, Michel Brion, Antoine Ducros, Javier Fresán, Olivier Guichard, June Huh, Ilia Itenberg et Bernard Teissier pour leurs commentaires sur des premières versions de ce rapport.
2. ÉVENTAILS 2.1. — Soit (P, 4) un ensemble ordonné, disons fini, et soit A un anneau commutatif. L’algèbre de convolution A (P; A) est le A-module des fonctions à valeurs dans A sur l’ensemble des couples (x, y) d’éléments de P tels que x 4 y, muni du produit de convolution défini par X ϕ ∗ ψ(x, y) = ϕ(x, z)ψ(z, y). x4z4y
Son élément unité δ est l’indicatrice de Kronecker. Un élément de A (P; A) est inversible si et seulement s’il ne prend que des valeurs inversibles en les couples de la forme (x, x). La fonction de Möbius de P, notée µ, est l’inverse de la fonction
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
319
constante 1 de valeur 1 ; elle est caractérisée par les relations µ(x, x) = 1
(2.2) X
(2.3)
µ(x, z) = 0
x4z4y
pour tout x ∈ P d’une part, et tout couple (x, y) d’éléments de P tels que x ≺ y, d’autre part. L’algèbre A (P; A) agit à gauche sur le A-module F (P; A) des fonctions de P dans A, par la formule : ϕ ∗ f (x) =
X
ϕ(x, y)f (y).
x4y
La formule d’inversion de Möbius est alors, pour deux éléments f, g de F (P; A), l’équivalence entre les relations g = 1 ∗ f et f = µ ∗ g ; autrement dit : g(x) =
X
⇔
f (y)
x4y
f (y) =
X
µ(y, x)g(x).
y4x
Lorsque, de plus, P est un treillis, on a la relation (théorème de Weisner ) : X
(2.4)
µ(inf(P), x) = 0
sup(x,a)=sup(P)
pour tout a ∈ P distinct de inf(P). Et si, de plus, ce treillis est sous-modulaire, le signe de la fonction de Möbius est donné par : (−1)rg(y)−rg(x) µ(x, y) > 0
(2.5) pour x, y ∈ P tels que x 4 y.
2.6. — Le polynôme caractéristique d’un matroïde M s’exprime en termes de son treillis des plats, par la relation : (2.7)
χM (T) =
X
µ(∅, P)TcorgM (P) .
P∈PM
Cette relation permet aussi de supposer, dans les questions relatives au polynôme caractéristique χM , que le matroïde M est une géométrie combinatoire. Jointe aux inégalités (2.5), elle prouve enfin que les entiers wk (M) introduits dans le corollaire 1.12 sont positifs ou nuls.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
320
A. CHAMBERT-LOIR
2.8. — Soit M une géométrie combinatoire de rang > 1 sur un ensemble E ; posons r = rgM (M)−1 et n = Card(E)−1. On note N ' Zn le quotient du Z-module libre ZE , P de base canonique (ei )i∈E par le sous-module engendré par ei ; pour i ∈ E, on note E encore ei l’image dans N de l’élément correspondant de Z . Pour toute partie I de E, P on pose eI = i∈I ei . Dans tout ce texte, un drapeau de plats de M sera un ensemble totalement ordonné de plats de M distincts de ∅ et |M|. Si D est un drapeau, on note alors σD le cône de NR engendré par les vecteurs eP , pour P ∈ D ; il est de dimension Card(D). Notons ΣM l’ensemble de ces cônes : c’est l’éventail de Bergman du matroïde M (Ardila & Klivans [4]). Proposition 2.9. — L’ensemble ΣM est un éventail unimodulaire de NR , purement de dimension r. Que ΣM soit un éventail signifie qu’il n’est pas vide, que toute face d’un cône de ΣM appartient à ΣM et que l’intersection de deux cônes de ΣM , est une face commune de ces deux cônes ; qu’il soit unimodulaire signifie que les cônes de ΣM sont engendrés par une partie d’une base de N ; qu’il soit purement de dimension r signifie que tout cône maximal de ΣM est de dimension r. À tout éventail Σ est classiquement associée une K-variété torique XΣ , aussi notée X(Σ), obtenue en recollant les variétés affines Xσ = Spec(K[N∨ ∩ σ ◦ ]), pour σ parcourant Σ, où σ ◦ désigne l’ensemble des formes linéaires sur NR qui sont positives en tout point de σ ; je renvoie par exemple à Fulton [24] pour plus de détails sur cette théorie. Noter que si τ est une face de σ, Xτ est un ouvert de Xσ pour la topologie de Zariski. Soit σ un cône de Σ. Si σ est engendré par une partie d’une base de N, la n−dim(σ) . Si l’éventail Σ est variété Xσ est un ouvert de AE , isomorphe à Adim(σ) × Gm unimodulaire, cette hypothèse est donc vérifiée pour tout cône, de sorte que la variété torique XΣ est lisse. Nous noterons XM la variété torique lisse associée à l’éventail ΣM . Remarque 2.10. — Soit K un corps. Supposons que le matroïde M soit associé à l’arrangement d’hyperplans d’un sous-espace projectif V de Pn de dimension r découpé par les hyperplans de coordonnées de Pn (sur le corps K). Le support |ΣM | de l’éventail ΣM , réunion des cônes de ΣM , s’interprète alors comme la tropicalisation de V ∩ Gnm . Il y a plusieurs façons de définir cette tropicalisation. Munissons le corps K de la valeur absolue triviale et considérons le tore K-analytique (Gnm )an , au sens de Berkovich [8], c’est-à-dire l’espace des semi±1 normes multiplicatives sur la K-algèbre K[T±1 1 , . . . , Tn ] qui sont triviales sur K. Il
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
321
est muni d’une application continue et propre de tropicalisation, τ : (Gnm )an → Rn qui applique une semi-norme |·| sur (log(|T1 |), . . . , log(|Tn |)). L’espace de Berkovich (V ∩ Gnm )an de V ∩ Gnm est un sous-espace de (Gnm )an et son image par τ est égale à |ΣM |. Peut-être plus élémentairement (voir Einsiedler et al., [20]), considérons une extension algébriquement close L de K munie d’une valeur absolue non archimédienne non triviale, mais triviale sur K, par exemple une clôture algébrique du corps K((z)) des séries de Laurent. Alors, |ΣM | est l’adhérence de l’image de V(L) ∩ (L× )n par l’application (a1 , . . . , an ) 7→ (log(|a1 |), . . . , log(|an |) de (L× )n dans Rn . On peut enfin prendre K = C et considérer, pour tout nombre réel ε > 1, l’application λε : (C× )n → Rn donnée par λε (z1 , . . . , zn ) = (logε (|z1 |), . . . , logε (|zn |)) (logarithme en base ε). Lorsque ε tend vers +∞, λε (V ∩ (C× )n ) converge vers |ΣM |. 2.11. — Soit N un Z-module libre de rang fini, n, et soit Σ un éventail unimodulaire de N ; notons r la borne supérieure (dans N) des dimensions des cônes de Σ. Soit K un corps ; considérons la K-variété torique XΣ associée à l’éventail Σ, et notons A(XΣ ) son anneau de Chow. On note VΣ l’ensemble des rayons de Σ, c’est-à-dire des générateurs primitifs des cônes de dimension 1 de Σ. À tout v ∈ Vσ correspond un diviseur de Cartier irréductible Dv de XΣ . Soit SΣ = Z[(Tv )v∈Vσ ] l’anneau gradué des polynômes à coefficients entiers et à indéterminées dans Vσ . Pour tout entier k, on note SkΣ sa composante homogène de degré k. Q Pour tout cône σ de Σ, on pose Tσ = v∈σ∩VΣ Te ; c’est un monôme de degré dim(σ). Pour tout entier k, on définit un sous-module M Zk (Σ) = ZTσ ; σ∈Σ dim(σ)=k
L c’est un sous-module de SkΣ , nul pour k > r. On pose aussi Z(Σ) = k∈N Zk (Σ). Soit IΣ l’idéal homogène de SΣ engendré par les monômes qui n’appartiennent P pas à Z(Σ) et JΣ l’idéal de SΣ engendré par les polynômes linéaires v∈Vσ ϕ(v)Tv , pour ϕ ∈ N∨ . Proposition 2.12. — L’unique homomorphisme d’anneaux de SΣ dans A(XΣ ) qui applique tout v ∈ Vσ sur la classe de Dv dans A1 (XΣ ) est surjectif. Son noyau est l’idéal IΣ + JΣ . L’anneau gradué quotient A(Σ) = SΣ /(IΣ + JΣ ) sera ainsi appelé l’anneau de Chow de l’éventail Σ. Pour tout entier k, on note Ak (Σ) sa composante homogène de degré k ; elle est engendrée par Zk (Σ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
322
A. CHAMBERT-LOIR
Pour k > dim(Σ), on a Ak (Σ) = 0. Remarque 2.13. — On note PL(Σ) (resp. PP(Σ)) l’espace vectoriel (resp. la R-algèbre) des fonctions de |Σ| dans R dont la restriction à tout cône de Σ est linéaire (resp. polynomiale) ; une telle fonction est continue. On dit, par abus, que ce sont les fonctions linéaires (resp. polynomiales) par morceaux sur |Σ|. Pour v ∈ VΣ , il existe une unique fonction ϕv ∈ PL(Σ) telle que pour tout w ∈ VΣ , on a ϕv (w) = 1 si w = v, et ϕv (w) = 0 sinon. Ces fonctions ϕv , parfois appelées fonctions de Courant, forment une base de PL(Σ). D’après Billera [9], l’unique homomorphisme de R ⊗ SΣ dans PP(Σ) qui applique Tv sur ϕv , pour tout v ∈ VΣ , est surjectif ; son noyau est engendré par les monômes Tv1 · · · Tvd , tels que v1 , . . . , vd n’engendrent pas un cône de Σ. Par suite, A(Σ)R est le quotient de PP(Σ) par l’idéal engendré par les restrictions à |Σ| des formes linéaires sur NR . Lemme 2.14. — L’application de PL(Σ) dans A1 (XΣ )R qui, pour tout v ∈ VΣ , applique ϕv sur la classe de Dv , est surjective. Son noyau est le sous-espace de PL(Σ) engendré par les restrictions à |Σ| des formes linéaires sur NR . À une fonction linéaire par morceaux ϕ ∈ PL(Σ), on associe le R-diviseur (invariant P par l’action du tore) div(ϕ) = v∈VΣ ϕ(v)Dv . Ce diviseur est effectif si ϕ est positive sur |Σ|. Plus généralement, soit σ un cône de Σ et soit Vσ ⊂ Xσ l’adhérence de l’orbite du tore qui lui correspond (on a dim(Vσ ) = codim(σ)). On dit que ϕ est convexe en σ si la classe du diviseur div(ϕ)|Vσ sur Vσ est effective. Cela revient à dire qu’il existe une forme linéaire m sur NR telle que ϕ = m sur σ, et telle que ϕ > m sur l’étoile de σ, c’est-à-dire sur le sous-éventail starΣ (σ) de Σ formé des cônes de Σ contenant une face de σ. On dit que ϕ est strictement convexe en σ s’il existe une forme linéaire m sur NR telle que ϕ = m sur σ et telle que ϕ(v) > m(v) pour tout rayon v de l’étoile de σ qui n’appartient pas à σ. L’ensemble des fonctions ϕ ∈ PL(Σ) qui sont convexes (resp. strictement convexes) en tout cône σ ∈ Σ est un cône (resp. un cône ouvert) de PL(Σ) ; on l’appelle le cône nef (resp. le cône ample) de PL(Σ) et on le note NΣ (resp. KΣ ). Ces cônes contiennent l’image du dual de NR , on désigne des mêmes lettres leurs images dans A1 (XΣ )R . Si KΣ n’est pas vide, c’est l’intérieur de NΣ , lequel est son adhérence. Cela se produit en particulier lorsque Σ est l’éventail associé à un matroïde ; en effet, Σ est alors un sous-éventail de l’éventail normal d’un polytope.
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
323
2.15. — Supposons que Σ soit l’éventail ΣM associé au matroïde M. On notera alors A(M), SM , etc. les objets A(ΣM ), SΣM , etc. ∗ Dans ce cas, les rayons de ΣM sont les vecteurs eP , où P parcourt l’ensemble PM des ∗ ]. L’idéal IM est plats de M tels que P 6= ∅ et P 6= |M|. On a donc SM = Z[(TP )P∈PM engendré par les monômes quadratiques TP TQ , où (P, Q) parcourt l’ensemble des ∗ couples d’éléments incomparables de PM , tandis que l’idéal JM est engendré par les polynômes linéaires X X TP − TP , P3i
P3j
où (i, j) parcourt l’ensemble des couples d’éléments de |M|. On a Ak (M) = 0 pour k > r. On définit deux éléments αM et βM de A1 (M) par X X αM = TP , TP , βM = P3i
P63i
où i est un élément arbitraire de |M| (ils n’en dépendent pas). Si D est un drapeau de plats donné, on voit, en choisissant i hors de sup(D), resp. dans inf(D), que leurs images dans A1 (M)R appartiennent au cône nef NM . Proposition 2.16. —
a) Il existe un unique homomorphisme de groupes deg : Ar (M) → Z
tel que deg(TP1 · · · TPr ) = 1 pour toute suite (P1 , . . . , Pr ) de plats de M vérifiant r ∅ ( P1 ( · · · ( Pr ( |M|. C’est un isomorphisme. De plus, deg(αM ) = 1. b) Pour tout entier k tel que 0 6 k 6 r, on a r−k k µk (M) = deg(αM βM ).
La deuxième partie de la proposition est la généralisation, dans le contexte combinatoire, du théorème 1.15. 2.17. — Soit A une Z-algèbre commutative unifère, graduée, artinienne, et soit r un entier ; on suppose que Ak = 0 pour k < 0 ou k > r et on se donne un homomorphisme deg : Ar → Z. On dit que (A, deg) vérifie la dualité de Poincaré si pour tout entier k tel que 0 6 k 6 r, l’application a 7→ (b 7→ deg(ab)) est un isomorphisme de Ak sur (Ar−k )∨ . Soit ` un élément de A1R et soit k un entier tel que k 6 r/2. L’application de Lefschetz associée à ` est l’application linéaire λk : a 7→ `r−2k a de AkR dans Ar−k R . On définit aussi une forme bilinéaire symétrique Qk` sur AkR par Qk` (a, b) = (−1)k deg(a `r−2k b).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
324
A. CHAMBERT-LOIR
On note Pk` le sous-espace de AkR formé des a ∈ AkR tels que `r+1−2k a = 0. Si k > r/2, on pose Pk` = 0. On dit que (AR , `) vérifie le théorème de Lefschetz difficile si λk est un isomorphisme pour tout entier k tel que 0 6 k 6 r/2. Alors, pour tout entier k tel que 0 6 k 6 r/2, l’espace AkR admet la décomposition de Lefschetz : AkR = Pk` ⊕ `Pk−1 ⊕ · · · ⊕ `k P0` ; ` c’est une décomposition orthogonale pour la forme Qk` . Pour tout entier k tel que r−k r/2 < k 6 r, on obtient une décomposition similaire en écrivant AkR = `2k−r AR : AkR = `2k−r Pr−k ⊕ `2k−r−1 P`r−k−1 ⊕ · · · ⊕ `k P0` . ` On dit que (AR , `) vérifie les relations de Hodge-Riemann si la restriction à Pk` de la forme quadratique associée à Qk` est définie positive pour tout entier k tel que 0 6 k 6 r/2. Exemple 2.18. — La terminologie provient bien sûr des propriétés de l’algèbre de cohomologie d’une variété complexe compacte (connexe) kählérienne. Soit en effet V une telle variété, soit n sa dimension et soit H(V) l’algèbre réelle graduée, gr-commutative, de cohomologie de De Rham. On a Hk (V) = 0 si k > 2n. La décomposition de Hodge munit H(V)C d’une bigraduation canonique L p,q Hk (V)C = (V) ; on a Hp,q (V) = 0 si p ou q n’appartient pas à p+q=k H l’intervalle [0, n]. R On dispose d’un isomorphisme canonique : H2n (V) → R. Pour tout entier k, R l’homomorphisme a 7→ (b 7→ a∧b) induit un isomorphisme de Hk (V) sur H2n−k (V)∨ (dualité de Poincaré) et de Hp,q (V) sur Hn−p,n−q (V)∨ . Soit ` la classe dans H2 (V) d’une forme de Kähler sur V ; elle appartient à H1,1 (V). Alors, pour tout entier k tel que k 6 n, l’application a 7→ `k ∧ a de Hk (V) dans Hk+2 (V) est injective (théorème de Lefschetz difficile). On note alors Pk (V) le sous-espace primitif de Hk (V), noyau de a 7→ `k+1 ∧ a. R La forme bilinéaire Qk sur Hk (V) définie par Qk (a, b) = `n−k ∧a∧b est symétrique si k est pair, alternée si k est impair, de sorte que la forme bilinéaire Rk sur Hk (V)C définie par Rk (a, b) = ik Qk (a, b) est hermitienne (forme de Riemann). Soit (p, q) un couple d’entiers tels que p + q = k. La restriction à Pk (V)C ∩ Hp,q (V) de cette forme hermitienne est définie, de signe (−1)k(k−1)/2+q (relations bilinéaires de HodgeRiemann). Dans le cas particulier où p = q, l’entier k = 2p est pair, le coefficient ik qui intervient dans la définition de Rk est égal à (−1)p , et sur P2p (V)C ∩ Hp,p (V), la forme de Riemann est définie positive. Supposons de plus que V soit projective et notons C(V) l’anneau des classes de cycles pour l’équivalence homologique. L’homomorphisme de classe de cycles C(V) → H(V) est alors injectif, de sorte que C(V) vérifie les conditions du paragraphe
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
325
précédent. Noter que lorsque V est une variété torique projective lisse, l’équivalence homologique coïncide avec l’équivalence rationnelle et l’homomorphisme de classe de cycles est un isomorphisme. Théorème 2.19. — Soit M une géométrie combinatoire de rang > 0 et soit r = rg(M) − 1. Soit ` ∈ KM une classe ample de PL(M). 1) Le couple (A(M), deg) vérifie la dualité de Poincaré ; 2) Le couple (A(M)R , `) vérifie le théorème de Lefschetz difficile ; 3) Le couple (A(M)R , `) vérifie les relations de Hodge-Riemann. C’est en quelque sorte le théorème principal de l’article d’Adiprasito, Huh & Katz [2]. Nous donnerons des indications de sa preuve dans la section suivante. Voyons tout de suite comment il entraîne le théorème 1.11. On commence par en déduire le corollaire suivant, analogue aux inégalités de Khovanskii-Teissier. Corollaire 2.20. — Soit α et β des classes de A1 (M)R . Si α est nef, alors deg(αr−2 β 2 ) deg(αr ) 6 deg(αr−1 β)2 . Démonstration. — Par passage à la limite, il suffit de traiter le cas où α est ample. La décomposition de Lefschetz A1 (M)R = P1α (M) ⊕ hαi est orthogonale pour la forme Q1α définie par Q1α (x, y) = − deg(xαr−2 y), laquelle est définie positive sur P1α (M) et définie négative sur hαi. L’inégalité à vérifier est évidente si β est proportionnelle à α. Sinon, le sous-espace hα, βi est de dimension 2 et la restriction de la forme Q1α y est de signature (1, 1). Son discriminant est donc négatif, d’où le corollaire. 2.21. Démonstration du théorème 1.11 On prouve d’abord que pour tout k ∈ {0, . . . , r}, l’entier µk (M) est strictement positif, par exemple en déduisant du théorème de Weisner qu’il est égal au nombre de « drapeaux initiaux descendants » de longueur k, c’est-à-dire de familles (P1 , . . . , Pk ) de plats de M tels que P1 ⊂ · · · ⊂ Pk , rgM (Pj ) = j pour tout j, et inf(P1 ) > inf(P2 ) > · · · > inf(Pk ) > 0. (Noter que ces conditions imposent P1 6= ∅ et Pk 6= |M|.) r−k k D’après la proposition 2.16, on a µk (M) = deg(αM βM ). Ainsi, lorsque k = r − 1, l’inégalité (ii) du théorème 1.11 n’est autre que celle du corollaire 2.20, appliquée à α = αM et β = βM . Sinon, on remplace M par la géométrie combinatoire associée au matroïde tronqué τ (M) dont le treillis des plats est l’ensemble des plats de M dont le rang n’appartient pas à [k + 1, r]. Son rang est égal à k + 2 et l’on a µj (M) = µj (τ (M)) pour tout entier j tel que j 6 k + 1. L’inégalité voulue se déduit donc du cas déjà traité.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
326
A. CHAMBERT-LOIR
3. FILTRES 3.1. — La démonstration du théorème 2.19 est combinatoire et les paragraphes qui suivent ne font guère plus qu’en décrire le cheminement ; je renvoie à (Adiprasito, Huh & Katz [2, §6–8]) pour les détails. Cette démonstration consiste à partir de l’éventail de l’espace projectif, pour lequel la conclusion du théorème est évidente, et à le modifier progressivement jusqu’à l’éventail ΣM , de sorte qu’à chaque étape la conclusion du théorème reste vraie. Ces modifications exigent d’introduire des éventails un peu plus compliqués. On dira ainsi qu’un éventail Σ vérifie la dualité de Poincaré en dimension r s’il existe un isomorphisme deg : Ar (Σ) → Z tel que l’anneau de Chow (A(Σ), deg) la vérifie. On dira alors que Σ vérifie le théorème de Lefschetz difficile, resp. les relations de Hodge-Riemann, si (A(Σ)R , `) les vérifie pour toute classe ample ` ∈ KΣ . 3.2. — Soit M un matroïde sans boucle et soit PM le treillis de ses plats. On suppose que M est de rang > 0 et on pose r = rg(M) − 1. On note inf(D) l’intersection, dans |M|, des éléments d’un drapeau D de plats de M ; si D = {P1 , . . . , Pd }, où ∅ ( P1 ( · · · ( Pd ( |M|, on a donc inf(D) = |M| lorsque d = 0, et inf(D) = P1 sinon. Soit D un tel drapeau et soit I une partie de inf(D). On dit que I et D sont compatibles, et on note I < D, si I est une partie stricte de inf(D). On dit qu’ils sont compatibles vis-à-vis de M, et on note I 1. 1) Il existe un unique homomorphisme de groupes ΨpP : A(M/P) → que ΨpP (tD ) = tpP tD pour tout drapeau D de plats de MP ; il est degré p. 2) Il existe un unique homomorphisme de groupes ΓpP : A(M | P) que ΓpP (tD ) = tpP tD pour tout drapeau D de plats de MP ; il est degré p.
A(M, P 0 ) tel homogène de → A(M) tel homogène de
Théorème 3.11. — L’homomorphisme rgM (P)−1
ΦP +
X
ΨpP : A(M, P) ⊕ A(M/P)[−p] → A(M, P 0 )
p=1
est un isomorphisme d’anneaux gradués, où le symbole [−p] signifie que la graduation est décalée de −p.
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
329
Corollaire 3.12. — L’homomorphisme ΦP induit un isomorphisme ∼
Ar (M, P) − → Ar (M, P 0 ) et l’algèbre A(M, P 0 )R muni de l’isomorphisme deg ◦ΦP : Ar (M, P 0 ) → Z, vérifie la dualité de Poincaré. 3.13. — La démonstration du théorème 3.11 commence par établir la surjectivité de rg (P) l’homomorphisme indiqué. On en déduit ensuite que l’homomorphisme ΨP M induit r−rgM (P) r un isomorphisme de A (M/P) sur A (M, P). Sous l’hypothèse que la dualité de Poincaré vaut pour A(M, P) et A(M/P), une dernière étape prouve l’injectivité de l’homomorphisme. Compte tenu du corollaire, l’algèbre A(M, P 0 ) vérifie alors la dualité de Poincaré. Par récurrence, cela prouve ainsi que pour tout matroïde M de rang r + 1 et tout filtre de plats P sur M, l’anneau A(M, P) vérifie la dualité de Poincaré en dimension r. En particulier, pour P = PM , l’anneau A(M) vérifie la dualité de Poincaré. 3.14. — La dualité de Poincaré acquise, la démonstration du théorème de Lefschetz difficile et celle des inégalités de Hodge-Riemann sont menées de front : le théorème de Lefschetz difficile affirme que la forme bilinéaire de Hodge-Riemann est non dégénérée, et les inégalités de Hodge-Riemann en précisent la signature. Grâce à la remarque que la signature est une fonction localement constante sur l’espace des formes quadratiques non dégénérées, un argument élémentaire de déformation prouve que si le théorème de Lefschetz difficile est vérifié pour toute classe ample, alors les inégalités de Hodge-Riemann valent pour toute classe ample si et seulement si elle valent pour une classe ample. Soit Σ un éventail unimodulaire vérifiant la dualité de Poincaré en dimension r. Pour tout rayon v ∈ VΣ , l’algèbre quotient A(Σ)R / ann(tv ), associée à l’étoile starΣ (σ), satisfait la dualité de Poincaré en dimension r − 1, et (Adiprasito et al. [2]) introduisent la variante « locale » des inégalités de Hodge-Riemann qui postule que cette algèbre vérifie ces inégalités pour (l’image de) toute classe ample dans KΣ . Proposition 3.15. — Les inégalités de Hodge-Riemann locales impliquent le théorème de Lefschetz difficile. 3.16. — On démontre la validité des inégalités de Hodge-Riemann pour l’algèbre A(M, P)R en raisonnant par récurrence d’abord sur le rang de M puis sur le cardinal de P. Lorsque P = ∅, on a déjà mentionné que l’algèbre A(M, P)R , isomorphe à l’algèbre R[t]/(tr+1 ) associée à Pr , vérifie le résultat voulu. Une première réduction permet de supposer que M est une géométrie combinatoire.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
330
A. CHAMBERT-LOIR
Revenons alors au contexte d’un flip matroïdal (§3.8) : P est un filtre de plats sur M, P est un plat maximal dans PM P et P 0 = P ∪ {P}. Tout d’abord, Adiprasito et al. [2, prop. 3.5] observent que l’étoile starΣM,P0 de tout rayon v est le produit des éventails ΣM | P,P | P et ΣM/P si le rayon v est associé à un plat P, et l’éventail ΣMi ,Pi si le rayon v est associé à un élément i de |M|. (On a noté P | P l’ensemble des plats de P qui sont contenus dans P ; c’est un filtre de plats sur M | P.) Dans ce dernier cas, l’éventail vérifie les inégalités de Hodge-Riemann, par l’hypothèse de récurrence. Dans le premier cas, les deux éventails qui interviennent les vérifient également, donc leur produit aussi : cela revient à prouver que l’algèbre A(M | P, P | P) ⊗ A(M/P) vérifie ces inégalités, ce que l’on démontre en se ramenant au cas du produit tensoriel R[t]/(ta+1 ) ⊗ R[t]/(tb+1 ) associé à Pa × Pb . Ainsi, l’éventail ΣM,P 0 vérifie les inégalités locales de Hodge-Riemann. Il vérifie donc le théorème de Lefschetz difficile. Il reste à démontrer les inégalités de Hodge-Riemann, mais il suffit maintenant de les vérifier pour une classe. La conclusion du théorème 3.11 fournit un isomorphisme de R-espaces vectoriels gradués A(M, P 0 )R ' A(M, P)R ⊕ R[t]/(trgM (P)−1 ) ⊗R A(M/P) [−1] qu’Adiprasito et al. [2] utilisent pour construire des classes amples qui vérifient les inégalités de Hodge-Riemann.
4. PLATS 4.1. — Concluons ce rapport en évoquant une autre conjecture, encore ouverte, en combinatoire énumérative des matroïdes, mais à laquelle l’article de Huh & Wang [30] apporte une réponse positive dans le cas représentable. Soit M un matroïde. Pour tout entier k, on note M(k) l’ensemble des plats de rang k de M et on pose Wk (M) = Card(M(k) ) ; ce sont les nombres de Whitney de seconde espèce de M. Ils sont nuls pour k < 0 ou k > rg(M). Conjecture 4.2 (conjecture de Rota-Welsh). — Soit M un matroïde et soit r = rg(M). (i) La suite (W0 (M), . . . , Wr ) est log-concave ; en particulier, elle est unimodale ; (ii) Pour tout entier k tel que 0 6 k 6 r/2, on a Wk (M) 6 Wr−k (M) ; (iii) On a W0 (M) 6 W1 (M) 6 · · · 6 Wbr/2c (M). L’unimodalité a été conjecturée par Rota [41] et on doit à Welsh [47] la suggestion que cette suite pourrait être log-concave. Mason [35] conjecture même que le quotient Wk (M)2 /Wk−1 (M)Wk+1 (M) serait toujours supérieur ou égal à (k + 1)/k, qui est la
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
331
valeur prise par ce quotient pour la structure de matroïde sur |M| pour laquelle toute partie est libre (« matroïde libre »). Théorème 4.3 (Huh & Wang [30]). — Soit M un matroïde représentable et soit r = rg(M). Soit p, q des entiers tels que 0 6 p 6 inf(q, r − q). Il existe une application injective ϕ : M(p) → M(q) telle que x ⊂ ϕ(x) pour tout x ∈ M(p) . En particulier, on a Wp (M) 6 Wq (M). En prenant p = k et q = p + 1 (resp. q = r − k), on en déduit en particulier que les assertions (ii) et (iii) de la conjecture 4.2 sont satisfaites pour un matroïde représentable. Dans le cas d’un matroïde représentable de rang 3, on retrouve le théorème classique de de Bruijn & Erdős [14] selon lequel n points non alignés d’un plan projectif déterminent au moins n droites. 4.4. — Soit M un matroïde, posons n + 1 = Card(|M|) et r = rg(M) ; on suppose que |M| = {0, . . . , n}. Supposons M représentable sur un corps K. Notons [x0 : · · · : xn ] les coordonnées homogènes de Pn,K et identifions le complémentaire de l’hyperplan défini par x0 = 0 à l’espace affine AnK . Considérons un sous-espace affine L de dimension r de Kn dont l’adhérence X dans Pn,K représente M, au sens où les hyperplans de coordonnées de Pn,K découpent sur X un arrangement d’hyperplans qui représente M. Pour tout circuit C de M, il existe une famille (aC,i )i∈C d’éléments de K, non tous nuls, unique à multiplication près par un élément non nul de K, telle P que i∈C aC,i xi = 0 sur X. Soit Y l’adhérence de L dans le produit des droites projectives (P1,K )n . Notons [z1 , w1 ], . . . , [zn , wn ] les coordonnées multi-homogènes de Pn1,K . La démonstration du théorème 4.3 repose sur l’observation suivante, due à Ardila & Boocher [3] qui décrivent l’idéal homogène de Y. Proposition 4.5. — La variété Y est définie dans (P1,K )n par la famille d’équations multi-homogènes X Y aC,i zi wj = 0, i∈C
j∈C {i}
où C parcourt l’ensemble des circuits du matroïde M. Pour tout plat P ∈ PM , soit YP l’intersection de Y et du sous-espace localement fermé de (P1,K )n défini par wi = 0 si et seulement si i 6∈ P. Corollaire 4.6. — La famille (YP )P∈PM est une partition de Y en parties localement fermées. De plus, pour tout plat P de M, YP est isomorphe à l’espace rg (P) affine AK M .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
332
A. CHAMBERT-LOIR
4.7. — Bien que Y soit singulière en général, l’existence de la partition (YP ) a des conséquences remarquables sur sa cohomologie. Pour fixer les idées, choisissons un nombre premier ` distinct de la caractéristique de K et notons H(Y) la cohomologie étale de YK à coefficients dans Q` . Lorsque K est de caractéristique p > 0, on peut se ramener au cas où K est une clôture algébrique d’un corps fini. Lorsque K est de caractéristique zéro, on peut préférer se ramener au cas où K = C et prendre pour H(Y) la cohomologie singulière de Y(C) munie de sa structure de Hodge mixte. Dans les deux cas, on dispose d’une filtration par le poids sur les espaces de cohomologie Hk (Y). Notons aussi IH(Y) la cohomologie d’intersection de Y (Goresky & MacPherson [25], Be˘ılinson, Bernstein, Deligne & Gabber [7]) : disons juste que c’est la cohomologie d’un complexe borné à cohomologie constructible sur Y, le complexe d’intersection décalé ICY [−r], caractérisé (dans une catégorie dérivée convenable) d’une part par la propriété qu’il prolonge le faisceau constant sur le lieu lisse de Y, et d’autre part par les « conditions de perversité » (décalées) sur la dimension du support de ses faisceaux de cohomologies et de ceux de son dual de Verdier. Les espaces Hk (Y) et IHk (Y) sont nuls si k 6∈ [0, 2r]. De plus, Björner & Ekedahl [11, th. 3.1] déduisent du corollaire 4.6 que pour tout entier k, 1) Si k est impair, on a Hk (Y) = 0. 2) Si k est pair, l’espace Hk (Y) est pur de poids k et de dimension Wk/2 (M), engendré par les classes de cycles [YP ], pour P ∈ M(k/2) . 3) L’homomorphisme canonique de Hk (Y) dans IHk (Y) est injectif. Par récurrence sur le cardinal de PM , les deux premières assertions se déduisent de la cohomologie des espaces affines et de la suite exacte longue de cohomologie à support compact associée à une partition de Y en un ouvert et le fermé complémentaire. La troisième assertion est démontrée dans Björner & Ekedahl [11, th. 2.1] lorsque K est la clôture algébrique d’un corps fini, et par Weber [46, th. 1.8] lorsque K = C : le noyau de l’homomorphisme canonique de Hk (Y) dans IHk (Y) est la partie de poids < k de Hk (Y). C’est une conséquence du comportement des poids par les six opérations cohomologiques usuelles (Deligne [18, 19]) et du fait que le prolongement intermédiaire d’un faisceau pervers pur est un faisceau pervers pur de même poids. 4.8. — La cohomologie d’intersection IH(Y) de Y est un module sur sa cohomologie usuelle H(Y). En particulier, pour tout fibré en droites ample L sur Y et tout entier k tel que 0 6 k 6 r/2, on peut considérer l’homomorphisme de Lefschetz c1 (L )r−2k ∩ : IH2k (Y) → IH2r−2k (Y). Cet homomorphisme est injectif : le théorème de Lefschetz difficile vaut pour la cohomologie d’intersection (Be˘ılinson, Bernstein, Deligne & Gabber [7, 5.4.10, 6.2.10]).
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
333
Puisque l’homomorphisme canonique de H2k (Y) dans IH2k (Y) est injectif, il en résulte que l’homomorphisme de Lefschetz c1 (L )r−2k ∩ : H2k (Y) → H2r−2k (Y) est encore injectif. Autrement dit : le théorème de Lefschetz difficile vaut pour la cohomologie usuelle de Y. Cela démontre déjà l’inégalité Wk (M) 6 Wr−k (M) pour tout entier k tel que 0 6 k 6 r/2. Si p, q sont des entiers tels que 0 6 p 6 inf(q, r − q), l’homomorphisme c1 (L )q−p ∩ : H2p (Y) → H2q (Y) est a fortiori injectif, ce qui entraîne l’inégalité Wp (M) 6 Wq (M) du théorème 4.3. 4.9. — Prenons pour fibré en droites L le produit tensoriel externe des fibrés O(1) sur les n facteurs de (P1,K )n et considérons la matrice Λ = (ΛP,Q ) de l’application c1 (L )q−p ∩ dans les bases ([YP ])P∈M(p) de H2p (Y) et ([YQ ])Q∈M(q) de H2q (Y). L’intersection c1 (L ) ∩ [YP ] est somme des termes [YhP,ii ] pour i ∈ {1, . . . , n} P. Par suite, on a ΛP,Q = 0 si P 6⊂ Q. D’après ce qui précède, la matrice Λ est de rang maximal Wp (M), donc au moins un mineur de taille Wp (M) en est inversible. Ce mineur est de type P × P0 , où P0 est une partie de Q de cardinal Wp (M) ; une fois choisi un ordre total sur P et P0 , ce mineur se développe comme une somme de termes de la forme Y ± ΛP,ι(P) P∈M(p)
où ι parcourt l’ensemble des bijections de P sur P0 . Au moins l’un de ces termes n’est pas nul : il correspond à une application injective ι : M(p) → M(q) telle que P ⊂ ι(P) pour tout P ∈ M(p) . Cela conclut la preuve du théorème 4.3. 4.10. — Dans le but de généraliser ce théorème aux matroïdes non représentables, on peut observer que la cohomologie de Y possède un modèle combinatoire, décrit uniquement en termes du matroïde M. Soit donc M un matroïde, non nécessairement représentable. Notons B(M) le groupe abélien libre sur l’ensemble des plats de M, et soit (δP )P∈PM sa base canonique. On munit B(M) de la graduation pour laquelle, pour tout entier k, Bk (M) est le sousgroupe engendré par les fonctions δP , où P parcourt l’ensemble M(k) des plats de rang k. On définit ensuite une multiplication dans B(M) par ( δP∨Q si rgM (P) + rgM (Q) = rgM (P ∨ Q) ; δP · δQ = 0 sinon. Pour ces structures, B(M) est une algèbre commutative graduée, que Huh & Wang [30] appellent l’algèbre de Möbius graduée du matroïde M. P Posons aussi λ = δi ∈ B1 (M). i∈|M|
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
334
A. CHAMBERT-LOIR
Lorsque M est représentable, l’unique homomorphisme d’espaces vectoriels gradués de B(M)Q` dans H(Y) qui applique δP sur [YP ] est un isomorphisme d’algèbres graduées, et l’application de Lefschetz c1 (L )∩ correspond à la multiplication par λ. Huh & Wang [30] conjecturent alors que pour tout matroïde M de rang r, non nécessairement représentable, l’application λk : Bk (M) → Br−k (M) est injective pour tout entier k tel que 0 6 k 6 r/2. La conclusion du théorème 4.3 s’en déduirait alors comme ci-dessus.
RÉFÉRENCES [1] K. Adiprasito, J. Huh & E. Katz – Hodge theory of matroids, Notices Amer. Math. Soc. 64 (2017), no 1, p. 26–30. [2]
, Hodge theory for combinatorial geometries, Ann. of Math. 188 (2018), no 2, p. 381–452, prépublication arXiv:1511.02888v1.
[3] F. Ardila & A. Boocher – The closure of a linear space in a product of lines, J. Algebraic Combin. 43 (2016), no 1, p. 199–235. [4] F. Ardila & C. J. Klivans – The Bergman complex of a matroid and phylogenetic trees, J. Combin. Theory Ser. B 96 (2006), no 1, p. 38–49. [5] F. Babaee & J. Huh – A tropical approach to a generalized Hodge conjecture for positive currents, Duke Math. J. 166 (2017), no 14, p. 2749–2813. [6] M. Baker – Hodge theory in combinatorics, Bull. Amer. Math. Soc. (N.S.) 55 (2018), no 1, p. 57–80, prépublication arXiv:1705.07960. [7] A. A. Be˘ılinson, J. Bernstein, P. Deligne & O. Gabber – Faisceaux pervers, in Analyse et topologie sur les espaces singuliers, I (Luminy, 1981), Astérisque, vol. 100, Soc. Math. France, 2018, p. 5–171. [8] V. G. Berkovich – Spectral theory and analytic geometry over nonArchimedean fields, Mathematical Surveys and Monographs, vol. 33, Amer. Math. Soc., 1990. [9] L. J. Billera – The algebra of continuous piecewise polynomials, Adv. Math. 76 (1989), no 2, p. 170–183. [10] L. J. Billera & C. W. Lee – Sufficiency of McMullen’s conditions for f -vectors of simplicial polytopes, Bull. Amer. Math. Soc. (N.S.) 2 (1980), no 1, p. 181–185. [11] A. Björner & T. Ekedahl – On the shape of Bruhat intervals, Ann. of Math. 170 (2009), no 2, p. 799–817. [12] F. Brenti – Log-concave and unimodal sequences in algebra, combinatorics, and geometry : an update, in Jerusalem combinatorics ’93, Contemp. Math., vol. 178, Amer. Math. Soc., 1994, p. 71–89.
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
335
[13] H. Bruhn, R. Diestel, M. Kriesell, R. Pendavingh & P. Wollan – Axioms for infinite matroids, Adv. Math. 239 (2013), p. 18–46. [14] N. G. de Bruijn & P. Erdős – On a combinatorial problem, Indagationes Math. 10 (1948), p. 421–423. [15] T. Brylawski – The Tutte polynomial. Part I : General theory, in Matroid theory and its applications, C.I.M.E. Summer Sch., vol. 83, Springer, 1982, p. 125– 275. [16] M. A. A. de Cataldo & L. Migliorini – The Hodge theory of algebraic maps, Ann. Sci. École Norm. Sup. 38 (2005), no 5, p. 693–750. [17] C. De Concini & C. Procesi – Wonderful models of subspace arrangements, Selecta Math. (N.S.) 1 (1995), no 3, p. 459–494. [18] P. Deligne – Théorie de Hodge. III, Publ. Math. Inst. Hautes Études Sci. 44 (1974), p. 5–77. [19] , La conjecture de Weil, II, Publ. Math. Inst. Hautes Études Sci. 52 (1980), p. 137–252. [20] M. Einsiedler, M. Kapranov & D. Lind – Non-Archimedean amoebas and tropical varieties, J. reine angew. Math. 601 (2006), p. 139–157. [21] D. Eisenbud & H. I. Levine – An algebraic formula for the degree of a C∞ map germ, Ann. of Math. 106 (1977), no 1, p. 19–44. [22] B. Elias & G. Williamson – The Hodge theory of Soergel bimodules, Ann. of Math. 180 (2014), no 3, p. 1089–1136. [23] E. M. Feichtner & S. Yuzvinsky – Chow rings of toric varieties defined by atomic lattices, Invent. math. 155 (2004), no 3, p. 515–536. [24] W. Fulton – Introduction to toric varieties, Annals of Math. Studies, vol. 131, Princeton Univ. Press, 1993. [25] M. Goresky & R. MacPherson – Intersection homology. II, Invent. math. 72 (1983), no 1, p. 77–129. [26] A. P. Heron – Matroid polynomials, in Combinatorics (Proc. Conf. Combinatorial Math., Math. Inst., Oxford, 1972), Inst. Math. Appl., Southendon-Sea, 1972, p. 164–202. [27] S. G. Hoggar – Chromatic polynomials and logarithmic concavity, J. Combinatorial Theory Ser. B 16 (1974), p. 248–254. [28] J. Huh – Milnor numbers of projective hypersurfaces and the chromatic polynomial of graphs, J. Amer. Math. Soc. 25 (2012), no 3, p. 907–927. [29] J. Huh & E. Katz – Log-concavity of characteristic polynomials and the Bergman fan of matroids, Math. Ann. 354 (2012), no 3, p. 1103–1116. [30] J. Huh & B. Wang – Enumeration of points, lines, planes, etc, Acta Math. 218 (2017), no 2, p. 297–317.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
336
A. CHAMBERT-LOIR
[31] I. Itenberg, L. Katzarkov, G. Mikhalkin & I. Zharkov – Tropical homology, prépublication arXiv:1604.01838, 2016. [32] K. Karu – Hard Lefschetz theorem for nonrational polytopes, Invent. math. 157 (2004), no 2, p. 419–447. [33] A. G. Khovanskii – Algebra and mixed volumes, in Geometric inequalities (Y. D. Burago & V. A. Zalgaller, éd.), Grundl. math. Wiss., vol. 285, Springer, 1988, p. 182–207. [34] M. Lenz – The f -vector of a representable-matroid complex is log-concave, Adv. in Appl. Math. 51 (2013), no 5, p. 543–545, version augmentée, arXiv{\char58}1106.2944. [35] J. H. Mason – Matroids : unimodal conjectures and Motzkin’s theorem, in Combinatorics (Proc. Conf. Combinatorial Math., Math. Inst., Oxford, 1972), Inst. Math. Appl., Southend-on-Sea, 1972, p. 207–220. [36] P. McMullen – On simple polytopes, Invent. math. 113 (1993), no 2, p. 419– 444. [37] P. Nelson – Almost all matroids are nonrepresentable, Bull. London Math. Soc. (2018), doi:10.1112/blms.12141. [38] J. G. Oxley – Matroid theory, Oxford Science Publications, The Clarendon Press Univ. Press, 1992. [39] R. C. Read – An introduction to chromatic polynomials, J. Combinatorial Theory 4 (1968), p. 52–71. [40] S. Riche – La théorie de Hodge des bimodules de Soergel (d’après Soergel et Elias–Williamson), Séminaire Bourbaki, vol. 2017/2018, exp. no 1139, Astérisque 414 (2019), p. 125–166 (ce volume). [41] G.-C. Rota – Combinatorial theory, old and new, in Actes du Congrès International des Mathématiciens (Nice, 1970), Tome 3, Gauthier-Villars, 1971, p. 229–233. [42] R. P. Stanley – The number of faces of a simplicial convex polytope, Adv. in Math. 35 (1980), no 3, p. 236–238. [43]
, Generalized H-vectors, intersection cohomology of toric varieties, and related results, in Commutative algebra and combinatorics (Kyoto, 1985), Adv. Stud. Pure Math., vol. 11, North-Holland, 1987, p. 187–213.
[44]
, Log-concave and unimodal sequences in algebra, combinatorics, and geometry, in Graph theory and its applications : East and West (Jinan, 1986), Ann. New York Acad. Sci., vol. 576, New York Acad. Sci., 1989, p. 500–535.
[45] B. Teissier – Du théorème de l’index de Hodge aux inégalités isopérimétriques, C. R. Acad. Sci. Paris Sér. A-B 288 (1979), no 4, p. A287–A289.
ASTÉRISQUE 414
(1144)
RELATIONS DE HODGE-RIEMANN ET COMBINATOIRE DES MATROÏDES
337
[46] A. Weber – Pure homology of algebraic varieties, Topology 43 (2004), no 3, p. 635–644. [47] D. J. A. Welsh – Matroid theory, L. M. S. Monographs, vol. 8, Academic Press, London-New York, 1976. [48] N. White (éd.) – Theory of matroids, Encyclopedia of Mathematics and its Applications, vol. 26, Cambridge Univ. Press, 1986. [49]
(éd.) – Combinatorial geometries, Encyclopedia of Mathematics and its Applications, vol. 29, Cambridge Univ. Press, 1987.
[50] H. Whitney – On the abstract properties of linear dependence, Amer. J. Math. 57 (1935), no 3, p. 509–533. [51] G. Williamson – The Hodge theory of the decomposition theorem, Séminaire Bourbaki, vol. 2015/2016, exposé no 1115, Astérisque 390 (2017), p. 335–367.
Antoine CHAMBERT-LOIR Université Paris Diderot, Sorbonne Université, CNRS Institut de Mathématiques de Jussieu-Paris Rive Gauche, IMJ-PRG F-75013, Paris, France. E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1145, p. 339 à 378 doi:10.24033/ast.1089
Mars 2018
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE [d’après N. Anantharaman, M. Léautaud et F. Macià] par Gabriel RIVIÈRE
INTRODUCTION
Le régime semi-classique de la mécanique quantique est un régime où la constante de Planck est négligeable devant les autres actions physiques mises en jeu dans le système. À la limite, le système considéré est alors régi par les équations de la mécanique classique et on s’attend à ce que la nature du système classique associé (par exemple, chaotique vs. intégrable) se reflète dans le comportement du système quantique. D’un point de vue mathématique, ce type d’asymptotique est au cœur de ce qu’on appelle l’analyse microlocale dont le champ d’applications est extrêmement varié : théorie spectrale, équations aux dérivées partielles, topologie symplectique, systèmes dynamiques hyperboliques, géométrie aléatoire, etc. L’objet de cet exposé est l’étude de problématiques de géométrie spectrale et d’équations aux dérivées partielles à travers cette perspective. Précisément, nous discuterons les propriétés des solutions de l’équation de Schrödinger dans la limite semi-classique de la mécanique quantique. Un cas particulier important est celui des vecteurs propres du Laplacien ou plus généralement de l’opérateur de Schrödinger sur une variété compacte lorsque la valeur propre tend vers l’infini. De ce point de vue, il s’agit de questions typiques de géométrie spectrale qui ont fait l’objet d’une grande attention ces quarante dernières années notamment en lien avec le problème de l’ergodicité quantique que nous décrirons brièvement. Dans ce texte, nous mettrons plutôt l’accent sur la situation opposée, à savoir celle des systèmes complètement intégrables et, à travers les exemples du tore et du disque, nous essayerons de comprendre de manière fine la dynamique de l’équation de Schrödinger.
© Astérisque 414, SMF 2019
340
G. RIVIÈRE
1. LE CAS STATIONNAIRE 1.1. Mesures semi-classiques Présentons maintenant un peu plus précisément les objets de notre étude. Pour simplifier, on se limite dans cette première partie au cas d’une variété M qui est lisse (C ∞ ), compacte et sans bord. On suppose aussi cette variété connexe, orientée et munie d’une métrique riemannienne g lisse et on note d ≥ 1 sa dimension. Un cas particulier du problème que l’on va étudier est l’équation suivante : Å ã ∆g (1) − + V ψλ = λψλ , kψλ kL2 = 1, 2 où ∆g est l’opérateur de Laplace-Beltrami (ou laplacien) associé à la métrique g, où V appartient (1) à C ∞ (M, R) et où l’espace L2 est défini par rapport au volume riemannien. Sous nos hypothèses, on sait [70, Th. 14.7] qu’il existe une base orthonormée (ej )j≥0 de L2 (M ) composée de fonctions C ∞ et une suite croissante (λj )j≥0 tendant vers +∞ telles que Å ã ∆g ∀j ≥ 0, − + V ej = λj ej . 2 À part dans certains cas très particuliers (2), on n’a en général pas d’expression explicite de ces fonctions et il est naturel de chercher à les décrire. Du point de vue physique, les solutions de (1) sont des états stationnaires de l’équation de Schrödinger : ∆g u + V u, u(t = 0) = ψ ∈ L2 (M ). 2 Les valeurs propres λ représentent l’énergie de l’état quantique ψλ [25, § 2.5] et l’objet de cet exposé est l’étude de la limite où les états quantiques sont de plus en plus « excités », i.e. λ → +∞. Le principe de correspondance affirme que, dans ce régime asymptotique, les propriétés des états quantiques seront régies par celles du système classique sous-jacent [25, § 7.4], ici le flot géodésique sur le fibré cotangent T ∗ M . On parle alors de limite semi-classique de la mécanique quantique. L’objet de cette note est d’étudier les propriétés de concentration de ces états stationnaires ou plus généralement des solutions de l’équation de Schrödinger dans cette limite. Rappelons qu’il s’agit de fonctions lisses et notre but est de comprendre si ces solutions peuvent développer asymptotiquement des singularités. Afin de mesurer ceci, nous allons étudier ces états quantiques à travers des mesures de probabilité qui leur sont naturellement associées. Précisément, pour toute solution de (1), on pose i∂t u = −
dνλ (x) := |ψλ (x)|2 dVolg (x), (1)
Dans tout l’exposé, on suppose le potentiel lisse mais une grande partie des résultats resteraient valables sous des hypothèses de régularité plus faibles. (2) Par exemple, si V ≡ 0 et si M est un tore ou une sphère (munis de leurs métriques canoniques).
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
341
où Volg est le volume riemannien associé à g. Du point de vue de la mécanique quantique, cette mesure représente la probabilité de trouver en x une particule dans l’état ψλ . Nous nous intéressons au comportement asymptotique de ces mesures et nous notons N (∞) l’ensemble des points d’accumulation de la suite de mesures (νλj )j≥0 lorsque λj → +∞. Afin d’étudier cet ensemble, il est utile de relever ces mesures de probabilité en des distributions sur le fibré cotangent T ∗ M . Ce type de construction apparaît déjà dans les travaux de Wigner [64] et porte parfois le nom de distribution de Wigner. D’un point de vue mathématique, ceci nécessite de faire appel à la notion d’opérateurs pseudo-différentiels [70, Ch. 4]. On définit, pour λ > 0, ¨ ∂ µλ : Cc∞ (T ∗ M ) 3 a 7→ ψλ , Op − 21 (a)ψλ 2 ∈ C, λ
L
où Op − 21 (a) est un opérateur pseudo-différentiel (semi-classique) de symbole λ principal a. Notons que, si l’on étend la définition à des fonctions a dans C ∞ (M ), on a hµλ , ai = hνλ , ai et cet objet encode plus d’information que νλ . Dans la littérature mathématique, ce type de quantités apparaît par exemple dans le théorème d’ergodicité quantique sur lequel nous reviendrons au paragraphe suivant. Leur étude systématique pour les problèmes d’équations aux dérivées partielles est due à Tartar [61], Gérard [27, 26], Lions-Paul [44], etc. Nous renvoyons par exemple à l’article de Burq dans ce même séminaire pour plus de précisions à ce sujet [12]. Le théorème de Calderón-Vaillancourt [70, Th. 4.23] nous assure que la suite µλ est bornée dans D0 (T ∗ M ). Nous notons M (∞) l’ensemble de ses points d’accumulation lorsque λ → +∞. Les éléments de M (∞) sont appelés les mesures semi-classiques de l’opérateur de Schrödinger. Les théorèmes d’analyse semi-classique nous permettent en effet de démontrer [70, Ch. 5] que tout élément µ de M (∞) est une mesure de probabilité à support dans le fibré unitaire cotangent S ∗ M et invariante par le flot géodésique ϕt : T ∗ M → T ∗ M. Les mesures de probabilité invariantes peuvent être régulières (mesure de Liouville) ou très singulières (mesure portée par une géodésique fermée). L’une des questions au cœur de cet exposé est d’essayer de caractériser parmi elles les mesures semiclassiques. Autrement dit, quelles mesures invariantes peuvent effectivement être obtenues comme limites de fonctions propres de l’opérateur de Schrödinger ? On cherche notamment à comprendre leur régularité. Finalement, pour faire le lien avec l’ensemble plus simple N (∞), mentionnons que l’on a ®Z ´ N (∞)
= ∗M Sx
µ(x, dξ) : µ ∈ M (∞) .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
342
G. RIVIÈRE
Pour illustrer le principe de correspondance semi-classique et l’influence de la dynamique du flot géodésique sur la structure des fonctions propres, nous décrivons maintenant quelques propriétés connues de ces mesures semi-classiques dans trois cadres dynamiques assez distincts. 1.2. Le cas des variétés à courbure négative Commençons par le cas historique des variétés à courbure strictement négative. Il s’agit du cadre diamétralement opposé à celui qui occupera le reste de l’exposé au sens où le flot géodésique est dans ce cas ergodique pour la mesure de Liouville sur S ∗ M . En utilisant cette propriété dynamique et la loi de Weyl microlocale, Šnirel0 man [60], Zelditch [67] et Colin de Verdière [17] démontrent la propriété dite d’ergodicité quantique : étant donnée une base orthonormée (ej )j≥0 de solutions de (1), on peut trouver S ⊂ N de densité 1 tel que Z Z 1 2 0 a(x)|ej (x)| dVolg (x) = (2) ∀a ∈ C (M ), lim a(x)dVolg (x). j→+∞,j∈S M Volg (M ) M Autrement dit, le volume riemannien est un élément de N (∞) et la plupart des fonctions propres d’une base orthonormée ont tendance à s’équidistribuer sur M . Le résultat s’étend en fait aux distributions de Wigner : Z (3) ∀a ∈ Cc∞ (T ∗ M ), lim hµλj , ai = a(x, ξ)dL(x, ξ), j→+∞,j∈S
S∗ M
où L est la désintégration de la mesure de Liouville sur S ∗ M . Ce théorème est à la base de la conjecture d’unique ergodicité quantique de Rudnick et Sarnak [56] qui affirme que l’on n’a en fait pas besoin d’extraire une sous suite, i.e. S = N. Cette conjecture reste largement ouverte même si de nombreux résultats ont été obtenus ces quinze dernières années [22, 43, 2, 7, 39, 30, 21]. Nous renvoyons par exemple à l’article de Colin de Verdière dans ce séminaire pour une description d’une partie de ces résultats [18]. Le résultat d’ergodicité quantique est assez robuste et s’étend à toutes les situations où l’on a un flot hamiltonien ergodique pour la mesure de Liouville [32]. En particulier, Gérard-Leichtnam et Zelditch-Zworski ont démontré qu’il reste valable pour des variétés à bord pour lesquelles la mesure de Liouville est ergodique [28, 69]. Notons toutefois qu’à l’exception du résultat [30], nous en savons beaucoup moins sur la structure des mesures semi-classiques dans le cas à bord. 1.3. Le cas du tore L’article d’Anantharaman, Léautaud et Macià s’intéresse à la situation des systèmes intégrables et plus précisément au cas de l’équation de Schrödinger sur le disque. Avant d’y venir, commençons par décrire ce qui est connu dans le cas
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
343
(sans bord) du tore Td = Rd /2πZd muni de sa métrique canonique sous l’hypothèse V ≡ 0 : c’est l’exemple le plus simple d’un système complètement intégrable (non dégénéré). Dans ce cadre particulier, nous pouvons faire appel à des techniques d’analyse harmonique et de théorie des nombres pour décrire la structure de N (∞). Rappelons en effet que, pour V ≡ 0, toute solution ψλ de (1) est de la forme X X ψλ = b ck eik.x , |b ck |2 = 1. k∈Zd :kkk2 =2λ
k∈Zd :kkk2 =2λ
Ainsi, la structure des vecteurs propres du laplacien est intimement liée dans ce cadre à la description des solutions de l’équation diophantienne k12 + k22 + · · · + kd2 = 2λ dans Zd . Or le nombre de solutions de cette équation tend vers +∞ le long de certaines sous-suites λn → +∞ [29]. En d’autres termes, le spectre du laplacien a de fortes multiplicités et ceci rend délicat la description des vecteurs propres lorsque λ tend vers l’infini. En se basant sur cette structure arithmétique, Zygmund [71] a démontré 1 que, pour d = 2, V ≡ 0 et pour toute solution de (1), kψλ kL4 (T2 ) ≤ 5 4 . Ceci implique en particulier que tout élement de N (∞) est dans ce cas absolument continu par rapport à la mesure de Lebesgue sur le tore et que la densité des mesures est en fait un élément de L2 . Ceci exclut la possiblité qu’une suite de fonctions propres se concentre sur une orbite périodique du flot géodésique. Toujours en dimension 2, Jaffard a quant à lui démontré que cette densité était strictement positive presque partout [35] en utilisant la théorie des séries de Fourier lacunaires de Kahane [38]. Ce résultat a été ensuite généralisé par Jakobson [36] qui a démontré, en se ramenant à la résolution de certaines équations de Pell, que tout élément de N (∞) est en fait un polynôme trigonométrique dont les modes de Fourier sont contenus dans deux cercles centrés en l’origine. Pour d ≥ 3 et en se servant aussi de la structure arithmétique sous-jacente, Bourgain a démontré que les éléments de N (∞) restaient des mesures absolument continues par rapport à la mesure de Lebesgue [36] et leur régularité a été décrite par Jakobson dans ce même article. Dans le cas où V ne s’annule pas, les méthodes d’analyse harmonique continuent de s’appliquer et nous pouvons par exemple mentionner l’article de Bourgain, Burq et Zworski en dimension 2 [10] – voir aussi [15]. Finalement, mentionnons que Marklof et Rudnick ont démontré la version faible (2) du théorème d’ergodicité quantique dans le cas du tore [51] même si (3) n’est pas vraie pour une base orthonormée quelconque. Dans ce contexte géométrique, il est toutefois nécessaire d’extraire une sous-suite pour assurer la convergence vers la mesure volume [42]. L’avantage de ces techniques d’analyse harmonique est de donner des résultats très précis sur la régularité des solutions [36] et de pouvoir être poussées jusqu’à traiter des potentiels peu réguliers en dimension 2 [10, 15]. Toutefois, elles se généralisent a priori
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
344
G. RIVIÈRE
mal à des systèmes intégrables plus généraux comme ceux qui nous intéressent ici. Avec cet objectif en tête, il est donc nécessaire de comprendre comment ces résultats peuvent être obtenus par des techniques différentes qui sont d’une certaine manière plus robustes du point de vue de la dynamique classique. En utilisant des outils d’analyse semi-classique, Anantharaman et Macià ont démontré en toute dimension l’absolue continuité des élément de N (∞) pour des potentiels assez généraux et étendu cette régularité aux solutions de l’équation de Schrödinger dépendant du temps [47, 6]. Par ailleurs, leur argument permet de donner une nouvelle démonstration du théorème de Jaffard. En dimension 2, ces résultats peuvent aussi être obtenus plus directement comme conséquence de l’analyse de Burq et Zworski dans [16, 14] dont les démonstrations sont intermédiaires entre les deux types d’approche. Pour résumer, par des méthodes diverses et variées, on a le théorème suivant dans le cas du tore : Théorème 1.1 ([71, 35, 36, 16, 47, 6, 14, 10]). — Pour d ≥ 1 et V ∈ C ∞ (Td , R), on a : 1. N (∞) ⊂ L1 (Td ), 2. pour tout ouvert non vide ω de Td , il existe C(ω) > 0 telle que ∀ν ∈ N (∞),
ν(ω) ≥ C(ω).
La stratégie (semi-classique) d’Anantharaman et Macià pour démontrer ce théorème consiste à introduire des généralisations des distributions de Wigner pour étudier la régularité des solutions de (1) au voisinage de sous-variétés où le flot géodésique remplit des tores invariants de dimension < d, e.g. le long de géodésiques fermées. On parle de seconde microlocalisation le long de ces sous-variétés invariantes et nous reviendrons plus en détail sur l’exemple du tore ainsi que sur cette procédure qui est plus ou moins classique en analyse microlocale [58, 40, 9, 20, 54, 59, 24]. L’avantage de cette approche est qu’elle se généralise à des systèmes complètement intégrables plus généraux (non dégénérés) que le tore. Elle met ainsi en lumière le fait que la régularité des éléments de N (∞) est essentiellement due à la structure complètement intégrable du système classique. Par exemple, Anantharaman, Fermanian-Kammerer et Macià ont démontré comment étendre cette analyse à des systèmes complètement intégrables dont l’hamiltonien classique sous-jacent est une fonction strictement convexe des variables d’action [3]. Notons que ces procédures de seconde microlocalisation étaient aussi au cœur de la série de travaux de Vasy et Wunsch [65, 63, 66] sur la régularité des quasi-modes pour les systèmes complètement intégrables en dimension 2 via la notion de front d’onde. Enfin, cette stratégie est centrale dans l’article d’Anantharaman, Léautaud et Macià [5] que nous voulons décrire ici et qui concerne le cas du disque euclidien.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
345
1.4. Le cas de la sphère Pour conclure cette introduction, discutons brièvement le cas de systèmes complètement intégrables dégénérés comme la sphère munie de sa métrique canonique. Dans ce cas et en supposant V ≡ 0, Jakobson et Zelditch ont démontré [37], en se servant de la structure algébrique sous-jacente, que toute mesure invariante par le flot géodésique appartient à l’ensemble M (∞). En particulier, l’ensemble M (∞) est de taille maximale dans ce cadre géométrique. Ce résultat a été généralisé aux autres variétés compactes symétriques de rang 1 par Macià [45] en se servant de méthodes de nature plus semi-classique – voir aussi [8, 34] pour d’autres démonstrations. Notons toutefois que, si V n’est pas identiquement nul ou si (M, g) est une variété de Zoll quelconque (3), cette propriété n’est plus satisfaite en général [48, 50]. Finalement, si on revient au cas où V ≡ 0, on a la propriété d’unique ergodicité quantique pour un choix aléatoire de base orthonormée de fonctions propres [68, 62] et la version faible (2) est vérifiée pour des bases vérifiant certaines symétries de type Hecke [11].
2. MESURES SEMI-CLASSIQUES DÉPENDANT DU TEMPS Jusqu’à présent, nous nous sommes limités, par souci de simplicité, au cas stationnaire mais les quantités et la plupart des résultats de l’introduction se généralisent au cas de l’équation dépendant du temps que nous allons maintenant décrire afin de pouvoir énoncer le résultat d’Anantharaman, Léautaud et Macià dans toute sa généralité. Le problème qui nous intéresse est donc Å ã ∆g (4) i∂t un = − + V un , un (t = 0) = ψn , 2 où (ψn )n∈N est une suite normalisée dans L2 (M ). Nous continuons de décrire le cas d’une variété sans bord. On s’intéresse à la suite des solutions (un ) de cette équation et, de nouveau, on se place dans un cadre semi-classique où la suite (ψn )n∈N de conditions initiales correspond à des états de plus en plus « excités ». En plus d’être normalisées dans L2 , on suppose donc aussi que ces états oscillent à une fréquence ~−1 n , i.e. X (5) lim lim sup |hej , ψn iL2 |2 = 0 R→+∞ n→+∞
j:~2n λj ≥R
et (6)
lim+ lim sup
δ→0
(3)
n→+∞
X
|hej , ψn iL2 |2 = 0,
j:~2n λj ≤δ
C’est-à-dire dont toutes les géodésiques sont fermées.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
346
G. RIVIÈRE
où (ej )j≥0 est une base orthonormée de fonctions propres de ∆g (associées aux valeurs propres λj ) et ~n → 0+ lorsque n tend vers +∞. Afin d’alléger la présentation, nous faisons par la suite l’abus de notation (standard en analyse semi-classique) d’omettre le paramètre n et donc de considérer la limite ~ → 0+ . De nouveau, on cherche à étudier les points d’accumulation des distributions de Wigner associées à ces suites de solutions. L’étude systématique de ces objets dans le cas dépendant du temps a été faite par Macià dans [46]. Remarque 2.1. — Observons que, pour une suite quelconque de données initiales (ψn )n≥1 , on ne peut pas forcément trouver une suite ~n → 0+ de telle sorte que (5) et (6) soient satisfaites simultanément. On pourrait prolonger l’analyse de cet exposé à des données plus générales mais nous ne discutons pas cette question ici. Nous renvoyons le lecteur désireux d’en savoir plus à [5, §2.1, §2.6] pour une discussion précise sur les hypothèses d’oscillation des données initiales. Fixons maintenant une suite (ψ~ )~→0+ normalisée dans L2 (M ) et vérifiant les hypothèses (5) et (6). Quitte à extraire une sous-suite, on peut toujours supposer que, pour tout θ dans L1 (R) et pour toute a dans C 0 (M ), Z Z ÅZ ã ÅZ ã lim+ θ(t) a(x)|u~ (x, t)|2 dVolg (x) dt = θ(t) a(x)dνt (x) dt, ~→0
M
R
R
M
où, pour presque tout t dans R, νt est une mesure de probabilité sur M . On note par la suite NSchr l’ensemble des éléments t 7→ νt obtenus de cette manière et notre objectif est de décrire la régularité de ces objets (e.g. absolue continuité) dans le cas de systèmes complètement intégrables. Une nouvelle fois, leur étude repose sur la description de leur relevé à l’espace cotangent : w~ (t) : Cc∞ (T ∗ M ) 3 a 7→ hu~ (t), Op~ (a)u~ (t)iL2 ∈ C. D’après [46], on peut, quitte à extraire une nouvelle sous-suite, supposer que, pour tout θ dans L1 (R) et pour toute a dans Cc∞ (T ∗ M ), Z Z ÅZ ã lim+ θ(t) hw~ (t), ai dt = θ(t) a(x, ξ)dµt (x, ξ) dt, ~→0
R
R
T ∗M
où, pour presque tout t dans R, µt est une mesure de probabilité invariante par le flot géodésique et supportée dans T ∗ M . On note MSchr l’ensemble de ces points d’accumulation qui sont donc des familles de mesures de probabilité. En utilisant (6), on a µt (M × {0}) = 0 pour presque tout t dans R. Remarque 2.2. — Comme ce type d’argument reviendra à de multiples reprises dans la suite, expliquons comment déterminer cette propriété d’invariance. Pour cela, nous
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
347
devons dériver la distribution de Wigner et exploiter le fait que u~ (t) résout l’équation de Schrödinger (4) : ≠ ï ò ∑ d 1 hw~ (t), ai = i u~ (t), − ∆g + V, Op~ (a) u~ (t) dt 2 ≠ ß ™∑ kξk2x 1 w~ (t), , a(x, ξ) + O (1), = ~ 2 où {., .} est le crochet de Poisson [70, p. 20]. La seconde égalité est une conséquence du théorème de composition des opérateurs pseudo-différentiels [70, Th. 4.18] et du théorème de Calderón-Vaillancourt [70, Th. 4.23]. En intégrant contre une fonction test θ dans Cc∞ (R) et en utilisant le théorème de Calderón-Vaillancourt une nouvelle fois, on trouve, après passage à la limite ~ → 0+ , Z ≠ ß ™∑ kξk2x θ(t) µt , , a(x, ξ) dt = 0. 2 R kξk2
x Rappelons que H(x, ξ) := est l’hamiltonien associé au flot géodésique. 2 En particulier, si on note X le champ de vecteurs hamiltonien générant le flot géodésique ϕs , la relation précédente se lit, pour presque tout t dans R,
X(µt ) = 0, ou, de manière équivalente, pour presque tout t dans R, ∀s ∈ R,
ϕs∗ µt = µt .
Par la suite, nous serons amenés à raffiner ce type de raisonnement afin d’en tirer le maximum de propriétés d’invariance des élements µt . On a, comme précedemment, ® Z NSchr
=
t 7→ Tx∗ M
´ µt (x, dξ) : t 7→ µt ∈ MSchr .
Remarque 2.3. — Le fait que tout élement νt de NSchr soit le poussé en avant d’une mesure de probabilité positive µt ne chargeant pas {ξ = 0} et vérifiant l’équation (au sens des distributions) ß ™ kξk2x , µt (x, ξ) = 0 2 nous indique déjà certaines propriétés de régularité des νt . Par exemple, νt ne peut pas être portée par un point. Dans le cas des systèmes complètement intégrables, nous verrons comment dériver encore plus de propriétés de régularité de la limite.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
348
G. RIVIÈRE
On cherche donc à décrire la structure de MSchr pour en déduire des propriétés de l’ensemble NSchr . Notons que les résultats de la section 1 admettent en fait des généralisations à ce cadre dépendant du temps mais nous n’y revenons pas pour nous concentrer sur le cas des systèmes intégrables et sur les nouvelles questions que soulève cette approche et les possibilités qu’elle offre. 2.1. Nouvelles questions et lien avec le cas stationnaire En plus des questions de régularité mentionnées plus haut, on peut se demander quel est le lien entre la solution au temps t et la suite de conditions initiales. Quitte à extraire encore une fois une sous-suite, on peut supposer que, pour toute a dans Cc∞ (T ∗ M ), Z lim+ hw~ (0), ai = lim+ hψ~ , Op~ (a)ψ~ iL2 = a(x, ξ)dµ0 (x, ξ), ~→0
T ∗M
~→0
∗
où µ0 est une mesure de probabilité sur T M . De nouveau, les hypothèses de fréquence permettent de vérifier que la mesure limite ne charge pas la section nulle. En revanche, µ0 n’est pas en général invariante par le flot géodésique puisqu’on peut avoir a priori n’importe quelle mesure de probabilité. On peut raisonnablement se demander si µt est complètement déterminée par µ0 . Pour le cas des systèmes complètement intégrables qui nous occupe, nous verrons que ce n’est pas le cas et l’objectif de cet exposé est de reconstruire complètement µt à partir de certaines familles de fonctionnelles linéaires associées à la suite des données initiales. Bien entendu, reconstruire µt à partir de la suite des données initiales permet de déduire des propriétés de régularité en se basant sur la représentation explicite que nous aurons réussi à obtenir. Remarque 2.4. — À titre d’exemple, on peut considérer le cas du cercle S1 = R/2πZ muni de sa métrique canonique. Pour a(ξ) ∈ Cc∞ (R), on a ≠ ï ò ∑ d ∆ hw~ (t), a(ξ)i = i u~ (t), − + V, Op~ (a(ξ)) u~ (t) = O (~), dt 2 où l’on a utilisé le théorème de composition pour les opérateurs pseudo-différentiels. Ainsi, en intégrant contre une fonction test θ dans Cc1 (R) et en passant à la limite ~ → 0+ , on trouve Z ÅZ ã θ0 (t) a(ξ)µt (dx, dξ) dt = 0. R
S1 ×R
R
Ainsi, S1 ×R a(ξ)µt (dx, dξ) est indépendante du temps. L’invariance par le flot géodésique ϕs : (x, ξ) 7→ (x + sξ, ξ) et le fait que µt ({ξ = 0}) = 0 nous permettent alors de conclure que Z µt (x, ξ) = µ0 (dx0 , ξ). S1
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
349
Dans cet exemple particulier, la mesure µt est donc complètement déterminée par µ0 et la projection sur S1 est aussi régulière que possible. Notons que, dans cet exemple particulier, µt (x, ξ) ne dépend in fine ni de t ni de x. Faisons l’observation que l’on pourrait considérer la version semi-classique de l’équation de Schrödinger : Å 2 ã ~ ∆g i~∂t v~ = − + ~2 V v~ , v~ (t = 0) = ψ~ , 2 où nous rappelons que V ne dépend pas de t. Avec cette convention, le fait de considérer u~ (t) solution de (4) revient à se placer sur une échelle de temps semiclassique d’ordre 1/~. C’est bien entendu naturel mais on aurait pu aussi regarder une autre échelle τ~ → +∞. Les résultats obtenus sur la structure des mesures limites seraient alors différents. Nous nous contentons de dire que l’échelle 1/~ est en fait la taille critique jusqu’à laquelle on peut reconstruire la mesure au temps t à partir des données initiales pour les systèmes intégrables non dégénérés et nous renvoyons à l’article d’Anantharaman, Fermanian-Kammerer et Macià [3, § 6] pour une discussion plus détaillée sur ces aspects. Finalement, notons que si les conditions initiales (ψ~ )~→0+ vérifient l’équation des quasi-modes (4) Å 2 ã ~ ∆g − + ~2 V ψ~ = ψ~ + o(~2 ), 2 alors hw~ (t), ai = hw~ (0), ai + ot (1) pour toute a dans Cc∞ (T ∗ M ). Ainsi, la mesure limite vérifie µt = µ0 pour presque tout t dans R. En particulier, toute information obtenue à partir du cas non stationnaire nous permet de déduire des propriétés sur les mesures semi-classiques de quasi-modes. Même si la version dépendant du temps est légèrement plus précise, il est possible de déduire un grand nombre d’informations sur le problème non stationnaire à partir de l’étude des quasi-modes. Pour cet aspect du problème, nous renvoyons par exemple à l’article de Burq et Zworski qui établit un lien entre ces deux questions [13, Th. 4]. 2.2. Le cas du disque Concentrons-nous maintenant sur le cas de la dynamique de l’équation de Schrödinger sur le disque. Pour cela, il convient avant toute chose de fixer quelques notations. Le disque euclidien est défini comme suit D := z = (x, y) ∈ R2 : x2 + y 2 < 1 . (4)
De manière équivalente, on parle de solutions quasi-stationnaires de l’équation de Schrödinger.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
350
G. RIVIÈRE
L’équation qui nous intéresse est alors ( i∂t u = − ∆ (x, y) ∈ D 2 + V u, t ∈ R, (7) , u(t = 0) = ψ, ue∂D = 0 où V appartient à C ∞ (D, R). Comme précédemment, on peut introduire les ensembles MSchr et NSchr associés à des suites de données initiales oscillantes et chercher à décrire leur régularité ainsi que leur dépendance par rapport aux conditions initiales. De nouveau, ce sont des mesures de probabilité dont le support le long de la variable x est inclus dans D. Remarque 2.5. — Rappelons que le Laplacien s’écrit de la manière suivante en coordonnées polaires (r, ϑ) ∈ (0, 1] × S1 : ∆u = ∂r2 u + r−1 ∂r u + r−2 ∂ϑ2 u. En décomposant en série de Fourier le long de la variable angulaire, on trouve que les vecteurs propres sont de la forme ± ψn,k (r, ϑ) = e±inϑ Jn (αn,k r),
où Jn est la n-ième fonction de Bessel et (αn,k )k≥1 la suite strictement croissante de 2 ses zéros. Dans ce cas, on peut vérifier que αn,k est la valeur propre correspondante du (5) Laplacien de Dirichlet −∆D . Rappelons qu’un résultat classique de Siegel démontre que Jn et Jm n’ont pas de zéros communs (à l’exception de 0) dès que n 6= m. La description des éléments de MSchr en fonction des conditions initiales nécessite l’introduction d’un peu de formalisme. Nous nous limitons à ce stade de l’exposé à l’énoncé de quelques conséquences marquantes de ce résultat sur la régularité des éléments de NSchr . Rappelons-nous que les résultats s’appliquent notamment au cas 2 des quasi-modes de − ~ 2∆ + ~2 V d’ordre o(~2 ) pour lesquels t 7→ νt est indépendant du temps – voir [4] pour une discussion détaillée de ce cas. Un premier résultat de régularité est le suivant : Théorème 2.6 ([5]). — Soit t 7→ νt un élément de NSchr sur D. Alors, il existe ε dans [0, 1] tel que, pour presque tout t dans R, on peut trouver une mesure de probabilité ν˜t absolument continue vérifiant (6) 1 δ∂D , 2π En particulier, νt eD est absolument continue pour presque tout t dans R. νt = ε˜ νt + (1 − ε)
(5) (6)
Par la suite, on utilisera l’indice D pour rappeler la condition au bord. Ici, δ∂D (r, ϑ) := δ0 (r − 1) est la mesure de Lebesgue le long du cercle de rayon r = 1 centré en 0.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
351
Notons que ce théorème n’interdit pas que νt se concentre sur le bord ∂D, i.e. le cas ε = 0. À titre d’exemple, il suffit de considérer le cas où V ≡ 0 et la suite de + vecteurs propres du Laplacien de Dirichlet (ψn,k )n≥1 avec k ≥ 1 fixé. Dans ce cas, on peut démontrer que la mesure limite est égale à (2π)−1 δ∂D [5]. Notons tout de même que ce théorème exclut la possibilité qu’une suite de vecteurs propres se concentre le long d’une orbite fermée du flot du billard (à l’exception de la trajectoire au bord). Concernant le bord, nous pouvons mentionner le résultat suivant qui est aussi obtenu dans l’article [5] que nous présentons :
Théorème 2.7 ([5]). — Pour tout ouvert ω de D intersectant ∂D et pour tout T > 0, il existe C(T, ω) > 0 telle que, pour tout t 7→ νt dans NSchr , Z
T
νt (ω)dt ≥ C(T, ω). 0
Lorsque cette propriété est satisfaite, on dit que les solutions de l’équation de Schrödinger sont observables sur l’ouvert ω en tout temps T > 0. En d’autres termes, ceci signifie que, pour presque tout temps, la densité de probabilité quantique sur l’ouvert ω est strictement positive. Une nouvelle fois, l’hypothèse d’intersecter le bord est cruciale dans l’énoncé du théorème. Ce théorème est intimement lié à la question du contrôle de l’équation de Schrödinger que nous n’évoquons pas vraiment dans cet exposé pour nous concentrer plutôt sur la dynamique de l’équation de Schrödinger sans terme source (7). En plus de [5], nous renvoyons le lecteur aux articles de Lebeau [41] et de Burq et Zworski [13] pour plus de détails sur ces questions. Ces deux théorèmes sont les analogues du théorème 1.1 dans le cas du disque et dans le cas dépendant du temps. Comme nous l’avons déjà dit, ce sont des conséquences plus ou moins simples d’un résultat de structure des éléments de MSchr . Précisément, Anantharaman, Léautaud et Macià réussissent à déterminer complètement un élément t 7→ µt en fonction de la suite de conditions initiales utilisées pour le générer. À partir de cette expression, il faut bien sûr travailler encore un peu pour déduire les propriétés de régularité que nous venons d’énoncer, e.g. utiliser des propriétés de prolongement unique. Dans la suite de ce texte, nous chercherons surtout à comprendre comment les éléments de MSchr peuvent être exprimés en fonction des données initiales, ce qui est en fait le coeur de l’analyse faite dans [5]. Nous renvoyons le lecteur à la section 7 de cette référence pour comprendre comment ce résultat de structure de MSchr implique les deux théorèmes que nous venons d’énoncer.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
352
G. RIVIÈRE
3. LE CAS DU TORE Avant de décrire la structure des mesures semi-classiques µt sur le disque, commençons par nous intéresser à la structure des mesures semi-classiques dans le cas du tore euclidien T2 lorsque V ≡ 0. Ceci nous familiarisera avec les outils utilisés ainsi qu’avec la stratégie mise en œuvre dans ce type de démonstration. Ce modèle nous évite les problématiques liées à la présence du bord et nous permet de travailler avec un système complètement intégrable non dégénéré qui se présente directement sous une forme « action-angle ». Ce cas avait été traité par Macià dans [47] et nous reprenons ici sa démonstration en nous inspirant de la généralisation de ce résultat qu’il a donné en dimension d ≥ 2 avec Anantharaman dans [6] – voir aussi [3, 49]. 3.1. Structure des mesures semi-classiques Afin d’énoncer un résultat de structure dans le cas du tore, nous avons besoin de fixer quelques conventions. On suppose dans toute cette section que V ≡ 0. On note L1 l’ensemble des sous-réseaux primitifs Λ de Z2 qui sont de rang 1. Ceci signifie que dimhΛi = 1 et que hΛi ∩ Z2 = Λ où hΛi est le R-espace vectoriel engendré par Λ. Pour chaque Λ dans L1 , on fixe eΛ ∈ Z2 tel que ZeΛ = Λ. On note aussi e⊥ Λ l’élément de Z2 qui lui est directement orthogonal, LΛ la longueur commune de ces 2 deux vecteurs et Λ⊥ = Re⊥ Λ . Le flot géodésique sur le tore T s’écrit ϕs : (x, ξ) ∈ T ∗ T2 7→ (x + sξ, ξ) ∈ T ∗ T2 , qui est périodique dans chacune des directions Λ⊥ − {0}. Par contraste, si ξ appartient à Å[ ã 2 ⊥ Ω2 := R \ Λ , Λ∈L1
alors, pour toute a dans Cc∞ (T ∗ T2 ), on a Z Z 1 T 1 s lim a ◦ ϕ (x, ξ)ds = a(x0 , ξ)dx0 . T →+∞ T 0 (2π)2 T2 Remarquons que chacun des T2 × Λ⊥ − {0} est feuilleté par des tores invariants de dimension 1 (les géodésiques périodiques) et T2 × Ω2 est quant à lui feuilleté par des tores invariants de dimension 2. Ce sont les tores invariants du sytème complètement intégrable sur T2 × R2 − {0}. Fixons maintenant un élément t 7→ µt dans MSchr . Comme µt ne charge pas T2 × {0}, décomposons-le selon les sous-ensembles invariants que nous venons juste d’introduire : X (8) µt = µt eT2 ×Ω2 + µt eT2 ×Λ⊥ −{0} . Λ∈L1
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
353
Écrivons aussi la décomposition de Fourier de cette mesure : X eik.x µ bk,t (ξ) µt = . (2π)2 2 k∈Z
En utilisant l’invariance de µt par le flot géodésique, µt peut alors se récrire X IΛ (µt )eT2 ×Λ⊥ −{0} , (9) µt = µ b0,t eT2 ×Ω2 + Λ∈L1
où IΛ (µt )
=
X
µ bk,t (ξ)
k∈Λ
eik.x . (2π)2
On peut vérifier que, pour presque tout t dans R, IΛ (µt ) est encore une mesure positive. Fixons maintenant a(ξ) appartenant à Cc∞ (R2 ). On peut faire le même calcul que sur le cercle : ≠ ï ò ∑ ∆ d w (a)u (t)i = i u (t), − (a(ξ)) u (t) = 0, (10) hu~ (t), Opw , Op ~ ~ ~ ~ ~ dt 2 où la seconde égalité vient du théorème de composition pour la quantification de Weyl [70, Chap. 4]. Remarque 3.1. — Remarquons qu’on fait ici un choix particulier de quantification en choisissant d’utiliser la quantification de Weyl Opw ~ . On aurait aussi pu utiliser la quantification standard Op~ et le calcul précédent resterait vrai. En revanche, les choix de quantification vont affecter en un certain sens les objets 2-microlocaux que nous allons introduire dans un instant. Par exemple, l’énoncé du théorème 3.2 cidessous dépend implicitement du choix de quantification et un autre choix mènerait à une formulation légèrement différente. De (10), on déduit que le mode de Fourier d’indice 0 est indépendant de t dans R. Ainsi, pour a dans Cc∞ (T ∗ T2 ) et pour presque tout t dans R, on trouve finalement (7) Z Z Z Å ã 1 0 0 a(x, ξ)dµt (x, ξ) = a(x , ξ)dx dµ0 (x, ξ) (2π)2 T2 T ∗ T2 T ∗ T2 Z X ˚Λ (a)dµt (x, ξ), + I Λ∈L1
T2 ×Λ⊥
où ˚Λ (a)(x, ξ) I
:=
X k∈Λ−{0}
b ak (ξ)
eik.x . 2π
Il nous suffit donc de déterminer la restriction de µt le long des orbites périodiques du flot géodésique. Pour cela, on analysera précisément la structure des solutions de (7)
On peut remplacer l’intégrale sur Λ⊥ − {0} par une intégrale sur Λ⊥ grâce à l’hypothèse (6).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
354
G. RIVIÈRE
l’équation de Schrödinger au voisinage de chacun des sous ensembles T2 × Λ⊥ − {0} et on définit la généralisation suivante des distributions de Wigner : ãã ∑ Å ≠ Å ˚Λ (a) x, ξ, hξ, eΛ i ψ~ . w ˜Λ,~ : a ∈ Cc∞ (T ∗ T2 × R) 7→ ψ~ , Opw I ~ LΛ ~ L2 Ces nouvelles familles de distributions mesurent la façon dont les données initiales se concentrent dans un voisinage de taille ~ de Λ⊥ et on dit qu’on effectue une seconde microlocalisation le long de la sous-variété T2 × Λ⊥ . De nouveau, quitte à extraire via un procédé diagonal, on peut supposer que, pour tout Λ dans L1 , la suite de distributions (w ˜Λ,~ )~→0+ converge vers une certaine limite µ ˜Λ,0 dont on peut écrire la décomposition de Fourier X eik.x µ ˜Λ,0 (x, ξ, η) = µ b0k (ξ, η) . 2π k∈Λ−{0}
On parle de mesures 2-microlocales. Ce type de raffinement des mesures semiclassiques a été introduit par Fermanian-Kammerer [23], Miller [53] et Nier [54] et ces objets joueront un rôle crucial dans l’analyse à venir. Notons que, grâce à [57, Th. 4.8.1], on sait que µ b0k (ξ, η) est une mesure de Radon finie même si µ ˜Λ,0 n’en est pas une a priori. Nous pouvons maintenant formuler le théorème de structure dans le cas du tore : Théorème 3.2 ([47, 6]). — Supposons que V ≡ 0 et que d = 2. Alors, pour tout t 7→ µt dans MSchr , on a Z Z Z Å ã 1 0 0 a(x, ξ)dµt (x, ξ) = a(x , ξ)dx dµ0 (x, ξ) (2π)2 T2 T ∗ T2 T ∗ T2 Å ã XZ eΛ + a x + tη , ξ d˜ µΛ,0 (x, ξ, η), LΛ T ∗ T2 ×R Λ∈L1
où µ0 et (˜ µΛ,0 )Λ∈L1 sont les distributions associées à la suite de données initiales (ψ~ )~→0+ utilisée pour générer µt . Ce théorème permet donc de déterminer complètement µt à partir des conditions initiales en faisant intervenir à la fois la mesure semi-classique de la suite de données initiales et ces mesures 2-microlocales qui quantifient la concentration des données initiales dans un voisinage de taille ~ des orbites périodiques du flot géodésique. Notons en particulier que la seule connaissance de µ0 ne permet pas de déterminer µt – voir [46, Prop. 11] pour un exemple explicite. Ce résultat s’étend à des potentiels assez généraux et aussi en dimension d ≥ 3. Maintenant que nous avons cette description complète de µt , la question de la régularité en x consiste à comprendre la régularité en x des (˜ µΛ,0 (x + teΛ /LΛ , ξ, η))Λ∈L1 . À titre d’illustration, nous verrons au paragraphe 3.5 que l’on a la propriété suivante :
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
355
Corollaire 3.3. — Supposons que V ≡ 0 et que d = 2. Alors, pour tout t 7→ νt dans NSchr et pour presque tout t dans R, νt appartient à L1 (T2 ). En d’autres termes, la mesure est absolument continue. En particulier, ceci implique la partie 1 du théorème 1.1 lorsque V ≡ 0 et d = 2. De nouveau, ce résultat reste vrai pour des tores de dimension d ≥ 3 et des potentiels plus généraux. Ce type de stratégie permet aussi de traiter le cas de systèmes complètement intégrables dont l’hamiltonien est une fonction strictement convexe des variables d’action [3]. Dans le cas du disque, l’objectif est de mettre en place la même stratégie que sur le tore mais cette fois-ci, plusieurs difficultés vont s’ajouter : le système ne se présente pas directement dans un système de coordonnées action-angle et les conditions aux bords s’expriment mal dans ces coordonnées. 3.2. Seconde microlocalisation le long des tores d’orbites périodiques Démontrons maintenant ce théorème de structure sur le tore. Nous avons vu précédemment que tout revenait à comprendre la structure des mesures semiclassiques le long des orbites périodiques T2 × (Λ⊥ − {0}). L’invariance par le flot géodésique nous a aussi permis de réduire la question à l’analyse des mesures Z ∞ ∗ 2 ˚Λ (a)dµt (x, ξ). a ∈ Cc (T T ) 7→ I T2 ×Λ⊥
En d’autres termes, nous ne devons nous soucier que des coefficients de Fourier le long du sous-réseau Λ. Pour Λ dans L1 , nous introduisons donc ≠ Å Å ãã ∑ ˚Λ (a) x, ξ, hξ, eΛ i b 7→ u~ (t), Opw I w~,Λ (t) : a ∈ Cc∞ (T ∗ T2 × R) u (t) , ~ ~ LΛ ~ L2 où u~ (t) est la solution de l’équation (4). b = R ∪ {±∞} ' [−1, 1] et on se servira des propriétés Remarque 3.4. — On note R classiques des opérateurs pseudo-différentiels que l’on peut par exemple retrouver dans [70, Ch. 4 et 5]. Λi D’une certaine manière, le fait d’introduire cette nouvelle variable hξ,e LΛ ~ dans la distribution de Wigner nous permet de zoomer sur ce qui se passe à une distance ~ de l’ensemble T2 × Λ⊥ qui nous intéresse. On parle de seconde microlocalisation le long de la sous-variété T2 × Λ⊥ et nous allons voir que l’analyse de la structure de ces nouveaux objets est possible. En particulier, on pourra les déterminer complètement en fonction de la suite de conditions initiales, i.e. de µ ˜Λ,0 . Expliquons brièvement comment extraire des sous-suites de ces nouvelles distributions. En utilisant le théorème de Calderón-Vaillancourt [70, Th. 5.5], b 0 pour on peut vérifier que t 7→ w~,Λ (t) est une suite bornée dans L1 (R, C l (T ∗ T2 × R))
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
356
G. RIVIÈRE
un l assez grand. Ainsi, quitte à faire une extraction diagonale, on peut supposer que, b et pour tout θ dans L1 (R), pour tout Λ dans L1 , pour toute a dans Cc∞ (T ∗ T2 × R) Z Z lim θ(t)hw~,Λ (t), aidt = θ(t)hµΛ (t), aidt, ~→0+ l
R ∗
R 2
0
b pour presque tout t dans R. Écrivons maintenant où µΛ (t) appartient à C (T T × R) la décomposition de Fourier de a : ∏ Æ Z X Z eik.x b ak (ξ, η) dt. θ(t)hµΛ (t), aidt = θ(t) µΛ (t), 2π R R k∈Λ−{0}
b et pour tout θ En utilisant [57, Th. 4.8.1], on vérifie que, pour tout a ∈ Cc∞ (R2 × R) 1 dans L (R), Z ∏ Æ Z eik.x a(ξ, η) dt ≤ Ckkk3 |θ(t)| kakC 0 , θ(t) µΛ (t), R 2π R pour une certaine constante C > 0 indépendante de a et de k. Ainsi, pour presque R ik.x b et tout t dans R, T2 e2π µΛ (t, dx, ξ, η) est une mesure de Radon finie sur R2 × R 2 ⊥ 2 ⊥ on peut prendre sa restriction à T × Λ × R et à T × Λ × {±∞}. On les note respectivement µ bΛ,−k (t) et µ bΛ,−k (t). Relions maintenant ces quantités à celles qui nous intéressent originellement, i.e. ˚Λ (µt ). On a, pour toute a dans C ∞ (T ∗ T2 ) et pour tout θ dans L1 (R), I c Z ÅZ ã X Z ˚Λ (a)(x, ξ)µt (dx, dξ) dt = θ(t) I θ(t) hb µΛ,−k (t), b ak (ξ)i dt R
T2 ×Λ⊥
k∈Λ−{0}
+
R
X k∈Λ−{0}
Z R
Λ,−k θ(t) µ b (t), b ak (ξ) dt.
Nous allons maintenant séparer l’analyse de la partie à l’infini µ bΛ,−k (t, ξ, η) de la partie compacte µ bΛ,−k (t, ξ, η). Dans le premier cas, nous montrerons que cette quantité est nulle car nous pourrons en quelque sorte faire marcher l’argument qui permet de montrer l’invariance des mesures semi-classiques par le flot géodésique. L’idée heuristique est la suivante. On a seulement besoin de tester la distribution à l’infini contre des fonctions test ayant leurs coefficients de Fourier le long de Λ. Or, lorsqu’on regarde la partie à l’infini dans la seconde microlocalisation, on a coupé les covecteurs ξ qui sont à une distance ≤ R~ de Λ⊥ (avec R grand). Ainsi, lorsqu’on écrit le théorème d’Egorov sur des échelles de temps semi-classiques ~−1 , on réussit à montrer l’équidistribution en x. Pour µ bΛ,−k (t), on reprend le même argument mais cette fois les co-vecteurs sont à une distance d’ordre ~ et on n’a plus ce phénomène de régularisation en x par le flot géodésique. À la place, nous vérifierons que la distribution est déterminée par une certaine équation de transport. Dans les deux cas, le principe de démonstration consiste à revisiter la démonstration que nous
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
357
avons donnée pour l’invariance des µt par le flot géodésique et à essayer d’en tirer le maximum d’informations. Remarque 3.5. — Notons que l’on peut faire la même extraction pour le problème indépendant du temps associé à la suite de données intiales (ψ~ )~→0+ . De cette manière, on définit µΛ (0), µ bΛ,−k (0) et µ bΛ,−k (0) pour tout Λ dans L1 et pour tout k dans Λ − {0}. Observons aussi que µ bΛ,−k (0) coïncide avec la mesure µ b0−k définie plus haut. 3.3. Analyse de la partie à l’infini Fixons k dans Λ − {0} et commençons par démontrer que µ bΛ,−k (t) est nulle pour presque tout t dans R. Il suffit donc de vérifier que Z a(ξ, η)eik.x µΛ (t, dx, dξ, dη) = 0. T ∗ T2 ×{±∞}
Pour cela, on fixe une fonction χ ˜ ∈ C ∞ (R, [0, 1]) qui est égale à 1 pour η ≥ 2 et à 0 pour η ≤ 1. On pose alors aR (x, ξ, η) = χ ˜R (η)a(ξ, η)eik.x où χR (η) = χ(η/R) et on écrit (11) Å ≠ ∑ ≠ ï Å ããò ∑ d LΛ ~ R aR (x, ξ, η) ∆ hξ, eΛ i wΛ,~ (t), = i u~ (t), − , Opw a x, ξ, u (t) . ~ ~ dt η 2 hξ, eΛ i LΛ ~ En utilisant le théorème de composition pour les opérateurs pseudo-différentiels [70, Th. 4.14], ceci se récrit : ≠ ∑ ≠ Å Å ãã ∑ d aR (x, ξ, η) 1 LΛ ~ hξ, eΛ i w R wΛ,~ (t), = u~ (t), Op~ ξ.∂x a x, ξ, u~ (t) . dt η ~ hξ, eΛ i LΛ ~ Observons que la formule précédente est exacte car nous utilisons la quantification de Weyl. En utilisant l’expression de aR , on a alors ≠ ∑ ≠ ãã ∑ Å Å d aR (x, ξ, η) hk, eΛ i hξ, eΛ i w R wΛ,~ (t), =i u~ (t), Op~ a x, ξ, u~ (t) . dt η LΛ LΛ ~ On intègre alors contre une fonction θ dans Cc1 (R) et on trouve Z Z ≠ ∑ hk, eΛ i aR (x, ξ, η) θ(t)hµΛ (t), aR idt = lim+ i θ0 (t) wΛ,~ (t), dt. LΛ η ~→0 R R Une nouvelle application du théorème de Calderón-Vaillancourt nous permet vérifier que le terme de droite est un O (R−1 ). Ainsi, en faisant tendre R vers +∞, on trouve finalement que ÇZ å Z ik.x ∀k ∈ Λ − {0}, θ(t) a(x, η)e µΛ (t, dx, dξ, dη) dt = 0. R
T ∗ T2 ×{+∞}
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
358
G. RIVIÈRE
b Ceci étant valable pour toute fonction θ dans Cc1 (R) et pour toute a dans Cc∞ (R2 × R), Λ,−k on peut conclure que µ b (t)eΛ⊥ ×{+∞} ≡ 0. Le même argument étant valable pour la partie en −∞, on conclut donc Z X Z ˚Λ (a)dµt (x, ξ) = I b ak (ξ, η)db µΛ,−k (t, ξ, η), T2 ×Λ⊥
k∈Λ−{0}
Λ⊥ ×R
où le membre de gauche est la quantité que l’on doit calculer pour conclure la preuve du théorème. Remarque 3.6. — Nous avons déjà soulevé l’importance du choix de quantification dans notre seconde microlocalisation. Ici, ce choix ne changerait pas notre conclusion. En effet, si nous remplacions Opw ~ par Op~ , nous trouverions ≠ ∑ ≠ Å Å ãã ∑ aR (x, ξ, η) hk, eΛ i hξ, eΛ i d wΛ,~ (t), =i u~ (t), Op~ aR x, ξ, u~ (t) + Ok (R−1 ), dt η LΛ LΛ ~ qui nous mènerait au même résultat in fine. 3.4. Transport de la partie « compacte » Pour conclure, nous allons donc déterminer µ bΛ,−k (t) en fonction de µ bΛ,−k (0). Pour cela, nous allons vérifier que µ bΛ,−k (t) vérifie une équation de transport linéaire pour tout k dans Λ − {0}. Fixons ak (x, η) = eik.x a(ξ, η) dans Cc∞ (T ∗ T2 × R) et écrivons ≠ ï ããò ∑ Å Å d ∆ hξ, eΛ i ik.x hwΛ,~ (t), ak i = i u~ (t), − , Opw u (t) . e a ξ, ~ ~ dt 2 LΛ ~ Une nouvelle application du théorème de composition pour les opérateurs pseudodifférentiels nous donne ≠ Å Å ãã ∑ d hk, eΛ i hξ, eΛ i w hξ, eΛ i hwΛ,~ (t), ak i = i u~ (t), Op~ ak x, ξ, u~ (t) . dt LΛ LΛ ~ LΛ ~ On intègre cette expression contre une fonction test dans Cc∞ (R) et on obtient, après passage à la limite ~ → 0+ , Z Z hk, eΛ i 0 − θ (t)hb µΛ,−k (t), aidt = i θ(t) hb µΛ,k (t), ηa(ξ, η)i dt, LΛ R R qui est l’équation de transport attendue. Ceci nous permet de relier µ bΛ,−k (t) à µ bΛ,−k (0) et donc de conclure la preuve du théorème de structure des mesures semi-classiques dans le cas du tore. Remarque 3.7. — Pour cette partie de l’argument, le choix de quantification affecte l’équation de transport que nous dérivons (ainsi que les conditions initiales). En
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
359
reprenant le calcul précédent, nous trouverions Z Z hk, eΛ i − θ0 (t)hb θ(t) hb µΛ,−k (t), ηa(ξ, η)i dt µΛ,−k (t), aidt = i LΛ R R Å ã2 Z i hk, eΛ i + θ(t) hb µΛ,−k (t), a(ξ, η)i dt. 2 LΛ R De manière compacte, plutôt qu’une équation de transport, on obtient, pour la partie compacte le long de Λ, Å Å ã ã2 eΛ 1 1 eΛ ∂t µ bΛ = iη .∂x µ .∂x µ bΛ − bΛ . i LΛ 2 LΛ L’expression est différente de celle obtenue via la quantification de Weyl mais il faut se rappeler que la donnée initiale est aussi affectée par le changement de quantification. En considérant ces objets comme des mesures à valeurs opérateur (8), cette légère différence de formulation disparaîtrait in fine. 3.5. Régularité en x Nous voulons maintenant vérifier que les éléments de NSchr sont réguliers en x, i.e. νt (x) ∈ L1 (T2 ) pour presque tout t dans R (corollaire 3.3). D’après le théorème 3.2, il suffit d’étudier les contributions dues aux tores d’orbites périodiques. Par ailleurs, l’hypothèse de localisation en fréquence (5) nous permet de réduire la question au cas d’observables a(x, ξ, η) ∈ Cc∞ (T ∗ T2 × R) ne dépendant pas de la variable ξ. Fixons maintenant R > 0 et une fonction χ dans Cc∞ (R, [0, 1]) qui est égale à 1 sur [−1, 1] et à 0 en dehors de [−2, 2]. La régularité en x revient à comprendre les points d’accumulation (lorsque ~ → 0+ puis R → +∞) de la quantité suivante, pour a ∈ C ∞ (T2 ), ≠ Å Å ã Å ãã ∑ hξ, eΛ i eΛ w ˚ 2 hξ, eΛ i hwΛ,~,R (t), ai = ψ~ , Op~ IΛ (a) x + t χ ψ~ , LΛ ~ LΛ RLΛ ~ qui, grâce au théorème d’Egorov, s’écrit aussi ≠ D2 Å Å ãã D2 ∑ Λ Λ 2 hξ, eΛ i ˚ hwΛ,~,R (t), ai = eit 2 ψ~ , Opw I (a) (x) χ eit 2 ψ~ , Λ R−1 LΛ où DΛ := h−i∂LxΛ,eΛ i . En utilisant les règles de composition pour le calcul pseudodifférentiel, cette quantité se récrit encore Z it DΛ2 2 −1 ˚ 2 ψ~ dx + Oa (R−1 ). hwΛ,~,R (t), ai = IΛ (a) χ R DΛ e T2
Autrement dit, pour comprendre la régularité en x des mesures semi-classiques, il suffit de décrire la régularité en x des points d’accumulation de la suite de mesures (8)
C’est notamment le bon point de vue si on veut traiter le cas où V est non nul.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
360
G. RIVIÈRE
définies par Z hνΛ,~,R (t), ai :=
it DΛ2 2 −1 ˚ 2 χ R DΛ ψ~ dx. IΛ (a) e 2
T
Pour conclure, il est utile de se placer dans un système de coordonnées adaptées au tore d’orbites périodiques qui nous intéresse. On introduit les deux tores de dimension 1 : ThΛi := hΛi/(2πΛ) et TΛ⊥ := Λ⊥ /2π(Z2 ∩ Λ⊥ ). Leur produit ThΛi × TΛ⊥ (vu comme sous-ensemble de R2 ) contient L2Λ copies du tore T2 . Ceci nous permet alors de séparer les variables comme suit : ÇZ å 2 Z it DΛ2 1 −1 ˚ hνΛ,~,R (t), ai = 2 IΛ (a)(s1 ) e 2 χ R DΛ ψ~ (s1 , s2 ) ds1 ds2 . LΛ TΛ⊥ ThΛi Ainsi, modulo l’intégration le long de TΛ⊥ , nous avons d’une certaine manière réduit le problème d’une dimension. La démonstration du corollaire 3.3 devient alors une conséquence du lemme suivant qui est une variante d’un résultat dû à Zygmund [71] : Lemme 3.8. — Pour tout Λ dans L1 et pour tout ψ dans L2 (T2 ), Z
2πLΛ
ÇZ
0
0
4πL2Λ
Z 0
2πLΛ
å 21 4 5 it DΛ2 e 2 ψ(s1 , s2 ) ds1 dt ds2 ≤ 8π 2 LΛ2 kψk2L2 (T2 ) ,
où (s1 , s2 , t) ∈ ThΛi × TΛ⊥ × R/(4πL2Λ ). En appliquant Cauchy-Schwarz, ce lemme nous permet de montrer que tout point d’accumulation de (νΛ,~,R )~→0+ ,R→+∞ est dans L2loc (R × T2 ). Par conséquent, en utilisant le théorème 3.2, on peut finalement vérifier que, pour tout ν dans N (∞), νt appartient à L1 (T2 ) pour presque tout t dans R. L’utilisation de ce lemme n’est pas essentielle pour conclure au caractère L1 de la limite [6] mais il permet d’illustrer simplement l’utilité des techniques d’analyse harmonique quand il s’agit des questions de régularité. En effet, l’argument général de [6] permet a priori de conclure au caractère L1 pour la contribution de chaque tore d’orbites périodiques alors qu’ici on a obtenu une régularité L2 grâce au lemme 3.8. Insistons sur le fait que cette régularité L2 est spécifique aux tores invariants de dimension ≥ d − 1 du système complètement intégrable (9) et au potentiel V ≡ 0. Pour des tores invariants de dimension < d − 1 et pour des potentiels généraux, on aurait seulement une régularité L1 en suivant les arguments généraux [6] – voir tout de même [1] pour des généralisations de cet argument d’analyse harmonique en dimension supérieure. (9)
Pour les tores de dimension d, la mesure est constante en x.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
361
Même si elle est relativement classique, rappelons la démonstration du lemme 3.8 2 DΛ
car elle est courte et instructive. On commence par écrire eit 2 ψ dans le système de coordoonées adaptées (s1 , s2 , t) ∈ ThΛi × TΛ⊥ × R/(4πL2Λ ) : Ñ é 2 l2 t l2 t X X X s2 ls ls DΛ ⊥ i L hn,eΛ i i 1 i 2 b b s2 )ei LΛ1 ei 2L2Λ . Λ eit 2 ψ(s1 , s2 ) = ψ(n)e ψ(l, e LΛ e 2LΛ =: l∈Z
n:hn,eΛ i=l
l∈Z
À ce stade de la récriture, l’idée de Zygmund est d’utiliser l’égalité de Plancherel 2 DΛ
appliquée à |eit 2 ψ|2 pour les variables (s1 , t). Pour cela, on écrit 2 (l2 −m2 )t X (l−m)s it DΛ2 i L 1 i 2L2 b s2 )ψ(m, b e 2 ψ(s1 , s2 ) = Λ Λ e ψ(l, s )e . 2 l,m∈Z
Observons maintenant que, pour (k1 , k2 ) ∈ Z2 , l’équation diophantienne l − m = k1
et l2 − m2 = k2
a au plus une solution si k1 6= 0 et une infinité de solutions si (k1 , k2 ) = (0, 0). En utilisant Plancherel, on a donc 4 Z 4πL2Λ Z 2πLΛ D2 it Λ 1 e 2 ψ(s1 , s2 ) ds1 dt 3 2 8π LΛ 0 0 2 X X 2 b s2 )| + b s2 )|2 |ψ(m, b ≤ |ψ(l, |ψ(l, s2 )|2 2 l∈Z
l,m∈Z
2 X 2 b ≤ 2 |ψ(l, s2 )| . l∈Z
On va maintenant intégrer par rapport à la variable s2 et, en utilisant une nouvelle fois Plancherel, on obtient å 21 Z 4πL2Λ Z 2πLΛ D2 4 Z 2πLΛ Ç √ X Z 2πLΛ it Λ 1 b s2 )|2 ds2 e 2 ψ ds1 dt ds2 ≤ 2 |ψ(l, 8π 2 L3Λ 0 0 0 0 l∈Z X X √ 2 b ≤ 2 2πLΛ |ψ(n)| , l∈Z n:hn,eΛ i=l
qui termine la démonstration du lemme 3.8.
4. STRUCTURE DES MESURES SEMI-CLASSIQUES SUR LE DISQUE Même si nous ne rentrerons pas autant dans les détails, nous allons maintenant essayer de mettre en place dans le cas du disque les outils que nous avons introduits pour l’analyse sur le tore. Remarquons d’ores et déjà que l’une des difficultés à laquelle
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
362
G. RIVIÈRE
on est confronté est que le système de coordonnées action-angle est moins simple que sur le tore où le problème est dès le départ exprimé dans un bon système de coordonnées. Une autre difficulté – et d’une certaine manière la principale par rapport à [47, 6, 3] – est le fait que l’on doit tenir compte de la condition de bord et que celle-ci ne s’exprime pas vraiment bien dans le système de coordonnées action-angle du disque et il faut donc en quelque sorte jongler entre différents systèmes de coordonnées. L’article [5] fait appel à tout un arsenal de techniques d’analyse microlocale qu’il ne serait pas raisonnable de décrire en détail ici et nous nous contentons donc d’esquisser les grandes lignes de la preuve en nous appuyant sur la construction faite dans le cas du tore. Mentionnons que l’article s’appuie aussi de manière essentielle sur les techniques développées par Gérard et Leichtnam [28] afin d’analyser les mesures semi-classiques pour des problèmes aux valeurs propres dans des domaines à bord. Par souci de simplicité, nous faisons une restriction très forte sur les suites de conditions initiales considérées. Ceci nous permettra d’alléger un peu la présentation sans perdre pour autant les idées essentielles. Précisément, nous supposons X |hej , ψ~ iL2 |2 = 0, (12) ∀δ > 0, lim+ ~→0
j:|~2 λj −1|≥δ
plutôt que (5) et (6) où (ej )j est une base orthonormée de fonctions propres du Laplacien de Dirichlet. Anantharaman, Léautaud et Macià traitent le cas d’une suite générale mais nous nous limitons à cette hypothèse plus restrictive qui nous permet (1) d’exposer déjà les points importants de leur démonstration. On note MSchr ⊂ MSchr le sous-ensemble des points d’accumulation t 7→ µt correspondant à ce type de données initiales. Avec cette hypothèse de localisation en fréquence, on peut vérifier que, pour presque tout t dans R, µt est une mesure de probabilité à support dans le fibré unitaire cotangent à D. Avant d’aller plus loin dans la discussion, il convient de mentionner une chose que nous avons passée sous silence dans le cas du problème à bord, à savoir la classe des fonctions test que nous devons utiliser pour définir les points d’accumulation. Dans le cas sans bord, il était naturel de travailler avec les fonctions lisses à support compact dans T ∗ M . Dans le cas du disque, nous prolongeons la solution de l’équation de Schrödinger u~ (t, z) par 0 en dehors de R × D et nous notons ce prolongement u ˜~ (t, z). Nous définissons alors la distribution de Wigner : w~ (t) : a ∈ Cc∞ (T ∗ R2 ) 7→ h˜ u~ (t), Op~ (a)˜ u~ (t)iL2 (R2 ) , où Op~ est la quantification standard sur R2 [70, Ch. 4]. Nous faisons ici ce choix pour rester consistant avec les conventions de [5] mais aussi parce que les propriétés de base des mesures semi-classiques pour les problèmes à bord ont été dérivées par Gérard et Leichtnam pour ce choix de quantification [28] qui simplifie un certain nombre de choses.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
363
Remarque 4.1. — Notons que u ˜~ (t) ainsi prolongée vérifie l’équation Å ã ∆ 1 i∂t u ˜~ = − + V u ˜~ − ∂n u~ ⊗ δ∂D , 2 2 où ∂n u~ est la dérivée normale au bord du disque, i.e. ∂r u~ en coordonnées polaires. L’opérateur ∆ est ici le laplacien agissant sur R2 et pas le laplacien de Dirichlet que nous notons ∆D pour le distinguer. (1)
Les points d’accumulation t 7→ µt dans MSchr sont donc des éléments de D0 (T ∗ R2 ) dont on vérifie qu’il s’agit de mesures de probabilité à support dans S ∗ D = D × S1 en adaptant l’argument de [28, Prop. 2.2] au cas dépendant du temps. 4.1. Invariance par le flot du billard L’espace des phases associé à notre problème sur le disque D est plutôt l’espace quotient W1 := D × S1 / ∼, où, pour |z| = 1, on a quotienté par la relation d’équivalence (z, ζ) ∼ σ(z, ζ) avec (10) σ(z, ζ) = ζ − 2(z.ζ)z. La relation d’invariance par le flot géodésique se lit alors, pour presque tout t dans R et pour toute fonction a dans Cc∞ (T ∗ R2 ) vérifiant a ◦ σ = a pour |z| = 1, hµt , ζ.∂z ai = 0. Par la suite, nous ne considérerons que des fonctions vérifiant cette propriété de symétrie au bord du disque. Remarque 4.2. — Nous venons de dire que la propriété (12) assure que les mesures sont supportées par W1 . Dans la suite, nous ferons donc toujours l’hypothèse que les fonctions test a (ou b) sont 0-homogènes au voisinage de la couche d’énergie kζk = 1. Dans le cas du tore, nous avons vu que la démonstration consistait entre autres choses à raffiner les arguments utilisés pour démontrer l’invariance de µt par le flot géodésique. Afin de comprendre les difficultés supplémentaires liées au bord, il est utile de se souvenir des complications liées à ce cadre géométrique. De nouveau, nous calculons la dérivée de la distribution de Wigner : ≠ ï 2 ò ∑ d i ~ ∆ 2 hw~ (t), ai = 2 u ˜~ (t), − + ~ V, Op~ (a) u ˜~ (t) dt ~ 2 i + h~∂n u~ (t) ⊗ δ∂D , Op~ (a)˜ u~ (t)i 2~ i h˜ u~ (t), Op~ (a)~∂n u~ (t) ⊗ δ∂D i . − 2~ Comme dans le cas sans bord, le premier terme est égal à ~1 h˜ u~ (t), Op~ (ζ.∂x a)˜ u~ (t)i + O (1) qui est bien la quantité recherchée. Si le support de a n’intersecte pas le bord de D, alors on vérifie que les autres termes sont nuls. Il nous reste donc à comprendre ce (10)
Il s’agit simplement de la symétrie d’axe la tangente au disque en z.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
364
G. RIVIÈRE
qui se passe près de ∂D. Pour cela, il convient de récrire a sous une forme adaptée à la géométrie du bord [28, Eq. (3.34), p. 589]. Sous les hypothèses de symétrie que nous avons imposées sur a, on peut vérifier que ce reste s’annule lorsqu’on passe à la limite. Pour un a général, il faudrait introduire la mesure semi-classique (sur ∂D) associée à la suite (~∂n u~ (t)e∂D )~→0+ . La question de l’invariance devient donc plus délicate surtout si on cherche à analyser le problème jusqu’au bord du domaine. Cette question avait été résolue pour des domaines assez généraux par Gérard et Leichtnam [28, Th. 2.3] en adaptant à ce contexte les résultats de Melrose et Sjöstrand sur la propagation des singularités pour les problèmes à bord [52]. Anantharaman, Léautaud et Macià sont amenés à raffiner ce type d’arguments afin de l’adapter à des versions 2-microlocales comme celles introduites dans le cas de T2 . Ils doivent notamment étudier les contributions dues au bord de manière beaucoup plus fine dans le cas où les symboles sont supportés dans des voisinage de taille ~ des tores invariants d’orbites périodiques.
4.2. La dynamique de billard sur le disque Comme précedemment, µt est une mesure invariante par le flot géodésique que nous allons décrire un peu plus précisément afin de pouvoir décomposer µt le long de sous-ensembles invariants, les fameux tores invariants du système complètement intégrable. Grâce à notre hypothèse de localisation spectrale (12), nous restreignons notre description du flot géodésique à la couche d’énergie fixée par la première variable d’action E := |ζ| = 1. Commençons par rappeler que le flot géodésique (ou le flot du billard) ϕτ sur W1 est l’unique action continue du groupe (R, +) sur W1 vérifiant ϕτ (z, ζ) = (z + τ ζ, ζ), dès que ζ ∈ D et z + τ ζ ∈ D. Observons que la restriction de ce flot au bord du disque S ∗ ∂D est le flot géodésique sur le cercle. Notons aussi que ce flot préserve le moment angulaire : J := z.ζ ⊥ , où ζ ⊥ = (ζy , −ζx ). Il s’agit de la deuxième variable d’action de notre système complètement intégrable et nous allons donc décomposer l’espace des phases W1 le long des sous-ensembles de niveau J ∈ [−1, 1]. Pour cela, il est commode d’introduire l’angle αJ = − arcsin J que fait la trajectoire du billard avec la normale au bord lorsqu’elle touche celui-ci. Cet angle est bien entendu conservé au cours de l’évolution. Les tores invariants sont donc définis comme suit TJ
ASTÉRISQUE 414
:= (z, ζ) ∈ W1 : z.ζ ⊥ = J ,
J ∈ [−1, 1],
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
365
et on a G
W1 =
TJ .
J∈[−1,1]
Pour −1 < J < 1, TJ est bien un tore de dimension 2 mais, pour J = ±1, on a un cercle, ce que l’on peut interpréter comme une manifestation du fait que la structure complètement intégrable est dégénérée au bord du disque. Les variables d’angle sur ces tores sont alors définies de la manière suivante : Å Å ã ã ζx (θ, s) := − arctan , z.ζ . ζy Remarquons que θ représente l’angle que fait le covecteur ζ avec la verticale et que, pour J = ±1, s = 0. Chacun de ces tores est muni d’une mesure de Haar naturelle : dsdθ dθ ∀J 6= ±1, λJ := R et λ±1 := R . dsdθ dθ TJ T±1 4.3. Décomposition de µt (1)
Fixons maintenant un élément t → 7 µt de MSchr et utilisons le théorème de désintégation des mesures : Z 1 µt (z, ζ) = µ ˜J (t, z, ζ)µt (dJ), −1
où, pour µt presque tout J dans [−1, 1], µ ˜J est une mesure à support dans TJ . Remarquons que d
u ˜~ (t), Op~ a(z.ζ ⊥ ) u ˜~ (t) = O (~), ∀a ∈ Cc∞ (R), dt uniformément en t. En effet, Op~ a(z.ζ ⊥ ) = a(~∂ϑ ) où ϑ est la variable angulaire pour les coordonnées polaires. En particulier, Op~ a(z.ζ ⊥ ) définit un opérateur sur L2 (D) qui commute avec ∆D . Nous avons ainsi vérifié que la mesure µt est indépendante du temps. Nous la notons dorénavant µ0 et nous observons qu’elle est complètement déterminée par la mesure semi-classique µ0 de la suite de données initiales utilisées pour générer µt . Par ailleurs, pour µ0 presque tout J et pour presque tout t dans R, on peut vérifier que la mesure µ ˜J (t) est invariante par le flot géodésique. Or, pour αJ ∈ / πQ, le flot géodésique est uniquement ergodique sur le tore TJ , i.e. Z Z 1 T ∀(z, ζ) ∈ TJ , ∀a ∈ C 0 (W1 ), lim a ◦ ϕτ (z, ζ)dτ = adλJ . T →+∞ T 0 TJ Au contraire, si αJ ∈∈ πQ ∩ [−π/2, π/2], le flot géodésique est périodique de période LJ > 0 qui dépend seulement du moment angulaire. Bien entendu, pour J = ±1, l’unique ergodicité est équivalente à la périodicité puisque les tores T±1 sont de dimension 1. En utilisant une dernière fois que les tores TJ et la mesure µt sont invariants par le flot géodésique, nous venons donc de démontrer le résultat suivant :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
366
G. RIVIÈRE
(1)
Proposition 4.3. — Soit t 7→ µt appartenant à MSchr telle que la suite de données initiales utilisées pour générer µt détermine une unique mesure semi-classique µ0 . Si on pose µ0 = m∗ (µ0 ), où m : (z, ζ) ∈ W1 7→ J = z.ζ ⊥ ∈ [−1, 1], alors on a, pour presque tout t dans R, Z µt = λJ µ0 (dJ) + µ0 ({1})λ1 + µ0 ({−1})λ−1 arcsin J ∈πQ /
+
X arcsin J∈πQ∩(−π/2,π/2)
1 LJ
Z 0
LJ
(ϕτ )∗ µt eTJ dτ.
Nous pouvons d’ores et déjà remarquer que la restriction de la mesure semiclassique aux tores uniquement ergodiques est complètement déterminée par la mesure semi-classique de la suite de données initiales, plus précisément par son poussé en avant par l’application m. Par ailleurs, la mesure µt est aussi régulière que possible le long de ces tores. Ainsi, comme dans le cas du tore, nous nous sommes ramenés à la description de la restriction de la mesure semi-classique à des tores invariants de dimension 2 sur lesquels le flot géodésique est périodique. Ici, ces tores d’orbites périodiques correspondent à des trajectoires dont l’angle d’impact αJ avec la normale au bord est un multiple rationnel de π. Le cœur de l’analyse de l’article consiste donc à décrire la restriction Z LJ 1 (ϕτ )∗ µt eTJ dτ (13) LJ 0 des mesures semi-classiques à ces tores d’orbites périodiques et à essayer de les exprimer en fonction des données initiales. Notons que la mesure ainsi définie est indépendante de la variable d’angle s mais qu’elle pourrait être a priori très irrégulière en la variable θ. De nouveau, l’analyse de la régularité le long de la seconde variable d’angle va passer par une seconde microlocalisation (de taille ~) sur ces tores TJ lorsque αJ ∈ πQ ∩ (−π/2, π/2). 4.4. Analyse le long des tores de trajectoires périodiques La difficulté à laquelle il faut maintenant se confronter est le choix des coordonnées. Afin de procéder à cette seconde microlocalisation, l’exemple du tore nous invite à nous placer dans un jeu de coordonnées « action-angle ». Rappelons que nous avons introduit de telles coordonnées (s, θ, E, J) ∈ R × S1 × R2 : Å ã J J Φ : (s, θ, E, J) 7→ (x, y, ξx , ξy ) = cos θ − s sin θ, sin θ + s cos θ, −E sin θ, E cos θ . E E
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
367
Afin de travailler dans ce système, il faut introduire un opérateur (intégral de Fourier) U [5, §3.1] de telle sorte que, pour toute fonction a dans Cc∞ (T ∗ R2 ) supportée en dehors de E = 0, on a hw~ (t), ai = hU u ˜~ (t), Op~ (a ◦ Φ)U u ˜~ (t)i + Oa (~), | {z } =:hw ˜~ (t),a◦Φi
avec un reste uniforme en t. Par la suite, on notera v~ (t) = U u ˜~ (t) qui est un élément de L2 (R × S1 ). Fixons maintenant J0 tel que αJ0 ∈ πQ ∩ (−π/2, π/2) et, comme dans le cas du tore T2 , essayons de procéder à une seconde microlocalisation le long du tore invariant TJ0 . Comme il ne nous reste qu’à analyser la dépendance en θ le long de TJ0 , nous nous limitons dans ce qui suit à l’étude d’obervables b vérifiant la propriété d’invariance Ä ä p (14) (αJ0 − αJ ) ∂θ + 1 − J 2 ∂s b = 0. De manière intégrée, ceci donne p ∀τ ∈ R, b(s + τ 1 − J 2 , θ + τ (αJ0 − αJ ), E, J, η) = b(s, θ, E, J, η). Lorsque nous nous restreignons au tore TJ0 (qui est la zone que nous voulons analyser), ceci revient à dire que b est indépendante de s. Remarque 4.4. — Dans le cas du tore, c’est déjà ce que nous avions fait en prenant ˚Λ (a), ce qui revenait in fine à considérer des observables des fonctions de la forme I invariantes par le flot (x, ξ) 7→ (x + te⊥ Λ , ξ). Lorsque nous considérions la restriction de la mesure à T2 × Λ⊥ , nous n’avions en effet besoin d’analyser la mesure que le long de la variable (en x) induite par hΛi puisqu’elle était déjà régulière le long de la variable induite par Λ⊥ grâce à l’invariance par le flot géodésique. Ici, le tore TJ0 va jouer le rôle (11) de T2 × Λ⊥ . La mesure étant déterminée le long de la variable s, il nous reste à analyser ce qui se passe le long de la seconde variable d’angle θ. Découpons de nouveau le problème en deux parties en introduisant un nouveau paramètre R > 1 et une fonction de troncature χ ∈ Cc∞ (R, [0, 1]) qui est égale à 1 sur [−1/2, 1/2] et à 0 en dehors de [−1, 1]. Pour analyser la mesure le long de TJ0 , 0 on introduit aussi une nouvelle variable η = J−J et on pose, pour b(s, θ, E, J, η) ∈ ~ ∞ ∗ 1 b Cc (T (R × S ) × R) à support en dehors de E = 0 et vérifiant (14), ≠ ã Å ãã ∑ Å Å J − J0 J − J0 hw ˜~,R,J0 (t), bi := v~ (t), Op~ b s, θ, E, J, χ v~ (t) ~ R~ et ≠ Å Å ã Å ãã ∑ J − J0 J − J0 J0 (1 − χ) v~ (t) . hw ˜~,R (t), bi := v~ (t), Op~ b s, θ, E, J, ~ R~ (11)
Nous avons perdu une dimension grâce à notre hypothèse de fréquence (12).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
368
G. RIVIÈRE
Remarque 4.5. — Rappelons que nous travaillons avec des fonctions vérifiant une propriété de symétrie au bord du disque. Afin que la composée de b avec le flot du billard soit aussi lisse en tout temps, il faut aussi imposer cette propriété de symétrie pour toutes les dérivées partielles par rapport à s. Rappelons aussi que b est toujours supposée 0-homogène au voisinage de E = 1. Comme dans le cas du tore, le théorème de Calderón-Vaillancourt nous permet d’extraire des sous-suites convergentes de telle sorte qu’on obtient deux objets limites, µJ0 (t, s, θ, J, E, η) et µJ0 (t, s, θ, E, J, η), dont nous pouvons lister quelques premières propriétés : Proposition 4.6. — Soit J0 tel que αJ0 ∈ πQ ∩ (−π/2, π/2). Avec les notations précédentes, on a : 1. Les distributions µJ0 et µJ0 sont absolument continues par rapport à la variable t. 2. Pour presque tout t dans R, µJ0 (t) est une mesure positive supportée dans Φ−1 (W1 ) × {±∞}. 3. Pour presque tout t dans R, µJ0 (t) est une distribution concentrée sur TJ0 × R R et R µJ0 (t, dη) est une mesure positive supportée dans TJ0 . 4. On a ∂s µJ0 (t) = ∂s µJ0 (t) = 0 pour presque tout dans R (Invariance par le flot géodésique). 5. On a Z Z µt eTJ0 =
µJ0 (t, dη)eTJ0 + R
{±∞}
µJ0 (t, dη)eTJ0 .
Nous ne reprenons pas la démonstration de ce résultat et nous renvoyons à [5, Prop. 4.5] pour plus de détails et des références à la littérature existante. Notons tout de même que l’invariance par le flot géodésique énoncée dans le point 4 revient à reprendre la démonstration de Gérard et Leichtnam dans le cas de symboles oscillant en ~ et à vérifier que les termes dûs au bord s’annulent encore une fois. Ceci nécessite de se ramener au système de coordonnées polaires qui est plus adapté aux conditions de Dirichlet que les coordonnées « action-angle ». Rappelons d’après (13) qu’il nous reste seulement à comprendre la structure de µt le long des tores d’orbites périodiques TJ0 . La proposition précédente décompose ce problème en deux sous-questions : la description de µJ0 (t) et celle de µJ0 (t). Même si les objets sont plus complexes, nous sommes dans la même situation que sur le tore lorsque nous avions analysé la partie compacte et celle à l’infini de µΛ (t). L’essentiel de l’article [5] consiste à mettre en œuvre la même stratégie avec les difficultés additionnelles que nous avons déjà soulevées. Précisément, Anantharaman, Léautaud et Macià démontrent les propriétés suivantes :
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
369
1. Pour la partie à l’infini, ils démontrent que µJ0 (t)eTJ0 ×{±∞} est indépendante de θ [5, Th. 4.9]. En d’autres termes, c’est la mesure de Haar le long du tore R invariant, i.e. ±∞ µJ0 (t, dη)eTJ0 = cJ0 (t)λJ0 pour presque tout t dans R. On peut de nouveau vérifier [5, p. 553] que cJ0 (t) est indépendante du temps. Cette partie de la mesure est donc complètement déterminée par la donnée initiale et on peut noter que la projection sur D est régulière. 2. Pour la partie « compacte », ils réussissent aussi à déterminer µJ0 (t) complètement en fonction des conditions initiales. De la même manière que dans le cas du tore, µJ0 (t) peut être exprimée en fonction de µJ0 (0) propagée par une équation de transport (quantique) le long de la variable θ. La caractérisation précise de ces distributions permet alors de vérifier que la projection de ces mesures sur le disque D vérifie les propriétés de régularité énoncées dans les théorèmes 2.6 et 2.7 – voir [5, §7]. Pour conclure cet exposé, nous allons expliquer formellement les grandes lignes de la démonstration qui permet d’exprimer µJ0 (t) en fonction des conditions initiales. Afin d’insister sur les idées importantes de la démonstration et afin de mettre en avant le parallèle avec le cas du tore que nous avons traité en détail, nous insistons sur le fait que nous faisons des simplifications parfois un peu « abusives ». Nous invitons le lecteur à consulter [5, p. 540–551, App. C–E] pour la version détaillée de la démonstration. Remarque 4.7. — Afin de traiter le cas d’un potentiel général V et de faire les choses plus « proprement », il faudrait en fait introduire des fonctions test un peu plus générales, i.e. travailler avec des opérateurs pseudo-différentiels à valeurs dans les opérateurs compacts sur L2θ (S1 ). La partie compacte µJ0 serait alors une mesure à valeurs dans les operateurs à trace sur L2θ (S1 ) et elle vérifierait une équation de transport quantique pour une certaine équation de Schrödinger le long de la variable θ. Afin d’exposer les idées en jeu de la manière la plus simple possible, nous passons un peu cet aspect sous silence et nous supposons en particulier que V ≡ 0 dans la fin de ce paragraphe. Ce transport quantique sera donc un peu déguisé dans la suite. Nous renvoyons le lecteur aux articles [6, 3, 5] pour plus de détails sur cet aspect. Pour analyser la partie « compacte », nous reprenons l’argument que nous avons utilisé au paragraphe 3.4 dans le cas du tore et nous allons essayer de comprendre les points qui nécessitent une adaptation pour déterminer µJ0 . On fixe b(s, θ, J, E, η) à support compact en η vérifiant les propriétés de symétrie et d’homogénéité discutées plus haut. Pour R > 0 assez grand, on a ≠ Å Å ãã ∑ d J − J0 d hw ˜~,R,J0 (t), bi = v~ (t), Op~ b s, θ, E, J, v~ (t) dt dt ~
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
370
G. RIVIÈRE
Å Å ããò ∑ ≠ ï J − J0 U ∆U ∗ v~ (t) = i v~ (t), − , Op~ b s, θ, E, J, 2 ~ Å Å ≠ ãã ∑ J − J0 i − ∂n u~ (t) ⊗ δ∂D , U ∗ Op~ b s, θ, E, J, Uu ˜~ (t) 2 ~ ≠ Å Å ãã ∑ J − J0 i Uu ˜~ (t), Op~ b s, θ, E, J, U ∂n u~ (t) ⊗ δ∂D . + 2 ~ Anantharaman, Léautaud et Macià sont donc confrontés à l’étude de ces termes de bord que nous avons déjà rencontrés lorsque nous avons évoqué la démonstration de l’invariance des mesures semi-classiques par le flot du billard. La symétrie de b au bord permettait de vérifier que ces termes étaient en fait asymptotiquement nuls [28, Th. 2.3]. De la même manière, l’invariance des mesures 2-microlocales par le flot du billard énoncée dans la proposition 4.6 passe par l’étude de ces termes de bord. Dans ce dernier cas, les auteurs de [5] obtenaient de nouveau une simplification due à la symétrie de b par rapport au bord. Dans l’équation précédente, il faut pousser l’étude des termes de reste un cran plus loin et cette fois, le terme de bord ne va plus s’annuler. L’étude des termes de bord à tous les stades de la démonstration est un problème délicat qui occupe une grande partie de l’article [5] et notamment de ses appendices. Comme nous y avons déjà fait allusion, l’une des raisons qui rend les choses compliquées est que le choix de coordonnées action-angle est bien adapté pour comprendre les propriétés d’invariance mais qu’il n’est pas aisé d’y lire les conditions au bord de l’EDP. Nous ne rentrons pas dans les détails mais, après une analyse délicate, on peut vérifier que le terme de bord donne asymptotiquement la contribution [5, p. 551] : Å ã E J − J0 2 i p ∂ b s, θ, E, J, . θ ~ 2 1 − J02 Essayons maintenant de comprendre intuitivement ce que nous donne le terme principal qui est plus simple à analyser. La première chose à observer est que, dans le nouveau systèmes de coordonnées, on a [5, Lemma 3.1(ii)] −U ∆U ∗ = −∂s2 . Les règles du calcul pseudo-différentiel sur R2 [70, Ch. 4] nous donnent alors ï Å Å ããò J − J0 U ∆U ∗ , Op~ b s, θ, E, J, i − 2 ~ ÅÅ ãÅ ãã E ∂s2 b J − J0 = Op~ ∂s b − i s, θ, E, J, . ~ 2 ~ En utilisant la propriété d’invariance (14) sur b, nous trouvons pour le premier terme Å ã Å ã J − J0 E J − J0 J − J0 E ∂s b s, θ, E, J, ' −p ∂ b s, θ, E, J, . θ ~ ~ ~ 1 − J02 ~
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
371
Puisque b est indépendant de s le long de J = J0 , on peut aussi vérifier ∂2b que la contribution de 2s est asymptotiquement nulle. Ainsi, pour J0 tel que αJ0 ∈ πQ ∩ (−π/2, π/2), nous trouvons formellement l’équation de transport suivante après passage à la limite : » 1 i 1 − J02 ∂t µJ0 = iη∂θ µJ0 − ∂θ2 µJ0 . 2 En particulier, ce calcul nous montre formellement que la distribution µJ0 (t) est complètement déterminée par µJ0 (0), i.e. par la suite de conditions initiales et nous retrouvons bien une formule de transport similaire à celle que nous avions obtenue dans le cas du tore T2 – voir paragraphe 3.4. Remarque 4.8. — Nous n’avons pas discuté la partie à l’infini. Dans ce cas, Anantharaman, Léautaud et Macià reprennent la démonstration du paragraphe 3.3 afin de calculer µJ0 [5, p. 538–540, App. C–E]. Une nouvelle fois, ils sont amenés à analyser en détail les contributions des termes de bord afin de montrer qu’en utilisant la symétrie de b, elles s’annulent pour la partie à l’infini tout comme elles s’annulaient dans l’argument de Gérard et Leichtnam.
CONCLUSION Pour les systèmes complètement intégrables, nous venons de voir à travers le cas du tore et du disque qu’on pouvait obtenir des descriptions précises des solutions de l’équation de Schrödinger, au moins du point de vue de leurs mesures semiclassiques. Rappelons que ce type d’analyse s’étend à d’autres systèmes complètement intégrables [45, 3, 48, 50]. L’histoire semble pour autant loin d’être finie et nous voudrions conclure cet exposé avec quelques questions parmi d’autres : – Dans le cas du tore, nous avons vu au début de l’exposé qu’on pouvait aussi faire appel à des techniques d’analyse harmonique pour obtenir des résultats de régularité précis. Il serait intéressant de combiner autant que possible ces deux approches qui donnent des résultats en un certain sens complémentaires. Dans cette direction, nous pouvons par exemple mentionner les articles [1, 10, 15]. – Dans le cas du disque, il semble raisonnable de penser que des résultats fins sur les fonctions de Bessel permettraient de dire des choses sur la régularité des mesures semi-classiques comme dans le cas du tore. Dans ce sens, nous renvoyons à l’introduction de [5, §1.3]. – Le cas de l’ellipse devrait pouvoir être traité par des techniques similaires à celles de l’article d’Anantharaman, Léautaud et Macià.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
372
G. RIVIÈRE
– L’étude du spectre des systèmes complètement intégrables est un sujet classique en analyse microlocale et il serait naturel d’utiliser les techniques développées dans ce contexte pour décrire les mesures semi-classiques. Par exemple, les outils développés par Hitrik, Sjöstrand et V˜ u Ngo.c pour l’analyse de problèmes nonautoadjoints en dimension 2 [33] devraient avoir des applications dans ce cadre. – Toujours en dimension 2, il serait intéressant de comprendre la structure des mesures semi-classiques pour les systèmes semi-toriques étudiés par Pelayo et V˜ u Ngo.c [55]. – Le résultat d’équidistribution pour les billards polygonaux de Marklof et Rudnick [51] soulève la question de la régularité des mesures semi-classiques dans ce cadre. Une question naturelle serait de comprendre si, comme sur le tore, les mesures semi-classiques ne chargent pas les orbites périodiques. Il est raisonnable d’espérer que les techniques développées par Anantharaman, Fermanian-Kammerer, Léautaud et Macià ainsi que celles de Hassell, Hillairet et Marzuola [31] puissent être utiles à l’étude de ce type de questions. – Dans le cas d’un laplacien sous-riemannien associé à une structure de contact en dimension 3, les mesures semi-classiques se décomposent en une somme de deux mesures mutuellement singulières [19]. L’une µ∞ est invariante par le champ de Reeb associé et portée par un revêtement à deux feuillets de la variété. L’autre µ0 est invariante par le flot géodésique sous-riemannien et portée par le fibré unitaire de la structure sous-riemannienne (ici un cylindre au dessus de chaque point de la variété). Colin de Verdière, Hillairet et Trélat démontrent que, le long d’une sous-suite générique de fonctions propres, µ0 est forcément nulle. Comme c’était le cas pour les résultats d’ergodicité quantique, ceci n’exclut pas a priori qu’elle soit non nulle pour une sous-suite quelconque. Il serait intéressant de comprendre si les techniques 2-microlocales présentées dans cet exposé peuvent permettre d’analyser certaines propriétés fines de cette décomposition notamment de la mesure µ0 .
Remerciements
J’adresse mes sincères remerciements à N. Anantharaman, S. De Bièvre, M. Léautaud, F. Macià et B. Merlet pour leur aide et leurs commentaires lors de la préparation de cet exposé.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
373
RÉFÉRENCES [1] T. Aissiou, D. Jakobson & F. Macià – Uniform estimates for the solutions of the Schrödinger equation on the torus and regularity of semiclassical measures, Math. Res. Lett. 19 (2012), no 3, p. 589–599. [2] N. Anantharaman – Entropy and the localization of eigenfunctions, Ann. of Math. 168 (2008), no 2, p. 435–475. [3] N. Anantharaman, C. Fermanian-Kammerer & F. Macià – Semiclassical completely integrable systems : long-time dynamics and observability via twomicrolocal Wigner measures, Amer. J. Math. 137 (2015), no 3, p. 577–638. [4] N. Anantharaman, M. Léautaud & F. Macià – Delocalization of quasimodes in the disk, CRAS 354 (2016), no 3, p. 256–263. [5] , Wigner measures and observability for the Schrödinger equation on the disk, Invent. math. 206 (2016), no 2, p. 485–599. [6] N. Anantharaman & F. Macià – Semiclassical measures for the Schrödinger equation on the torus, J. Eur. Math. Soc. (JEMS) 16 (2014), no 6, p. 1253–1288. [7] N. Anantharaman & S. Nonnenmacher – Half-delocalization of eigenfunctions for the Laplacian on an Anosov manifold, Ann. Inst. Fourier 57 (2007), no 7, p. 2465–2523. [8] D. Azagra & F. Macià – Concentration of symmetric eigenfunctions, Nonlinear Anal. 73 (2010), no 3, p. 683–688. [9] J.-M. Bony & N. Lerner – Quantification asymptotique et microlocalisations d’ordre supérieur, in Séminaire sur les équations aux dérivées partielles 1986– 1987, École polytech., Palaiseau, 1987, exp. II–III. [10] J. Bourgain, N. Burq & M. Zworski – Control for Schrödinger operators on 2-tori : rough potentials, J. Eur. Math. Soc. (JEMS) 15 (2013), no 5, p. 1597– 1628. [11] S. Brooks, E. Le Masson & E. Lindenstrauss – Quantum ergodicity and averaging operators on the sphere, Int. Math. Res. Not. 2016 (2016), no 19, p. 6034–6064. [12] N. Burq – Mesures semi-classiques et mesures de défaut, Séminaire Bourbaki, vol. 1996/1997, exposé no 826, Astérisque (1997), no 245, p. 167–195. [13] N. Burq & M. Zworski – Geometric control in the presence of a black box, J. Amer. Math. Soc. 17 (2004), no 2, p. 443–471. [14]
, Control for Schrödinger operators on tori, Math. Res. Lett. 19 (2012), n 2, p. 309–324. o
[15]
, Rough controls for Schroedinger operators on 2-tori, Annales Henri Lebesgue 2 (2019), p. 331–347.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
374
[16] [17] [18]
[19]
[20] [21] [22]
[23] [24] [25]
[26]
[27] [28] [29] [30]
[31]
G. RIVIÈRE
, Eigenfunctions for partially rectangular billiards, prépublication arXiv:math/0312098. Y. Colin de Verdière – Ergodicité et fonctions propres du laplacien, Comm. Math. Phys. 102 (1985), no 3, p. 497–502. , Semi-classical measures and entropy [after Nalini Anantharaman and Stéphane Nonnenmacher], Séminaire Bourbaki, vol. 2006/2007, exposé no 978, Astérisque (2008), no 317, p. 393–414. Y. Colin de Verdière, L. Hillairet & E. Trélat – Spectral asymptotics for sub-Riemannian Laplacians, I : Quantum ergodicity and quantum limits in the 3-dimensional contact case, Duke Math. J. 167 (2018), no 1, p. 109–174. J.-M. Delort – F.B.I. transformation, Lecture Notes in Math., vol. 1522, Springer, 1992. S. Dyatlov & L. Jin – Semiclassical measures on hyperbolic surfaces have full support, Acta Mathematica 220 (2018), p. 297–339. F. Faure, S. Nonnenmacher & S. De Bièvre – Scarred eigenstates for quantum cat maps of minimal periods, Comm. Math. Phys. 239 (2003), no 3, p. 449–492. C. Fermanian-Kammerer – Mesures semi-classiques et équation de la chaleur, thèse de doctorat, Université Paris-Sud Orsay, 1995. C. Fermanian-Kammerer – Mesures semi-classiques 2-microlocales, C. R. Acad. Sci. Paris Sér. I Math. 331 (2000), no 7, p. 515–518. R. Feynman, R. Leighton & M. Sands – The Feynman lectures on physics. Vol. 3 : Quantum mechanics, Addison-Wesley Publishing Co., Reading, Mass.London, 1965. P. Gérard – Mesures semi-classiques et ondes de Bloch, in Séminaire sur les Équations aux Dérivées Partielles, 1990–1991, École polytech., Palaiseau, 1991, exp. XVI. , Microlocal defect measures, Comm. Partial Differential Equations 16 (1991), no 11, p. 1761–1794. P. Gérard & É. Leichtnam – Ergodic properties of eigenfunctions for the Dirichlet problem, Duke Math. J. 71 (1993), no 2, p. 559–607. E. Grosswald – Representations of integers as sums of squares, Springer Tokyo, 1985. A. Hassell – Ergodic billiards that are not quantum unique ergodic, with an appendix by the author and Luc Hillairet, Ann. of Math. 171 (2010), no 1, p. 605– 619. A. Hassell, L. Hillairet & J. Marzuola – Eigenfunction concentration for polygonal billiards, Comm. Partial Differential Equations 34 (2009), nos 4-6, p. 475–485.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
375
[32] B. Helffer, A. Martinez & D. Robert – Ergodicité et limite semi-classique, Comm. Math. Phys. 109 (1987), no 2, p. 313–326. ˜ Ngo.c – Diophantine tori and spectral [33] M. Hitrik, J. Sjöstrand & S. Vu asymptotics for nonselfadjoint operators, Amer. J. Math. 129 (2007), no 1, p. 105– 182. [34] E. Humbert, Y. Privat & E. Trélat – Observability properties of the homogeneous wave equation on a closed manifold, Comm. Partial Differential Equations 4 (2019), p. 749–772. [35] S. Jaffard – Contrôle interne exact des vibrations d’une plaque rectangulaire, Portugal. Math. 47 (1990), no 4, p. 423–429. [36] D. Jakobson – Quantum limits on flat tori, Ann. of Math. 145 (1997), no 2, p. 235–266. [37] D. Jakobson & S. Zelditch – Classical limits of eigenfunctions for some completely integrable systems, in Emerging applications of number theory (Minneapolis, MN, 1996), IMA Vol. Math. Appl., vol. 109, Springer, 1999, p. 329– 354. [38] J. Kahane – Pseudo-périodicité et séries de Fourier lacunaires, Ann. Sci. École Norm. Sup. 79 (1962), p. 93–150. [39] D. Kelmer – Arithmetic quantum unique ergodicity for symplectic linear maps of the multidimensional torus, Ann. of Math. 171 (2010), no 2, p. 815–879. [40] G. Lebeau – Deuxième microlocalisation sur les sous-variétés isotropes, Ann. Inst. Fourier 35 (1985), no 2, p. 145–216. [41] , Contrôle de l’équation de Schrödinger, J. Math. Pures Appl. 71 (1992), no 3, p. 267–291. [42] S. Lester & Z. Rudnick – Small Scale Equidistribution of Eigenfunctions on the Torus, Comm. Math. Phys. 350 (2017), no 1, p. 279–300. [43] E. Lindenstrauss – Invariant measures and arithmetic quantum unique ergodicity, Ann. of Math. 163 (2006), no 1, p. 165–219. [44] P.-L. Lions & T. Paul – Sur les mesures de Wigner, Rev. Mat. Iberoamericana 9 (1993), no 3, p. 553–618. [45] F. Macià – Some remarks on quantum limits on Zoll manifolds, Comm. Partial Differential Equations 33 (2008), nos 4-6, p. 1137–1146. [46] , Semiclassical measures and the Schrödinger flow on Riemannian manifolds, Nonlinearity 22 (2009), no 5, p. 1003–1020. [47] , High-frequency propagation for the Schrödinger equation on the torus, J. Funct. Anal. 258 (2010), no 3, p. 933–955. [48] F. Macià & G. Rivière – Concentration and Non-Concentration for the Schrödinger Evolution on Zoll Manifolds, Comm. Math. Phys. 345 (2016), no 3, p. 1019–1054.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
376
G. RIVIÈRE
[49]
, Two microlocal regularity of quasimodes on the torus, Analysis and PDE 11 (2018), p. 2111–2136.
[50]
, Observability and quantum limits for the Schrödinger equation on the sphere, prépublication arXiv:1702.02066.
[51] J. Marklof & Z. Rudnick – Almost all eigenfunctions of a rational polygon are uniformly distributed, J. Spectr. Theory 2 (2012), no 1, p. 107–113. [52] R. B. Melrose & J. Sjöstrand – Singularities of boundary value problems. I, Comm. Pure Appl. Math. 31 (1978), no 5, p. 593–617. [53] L. Miller – Propagation d’ondes semi-classiques à travers une interface et mesures 2-microlocales, thèse de doctorat, École polytechnique, 1996. [54] F. Nier – A semi-classical picture of quantum scattering, Ann. Sci. École Norm. Sup. 29 (1996), no 2, p. 149–183. ˜ Ngo.c – Constructing integrable systems of semitoric type, [55] A. Pelayo & S. Vu Acta Math. 206 (2011), no 1, p. 93–125. [56] Z. Rudnick & P. Sarnak – The behaviour of eigenstates of arithmetic hyperbolic manifolds, Comm. Math. Phys. 161 (1994), no 1, p. 195–213. [57] M. Ruzhansky & V. Turunen – Pseudo-differential operators and symmetries, Pseudo-Differential Operators. Theory and Applications, vol. 2, Birkhäuser, 2010. [58] J. Sjöstrand – Singularités analytiques microlocales, Astérisque 95 (1982), p. 1–166. [59] J. Sjöstrand & M. Zworski – Asymptotic distribution of resonances for convex obstacles, Acta Math. 183 (1999), no 2, p. 191–253. [60] A. I. Šnirel0 man – Ergodic properties of eigenfunctions, Uspehi Mat. Nauk 29 (1974), no 6(180), p. 181–182. [61] L. Tartar – H-measures, a new approach for studying homogenisation, oscillations and concentration effects in partial differential equations, Proc. Roy. Soc. Edinburgh Sect. A 115 (1990), nos 3-4, p. 193–230. [62] J. VanderKam – L∞ norms and quantum ergodicity on the sphere, Int. Math. Res. Not. 1997 (1997), no 7, p. 329–347. [63] A. Vasy & J. Wunsch – Semiclassical second microlocal propagation of regularity and integrable systems, J. Anal. Math. 108 (2009), p. 119–157. [64] E. Wigner – On the quantum correction for thermodynamic equilibrium, Phys. Rev. 40 (1932), p. 748–759. [65] J. Wunsch – Spreading of Lagrangian regularity on rational invariant tori, Comm. Math. Phys. 279 (2008), no 2, p. 487–496. [66]
, Non-concentration of quasimodes for integrable systems, Comm. Partial Differential Equations 37 (2012), no 8, p. 1430–1444.
ASTÉRISQUE 414
(1145)
DYNAMIQUE DE L’ÉQUATION DE SCHRÖDINGER SUR LE DISQUE
377
[67] S. Zelditch – Uniform distribution of eigenfunctions on compact hyperbolic surfaces, Duke Math. J. 55 (1987), no 4, p. 919–941. [68]
, Quantum ergodicity on the sphere, Comm. Math. Phys. 146 (1992), no 1, p. 61–71.
[69] S. Zelditch & M. Zworski – Ergodicity of eigenfunctions for ergodic billiards, Comm. Math. Phys. 175 (1996), no 3, p. 673–682. [70] M. Zworski – Semiclassical analysis, Graduate Studies in Math., vol. 138, Amer. Math. Soc., 2012. [71] A. Zygmund – On Fourier coefficients and transforms of functions of two variables, Studia Math. 50 (1974), p. 189–201.
Gabriel RIVIÈRE Université de Lille Département de Mathématiques Laboratoire Paul Painlevé U.M.R. 8524 du CNRS 59655 Villeneuve d’Ascq Cedex E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1146, p. 379 à 426 doi:10.24033/ast.1090
Mars 2018
DISTRIBUTION ASYMPTOTIQUE DES VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS [d’après Abel, Chebyshev, Robinson,...] par Jean-Pierre SERRE
À la mémoire de mon vieil ami Michel Raynaud
INTRODUCTION Lorsque l’on a une suite d’opérateurs linéaires de rang tendant vers l’infini, on peut s’intéresser à la distribution asymptotique de leurs valeurs propres. C’est ce que nous allons faire ici, dans le cas des endomorphismes de Frobenius des variétés abéliennes (autrement dit, des motifs purs de poids 1). Fixons un corps fini F, à q éléments. Soit A l’ensemble des classes d’isogénie de variétés abéliennes sur F de dimension > 0. Si A ∈ A, soit PA (X) le polynôme caractéristique de son endomorphisme de Frobenius. C’est un polynôme unitaire de degré 2 dim A, à coefficients dans Z, dont les racines complexes appartiennent au cercle C de centre 0 et de rayon q 1/2 ; réciproquement, d’après Honda-Tate ([34]), tout polynôme ayant ces propriétés provient (à une puissance près, cf. lemme 1.8.1) d’une variété abélienne sur F. Comment se répartissent les racines de PA quand A varie ? Pour donner un sens précis à cette question, il est commode d’utiliser le langage Qd des mesures : si d = 2 dim A, écrivons PA sous la forme i=1 (X − zi ) et définissons P une mesure µA sur C par µA = d1 δzi , où δzi désigne la mesure de Dirac en zi ; c’est une mesure positive de masse 1. Notons Mab l’ensemble des mesures sur C qui sont limites (pour la topologie faible de l’espace des mesures, cf. § 1.1) d’une suite de µA , avec A ∈ A. Quelles sont les propriétés des mesures µ ∈ Mab , et en particulier quels peuvent être leurs supports ? Nous répondrons partiellement à cette dernière question, en montrant que le support d’une mesure de Mab est, soit fini, soit de capacité > q 1/4 , la borne q 1/4 étant optimale. Nous donnerons aussi des exemples où le support de la mesure est un ensemble totalement discontinu analogue à l’ensemble triadique de Cantor. La
© Astérisque 414, SMF 2019
380
J-P. SERRE
situation est donc très différente de celle où l’on se limite à des jacobiennes de courbes algébriques : dans ce cas, Tsfasman et Vlăduţ ont montré (cf. [37] et [29]) que l’on n’obtient essentiellement que des mesures à support égal au cercle C, qui ont une densité continue ne s’annulant qu’en un nombre fini de points. Le texte est formé de deux §§ suivis de deux appendices. Le § 1 contient les démonstrations des énoncés ci-dessus. Il donne d’abord (§ 1.2) des théorèmes de structure sur les éléments de Mab , dans le cadre plus général des entiers algébriques qui sont « totalement » dans un compact fixé de C (pas nécessairement un cercle). Les démonstrations (§ 1.4) reposent sur la positivité de certaines intégrales R du type log |Q(x)|µ(x), où Q est un polynôme à coefficients dans Z. Ceci fait, il n’y a plus qu’à appliquer un théorème de Robinson ([25]) pour obtenir les énoncés indiqués plus haut (§ 1.8). La plupart des résultats de cette section avaient été obtenus il y a une vingtaine d’années. Je les avais exposés à diverses occasions, mais je n’en avais jamais publié les démonstrations. Le présent séminaire me donne l’occasion de combler cette lacune. J’ai appris tout récemment que M. Tsfasman venait de rédiger un texte ([36]) qui couvre une partie des §§ 1.1 à 1.4.
Le § 2 est consacré à la démonstration du théorème de Robinson, une démonstration très intéressante par les différents arguments qu’elle met en jeu : courbes hyperelliptiques, équation de Pell-Abel et polynômes de Chebyshev. Le premier appendice (appendice A) rassemble quelques définitions et théorèmes standard sur les capacités, tirés principalement des ouvrages de Tsuji [38] et Ransford [22]. L’appendice B, rédigé par J. Oesterlé, le complète en faisant le lien avec la théorie du potentiel. Je remercie J-F. Mestre et A. Bogatyrëv pour l’aide qu’ils m’ont apportée au sujet du § 2. Je remercie aussi J. Oesterlé pour sa lecture attentive du manuscrit et ses nombreuses suggestions et corrections.
1. MESURES ASSOCIÉES AUX ENTIERS ALGÉBRIQUES 1.1. Mesures Les mesures considérées ici sont des mesures de Radon positives sur un espace compact métrisable K, au sens de [8, chap. III] (1). En d’autres termes, ce sont les Rformes linéaires f 7→ µ(f ) sur l’espace C(K) des fonctions continues réelles f sur K (1)
Le mode d’exposition de [8] a été beaucoup critiqué, aussi bien à l’intérieur qu’à l’extérieur de Bourbaki, notamment parce qu’il mêle deux structures différentes : topologie et intégration. Il a cependant l’avantage de bien s’appliquer aux problèmes d’équipartition dont il est question ici, car
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
381
telles que : f > 0 sur K ⇒ µ(f ) > 0.
(1.1.1) On écrit souvent
R K
f (x)µ(x) ou
R K
f µ, à la place de µ(f ).
La masse d’une mesure µ est µ(1). La mesure de Dirac en un point z de K est notée δz ; on a δz (f ) = f (z). Nous aurons besoin plus loin d’intégrer des fonctions semi-continues supérieurement F sur K à valeurs dans R ∪ {−∞}. Par définition (cf. [8, chap. IV, § 1], appliqué à −F pour transformer « supérieurement » en « inférieurement ») cette intégrale est l’élément de R ∪ {−∞} donné par : Z Z (1.1.2) F µ = inf f µ, f >F
K
K
où la borne inférieure porte sur les f ∈ C(K) qui majorent F . Par exemple, si F est la fonction caractéristique d’une partie fermée T de K, le R nombre K F µ est la mesure µ(T ) de T pour µ. Quand T = {z} est réduit à un point z, on écrit µ(z) à la place de µ({z}) ; c’est la masse de µ en z. Lorsque tous les points sont de masse nulle, on dit que µ est diffuse (« atomless »), cf. [8, V.5.10]. Dans ce qui suit, nous munirons l’espace des mesures de la topologie faible (également appelée topologie vague, [8, chap. III, § 1.9]) ; c’est celle de la convergence simple : une suite (µn ) de mesures tend vers une mesure µ si µn (f ) → µ(f ) pour R tout f ∈ C(K). Si F est comme ci-dessus, K F µ est une fonction semi-continue supérieurement de µ (puisque c’est une borne inférieure de fonctions continues), autrement dit, on a : Z Z (1.1.3) F µ > lim sup F µn si lim µn = µ. K
K
En particulier : Z
Z F µn > 0
(1.1.4) K
pour tout n ⇒
F µ > 0. K
L’espace des mesures positives de masse 1 est compact pour la topologie faible, et métrisable, car c’est une partie fermée de la boule unité du dual de l’espace de Banach C(K), qui est de type dénombrable, cf. [8, III.1, cor. 3 à la prop. 15].
ces questions relèvent à la fois de la topologie et de l’intégration. Le lecteur que cette controverse intéresse pourra consulter l’introduction de [16].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
382
J-P. SERRE
1.2. Entiers algébriques et mesures associées À partir de maintenant, K est une partie compacte de C. On va s’intéresser aux entiers algébriques z ∈ C dont tous les Q-conjugués appartiennent à K, ce que l’on exprime en disant que z est « totalement dans K ». De façon plus précise, notons PolK l’ensemble des polynômes unitaires de degré > 0, à coefficients dans Z, dont toutes les racines appartiennent à K. Si P est un tel polynôme, de degré d et de racines z1 , . . . , zd , on lui associe la mesure δP sur K définie par : δP =
(1.2.1) i.e. δP (f ) =
1 d
P
1 (δz + · · · + δzd ), d 1
f (zi ) pour tout f ∈ C(K).
Notons M (ou MK lorsque l’on veut préciser K) l’adhérence pour la topologie faible de la famille des mesures δP , où P parcourt PolK . C’est la structure de M qui nous intéresse. On a tout d’abord : Proposition 1.2.2. — L’espace M est convexe et compact. La compacité résulte de ce que M est une partie fermée de l’espace des mesures de masse 1 sur K, qui est compact. Pour la convexité, on observe que, si P1 , . . . , Pm am appartiennent à PolK , il en est de même de leurs produits P1a1 · · · Pm avec ai ∈ N, et les δP correspondants sont denses dans le simplexe de sommets les δPi . Corollaire 1.2.3. — L’espace M est l’enveloppe convexe fermée de l’ensemble des δP . Notons IrrK le sous-ensemble de PolK formé des polynômes irréductibles, et soit IK l’ensemble des δP , P ∈ IrrK . Les éléments de IK sont linéairement indépendants, et leur enveloppe convexe fermée est M. Lorsque IrrK est fini, cela donne la structure de M : c’est le simplexe dont l’ensemble des sommets est IK . Supposons IrrK infini. C’est un ensemble dénombrable. Numérotons ses éléments : P1 , P2 , . . . Pour tout n > 1, soit Mn l’enveloppe convexe fermée des δPi , i > n. On a : (1.2.4)
M = M1 ⊃ M2 ⊃ · · ·
Posons : (1.2.5)
M∞ =
\
Mn .
n>1
C’est un convexe compact non vide ; il ne dépend pas de la numérotation des éléments de IrrK .
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
383
Théorème 1.2.6. — Soit µ ∈ M∞ , et soit S = Supp µ son support. Alors : (1.2.7) µ est diffuse (cf. § 1.1). (1.2.8) La capacité cap(S) de S est > 1; si elle est égale à 1, alors µ est la mesure d’équilibre de S. (1.2.9) L’ensemble S est réduit au sens de A.4.7. (Pour tout ce qui concerne les capacités et les mesures d’équilibre, voir les deux appendices ; les références correspondantes commencent par les lettres A et B.) Corollaire 1.2.10 (Fekete-Szegő [15]). — Si cap(K) < 1, alors IrrK est fini. La démonstration du th. 1.2.6 sera donnée au § 1.4.4. La structure de M se ramène à celle de M∞ par le théorème suivant : Théorème 1.2.11. — Soit µ ∈ M. Il existe une suite et une seule de nombres réels P positifs c0 , c1 , c2 , . . . tels que i>0 ci = 1, et que : P (1.2.12) µ = i>1 ci δPi + ν, avec ν ∈ c0 M∞ . Rappelons que P1 , P2 , . . . sont les différents éléments de IrrK , numérotés dans un ordre arbitraire.
La démonstration sera donnée au § 1.4.5. Corollaire 1.2.13. — Si µ ∈ M n’est pas combinaison linéaire d’un nombre fini de δPi , la capacité de Supp µ est > 1. Si ν 6= 0, cela résulte de (1.2.8) appliqué à c−1 0 ν. Si ν = 0, il y a une infinité de ci qui sont non nuls, et Supp µ contient les zéros des Pi correspondants ; d’après (1.2.10) appliqué à Supp µ, on a cap(Supp µ) > 1. Remarque. — La somme infinie (1.2.14)
µat =
X
ci δPi
i>1
est une mesure atomique ([8, III.1.3]). La formule µ = µat + ν donne la décomposition canonique de µ en partie atomique et partie diffuse, cf. [8, V.5.10, prop. 15]. Les th. 1.2.6 et 1.2.11 entraînent : Théorème 1.2.15. — Soit µ ∈ M. (i) µ ∈ M∞ ⇐⇒ µ est diffuse. (ii) La masse µ(z) de µ en un point z ∈ K est 0 si z n’est pas un entier algébrique totalement dans K. (iii) Si z, z 0 ∈ K sont deux entiers algébriques conjugués, on a µ(z) = µ(z 0 ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
384
J-P. SERRE
Remarque sur (ii). — Cette propriété exprime une sorte d’indépendance des mesures δPi , plus forte que la simple indépendance linéaire (le lemme 1.3.1 cidessous va dans la même direction). En général, l’enveloppe convexe fermée d’une suite de mesures discrètes contient bien d’autres mesures discrètes. Par exemple, sur K = [0, 1], l’enveloppe convexe fermée des mesures δz , avec z ∈ Q ∩ K, est l’ensemble de toutes les mesures positives de masse 1 sur K, y compris les mesures de Dirac en des points irrationnels. 1.3. Lemmes de positivité Les démonstrations des théorèmes du § 1.2 sont basées sur la positivité de certaines intégrales portant sur les mesures µ ∈ M, les fonctions intégrées étant du type z 7→ log |Q(z)|, où Q est un polynôme (2) à coefficients dans Z. Noter que, lorsque Q(z) = 0, on a log |Q(z)| = −∞ ; ainsi log |Q| est une fonction continue sur K à valeurs dans R ∪ {−∞}, et on peut lui appliquer le § 1.1.2, ce qui donne un sens aux intégrales de type µ(log |Q|). Lemme 1.3.1. — Soit P ∈ PolK et soit Q ∈ Z[X], Q 6= 0. On a δP (log |Q|) = −∞ si P et Q ont une racine commune, et δP (log |Q|) > 0 sinon. Démonstration. — Soit d le degré de P et soient z1 , . . . , zd ses racines. On a Y 1X 1 1 (1.3.2) δP (log |Q|) = log |Q(zi )| = log | Q(zi )| = log |R|, d d d où R est le résultant de P et Q ([10, § 6.6]). Comme R est un entier, on a log |R| > 0 si R 6= 0 et log |R| = −∞ si R = 0. D’où (1.3.1), puisque R = 0 si et seulement si P et Q ont une racine commune. Lemme 1.3.3. — Soit µ ∈ Mn , n > 1, et soit Q ∈ Z[X], Q 6= 0. Supposons que Q ne soit divisible par aucun Pi , i > n. On a alors µ(log |Q|) > 0. Démonstration. — Lorsque µ est combinaison linéaire finie des δPi , i > n, la positivité de µ(log |Q|) résulte de (1.3.1). Le cas général s’en déduit par passage à la limite en utilisant (1.1.4). Lemme 1.3.4. — On a µ(log |Q|) > 0 si µ ∈ M∞ et Q ∈ Z[X], Q 6= 0. Cela résulte du lemme précédent, appliqué en prenant n assez grand. Nous allons maintenant nous occuper d’intégrales doubles (il y a des énoncés analogues pour les intégrales triples, etc. — nous n’en aurons pas besoin). R L’utilisation d’intégrales log |Q(z)|µ(z) est une technique standard depuis l’application que C. Smyth en a faite pour l’estimation des traces des entiers algébriques totalement positifs, cf. [30]. (2)
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
385
Lemme 1.3.5. — Soit µ une mesure positive sur K, soit z ∈ K, et soit F (x, y) une fonction semi-continue supérieurement sur K × K, à valeurs dans R ∪ {−∞}. On a : ZZ Z (1.3.6) F (x, y) δz (x)µ(y) = F (z, y) µ(y). K×K
K
Démonstration. — Cela résulte du théorème de Lebesgue-Fubini ([8, chap.V, § 8, prop. 5]), appliqué à y 7→ −F (z, y)+C, où C > supy∈X F (z, y) — le signe « moins » et la constante C sont dus au fait que Bourbaki traite le cas des fonctions semi-continues inférieurement, à valeurs positives. Lemme 1.3.7. — Soient µ, ν ∈ M∞ , et soit Q ∈ Z[X, Y ], Q 6= 0. On a : ZZ log |Q(x, y)| µ(x)ν(y) > 0. (1.3.8) K×K
Démonstration. — Notons I(µ, ν) le membre de gauche de (1.3.8). Il a un sens pour tout couple de mesures µ, ν sur K. Choisissons le couple (δP , ν), avec P ∈ IrrK ; soit d le degré de P , et soient z1 , . . . , zd ses racines. Supposons que P (X) ne divise pas Q(X, Y ), i.e. que les Q polynômes Q(zi , Y ) soient 6= 0, et posons HP (Y ) = Q(zi , Y ) ; c’est un polynôme en Y , non nul, et à coefficients entiers. On a : ZZ I(δP , ν) = log |Q(x, y)| δP (x)ν(y) K×K Z Z 1X = log |Q(x, y)| δzi (x)ν(y) d K×K Z 1X = log |Q(zi , y)| ν(y) d’après (1.3.6), d K Z 1 = log |HP (y)| ν(y) > 0 d’après le lemme 1.3.4. d K On déduit de là que I(δP , ν) > 0 pour tous les P ∈ IrrK , sauf ceux qui divisent Q(X, Y ). Par combinaisons linéaires et passages à la limite, on en déduit le même résultat pour I(µ, ν), avec µ ∈ Mn pour n assez grand. D’où (1.3.8), sous une forme un peu plus précise : (1.3.9) I(µ, ν) > 0 si ν ∈ M∞ et µ ∈ Mn et si aucun des Pi (X), i > n, ne divise Q(X, Y ). Le cas particulier le plus utile de (1.3.8) est celui où Q = X − Y : Corollaire 1.3.10. — Si µ, ν ∈ M∞ , on a
RR K×K
log |x − y|µ(x)ν(y) > 0.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
386
J-P. SERRE
1.4. Démonstration du th. 1.2.6 et du th. 1.2.10 L’énoncé suivant est un cas élémentaire du théorème de décomposition des mesures en partie atomique et partie diffuse ([8, V.5.10, prop. 15]) : Proposition 1.4.1. — Soit µ une mesure positive sur K, et soit c sa masse en un point z ∈ K. Alors la mesure µ − cδz est positive. Démonstration. — Soit f une fonction continue positive sur K. Il nous faut prouver que µ(f ) > cf (z). Si f (z) = 1, cela résulte de la définition de c rappelée au § 1.1. Le cas général en résulte par homogénéité. Corollaire 1.4.2. — Soient µ, z, c comme ci-dessus, avec c > 0. Soit F une fonction semi-continue supérieurement sur K, à valeurs dans R ∪ {−∞}, et telle que F (z) = −∞. Alors µ(F ) = −∞. Démonstration. — D’après la prop. 1.4.1, on a µ = cδz + ν, où ν est une mesure positive ; ainsi, ν(F ) a un sens. On a µ(F ) = cF (z) + ν(F ) = −∞ + ν(F ) = −∞. [Rappelons que −∞ + x = −∞ pour tout x ∈ R ∪ {−∞}.] Corollaire 1.4.3. — Si µ ∈ Mn , n > 1, on a µ(z) = 0 pour toute racine z de l’un des polynômes Pi , i < n. Démonstration. — Si l’on avait µ(z) > 0 avec Pi (z) = 0 et i < n, on aurait µ(log |Pi |) = −∞ d’après le cor. 1.4.2, ce qui contredirait le lemme 1.3.3, appliqué à Q = Pi . On va maintenant s’occuper des démonstrations des énoncés du § 1.2. 1.4.4. Démonstration du th. 1.2.6.— Soit µ ∈ M∞ . Si µ avait une masse non nulle en un point z ∈ K, la mesure µ ⊗ µ aurait une masse non nulle au point (z, z) de K × K ; comme la fonction log |x−y| vaut −∞ en (z, z), le cor. 1.4.2 montrerait que l’intégrale RR I(µ) = K×K log |x − y|µ(x)µ(y) est égale à −∞, ce qui contredirait le cor. 1.3.10, qui dit que I(µ) > 0. La mesure µ est donc diffuse. Si S est son support, la positivité de I(µ) et la caractérisation (A.3.2) de cap(S) montrent que cap(S) > 1 ; le fait que S soit réduit résulte du cor. A.4.9. Si cap(S) = 1, alors I(µ) = 0 et µ est la mesure d’équilibre de S, vu l’unicité de celle-ci.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
387
1.4.5. Démonstration du th. 1.2.11.— Commençons par un résultat partiel : Proposition 1.4.6. — Soit n > 0 et soit µ ∈ M. (i) Il existe une famille et une seule de nombres réels positifs c0 , c1 , . . . , cn−1 , P P avec i>0 ci = 1, telle que µ − i>0 ci δPi ∈ c0 Mn . (ii) Soit i tel que 0 < i < n, et soit di = deg Pi . On a ci = di µ(z) pour toute racine z de Pi . Démonstration. — Le sous-espace de M formé des mesures de la forme : c1 δP1 + · · · + cn−1 δPn−1 + c0 ν, P
avec ci > 0, 06i 0, choisissons une racine z de Pi et posons ci = di µ(z), où di = deg Pi . Si n > 1, P posons γn = 1 − i 0, et l’on a : X (1.4.8) µ= ci δPi + νn , avec νn ∈ γn Mn . i 0. On a (1.4.11)
−1 c−1 0 ν = lim c0 νn . n→∞
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
388
J-P. SERRE
−1 Les masses des mesures positives (c−1 0 − γn )νn tendent vers 0 pour n → ∞. On peut donc récrire (1.4.11) sous la forme :
(1.4.12)
−1 c−1 0 ν = lim γn νn . n→∞
On a γn−1 νn ∈ Mn . Pour tout entier m, on a donc γn−1 νn ∈ Mm pour n assez grand, −1 et (1.4.12) entraîne c−1 0 ν ∈ Mm . Comme ceci est vrai pour tout m, on a c0 ν ∈ M∞ , i.e. ν ∈ c0 M∞ , ce qui termine la démonstration du th. 1.2.10. 1.5. Deux exemples : le cercle unité et l’intervalle [−2, 2] Prenons pour K le cercle unité C1 , i.e. l’ensemble des z ∈ C de module 1. Les entiers algébriques totalement dans K sont les racines de l’unité, cf. [17]. Les éléments de IrrK sont les polynômes cyclotomiques Φn , n = 1, 2, . . . La capacité de K est 1 ; d’après (1.2.8), cela montre que le seul élément de M∞ est la mesure d’équilibre µK de K, qui n’est autre que la mesure de masse 1 invariante par rotation, autrement dit 1 la mesure 2π dϕ, si l’on écrit les éléments de K comme z = eiϕ . D’après le th. 1.2.10, tout élément µ de M s’écrit de façon unique sous la forme (1.5.1)
µ = c0 µK +
∞ X
cn δΦn ,
n=1
où les ci sont des nombres réels positifs tels que
P∞
n=0 cn
= 1.
On peut montrer que l’application µ 7→ (cn )n>1 est un homéomorphisme de M sur P le sous-espace du cube infini [0, 1] × [0, 1] × · · · formé des (cn ) tels que n>1 cn 6 1. Noter que l’application M → [0, 1] donnée par µ 7→ cn est continue si n > 0, mais ne l’est pas si n = 0 ; la coordonnée c0 ne joue pas le même rôle que les autres. D’ailleurs le sous-espace du cube infini formé des (cn )n>0 de somme 1 n’est pas fermé.
Du cercle C1 on passe à l’intervalle I = [−2, 2] par z 7→ z + z, cf. A.6. Les entiers algébriques totalement dans I sont les z + z, où z est une racine de l’unité. On a une bijection naturelle des polynômes irréductibles correspondants, d’où aussi un isomorphisme de MC1 sur MI . L’unique élément de M∞,I est la mesure dx d’équilibre µI = π1 √4−x . 2 Remarque. — Au lieu de prendre K = I, comme nous venons de le faire, on pourrait choisir pour K n’importe quel ensemble compact contenant I et s’intéresser à l’espace MK,I formé des µ ∈ MK dont le support est contenu dans I. A priori, cet espace pourrait être strictement plus grand que MI – cela se produit dans d’autres cas. Mais cela ne se produit pas ici : on a MK,I = MI ; cela se voit en remarquant que, comme cap(I) = 1, la seule mesure diffuse de MK,I est µI . Même chose pour le cercle C1 .
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
389
1.6. Le théorème de Robinson et ses applications Théorème 1.6.1 (Robinson [25]). — Soit E la réunion d’un ensemble fini d’intervalles fermés de R. Supposons cap(E) > 1. Il existe une infinité d’entiers algébriques totalement dans E. De façon plus précise : Théorème 1.6.2. — Il existe une suite de polynômes Pn ∈ PolE telle que limn→∞ µPn = µE . La démonstration des théorèmes 1.6.1 et 1.6.2 fera l’objet du § 2. Remarque. — Le th. 1.6.1 a été démontré par Robinson deux ans après qu’il ait traité le cas particulier (déjà très intéressant) où E est un intervalle, cf. [24]. C’est l’analogue sur R du théorème suivant, dû à Fekete-Szegő ([15]) : Soit E un compact de C de capacité > 1, invariant par conjugaison. Pour tout voisinage U de E dans C, il existe une infinité d’entiers algébriques qui sont totalement dans U . (Noter que, si E ⊂ R, les entiers algébriques en question ne sont pas nécessairement dans R ; ils en sont « arbitrairement voisins », ce qui n’est pas suffisant pour ce qui nous intéresse.)
Soit maintenant K un compact de R, de capacité > 1, qui soit réunion d’un nombre fini d’intervalles. Nous allons donner deux applications du th. 1.6.2 à M∞ = MK,∞ . Tout d’abord : Théorème 1.6.3. — Soit E une partie compacte de K de capacité > 1, et soit µE sa mesure d’équilibre. On a µE ∈ M∞ . Démonstration. — Pour tout ε > 0, soit Eε l’ensemble des points de K dont la distance à E est 6 ε. On a E0 = E et Eε = K lorsque ε est assez grand. De plus, si ε > 0, Eε est une réunion finie d’intervalles. Si cap(E) > 1, il en est de même des Eε et l’on a µEε ∈ M d’après le th. 1.6.2. Comme E est l’intersection des Eε (ε > 0), on a µE = limε→0 µEε d’après (A.5.2), d’où µE ∈ M ; comme µE est une mesure d’équilibre, elle est diffuse, donc appartient à M∞ , cf. th. 1.2.15. Supposons maintenant cap(E) = 1. Soit α la borne supérieure des ε > 0 tels que cap(Eε ) = 1. Si β > α, le th. 1.6.2 montre que µEβ appartient à M, et d’après (A.5.2), il en est de même de µEα . Si α = 0, on a Eα = E, d’où µE ∈ M. Supposons α > 0 ; alors S Eα contient Eα0 = γ 4 contenus dans K : les mesures d’équilibre correspondantes appartiennent à M∞ . Noter que, dans le cas d’un intervalle E de longueur 4 dont les extrémités ne sont pas dans Z, on ignore si IrrE est infini. Le théorème suivant décrit la structure des supports des mesures µ ∈ M∞ : Théorème 1.6.4. — Soit S un compact de K. Pour que S soit le support d’une mesure appartenant à M∞ , il faut et il suffit que les deux conditions suivantes soient satisfaites : (i) cap(S) > 1. (ii) S est réduit, au sens de A.4.7. Démonstration. — La nécessité des conditions (i) et (ii) a déjà été démontrée (th. 1.2.6). Pour la suffisance, on applique le th. 1.6.3 à S ; on a µS ∈ M∞ , et puisque S est réduit, on a S = Supp(µS ). 1.6.5. Exemple. — Soit E l’ensemble triadique de Cantor dans [0, 1] : ensemble des P∞ −n , avec εn ∈ {0, 2}. Soit γ = cap(E). D’après [25], § 2 et [22], th. 5.3.7, on n=1 εn 3 1 a γ > 9 , et d’après [23] et [19], il est très vraisemblable que γ = 0,22094 . . . L’ensemble E est réduit. Cela résulte de la prop. A.4.8 ; en effet, tout ouvert non vide de E contient un sous-ensemble déduit de E par homothétie par une puissance de 1/3 suivie d’une translation ; un tel ouvert n’est donc pas de capacité 0. Ainsi, on peut appliquer le th. 1.6.4 à un multiple λE de E, avec λ > 1/γ, par exemple λ > 9. L’intérêt de cet exemple est que la mesure µλE ainsi obtenue a un support qui est de mesure 0 pour la mesure de Lebesgue dx. Ainsi, µλE et dx sont des mesures étrangères, au sens de [8, chap. V, § 5.7] : µλE n’est de la forme ϕ(x)dx pour aucune fonction intégrable ϕ sur K. Plus généralement : Proposition 1.6.6. — Soit I un intervalle fermé. Pour tout ε > 0, il existe une partie compacte de I, de mesure de Lebesgue 0, dont la capacité est > cap(I) − ε. Démonstration. — Il suffit de traiter le cas où I = [−2, 2] ; on a alors cap(I) = 1 et I contient l’ensemble de Cantor E défini ci-dessus. Soit n un entier > 0 et soit fn : I → I l’application x 7→ Tn (x), où Tn est le n-ième polynôme de Chebyshev, cf. (A.2.2). On a fn−1 (I) = I. Soit En = fn−1 (E). On a En ⊂ I, En est de mesure de Lebesgue 0, et, d’après (A.6.1), on a cap(En ) = cap(E)1/n . Comme on a
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
391
0 < cap(E) < 1, on a donc cap(En ) > 1 − ε pour tout n assez grand. Un tel En satisfait aux conditions de la prop. 1.6.6. Corollaire 1.6.7. — Pour tout intervalle fermé K de longueur > 4, il existe µ ∈ M∞,K tel que Supp(µ) soit de mesure 0 pour la mesure de Lebesgue. Démonstration. — Cela résulte de la prop. 1.6.6 et du th. 1.6.4. Un problème. — On aimerait avoir davantage de renseignements sur les mesures qui appartiennent à M∞ . Je me borne à un exemple : (1.6.8) Soit E un intervalle fermé de R, et soit νE sa mesure de Lebesgue (normalisée pour être de masse 1). Est-il possible que νE appartienne à M∞ ? Il me paraît probable que la réponse est « non ». En tout cas, une condition RR nécessaire est que I(νE ) > 0, où I(νE ) = L12 E×E log |x − y|dxdy, L étant la longueur de E. Un calcul élémentaire donne I(νE ) = log L − 3/2. On doit donc avoir L > e3/2 = 4,816 . . ., ce qui est un peu plus restrictif que la borne évidente L > 4. Dans certains cas, on peut améliorer cette borne : si par exemple le milieu de E est 0, R en écrivant que E log |x|dx est > 0, on trouve L > 2e = 5,436 . . . 1.7. Les sous-ensembles d’un cercle centré en 0 On suppose maintenant que K est un cercle C de centre 0 et de rayon r > 1, avec r2 ∈ N. Le cas qui nous intéressera par la suite est celui où r2 = q, avec q = |F|, comme dans l’introduction. Pour le cas plus général où une puissance entière de r est dans N, voir [26], § 2.
Soit I = [−2r, 2r]. Si z ∈ C, posons f (z) = z + z. Nous obtenons ainsi une application continue surjective f : C → I ; si a ∈ I, l’image réciproque de a est formée des racines de l’équation z 2 − az + r2 = 0 (on voit ainsi que, si a est un entier algébrique, il en est de même de z). Cette application va nous permettre d’identifier les ensembles IrrC , MC , MC,∞ avec les ensembles correspondants pour I. Cela provient des propriétés suivantes de f : 1.7.1. Comportement vis-à-vis des mesures. — L’application µ 7→ f (µ) est un isomorphisme de l’espace des mesures sur C invariantes par conjugaison sur l’espace des mesures sur I.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
392
J-P. SERRE
1.7.2. Comportement vis-à-vis de la capacité. — Si E est un compact de C stable par conjugaison, soit EI son image par f . D’après la prop. A.7.1, on a : (1.7.3) cap(E) = r1/2 cap(EI )1/2 . (1.7.4) Si cap(E) > 0, l’image par f de la mesure d’équilibre µE est la mesure d’équilibre µEI . 1.7.5. Comportement vis-à-vis des entiers algébriques – cf. [26, § 2]. — Si P ∈ IrrC il existe un unique PI ∈ IrrI dont les racines sont les images par f des racines de P , et l’on obtient ainsi une bijection IrrC → IrrI . On a deg PI = 21 deg P , sauf lorsque r est entier et P (X) = X ± r auquel cas PI (X) = X ± 2r. De plus, on a : (1.7.6) f (δP ) = δPI . Ces propriétés entraînent : Proposition 1.7.7. — L’application µ 7→ f (µ) définit un isomorphisme de MC sur MI qui transforme MC,∞ en MI,∞ . En appliquant à I le th. 1.6.3, le th. 1.6.4 et le cor. 1.6.7, on obtient : Théorème 1.7.8. — Soit E une partie fermée de C invariante par conjugaison. (i) Pour que E soit le support d’une mesure appartenant à MC,∞ , il faut et il suffit que E soit réduit et cap(E) > r1/2 . (ii) Il existe des ensembles E satisfaisant à (i) de mesure de Lebesgue 0. (iii) Si cap(E) > r1/2 , on a µE ∈ MC,∞ . [Noter le remplacement de 1 par r1/2 , dû à (1.7.3).]
Exemple. — Soit L = [a, b] un intervalle contenu dans [−r, r] et de longueur > 2 ; soit EL l’ensemble des points z = x + iy ∈ C tels que x ∈ L. Il résulte de (1.7.3) que cap(EL ) > r1/2 , de sorte que la mesure d’équilibre µ de EL appartient à MC,∞ d’après le th. 1.7.8. Sur la « moitié supérieure » de EL (celle où y > 0), on a 1 √ dx µ = 2π ; idem pour l’autre moitié. (b−x)(x−a)
1.8. Application aux variétés abéliennes Comme on l’a dit dans l’introduction, à toute variété abélienne A 6= 0 sur un corps F à q éléments, on associe le polynôme caractéristique PA de son endomorphisme de Frobenius. Ses valeurs propres se trouvent sur le cercle C de centre 0 et de rayon r = q 1/2 . Lemme 1.8.1. — Soit P ∈ IrrC . Il existe un entier m > 0 et une variété abélienne A sur F tels que PA = P m . Cela résulte du théorème de Honda-Tate, cf. [34, § 1, remarque 2]. Comme δP m = δP , on déduit de là :
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
393
Proposition 1.8.2. — L’enveloppe convexe fermée Mab des δA est égale à MC . On peut donc appliquer à Mab les résultats du § précédent, et en particulier le th. 1.7.8 ; noter que r1/2 est ici q 1/4 : la capacité du support d’une mesure appartenant 1/4 à Mab . ∞ est donc > q
2. DÉMONSTRATION DU THÉORÈME DE ROBINSON 2.1. Résumé de la démonstration Il s’agit de démontrer le th. 1.6.2, et donc aussi le th. 1.6.1. On se donne des nombres réels a0 < b0 < a1 < · · · < ag < bg , S en nombre 2g +2, g > 0. Pour chaque j = 0, . . . , g, soit Ej = [aj , bj ] et soit E = j Ej . On doit prouver que, si cap(E) > 1, il existe une suite (Pn ) de polynômes unitaires à coefficients dans Z, dont toutes les racines appartiennent à E, et qui jouissent de la propriété : (2.1.1)
µE = lim µPn . n→∞
La méthode est la suivante : On commence par traiter un cas particulier, celui que nous appellerons de Pell-Abel, cf. § 2.2 ; dans ce cas, on verra au § 2.4 qu’il existe, pour un certain entier r > 1, un polynôme unitaire P (x) de degré r, à coefficients réels, dont les racines sont distinctes et appartiennent à E ; de plus, sur chaque Ej , ce polynôme oscille entre −M et M (avec M > 0) de façon analogue à celle des polynômes de Chebyshev usuels sur [−2, 2]. On a cap(E) = M/2, de sorte que M > 2. L’étape suivante consiste à rétrécir E et à modifier P , arbitrairement peu, de telle sorte que l’on ait encore cap(E) > 1, et que les coefficients de P soient rationnels (§ 2.6) ; de là, on parvient à un polynôme à coefficients entiers, dont les racines sont dans E (§ 2.7) ; on obtient ainsi des polynômes de degré arbitrairement grand, et l’on prouve qu’ils jouissent de la propriété (2.1.1), ce qui démontre le th. 1.6.2 dans le cas considéré. Le cas général se ramène à celui-là en prouvant que, en rétrécissant arbitrairement peu E, il devient du type de Pell-Abel (§ 2.8 et § 2.9). La démonstration résumée ci-dessus est essentiellement celle de Robinson ([25]). Il en existe une autre, due à R. Rumely, qui est plus longue, mais qui donne un résultat plus général : elle s’applique à des courbes algébriques de genre quelconque et elle permet d’imposer aux points rationnels de ces courbes des conditions, non seulement archimédiennes, mais aussi p-adiques. Je renvoie à [27] pour les énoncés (Introduction,
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
394
J-P. SERRE
th. 0.4 et chap. 4, th. 4.2), ainsi que pour l’historique du sujet, et notamment le rôle de D. Cantor ([11], [12]), qui a été le premier à donner des énoncés de ce type. 2.2. Courbes hyperelliptiques et équation de Pell-Abel Soit k un corps de caractéristique 6= 2, et soit D(x) ∈ k[x] un polynôme unitaire de discriminant 6= 0, et de degré pair 2g + 2, g > 0. L’équation y 2 = D(x) définit aff une courbe hyperelliptique affine CD de genre g ; sa complétée CD s’obtient en lui ajoutant deux points à l’infini, que nous noterons ∞+ et ∞− ; ils sont caractérisés par le fait que y/xg+1 prend la valeur 1 au premier et −1 au second. aff L’algèbre affine de CD est un k[x]-module libre de base {1, y}. Ses éléments inversibles sont de la forme : (2.2.1)
f = P + yQ, avec P, Q ∈ k[x] et P 2 − DQ2 = c, avec c ∈ k × .
On supposera que P et Q sont non nuls (cela revient à éliminer le cas f ∈ k × ), et on les normalisera en demandant que ce soient des polynômes unitaires. On appellera degré de f le degré de P ; on a deg(P ) > g +1. L’équation P 2 −DQ2 = c est l’analogue pour k[x] de l’équation dite « de Pell » pour Z. Il est raisonnable de l’appeler l’équation de Pell-Abel, car elle apparaît pour la première fois dans Abel ([1]) où elle est étudiée à l’aide de fractions continues, comme l’équation de Pell dans le cas de Z. On trouve aussi dans la littérature le nom d’équation d’Abel-Chebyshev : elle avait en effet été retrouvée, et utilisée, par Chebyshev ([35]), à propos d’un problème de mécanique (3). Une différence importante avec l’équation de Pell usuelle est que l’équation de Pell-Abel n’a pas toujours de solution. De façon plus précise, soit r un entier > 1. Il y a équivalence entre : (2.2.2) L’équation (2.2.1) a une solution de degré r. (2.2.3) Le diviseur r(∞− − ∞+ ) de la courbe CD est linéairement équivalent à 0. [C’est immédiat : il suffit de vérifier qu’une fonction rationnelle f sur CD de diviseur r(∞− − ∞+ ) est nécessairement de la forme f = P + yQ, comme dans (2.2.1).]
On peut reformuler (2.2.3) de la manière suivante : si J désigne la jacobienne de CD , le diviseur ∞− − ∞+ définit un point P∞ de J(k), et (2.2.3) signifie que rP∞ = 0, autrement dit que P∞ est un point d’ordre fini divisant r. Lorsque g = 0, c’est le cas (3)
Problème (important pour les constructeurs de locomotives) : comment utiliser certains quadrangles articulés (les mécanismes de Chebyshev) pour transformer aussi bien que possible un mouvement circulaire en un mouvement rectiligne, et inversement ? C’est en essayant d’optimiser le « aussi bien que possible » que Chebyshev a été conduit aux polynômes qui portent son nom, ainsi qu’à l’équation P (x)2 − D(x)Q(x)2 = c. Le lecteur curieux trouvera sur internet des reproductions (avec vidéo) de certains de ces mécanismes.
ASTÉRISQUE 414
(1146)
395
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
car J = 0, et l’on trouve pour P, Q les polynômes de Chebyshev usuels (de première et seconde espèce, respectivement), avec une normalisation un peu différente ; c’est aussi le cas (pour r bien choisi) lorsque g > 1 et k est un corps fini. Par contre, si g > 1 et si car(k) = 0, il est facile de construire des exemples où P∞ est d’ordre infini, ce qui entraîne que l’équation de Pell-Abel n’a pas de solution. [Une autre façon de formuler ceci est d’introduire la jacobienne généralisée Jm de CD relative au conducteur m = ∞− + ∞+ . On a une suite exacte 1 → Gm → Jm → J → 1, qui montre que Jm est une extension de J par le groupe multiplicatif Gm ; la classe de cette extension dans Ext(J, Gm ) ' J(k) est P∞ , au signe près. Dire que P∞ est d’ordre fini signifie donc que Jm est isogène à J × Gm , ou encore que le 1-motif mixte de la courbe aff CD est scindé.]
2.3. Le cas réel : la forme de troisième espèce canonique Nous allons maintenant supposer que k = R et que le polynôme D(x) a pour racines les aj , bj du § 2.1 : a0 < b0 < a1 < · · · < ag < bg .
(2.3.1)
Ainsi D(x) est 6 0 si x ∈ E et > 0 sinon. Les points réels de la courbe CD correspondent donc aux x ∈ P1 (R)
◦
E.
Soit A ∈ R[x] un polynôme unitaire de degré g ; on lui associe la forme différentielle ηA = A(x)dx sur CD . Cette forme est holomorphe ailleurs qu’en l’infini ; elle a un pôle y simple en ∞+ et ∞− , avec résidus −1 et +1 respectivement ; c’est une « forme de 3e espèce ». Changer A revient à lui ajouter une forme de première espèce, puisque celles-ci ont pour base les xj dx/y, 0 6 j < g. On en déduit qu’il existe un choix et un seul de A tel que les périodes réelles de ηA soient nulles, autrement dit qui vérifie les conditions : Z aj A(x) p (2.3.2) dx = 0 pour j = 1, . . . , g. D(x) bj−1 [Dans cette formule, ainsi que dans les suivantes, si t est réel > 0, nous notons √ √ racine carrée > 0 ; si t < 0, nous définissons t comme i −t.]
√
t sa
Le polynôme A déterminé par ces conditions sera noté R, et la forme ηR sera appelée la forme de 3-ème espèce canonique, et notée simplement η. La formule (2.3.2), appliquée à R, montre que, dans chaque intervalle intermédiaire Tj = [bj−1 , aj ], l’intégrale de √R(x) est nulle ; cela entraîne que R(x) change de signe dans Tj , donc D(x)
s’annule en au moins un point intérieur de Tj . Comme le nombre des j est égal au degré de R, on obtient :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
396
J-P. SERRE
(2.3.4) Le polynôme R(x) a une racine et une seule à l’intérieur de chaque Tj , et n’a aucune autre racine (réelle ou complexe). Les changements de signe de R se font donc dans les « trous » Tj . Cela montre que R garde un signe constant sur chaque Ej . Comme R(x) est > 0 pour x assez grand, on en déduit, par récurrence descendante sur j : (2.3.5) On a R(x) > 0 sur Ej si g − j est pair et R(x) 6 0 sinon. On va maintenant s’intéresser aux « périodes imaginaires » de η, qui sont égales à 2ηj , avec : Z bj R(x) p (2.3.6) ηj = dx, j = 0, 1, . . . , g. D(x) aj Leurs parties réelles sont nulles.
Proposition 2.3.7. — Il existe des signes εj ∈ {−1, 1} tels que l’on ait : X (2.3.8) εj ηj = iπ. 06j6g
Démonstration. — Notons S la variété analytique complexe CD (C), vue comme une surface de Riemann au-dessus de P1 (C) = C∪{∞} via l’application (x, y) 7→ x. C’est un revêtement quadratique, ramifié seulement aux points aj , bj . Ce revêtement est non ramifié (c’est un vrai revêtement, au sens de la topologie) au-dessus de U = P1 (C) E. ˜ la réunion des E˜j . L’image Notons E˜j l’image réciproque de Ej dans S, et soit E ˜ ˜ réciproque U de U dans S est égale à S E. Un calcul sur les groupes fondamentaux ˜ → U est trivial. montre que le revêtement U [En termes plus traditionnels, cela signifie que l’on peut définir y comme une fonction méromorphe sur U , par prolongement analytique à partir de l’une de ses deux valeurs possibles en un point de U .]
˜ a deux composantes connexes ; nous noterons U ˜+ celle qui Il en résulte que U ˜− . L’adhérence S+ de U ˜+ est U ˜+ ∪ E ˜; contient le point ∞+ ; définition analogue pour U c’est une surface à bord (une « pièce », dit Bourbaki [FRV], 11.1.2), dont le bord est ˜j . Si l’on définit de manière analogue S− , on voit que la réunion des g + 1 cercles E S peut s’obtenir à partir de S+ et S− en collant leurs bords. ˜+ (comme variété analytique complexe) On notera que l’orientation naturelle de U ˜j+ de son bord ; cela donne un définit une orientation sur chacune des composantes E
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
397
R sens à une intégrale du type E˜j+ ω. Lorsque ω est de première espèce, la formule de Cauchy (4) ([9, 11.2.5]) donne : XZ ω = 0. j
˜j+ E
˜+ dont on a retiré un petit disque autour Un argument analogue, appliqué à η et à U de ∞+ , donne : XZ (2.3.9) η = −2iπ, j
˜j+ E
du fait que le résidu de η au point ∞+ est −1. R On passe de (2.3.9) à (2.3.8) en remarquant que, pour tout j, l’intégrale E˜j+ η est égale à ±2ηj , le signe « ± » provenant du fait que l’on n’essaie pas de préciser les orientations. 2.4. L’équation de Pell-Abel dans le cas du § 2.3 – énoncé des résultats On conserve les hypothèses du § 2.3, et l’on suppose en outre que, pour un certain entier r > 1, il existe une solution (P, Q) de degré r de l’équation P 2 − DQ2 = c, avec c ∈ R× . La constante c est positive, car c’est le carré de la valeur de P en l’un quelconque des points aj , bj . Nous la noterons M 2 , avec M > 0. On a donc : (2.4.1)
P 2 − DQ2 = M 2 .
Supposons x réel ; on a D(x) 6 0 si et seulement si x ∈ E ; cela entraîne : (2.4.2)
|P (x)| 6 M ⇐⇒ x ∈ E ou Q(x) = 0.
[En fait, le th. 2.4.4 ci-dessous entraîne que Q(x) 6= 0 si x ∈ / E. On peut donc supprimer « ou Q(x) = 0 » dans (2.4.2).]
De plus : (2.4.3)
|P (x)| = M ⇐⇒ x est, soit une racine de Q, soit l’un des aj , bj .
En ce qui concerne les racines des polynômes P, Q, la propriété la plus importante pour la suite est la partie (i) du théorème suivant : Théorème 2.4.4. — (i) Les racines des polynômes P et Q sont réelles, simples, et ˚ de E. appartiennent à l’intérieur E (ii) Soit f = P + yQ, cf. § 2.2.1. On a df/f = rη, où η est la forme de troisième espèce canonique définie au § 2.3. En fait, on aura besoin d’autres résultats, à savoir : (4)
Cas particulier de la formule de Stokes en dimension 2.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
398
J-P. SERRE
Théorème 2.4.5. — Pour j = 0, . . . , g, soit rj = période imaginaire de η, cf. (2.3.6). Alors :
r π|ηj | ,
où ηj est la j-ième demi-
(2.4.6) Les rj sont des entiers > 0, de somme r. (2.4.7) Le nombre de racines de P dans Ej est rj ; le nombre de racines de Q dans Ej est rj − 1. (2.4.8) Les racines de Q qui sont contenues dans Ej divisent Ej en rj sous-intervalles ; dans chacun d’eux, le polynôme P est, soit strictement croissant, soit strictement décroissant, de valeurs extrêmes M et −M . La figure ci-dessous (dessinée par J. Fresán) indique à quoi ressemble le graphe de P dans le cas où g = 1, r1 = 4, r2 = 6, r = 10, les racines de Q étant notées c1 , . . . , c8 . Les dix sous-intervalles sont [a0 , c1 ], [c1 , c2 ], . . . , [c8 , b1 ].
M
−M E:
a0
c1
c2
c3
b0
γ
a1
c4
c5
c6
c7
c8
b1
D(x) = (x − a0 )(x − b0 )(x − a1 )(x − b1 ) Q(x) = (x − c1 )(x − c2 ) · · · (x − c8 ) P (x)2 − D(x)Q(x)2 = M 2
Autres propriétés :
Théorème 2.4.9. — (i) dP/dx = rQ(x)R(x), où R est le polynôme de degré g défini au § 2.3. (ii) Le polynôme P est le r-ième polynôme de Chebyshev (au sens du § A.2) du compact E. (iii) cap(E) = (M/2)1/r .
ASTÉRISQUE 414
(1146)
399
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
[Dans le cas de la figure ci-dessus, on a R(x) = x − γ, où γ est le point de [b0 , a1 ] où P est maximum.] Les démonstrations des trois théorèmes ci-dessus sont données au § 2.5. Remarque historique. — Il n’est pas facile de dire à qui ces théorèmes sont dus. L’une des difficultés est qu’ils sont rarement énoncés explicitement, et, du coup, ils ne sont pas démontrés en détail. La plus ancienne référence que j’aie pu trouver est celle de Robinson [25]. Il y a eu ensuite Peherstorfer ([20]), Sodin-Yuditskii ([31]), Bogatyrëv ([5] et [6]), et sans doute d’autres. Il est toutefois possible que l’école russe, descendante de Chebyshev et Zolotarëv, et en particulier N.I. Akhiezer, ait été familière avec ces résultats dès les années 1930.
2.5. Démonstrations des énoncés du § 2.4 Démonstration du th. 2.4.4 (ii). — Soit f = P + yQ ; les seuls pôles de df/f sont les points ∞+ et ∞− , qui sont des pôles simples de résidus −r et r respectivement. Pour prouver que df/f = rη, il nous suffit donc de prouver que les périodes réelles de df/f sont nulles. Si j = 1, . . . , g, choisissons une détermination de y sur l’intervalle Tj = [bj−1 , aj ], p par exemple y(x) = D(x) ; cela permet de voir f comme une fonction f (x) sur Tj . Cette fonction est réelle, et ne s’annule pas ; comme |f (bj−1 )| = M = |f (aj )|, on en conclut que f (bj−1 ) = f (aj ) = εM , avec ε = ±1 ; le signe de f est donc ε sur Tj . La fonction log(εf ) prend les mêmes valeurs aux extrémités de Tj . Cela entraîne que l’intégrale sur Tj de sa dérivée est 0 ; comme cette dérivée est df/f , cela signifie que la j-ième période réelle de df/f est nulle. Remarque. — Soit ϕ(x) = log(εf (x)/M ). On a f (x) = εM eϕ(x) ; si f1 = P − yQ, le fait que f1 f = M 2 montre que f1 (x) = εM e−ϕ(x) . Comme P = (f + f1 )/2 et yQ = (f − f1 )/2, cela donne : (2.5.1) On a P (x) = εM cosh(ϕ(x)) et y(x)Q(x) = εM sinh(ϕ(x)) si x ∈ Tj = [bj−1 , aj ]. Comme ϕ est une « primitive » de df/f = rR(x)dx/y(x), on obtient donc une expression explicite de P et Q en termes de R(x), lequel peut se calculer en résolvant un système linéaire d’équations de type g × g.
Démonstration du th. 2.4.9 (i). — On a P + yQ = f et P − yQ = P =
1 2 (f
+
M2 f ),
yQ =
1 2 (f
−
M2 f ),
et dP =
1 M2 2 (1 − f 2 )df
M2 f ,
d’où
= yQdf/f = yQrη = rQRdx.
Démonstration du th. 2.4.5 et du th. 2.4.4 (i). — [La méthode est essentiellement la même que pour le th. 2.4.4 (ii), à cela près que le groupe multiplicatif R× est remplacé par le cercle unité C1 .]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
400
J-P. SERRE
p Considérons l’un des intervalles Ej , j = 0, . . . , g. Posons y1 (x) = −D(x), qui est à valeurs réelles > 0, et choisissons comme détermination de y la fonction iy1 (x). Comme ci-dessus, on peut voir f (x) = P (x) + iy1 (x)Q(x) comme une fonction sur Ej ; cette fonction est à valeurs complexes et de module M . On peut donc l’écrire sous la forme f (x) = M eiϑ(x) , où ϑ(x) est bien défini mod 2π. On peut relever ϑ : Ej → R/2πZ en une fonction continue θ : Ej → R, qui est bien déterminée si on lui impose sa valeur en aj ; comme f (aj ) = ±M , cette valeur est de la forme c0 π, avec c0 ∈ Z ; la valeur de f en bj est alors c1 π avec c1 ∈ Z. On a : P (x) = M cos(θ(x)) et y1 (x)Q(x) = M sin(θ(x)).
(2.5.2) De plus : Z
bj
Z
bj
dθ = i(θ(bj ) − θ(aj )) = (c1 − c0 )iπ.
df/f = i aj
aj
Soit rj = |c1 − c0 | ; c’est un entier > 0. Comme df/f = rη, la formule ci-dessus montre que, au signe près, rj iπ est la j-ième demi-période imaginaire de rη. On a donc rj = r|ηj |/π, avec les notations de (2.3.3). D’après (2.3.5), il existe des signes ± tels que : X (2.5.3) ±rj = r. j
Noter que la dérivée de θ(x) ne s’annule pas, donc θ(x) est strictement croissante (resp. décroissante) si c0 < c1 (resp. si c1 < c0 ). Or, si une variable croît strictement entre deux multiples entiers uπ et vπ, son cosinus s’annule un nombre de fois égal à v − u, et son sinus s’annule v − u − 1 fois en dehors des extrémités. On en conclut que le nombre de racines de P dans Ej est rj et que le nombre analogue pour Q dans l’intérieur de Ej est rj − 1. Comme P a au plus r racines, on a donc : X (2.5.4) rj 6 r. j
En comparant (2.5.3) et (2.5.4), on voit que tous les signes de (2.5.3) sont des P signes +, de sorte que l’on a rj = r, et l’on voit aussi que P n’a pas d’autres racines que celles qui sont dans les Ej et que celles-ci sont des racines simples (ce dernier point résulte aussi de la formule dP/dx = rQR du th. 2.4.9 (i)). Le même argument montre que Q n’a pas d’autres racines que celles contenues dans l’intérieur de E, et que celles-ci sont simples. Cela achève la démonstration de 2.4.4 (i), (2.4.6) et (2.4.7). Pour (2.4.8), on remarque que, dans un sous-intervalle [α, β] du type de (2.4.8), la dérivée de P est 6= 0 en tout point x tel que α < x < β : cela résulte de la formule dP dx = rQR et du fait que R ne s’annule pas sur les Ej , cf. (2.3.4). Démonstration du th. 2.4.9 (ii) : P est un polynôme de Chebyshev On démontre d’abord :
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
401
Lemme 2.5.5. — Soit q ∈ R[x] tel que |q(x)| < M pour tout x ∈ E. Le polynôme P − q a au moins r racines dans E. Démonstration. — Soit [α, β] un sous-intervalle de type (2.4.8) ; on a P (α) = −P (β) = ±M ; l’hypothèse faite sur q entraîne que le polynôme P − q a le même signe que P en α et en β ; il a donc au moins une racine dans l’intervalle ouvert ]α, β[ ; d’où le lemme, puisque le nombre des sous-intervalles est r. Démonstration du th. 2.4.9 (ii). — Soit q le polynôme de Chebyshev de E de degré r ; le fait qu’il soit unique montre que ses coefficients sont réels. Si l’on avait q 6= P , on aurait supx∈E |q(x)| < M. D’après le lemme ci-dessus, le polynôme P − q a au moins r racines ; comme il est de degré < r, ce n’est possible que s’il est nul, ce qui contredit l’hypothèse faite sur q. Démonstration du th. 2.4.9 (iii) : calcul de cap(E). — On a vu ci-dessus que, dans tout intervalle Ej , le polynôme P a rj zéros. Le même argument montre, pour tout z ∈ [−M, M ], distinct de ±M , l’équation P (x) = z a rj solutions dans Ej , donc n’a P aucune solution dans C E puisque r = rj ; lorsque z = ±M , cet énoncé est 2 également vrai (il résulte par exemple de P − M 2 = DQ2 ). D’où : (2.5.6)
L’image réciproque de [−M, M ] par P : C → C est E.
Comme la capacité de [−M, M ] est M/2, la formule (A.5.7) montre que cap(E) = (M/2)1/r . Autre démonstration. — On verra au § 2.7 que, pour tout entier n > 0, l’équation de Pell-Abel pour D, de degré rn, a une solution Pn , Qn , Mn avec Mn = 21−n M n . Avec les notations de (A.2), cela entraîne que crn (E) = Mn . D’après (A.2.1), on a : cap(E) = limn→∞ crn (E)1/rn = limn (Mn )1/rn = M 1/r limn 2(1−n)/rn = (M/2)1/r .
2.6. Comment remplacer les coefficients réels par des coefficients rationnels On conserve les notations E, D, P, Q, r, M des §§ ci-dessus. On désire démontrer : Proposition 2.6.1. — Pour tout M 0 tel que 0 < M 0 < M il existe E 0 et P 0 (5) tels que le sextuplet E 0 , D0 , P 0 , 1, r, M 0 ait les mêmes propriétés que E, D, P, Q, r, M , et en outre : ◦
(2.6.2)
on a P 0 ∈ Q[x] et E 0 ⊂ E.
[Noter que, dans cette modification, le polynôme Q a été remplacé par 1.] (5)
On aura soin de ne pas confondre P 0 et D0 avec les dérivées dP/dx et dD/dx.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
402
J-P. SERRE
Démonstration. — Soient u1 < u2 < · · · < u2r les racines de P (x)2 = M 02 . D’après (2.5.5), les ui sont distincts et appartiennent à l’intérieur de E ; de façon plus précise, pour tout j impair, l’intervalle [uj , uj+1 ] est contenu dans l’intérieur du j-ième sousintervalle de E au sens de (2.4.8). Si P 0 est assez voisin de P (au sens de la topologie naturelle de l’espace des polynômes unitaires de degré r), la même propriété vaut pour les racines de u01 , . . . , u02r de P 0 − M 0 et P 0 + M 0 , et les relations d’ordre entre racines de P 0 − M 0 et racines de P 0 + M 0 sont les mêmes que pour P . Choisissons un tel P 0 qui soit à coefficients dans Q. Posons Q0 = 1 et D0 = P 02 − M 02 ; l’équation de Q Pell-Abel P 02 − D0 Q02 = M 02 est satisfaite. On a D0 = (x − u0i ). L’ensemble E 0 des ◦
points où D0 est 6 0 est la réunion des [uj , uj+1 ], j impair. Il est contenu dans E : les conditions (2.6.2) sont donc satisfaites. Corollaire 2.6.3. — On peut choisir E 0 et P 0 de telle sorte que M 0 soit rationnel et que cap(E) − cap(E 0 ) soit aussi petit que l’on veut. C’est clair, puisque cap(E 0 ) = (M 0 /2)1/r d’après le th. 2.4.9 (iii) appliqué à E 0 . Remarque. — Le compact E 0 a r composantes connexes, et chacune d’elles contient une racine de P 0 et une seule ; le genre de la courbe hyperelliptique correspondante est en général > g. 2.7. Comment remplacer les coefficients rationnels par des coefficients entiers Théorème 2.7.1. — Soient E, D, Q, P, r, M comme dans les §§ 2.3 et 2.4. Supposons que M et les coefficients de P sont rationnels, que Q = 1 et que M > 2 (autrement dit cap(E) > 1). Il existe une suite (Pn0 ) de polynômes unitaires, à coefficients dans Z, de degrés tendant vers l’infini, ayant les propriétés suivantes : (i) Toutes leurs racines sont simples et appartiennent à E. (ii) On a µE = lim µPn0 . Corollaire 2.7.2. — Les théorèmes 1.6.1 et 1.6.2 sont vrais pour E. Démonstration de (i) (d’après [25], § 6). — Le point de départ consiste à utiliser la solution donnée (P, Q, M ) de l’équation de Pell-Abel pour en fabriquer d’autres de degré nr pour tout n > 1 : il suffit d’élever P +yQ à la puissance n, et de regrouper les termes en tenant compte de l’équation y 2 = D. Posons λ = M/2, de sorte que λ > 1. On trouve : (P + yQ)n = 2n−1 (Pn + yQn ) et Pn2 − DQ2n = 2λn , où Pn et Qn sont unitaires de degrés nr et nr − g − 1, respectivement. Pour n = 2, cela donne : (P + yQ)2 = 2(P2 + yQ2 ), avec P2 = P 2 − 2λ2 et Q2 = P Q.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
403
Pour n arbitraire, la formule analogue est : Pn (x) = λn Tn (P (x)/λ),
(2.7.3)
où Tn est le n-ième polynôme de Chebyshev, cf. (A.2.2) ; cela se démontre, par exemple, en se plaçant dans un sous-intervalle, et en remarquant que, d’après (2.5.2), on a P (x) = 2λ cos(θ(x)) et Pn (x) = 2λn cos(nθ(x)). Nous aurons besoin d’une formule pour Tn qui mette en évidence les propriétés de divisibilité de ses coefficients. Robinson donne la suivante (démontrée dans [24], § 2) : Ç å [n/2] X n kn n−k −1 (2.7.4) Tn (X) = X + (−1) X n−2k . k k−1 k=1
D’où : [n/2]
(2.7.5)
n
Pn (x) = P (x) +
X k=1
å n − k − 1 2k λ P (x)n−2k . (−1) k k−1 kn
Ç
Cela peut s’écrire en abrégé : (2.7.6)
Pn (x) = xnr +
X
αk xnr−k ,
k>0
où, pour chaque k > 0, αk est un polynôme à coefficients dans Q en n, en λ, et en les coefficients de P ; comme λ et les coefficients de P sont rationnels, on voit que αk est un polynôme en n, à coefficients dans Q, et de terme constant 0. Posons (2.7.7)
A = sup (1 + |x| + · · · + |x|r−1 ). x∈E
Choisissons un entier ` > 0 tel que : (2.7.8)
λ` (λ − 1) > A/2.
C’est possible puisque λ > 1. Choisissons un entier m > 1 tel que, pour k = 1, . . . , `r, les αk , considérés comme 1 polynômes en n, soient à coefficients dans m Z. Lemme 2.7.9. — Pour tout n > 0 divisible par m, il existe Cn ∈ R[x], de degré < nr, tel que : (i) |Cn (x)| < 2λn pour tout x ∈ E. (ii) Les coefficients de Pn − Cn sont des entiers. Ce lemme entraîne la partie (i) du th. 2.7.1 : en effet, le polynôme Pn0 = Pn −Cn est à coefficients entiers, et, d’après le lemme 2.5.5, appliqué à Pn et Cn , il a nr racines distinctes contenues dans E.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
404
J-P. SERRE
Démonstration du lemme 2.7.9. — On remarque d’abord que les `r premiers coefficients α1 , . . . , α`r de Pn sont entiers ; cela provient du fait que n est un multiple de m. On peut donc se borner à prendre pour Cn un polynôme de degré 6 nr − `r − 1. On utilise pour cela la base formée (6) des xj Pk (x), avec 0 6 j < r et 0 6 k < n − `. P On écrit Cn sous la forme Cn (x) = j,k cjk xj Pk (x), et l’on choisit les coefficients cjk entre −1/2 et 1/2, et tels que Pn − Cn soit à coefficients dans Z. Pour tout x ∈ E, on a : |Cn (x)| 6
1X j k |x| 2λ 6 A 2 j,k
k=n−`−1 X k=0
n−`
λk 6 A
λ
n−`
λ −1 0. Soit U l’ouvert de R2g+2 formé des points (a0 , b0 , a1 , . . . , bg ) tels que a0 < b0 < a1 < · · · < bg . Si u = (a0 , . . . , bg ) appartient à U , notons Eu le compact correspondant : Eu = [a0 , b0 ] ∪ · · · ∪ [ag , bg ]. Disons que u est de type PA si l’équation de Pell-Abel correspondante a une solution de degré > 0. Soit UP A l’ensemble des u de ce type. Théorème 2.8.1. — UP A est dense dans U . Cet énoncé permet d’achever la démonstration du th. 1.6.1. En effet, soit u un élément de U tel que cap(Eu ) > 1. D’après la prop. A.7.1, tous les v ∈ U suffisamment voisins de u sont tels que cap(Ev ) > 1. D’après le th. 2.8.1, on peut choisir v ∈ UP A avec Ev ⊂ Eu et cap(Ev ) > 1. Grâce au cor. 2.6.3, on peut aussi supposer que l’équation de Pell-Abel P 2 − DQ2 = M 2 pour Ev a une solution avec P ∈ Q[x] et M ∈ Q ; le cor. 2.7.2 montre alors que IrrEv est infini, donc aussi IrrEu , ce qui démontre le th. 1.6.1. Démonstration du th. 2.8.1 (d’après [18]). — Si u ∈ U , soit Ju la jacobienne de la courbe hyperelliptique Cu associée à Eu . La composante neutre Ju (R)0 de Ju (R) est un tore de dimension g, que l’on peut identifier à Rg /Zg , après un choix convenable (précisé dans [18]) de bases pour les formes de première espèce, et pour les cycles réels. L’image de ∞− − ∞+ dans Ju (R) appartient à Ju (R)0 ; d’où un élément
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
406
J-P. SERRE
ϑ(u) ∈ Rg /Zg . Cela définit une application analytique réelle (cf. [18]) ϑ : U → Rg /Zg ; comme U est simplement connexe, on peut la relever en une application continue θ : U → Rg . On a : (2.8.2)
u ∈ UP A ⇐⇒ θ(u) ∈ Qg .
En effet, θ(u) ∈ Qg ⇐⇒ ϑ(u) est d’ordre fini dans Rg /Zg . Ainsi, le th. 2.8.1 équivaut à dire que l’image réciproque de Qg par θ : U → Rg est dense dans U . On va voir que cela provient simplement du fait que Qg est dense dans Rg . Il faut d’abord « rappeler » quelques faits élémentaires : Intermède topologique. Proposition 2.8.3. — Soit f : X → Y une application entre espaces topologiques. Soit Y 0 une partie dense de Y . Si f est une application ouverte, f −1 (Y 0 ) est dense dans X. [Rappelons que f est dite ouverte si l’image par f de tout ouvert de X est un ouvert de Y ; cela n’entraîne pas que f soit continue.] Démonstration. — Soit V un ouvert non vide de X. Alors f (V ) est un ouvert non vide de Y ; il rencontre donc Y 0 , d’où V ∩f −1 (Y 0 ) 6= ∅, ce qui montre que f −1 (Y 0 ) est dense dans X. Nous allons appliquer ceci aux variétés analytiques réelles : Proposition 2.8.4. — Soit f : X → Y un morphisme de variétés analytiques réelles de dimension finie. Supposons que X soit connexe, et qu’il existe x ∈ X en lequel f est une submersion. Soit Y 0 une partie dense de Y . Alors f −1 (Y 0 ) est dense dans X. [Rappelons que f est une submersion en x signifie que l’application tangente à f en x est surjective.] Démonstration. — Soit F l’ensemble des points de X en lesquels f n’est pas une submersion ; c’est un sous-ensemble analytique fermé de X : il est défini localement ˚ l’intérieur de F . par l’annulation d’un nombre fini d’équations analytiques. Soit F ˚ est fermé. Comme il Le classique « principe du prolongement analytique » dit que F est ouvert, et que X est connexe, c’est, soit ∅, soit X. Or ce n’est pas X, puisqu’il ne contient pas x. C’est donc ∅, autrement dit X F est dense dans X. Comme la restriction de f à X F est une submersion, c’est une application ouverte. La prop. 2.8.3 entraîne que (X F ) ∩ f −1 (Y 0 ) est dense dans X F , donc aussi dans X.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
407
Fin de la démonstration du th. 2.8.1. — Pour démontrer le th. 2.8.1, il suffirait, d’après la prop. 2.8.4, d’exhiber un élément u de U , en lequel l’application θ : U → Rg est une submersion. Malheureusement, ce n’est pas facile pour g > 1. Dans [18], Lawrence procède autrement : il définit une variété U 0 qui contient U , ainsi que certains points « dégénérés » ; l’application θ se prolonge à U 0 , et il montre qu’elle est une submersion en certains des points dégénérés. Je renvoie à [18] pour plus de détails. Grosso modo, les points dégénérés qu’il utilise correspondent à des suites a0 < b0 = a1 < b1 = a2 < · · · < bg−1 = ag < bg . La courbe hyperelliptique de genre g est remplacée par une courbe de genre 0 ayant g points doubles ; sa jacobienne généralisée est un groupe de type multiplicatif de dimension g dont le groupe des points réels est compact. Remarque. — On trouvera d’autres démonstrations du th. 2.8.1 dans [25], [5] et [4]. 2.9. Fin de la démonstration du théorème 1.6.2 Conservons les notations du § 2.8 ci-dessus. Soit E = Eu , avec u ∈ U , une réunion finie d’intervalles fermés telle que cap(E) > 1. D’après la prop. A.8.1, tous les v ∈ U suffisamment voisins de u sont tels que cap(Ev ) > 1. D’après le th. 2.8.1, on peut choisir v ∈ UP A avec Ev ⊂ Eu et cap(Ev ) > 1. Grâce au cor. 2.6.3, on peut aussi supposer que l’équation de Pell-Abel P 2 − DQ2 = M 2 pour Ev a une solution avec P ∈ Q[x], Q = 1, M ∈ Q et M > 1. D’après le th. 2.7.1, on peut choisir des polynômes Pn,v unitaires à coefficients entiers, dont toutes les racines sont dans Ev , et qui sont tels que δPn,v converge vers µEv . Choisissons maintenant une suite d’éléments vj de U ayant les propriétés ci-dessus, et tels que les Evj forment une suite croissante, d’adhérence égale à E. D’après (A.5.5), on a µE = lim µEvj ; le procédé diagonal montre qu’il existe des nj tels que µE = lim δPnj ,vj . Cela achève la démonstration du th. 1.6.2, et donc aussi celle du th. 1.6.1.
APPENDICE A. FASCICULE DE RÉSULTATS SUR LES CAPACITÉS Soit K une partie compacte de C. La capacité cap(K) de K (parfois appelée capacité logarithmique, ou bien diamètre transfini) est un nombre réel > 0, défini de l’une des trois façons équivalentes A.1, A.2, A.3 données ci-dessous. Cette notion a été introduite en 1923-1924 par Fekete ([14]) et Szegő ([33]), sans doute inspirés par des résultats antérieurs de Stieltjes ([32]) et de Schur ([28]). On en trouvera une étude détaillée dans Tsuji ([38, chap. III]) et Ransford ([22, chap. 3-4-5]).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
408
J-P. SERRE
A.1. La capacité définie au moyen de discriminants (6) Si n > 1, posons : (A.1.1)
dn (K) =
Y
sup x1 ,...,xn ∈K
|xi − xj |1/n(n−1) .
i6=j
[Lorsque n = 2, dn (K) est le diamètre de K, au sens habituel.]
On a d2 (K) > d3 (K) > · · · . Lorsque K est fini, on convient que dn (K) = 0 si n > |K|. La capacité de K est définie par : (A.1.2)
cap(K) = inf dn (K) = lim dn (K). n
n→∞
Elle est souvent notée d∞ (K). A.2. La capacité, à la Chebyshev 1/n
Si n > 0, soit cn (K) = inf P kP kK , où P parcourt l’ensemble des polynômes unitaires de degré n à coefficients dans C, et kP kK est la borne supérieure de |P | sur K. Pour chaque n 6 card(K), il existe un unique P (cf. [38], th. III.23) tel que kP kK = cn (K)n : c’est le n-ième polynôme de Chebyshev de K. On a : (A.2.1)
cap(K) = inf cn (K)1/n = lim cn (K)1/n . n
n→∞
Exemple. — Prenons pour K le segment [−2, 2] ; il est bien connu que le n-ième polynôme de Chebyshev de K est le polynôme Tn caractérisé par Tn (t + t−1 ) = tn + t−n ,
(A.2.2) ou, ce qui revient au même : (A.2.3)
Tn (2 cosh x) = 2 cosh nx et Tn (2 cos θ) = 2 cos nθ.
On a k Tn kK = 2 ; d’après (A.2.1), cela entraîne cap(K) = 1. Ce résultat peut aussi se déduire de (A.1.2), et de la détermination des dn (K) due à Stieltjes et Schur, cf. [32] et [28], § 1, Satz I. La mesure d’équilibre de K (au sens de A.4 ci-dessous) est : (A.2.4)
µK =
dx 1 √ ; π 4 − x2
cela résulte de la prop. A.7.1, et du fait que la mesure d’équilibre d’un cercle est l’unique mesure de masse 1 invariante par rotation. (6)
Dans les énoncés ci-dessous, on suppose K non vide ; lorsque K est vide, et plus généralement quand K est fini, on a cap(K) = 0.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
409
Par homothétie, on déduit de cap([−2, 2]) = 1 que la capacité d’un intervalle de longueur ` est égale à `/4. A.3. Une variante de A.1, en termes de mesures Soit µ une mesure positive sur K. Posons : ZZ (A.3.1) I(µ) = log |x − y|µ(x)µ(y). K×K
C’est, soit −∞, soit un nombre réel. Soit v(K) = supµ I(µ), où µ parcourt l’ensemble des mesures positives de masse 1 à support dans K. On a : cap(K) = ev(K) ,
(A.3.2)
et en particulier cap(K) = 0 si et seulement si I(µ) = −∞ pour tout µ à support dans K. Le fait que les définitions A.1, A.2 et A.3 de cap(K) sont équivalentes est dû à Fekete et Szegő, cf. [14], [33], [15], ainsi que [22], th. 5.5.2 et th. 5.5.4. La terminologie « diamètre transfini » provient de A.1 et celle de « capacité logarithmique » de A.3. Noter que, du point de vue de la théorie des capacités de Choquet, c’est v(K) = log cap(K), et non cap(K), qui mériterait le nom de « capacité », cf. [13].
A.3.3. Extension de la notion de capacité aux ensembles non compacts. — Soit Y une partie bornée de C. On appelle capacité intérieure (ou simplement « capacité ») de Y , la borne supérieure des cap(K) lorsque K parcourt les sous-espaces compacts de Y ; on la note encore cap(Y ). En particulier, Y est dit de capacité 0 (« ensemble polaire » : « polar set » dans [22]) si cap(K) = 0 pour toute partie compacte K de Y . A.4. Mesure d’équilibre Lorsque K est un compact de capacité > 0, il existe une unique mesure positive µ de masse 1 telle que I(µ) = log cap(K), cf. [22, th. 3.7.6]. On l’appelle la mesure d’équilibre de K, et on la note µK . C’est une mesure diffuse (cela résulte du cor. 1.4.2). Son support Supp(µK ) n’est pas toujours égal à K ; ainsi, lorsque K est un disque, le support de µK est le cercle qui borde ce disque. Lorsque K est contenu dans R, K et Supp(µK ) ne diffèrent que par un ensemble de capacité 0. De façon plus précise : Proposition A.4.1. — Soit K une partie compacte de R de capacité > 0. Soit K 0 une partie fermée de K. Les propriétés suivantes sont équivalentes : (A.4.2) cap(K 0 ) = cap(K). (A.4.3) K 0 ⊃ Supp(µK ). (A.4.4) K
K 0 est de capacité 0 (au sens de A.3.3).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
410
J-P. SERRE
Corollaire A.4.5. — Supp(µK ) est la plus petite partie fermée de K ayant même capacité que K. Corollaire A.4.6. — L’ensemble K
Supp(µK ) est de capacité 0.
Démonstration de la prop. A.4.1. — (A.4.2) ⇒ (A.4.3). Si cap(K 0 ) = cap(K), on a I(µK 0 ) = I(µK ), d’où µK 0 = µK en vertu de l’unicité de la mesure d’équilibre de K ; cela entraîne Supp(µK 0 ) = Supp(µK ), d’où K 0 ⊃ Supp(µK ). (A.4.3) ⇒ (A.4.4). D’après [38], th. III.31, l’ensemble K Supp(µK ) est de capacité 0. Il en est a fortiori de même de K K 0 si K 0 contient Supp(µK ). (A.4.4) ⇒ (A.4.2). Cela résulte de A.5.4 ci-dessous. A.4.7. Disons que K est réduit si K = Supp(µK ). La prop. A.4.1 entraîne : Proposition A.4.8. — Soit K une partie compacte de R de capacité > 0. Les propriétés suivantes sont équivalentes : (i) K est réduit. (ii) Aucune partie fermée de K, distincte de K, n’a la même capacité que K. (iii) Aucune partie ouverte non vide de K n’est de capacité 0. Corollaire A.4.9. — Soit µ une mesure positive à support compact sur R, telle que I(µ) > −∞. Alors Supp(µ) est réduit. Démonstration. — Soit K = Supp(µ). Si K n’était pas réduit, d’après la prop. A.4.8, il existerait un ouvert non vide U de K de capacité 0. D’après le th. III.7 de [38], on aurait µ(U ) = 0, ce qui contredirait le fait que U est contenu dans Supp(µ). A.5. Quelques propriétés de la capacité (A.5.1) (Linéarité) cap(λK) = |λ| cap(K) pour tout λ ∈ C. (A.5.2) (Continuité pour les suites décroissantes) Soit Kn une suite décroissante de compacts de C. On a cap(∩Kn ) = inf n cap(Kn ), cf. [22, th. 5.1.3 (a)]. (A.5.3) Soient K1 , K2 ⊂ C deux compacts, et soit d leur distance. On a : cap(K1 ∪ K2 ) > cap(K1 )1/4 cap(K2 )1/4 d1/2 . Cela se démontre en appliquant (A.1.1) avec n pair, en choisissant de façon optimale n/2 points dans K1 et n/2 points dans K2 . (A.5.4) Soient B1 et B2 deux parties boréliennes bornées de C. Si B2 est de capacité 0, on a cap(B1 ∪ B2 ) = cap(B1 ), cf. [38], th. III.18. (A.5.5) (Continuité pour les suites croissantes) Soit Kn une suite croissante de S compacts et soit K un compact contenant Supposons que n Kn . S Kn ) = 0. Alors cap(K) = sup cap(Kn ). cap(K
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
411
S Démonstration. — D’après [22, th. 5.1.3 (b)], on a cap( n Kn ) = sup cap(Kn ). On S S applique (A.5.4) à B = K, B1 = n Kn et B2 = K n Kn . (A.5.6) Soit K un compact contenu dans R, et soit mes(K) sa mesure de Lebesgue. On a cap(K) > mes(K)/4, cf. [22, th. 5.3.2]. En particulier, cap(K) = 0 entraîne mes(K) = 0. La réciproque est fausse : l’ensemble triadique de Cantor dans [0, 1] est de mesure nulle, mais sa capacité est au moins 1/9, cf. § 1.6. (A.5.7) Soit f ∈ C[X] un polynôme unitaire de degré d > 1. On a cap(f −1 K) = cap(K)1/d pour tout compact K de C, cf. [22, th. 5.2.5]. (A.5.8) (Capacité de la réunion de deux intervalles de même longueur) Soient a, b ∈ R avec 0 < a < b, et soit E = [−b, −a] ∪ [a, b]. On a : 1p 2 cap(E) = b − a2 . 2 Cela résulte de (A.5.7) appliqué à f = X 2 et K = [a2 , b2 ], de sorte que f −1 K = E. A.6. Capacité des images réciproques Soit f ∈ C[X] un polynôme unitaire de degré d > 1. Soit K un compact de C et soit L = f −1 (K). Comme on l’a dit ci-dessus (cf. (A.5.7)), on a : (A.6.1)
cap(L) = cap(K)1/d .
Supposons cap(K) > 0, de sorte que cap(L) > 0 ; les mesures d’équilibre µK et µL sont donc bien définies. Voici comment on peut passer de l’une à l’autre : Proposition A.6.2. — (i) µK est l’image de µL par f : L → K. (ii) µL est l’image réciproque de µK par f : L → K, au sens défini ci-dessous. Définition de l’image réciproque ν ∗ d’une mesure ν sur K. — Il faut d’abord définir une opération d’image directe pour les fonctions. Soit ϕ ∈ C(L). Soit x ∈ K ; l’image réciproque de x par f est l’ensemble x1 , . . . , xd des racines du polynôme f (z) − x ; on convient de répéter chaque racine d’après sa multiplicité. Cela donne un sens à l’expression ϕ∗ (x) = d1 (ϕ(x1 ) + · · · + ϕ(xd )). On constate facilement que ϕ∗ est une fonction continue sur K (c’est clair en dehors des valeurs critiques de f ; il faut un argument local pour les valeurs critiques). On obtient ainsi une application linéaire continue C(L) → C(K). On en déduit par dualité une application linéaire sur les mesures : à une mesure ν sur K, on associe la mesure ν ∗ sur L telle que : (A.6.3)
ν ∗ (ϕ) = ν(ϕ∗ ) pour tout ϕ ∈ C(L).
Si ν est positive de masse 1, il en est de même de ν ∗ ; de plus, l’image de ν ∗ par f est égale à ν. On peut voir ν ∗ comme le relèvement canonique de ν.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
412
J-P. SERRE
[Variante : si x ∈ C, les d racines x1 , . . . , xd de l’équation f (X) = x définissent une mesure R P δ(x) = d1 δxi qui dépend continûment de x, et l’on a ν ∗ = K δ(x)ν(x), l’intégrale étant prise dans l’espace des mesures, comme dans [8, chap.V, § 4].]
Remarque. — Plus généralement, on peut prendre pour fonction ϕ n’importe quelle fonction continue sur L à valeurs dans R ∪ {−∞} ; la fonction ϕ∗ correspondante jouit de la même propriété, et la formule (A.6.3) est encore valable : c’est immédiat en tronquant et en passant à la limite. Nous en aurons besoin ci-dessous. Une première formule. — Soient x, y ∈ C, soient x1 , . . . , xd les d racines de l’équation f (X) = x, et soient y1 , . . . , yd celles de f (X) = y. Alors : (A.6.4)
d X
log |xi − yj | = log |x − y| pour tout j = 1, . . . , d.
i=1
Cela entraîne : (A.6.5)
1X log |xi − yj | = log |x − y|. d i,j
Démonstration. — Les xi sont les racines du polynôme unitaire f (X) − x = 0. On a donc : (A.6.6)
f (X) − x = (X − x1 ) · · · (X − xd ).
En remplaçant X par yj , et en prenant les valeurs absolues des deux membres, on Q obtient |y − x| = |yj − xi |, d’où (A.6.4). Une seconde formule. — Soit ν une mesure positive sur K, et soit ν ∗ la mesure correspondante sur L. On a : 1 (A.6.7) I(ν ∗ ) = I(ν). d RR [Rappelons que : I(ν) = K×K log |x − y|ν(x)ν(y) RR et I(ν ∗ ) = L×L log |u − v|ν ∗ (u)ν ∗ (v).] Démonstration de (A.6.7). — Posons, pour simplifier l’écriture : (A.6.8)
C(x, y) = log |x − y|.
Soit h la fonction définie par : Z h(u) =
C(u, v)ν ∗ (v).
L
Par définition de ν ∗ , on a : Z 1X h(u) = C∗ (u, y)ν(y), où C∗ (u, y) = C(u, yj ), d j K
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
413
les yj étant les racines de f (X) = y. D’après le théorème de Lebesgue-Fubini ([8, chap.V, § 8, prop. 5]), on a ZZ Z X 1 I(ν ∗ ) = C(u, yj ) ν ∗ (u)ν(y). h(u)ν ∗ (u) = d L×K j L Le même argument que pour h montre que ceci s’écrit aussi, en termes des solutions xi de f (X) = x, comme : ZZ X 1 I(ν ∗ ) = 2 C(xi , yj ) ν(x)ν(y). d K×K i,j RR D’après (A.6.5), cela donne : I(ν ∗ ) = d1 K×K C(x, y) ν(x)ν(y) = d1 I(ν). Démonstration de la prop. A.6.2. — On applique (A.6.7) à ν = µK . On en déduit : 1 1 I(µK ) = log cap(K) = log cap(L), d d est la mesure d’équilibre de L ; il est clair que son image par f
I(µ∗K ) = ce qui prouve que µ∗K est µK .
Un cas particulier. — C’est celui où L est réunion de d parties compactes disjointes Li (i = 1, . . . , d) telles que les projections : Li → K définies par f soient des homéomorphismes. Soit ν une mesure sur K ; notons νi la mesure sur Li déduite de ν par l’homéomorphisme K → Li inverse de f ; on peut considérer νi comme une mesure sur L. On a : 1 (A.6.9) ν ∗ = (ν1 + · · · + νd ). d C’est immédiat. Une autre façon d’exprimer (A.6.9) consiste à identifier L au produit K ×{1, . . . , d}, et à écrire ν ∗ comme un produit tensoriel : 1 (A.6.10) ν ∗ = ν ⊗ (δ1 + · · · + δd ). d A.7. Capacité des sous-ensembles d’un cercle L’énoncé suivant est analogue à ceux de A.6 : Proposition A.7.1. — Soit C un cercle de centre 0 et de rayon r. Soit I = [−2r, 2r], et soit f : C → I l’application z 7→ z + z. Soit K un compact de I et soit KC = f −1 (K). (i) On a cap(KC ) = r1/2 cap(K)1/2 . (ii) Supposons cap(K) 6= 0. On a f (µKC ) = µK , où µK et µKC sont les mesures d’équilibre de K et de KC , cf. A.4. La notation f (µKC ) désigne l’image de la mesure µKC par l’application f .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
414
J-P. SERRE
Remarque. — L’assertion (i) se trouve déjà dans [26]. Corollaire A.7.2. — La capacité d’un cercle de rayon r est égale à r. Cela résulte de (i) appliqué à K = I, KC = C. Démonstration de la prop. A.7.1. — Quitte à faire une homothétie, on peut supposer r = 1 ; alors C est le cercle unité |z| = 1, et I = [−2, 2]. On peut aussi supposer que cap(K) > 0. Soit ν une mesure positive sur C, invariante par la conjugaison complexe z 7→ z. Soit ν 0 l’image de ν par f ; c’est une mesure sur I, de même masse que ν. Soient I(ν) et I(ν 0 ) les intégrales définies dans (A.3.1), autrement dit : ZZ log |z1 − z2 |ν(z1 )ν(z2 ) I(ν) = C×C
et I(ν 0 ) =
ZZ
log |x − y|ν 0 (x)ν 0 (y).
I×I
Lemme A.7.3. — On a I(ν 0 ) = 2I(ν). Démonstration du lemme. — Posons A(z1 , z2 ) = log |z1 − z2 | + log |z 1 − z2 |. Comme ν est invariante par conjugaison, on a ZZ (A.7.4) A(z1 , z2 )ν(z1 )ν(z2 ) = 2I(ν). C×C
Soient x = f (z1 ) = z1 + z 1 et y = f (z2 ). Un calcul simple montre que : (A.7.5)
|(z1 − z2 )(z 1 − z2 )| = |z1 + z 1 − (z2 + z 2 )| = |x − y|,
d’où : A(z1 , z2 ) = log |x − y|.
(A.7.6)
Ainsi, la fonction A(z1 , z2 ) est la composée de f × f : C × C → I × I et de la fonction log |x − y| sur I × I. Comme ν 0 ⊗ ν 0 est l’image de ν ⊗ ν par f × f , on en déduit : ZZ ZZ (A.7.7) A(z1 , z2 )ν(z1 )ν(z2 ) = log |x − y|ν 0 (x)ν 0 (y) = I(ν 0 ). C×C
Le lemme résulte de (A.7.4) et (A.7.7).
ASTÉRISQUE 414
I×I
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
415
Fin de la démonstration de la prop. A.7.1. — L’application ν 7→ ν 0 donne une bijection entre les mesures positives de masse 1 sur KC qui sont invariantes par conjugaison, et les mesures positives de masse 1 sur K. Soit µK la mesure d’équilibre de K ; on a I(µK ) = c, avec c = log cap(K). Si ν est la mesure correspondante sur KC , le lemme A.7.3 montre que I(ν) = c/2, d’où cap(KC ) > cap(K)1/2 . Si cette inégalité était stricte, on aurait I(µKC ) > c/2 ; comme la mesure I(µKC ) est canonique, elle est invariante par conjugaison, et elle correspondrait à une mesure ν 0 sur K telle que I(ν 0 ) > c, contrairement à la définition de c. On a donc cap(KC ) = cap(K)1/2 , ce qui démontre (i). On voit en outre que ν est la mesure d’équilibre de KC , ce qui démontre (ii). A.8. Une propriété de continuité pour les réunions finies d’intervalles fermés de R Soit a = {a1 , . . . , an } une suite strictement croissante de nombres réels, en nombre n pair, et posons : Ea = [a1 , a2 ] ∪ [a3 , a4 ] ∪ · · · ∪ [an−1 , an ]. Proposition A.8.1. — La capacité de Ea dépend continûment de a. Démonstration. — Soit d = inf(ai+1 − ai ). Si ε est > 0 et < d/2, notons a0ε la suite des ai + (−1)i ε et a00ε la suite des ai − (−1)i ε. On a : Ea00ε ⊂ Ea ⊂ Ea0ε . La continuité de cap(Ea ) équivaut à dire que cap(Ea ) est la borne inférieure des cap(Ea0ε ) ainsi que la borne supérieure des cap(Ea00ε ), ce qui résulte respectivement de (A.5.2) et (A.5.5). A.9. Calculs effectifs de capacités Le calcul de la capacité d’un compact K donné est un problème difficile. On trouvera dans [22, p. 135] une liste de quelques cas connus. Signalons par exemple celui d’un arc de cercle, de rayon r et d’angle α, avec 0 6 α 6 2π : c’est r sin(α/4) ; cela se déduit de la prop. A.6.1 appliquée à K = [2r cos(α/2), 2r]. Voir aussi [23] et [19] pour des calculs approchés, sur ordinateur. Pour les sous-espaces de R, un cas particulièrement intéressant est celui où K est réunion disjointe de segments fermés. Le cas de deux segments a été traité par Akhiezer : [2] et [3] ; le résultat s’exprime en termes de fonctions thêta à la Jacobi. Pour le cas général, voir Bogatyrëv [5], Peherstorfer-Schiefermayr [21] et BogatyrëvGrigoriev [7].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
416
J-P. SERRE
APPENDICE B. POTENTIELS par Joseph OESTERLÉ B.1. Rappels sur les fonctions sous-harmoniques Soit U une partie ouverte de C. Une fonction numérique f : U → R est dite sous-harmonique si : (i) elle est à valeurs dans R ∪ {−∞} ; (ii) elle est semi-continue supérieurement ; (iii) pour tout disque fermé D(a, r) contenu dans U , f (a) est majoré par la valeur moyenne de f dans D(a, r). Sous les hypothèses (i) et (ii), la valeur moyenne de f dans un disque fermé contenu dans U est un élément bien défini de R ∪ {−∞}, cf. 1.1.
Lorsque f satisfait les conditions (i) et (ii), la condition (iii) est équivalente à : (iii0 ) Pour tout disque fermé D(a, r) contenu dans U , f (a) est majoré par la valeur moyenne de f dans le cercle C(a, r). De plus, pour qu’elle soit satisfaite, il suffit qu’il existe pour tout a ∈ U des disques fermés D(a, r) contenus dans U de rayon r > 0 arbitrairement petit pour lesquels f (a) est majoré par la valeur moyenne de f dans D(a, r) (resp. dans C(a, r)). La propriété pour une fonction numérique dans U d’être sous-harmonique est donc de nature locale. Une fonction sous-harmonique f dans U qui n’est égale à −∞ dans aucune composante connexe de U est localement intégrable ([22, th. 2.5.1]). Son laplacien au sens des distributions est une mesure de Radon positive ([22, th. 3.7.2]). Si g est une seconde fonction sous-harmonique dans U qui n’est égale à −∞ dans aucune composante connexe de U et a même laplacien que f , il existe une fonction harmonique h dans U telle que g = f + h ([22, Lemme 3.7.10]). B.2. Potentiels de mesures positives à support compact Soit µ une mesure de Radon positive dans C, à support compact. On appelle potentiel de µ la fonction pµ : C → R ∪ {−∞} définie par Z (B.2.1) pµ (z) = log |w − z|µ(w). C
Cette fonction est sous-harmonique dans C, harmonique en dehors du support de µ et l’on a (B.2.2)
ASTÉRISQUE 414
pµ (z) = µ(C) log |z| + o(1)
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
417
lorsque |z| tend vers +∞ ([22, th. 3.1.2]). Le laplacien de pµ au sens des distributions est 2πµ ([22, th. 3.7.4]). Proposition B.2.3. — Soit K une partie compacte de C. L’application µ 7→ pµ est une bijection de l’ensemble des mesures de Radon positives dans C, de masse 1 et à support dans K, sur l’ensemble des fonctions p : C → R possédant les propriétés suivantes : (i) la fonction p est sous-harmonique dans C; (ii) elle est harmonique en dehors de K; (iii) on a p(z) = log |z| + o(1) lorsque |z| tend vers +∞. Il résulte du début de ce numéro que cette application est bien définie. La relation ∆pµ = 2πµ montre qu’elle est injective. Démontrons qu’elle est surjective. Soit donc p : C → R une fonction possédant les propriétés (i), (ii) et (iii). D’après B.1, p est localement intégrable et son laplacien ∆p au sens des distributions est une mesure de Radon positive dans C, à support dans K. Écrivons cette mesure 2πµ. On a alors ∆pµ = ∆p. D’après B.1, il existe une fonction harmonique h dans C telle que pµ = p + h. On a (B.2.4)
h(z) = (µ(C) − 1) log |z| + o(1)
et a fortiori h(z) = o(|z|), lorsque |z| tend vers +∞. Cela implique que h est constante, d’après une variante du théorème de Liouville (cf. [22, exerc. 1.3.5]). La relation (B.2.4) implique alors d’abord que µ(C) = 1, puis que h = 0. On a ainsi pµ = p, ce qui démontre la surjectivité de l’application considérée.
B.3. Une propriété des ensembles polaires Proposition B.3.1. — Soit µ une mesure de Radon positive dans C à support compact telle que I(µ) > −∞. Toute partie borélienne polaire de C est de mesure nulle pour µ. [Pour la définition de I(µ), voir A.4.] Cela résulte de [22, th. 3.2.3]. B.4. Potentiels des mesures d’équilibre Soit K une partie compacte de C non polaire. Notons µK sa mesure d’équilibre et pK le potentiel de la mesure µK . Rappelons que v(K) = I(µK ) est le logarithme de la capacité de K (cf. A.4). Proposition B.4.1. — (a) On a pK > v(K) dans C. (b) L’ensemble des points x ∈ K tels que pK (x) > v(K) est polaire.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
418
J-P. SERRE
Il s’agit là d’un théorème de Frostman, cf. [22, th. 3.3.4]. Inversement : Proposition B.4.2. — Soit ν une mesure de Radon positive dans C, de masse 1 et à support dans K. Soit a la borne inférieure de pν dans K. On a a 6 v(K), avec égalité si et seulement si ν est la mesure d’équilibre de K. On a, d’après le théorème de Lebesgue-Fubini ([8, chap V, § 8, prop. 5]), ZZ Z (B.4.3) I(ν) = log |x − y|ν(x)ν(y) = pν (y)ν(y), K×K
K
et par suite a 6 I(ν) 6 v(K). Si a = v(K), on a I(ν) = v(K), et alors ν est la mesure d’équilibre de K (cf. A.4). B.5. Caractérisation du potentiel d’une mesure d’équilibre Proposition B.5.1. — Soit K une partie compacte de C, non polaire. Pour qu’une fonction p : C → R soit le potentiel de la mesure d’équilibre de K, il faut et il suffit qu’elle possède les propriétés suivantes : (i) elle est sous-harmonique dans C et harmonique en dehors de K; (ii) on a p(z) = log |z| + o(1) lorsque |z| tend vers +∞; (iii) il existe a ∈ R tel que p > a dans K, et que l’ensemble des x ∈ K tels que p(x) > a soit polaire. De plus, lorsque ces propriétés sont satisfaites, on a v(K) = a. Il résulte de B.2 et de la prop. B.4.1 que le potentiel pK de la mesure d’équilibre de K possède ces propriétés, avec a = v(K). Inversement, soit p : C → R une fonction possédant ces propriétés. D’après la prop. B.2.3, elle est de la forme pν , où ν est une mesure de Radon positive dans C, de masse 1 et à support dans K. On déduit de la relation (B.4.3) que l’on a I(ν) > a, et donc I(ν) > −∞. Compte tenu des propositions B.3.1 et B.4.1.(b), la fonction pK est ν-presque partout égale à v(K) R dans K, d’où K pK (x)ν(x) = v(K). D’autre part, il résulte de la prop. B.3.1 et de la condition (iii) que la fonction pν = p est µK -presque partout égale à a dans K, R d’où K pν (y)µK (y) = a. Or, d’après le théorème de Lebesgue-Fubini ([8, chap V, § 8, prop. 5]), on a Z ZZ Z (B.5.2) pν (y)µK (y) = log |x − y|ν(x)µK (y) = pK (x)ν(x), K
K×K
C
d’où v(K) = a. La prop. B.4.2 implique alors que ν est la mesure d’équilibre de K, et p est son potentiel.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
419
Corollaire B.5.3. — Soit h : C → R une fonction continue, nulle dans K et harmonique dans C K, telle que h(z) = log |z|+O(1) lorsque |z| tend vers +∞. Alors log |z| − h(z) a une limite a lorsque |z| tend vers +∞. On a v(K) = a et pK = h + a. Soit r > 0 un rayon tel que K soit contenu dans le disque D(0, r). La fonction z 7→ log |z −1 | − h(z −1 ) est alors harmonique et bornée dans le disque ouvert épointé de centre 0 et rayon r−1 . Par suite, elle se prolonge continûment en 0. D’où l’existence de la limite a. Si r est assez grand, h est positive sur le cercle C(0, r). Le principe du maximum appliqué à −h implique que h est positive dans l’ouvert D(0, r) K. Ainsi h est positive en tout point de C. Sa valeur en un point de K est nulle, donc majorée par la valeur moyenne de h dans tout disque fermé centré en ce point. Comme par ailleurs h est harmonique dans C K, elle est sous-harmonique dans C (cf. B.1). Alors p = h + a est sous-harmonique dans C, égale à a dans K et harmonique dans C K, et l’on a p(z) = log |z| + o(1) lorsque |z| tend vers +∞. Il résulte de la prop. B.5.1 que l’on a v(K) = a et pK = p. B.6. Potentiel de la mesure d’équilibre d’une réunion finie d’intervalles compacts réels Soient g un entier naturel et a0 < b0 < · · · < ag < bg
(B.6.1)
une suite finie strictement croissante de 2g + 2 nombres réels. Comme en 2.3, posons Ej = [aj , bj ], notons E la réunion des Ej et posons D(x) =
(B.6.2)
g Y
(x − aj )(x − bj ).
j=0
On a D(x) 6 0 pour x ∈ E et D(x) > 0 pour x ∈ R
E.
D’après 2.3, il existe un unique polynôme R ∈ R[x] unitaire de degré g tel que Z aj R(x) p dx = 0 pour 1 6 j 6 g. (B.6.3) D(x) bj−1 Ce polynôme a une unique racine simple dans chaque intervalle ]bj−1 , aj [, où 1 6 j 6 g, et aucune autre racine dans C (cf. 2.3.4). Il résulte de la démonstration de la prop. 2.3.7 qu’il existe une unique fonction holomorphe f dans C E telle que f (x) = √R(x) pour x ∈ ]bg , +∞[. On a D(x)
2
R2 (z) D(z)
f (z) = et f (z) = f (z) pour tout z ∈ C |z| tend vers +∞.
E, et f (z) = z −1 + O(z −2 ) lorsque
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
420
J-P. SERRE
Proposition B.6.4. — (a) Soit x ∈ ]bj−1 , aj [, où 1 6 j 6 g. On a f (x) = (−1)g−j+1 √R(x) . D(x)
(b) Soit x ∈ ]aj , bj [, où 0 6 j 6 g. Lorsque z ∈ C avec Im(z) > 0 tend vers x, |R(x)| f (z) tend vers (−1)g−j √R(x) = √ · i
−D(x)
i
|D(x)|
La dernière égalité résulte de (2.3.5). Le demi-plan supérieur fermé, privé des points a0 , b0 , . . . , ag , bg , est simplement connexe. La fonction rationnelle R2 /D y possède donc une racine carrée continue qui prolonge f . Cela implique l’existence des limites considérées en (b), et le fait qu’elles dépendent continûment de x. Tout revient donc dans (a) et (b) à déterminer un signe, qui en fait ne dépend que des intervalles considérés et non de x. Le germe de f en bg peut s’écrire √u(z) , où u est le germe d’une fonction z−bg p z − bg est celui de la holomorphe, réelle sur l’axe réel et non nulle en bg , et détermination principale de la racine carrée de z − bg . Comme on a f (x) = √R(x) > 0 D(x)
pour x ∈ ]bg , +∞[, on a u(bg ) ∈ R∗+ . Il s’ensuit que, lorsque z ∈ C avec Im(z) > 0 tend vers un point x de ]ag , bg [ suffisamment proche de bg , f (z) tend vers un élément de −iR∗+ . L’assertion (b) s’en déduit pour j = g. Une étude analogue au voisinage de aj (resp de bj−1 ), pour 1 6 j 6 g, montre que l’assertion (b) pour l’indice j implique l’assertion (a) pour l’indice j (resp. que l’assertion (a) pour l’indice j implique l’assertion (b) pour l’indice j − 1). La proposition en résulte donc par une récurrence descendante. Remarque B.6.5. — D’une étude analogue en a0 , on déduit que f (x) = (−1)g+1 √R(x)
D(x)
pour x ∈ ]−∞, a0 [. Remarque B.6.6. — Soit x ∈ ]aj , bj [, où 0 6 j 6 g. Lorsque z ∈ C avec Im(z) < 0 i|R(x)| tend vers x, f (z) tend vers (−1)g−j √iR(x) = √ ·. Cela résulte de la prop. −D(x)
|D(x)|
B.6.4.(b), puisque l’on a f (z) = f (z) pour tout z ∈ C
E.
La fonction f possède dans le demi-plan supérieur ouvert une primitive holomorphe. Celle-ci se prolonge en une fonction continue F+ dans le demi-plan supérieur fermé, vu la croissance de f au bord. Normalisons la primitive en exigeant que F+ (bg ) = 0 et posons alors h+ = Re(F+ ). On a h+ (z) = log |z| + O(1) lorsque |z| tend vers +∞, avec Im(z) > 0.
Proposition B.6.7. — La fonction h+ est nulle dans E.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
421
Il résulte de la prop. B.6.4.(b) que, si x et y sont deux points d’un intervalle ]aj , bj [, on a Z y |R(t)| p h+ (y) − h+ (x) = Re( dt) = 0, x i |D(t)| donc h+ est constante dans chacun des intervalles [aj , bj ], où 0 6 j 6 g. Par ailleurs, il résulte de la prop. B.6.4.(a) et de la relation (B.6.3) que l’on a h+ (bj−1 ) = h+ (aj ) pour 1 6 j 6 g. Comme h+ (bg ) = 0 par hypothèse, h+ est nulle dans chacun des intervalles [aj , bj ]. On définit de manière analogue une fonction continue F− dans le demi-plan inférieur fermé, nulle en bg , qui est une primitive de f dans le demi-plan inférieur ouvert. On a en fait F− (z) = F+ (z). On pose h− = Re(F− ). On a donc h− (z) = h+ (z) pour tout z ∈ C tel que Im(z) 6 0. Les fonctions h+ et h− coïncident dans R. Notons h la fonction de C dans R qui les prolonge. Elle est continue, nulle dans E et harmonique dans C E, puisqu’au voisinage de chaque point de C E elle peut s’écrire comme la partie réelle d’une primitive de f . On a h(z) = log |z| + O(1) lorsque |z| tend vers +∞. On déduit alors du cor. B.5.2 : Proposition B.6.8. — On a h(z) = log |z| − v(E) + o(1) lorsque |z| tend vers +∞, et h + v(E) est le potentiel de la mesure d’équilibre de E. On déduit de la prop. B.6.8 l’expression suivante du logarithme de la capacité de E : Z x R(t) p (B.6.9) v(E) = lim (log x − dt). x→+∞ D(t) bg Compte tenu de la remarque B.6.5, on a aussi : (B.6.10)
v(E) = lim (log |x| − (−1)g x→−∞
Z
a0
x
R(t) p dt). D(t)
B.7. Mesure d’équilibre d’une réunion finie d’intervalles compacts réels Conservons les notations de B.6. Théorème B.7.1. — La mesure d’équilibre µE de E est la mesure de densité |R(x)| √ par rapport à la mesure de Lebesgue sur E. π
|D(x)|
Nous avons vu dans la prop. B.6.8 que le potentiel pE de µE est égal à h + v(E), où h est une fonction continue dans C définie en B.6. Il résulte alors de B.2 que 2πµE est le laplacien de pE au sens des distributions ; c’est donc aussi le laplacien de h. La mesure µE est diffuse (cf. A.4) et son support est contenu dans E. Pour démontrer la prop. B.7.1, il nous suffit donc de démontrer que, pour toute fonction ϕ : E → C dont
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
422
J-P. SERRE
le support est contenu dans l’un des intervalles ouverts ]aj , bj [ et qui est de classe C ∞ , on a Z Z bj |R(x)| (B.7.2) 2π ϕ(x)µE (x)dx = 2 ϕ(x) p dx. |D(x)| E aj Choisissons un intervalle [c, d] ⊂ ]aj , bj [ tel que le support de ϕ soit contenu dans ]c, d[, puis un nombre réel r > 0. Il existe une fonction ψ : C → C de classe C ∞ prolongeant ϕ dont le support est contenu dans l’intérieur du rectangle K = [c, d] + i[−r, r]. Comme 2πµE = ∆h, le premier membre de (B.7.2) est égal à ZZ ZZ ∂2ψ (B.7.3) ∆ψ(x + iy)h(x + iy)dxdy = 2ih dz ∧ dz. ∂z∂z C K Pour 0 < ε < r, posons Kε+ = [c, d] + i[ε, r] et Kε− = [c, d] + i[−r, −ε]. ∂F+ Dans le demi-plan supérieur ouvert, on a, avec les notations de B.6, 2 ∂h ∂z = ∂z = f RR 2 ∂ ψ ∂2h = 0. Il résulte du théorème de Stokes que l’intégrale Kε+ 2ih ∂z∂z dz ∧ dz est et ∂z∂z égale à Z Z d+iε ∂ψ ∂h ∂ψ dz) = dz). (B.7.4) 2i(ψ dz + h i(ψf dz + 2h ∂z ∂z ∂z ∂Kε+ c+iε
Lorsque ε tend vers 0, cette intégrale tend vers Z d |R(x)| (B.7.5) ϕ(x) p dx |D(x)| c d’après les propositions B.6.4.(b) et B.6.7. On démontre de manière analogue que RR ∂2ψ l’intégrale Kε− 2ih ∂z∂z dz ∧ dz tend vers cette même limite. La formule (B.7.2) en résulte.
RÉFÉRENCES √ [1] N. Abel – Sur l’intégration de la forme différentielle ρdx/ R, R et ρ étant des fonctions entières (7), J. Crelle 1 (1826), p. 105–144 (= Œ, XI). [2] N. Akhiezer – Sur les polynomes de Tchebyscheff pour deux segments, C.R.A.S. 191 (1930), p. 754–756. [3]
, Über einige Funktionen welche in zwei gegebenen Intervallen am wenigsten von Null abweichen, Izv. Akad. Nauk SSSR (1932), p. 1163–1202, II, III (1933), p. 499–536.
(7)
Le texte original, écrit en français, est celui reproduit dans les Œuvres ; celui du journal de Crelle est une traduction en allemand, due probablement à Crelle.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
423
[4] Y. André, P. Corvaja & U. Zannier – The Betti map associated to a section of an abelian scheme (with an Appendix by Z. Gao), prépublication arXiv:1802.03204. [5] A. B. Bogatyrëv – On the efficient computation of Chebyshev polynomials for several intervals, Mat. Sb. 190 (1999), no 11, p. 15–50 ; traduction anglaise, Sbornik, Mathematics 190 (1999), p. 1571–1605. [6]
, Extremal Polynomials and Riemann Surfaces, MCCME, 2005 ; traduction anglaise, Springer, 2012.
[7] A. B. Bogatyrëv & O. A. Grigor0 ev – Closed formula for the capacity of several segments on the line, Tr. Mat. Inst. Steklova 298 (2017), p. 67–74 ; traduction anglaise Proc. Steklov Inst. Math. 298 (2017), p. 60–67. [8] N. Bourbaki – Intégration. Chapitres I-V, Hermann, 1967 ; traduction anglaise Integration I, Springer, 2004. [9] [10]
, Fascicule de résultats des variétés, Hermann, 1971. , Algèbre. Chapitres IV-VII, Masson, 1981 ; traduction anglaise, Algebra II, Springer, 2003.
[11] D. G. Cantor – On approximation by polynomials with algebraic integer coefficients, in Number Theory (Proc. Sympos. Pure Math., Vol. XII, Houston, Tex., 1967), Amer. Math. Soc., 1969, p. 1–13. [12]
, On an extension of the definition of transfinite diameter and some applications, J. reine angew. Math. 316 (1980), p. 160–207.
[13] G. Choquet – Capacitabilité en potentiel logarithmique, Acad. Roy. Belg. Bull. Cl. Sci. 44 (1958), p. 321–326. [14] M. Fekete – Über die Verteilung der Wurzeln bei gewissen algebraischen Gleichungen mit ganzzahligen Koeffizienten, Math. Z. 17 (1923), no 1, p. 228–249. [15] M. Fekete & G. Szegő – On algebraic equations with integral coefficients whose roots belong to a given point set, Math. Z. 63 (1955), p. 158–172. [16] R. Godement – Analyse mathématique. IV. intégration et théorie spectrale, analyse harmonique, le jardin des délices modulaires, Springer, 2003. [17] L. Kronecker – Zwei Sätze über Gleichungen mit ganzzahligen Coefficienten, J. Crelle 53 (1857), p. 173–175 (= Werke vol. I, p. 103–108). [18] B. Lawrence – A density result for real hyperelliptic curves, C. R. Math. Acad. Sci. Paris 354 (2016), no 12, p. 1219–1224 ; Corrigendum, ibid., 357 (2019), no 5, p. 462. [19] J. Liesen, O. Sète & M. M. S. Nasser – Fast and accurate computation of the logarithmic capacity of compact sets, Comput. Methods Funct. Theory 17 (2017), no 4, p. 689–713.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
424
J-P. SERRE
[20] F. Peherstorfer – On Bernstein-Szegő orthogonal polynomials on several intervals, SIAM J. Math. Anal. 21 (1990), no 2, p. 461–482. [21] F. Peherstorfer & K. Schiefermayr – Description of extremal polynomials on several intervals and their computation. I, II, Acta Math. Hungar. 83 (1999), nos 1-2, p. 27–58, 59–83. [22] T. Ransford – Potential theory in the complex plane, London Mathematical Society Student Texts, vol. 28, Cambridge Univ. Press, 1995. [23] T. Ransford & J. Rostand – Computation of capacity, Math. Comp. 76 (2007), no 259, p. 1499–1520. [24] R. M. Robinson – Intervals containing infinitely many sets of conjugate algebraic integers, in Studies in mathematical analysis and related topics, Stanford Univ. Press, Stanford, Calif., 1962, p. 305–315. [25] , Conjugate algebraic integers in real point sets, Math. Z. 84 (1964), p. 415–427. , Conjugate algebraic integers on a circle, Math. Z. 110 (1969), p. 41–51. [26] [27] R. Rumely – Capacity theory with local rationality, Mathematical Surveys and Monographs, vol. 193, Amer. Math. Soc., 2013. [28] I. Schur – Über die Verteilung der Wurzeln bei gewissen algebraischen Gleichungen mit ganzzahligen Koeffizienten, Math. Z. 1 (1918), no 4, p. 377– 402 (= Gesam. Abh. vol. II, no 32). [29] J-P. Serre – Répartition asymptotique des valeurs propres de l’opérateur de Hecke Tp , J. Amer. Math. Soc. 10 (1997), no 1, p. 75–102 (= Œ. vol. IV, no 170). [30] C. Smyth – Totally positive algebraic integers of small trace, Ann. Inst. Fourier 34 (1984), no 3, p. 1–28. [31] M. L. Sodin & P. M. Yuditski˘ı – Functions that deviate least from zero on closed subsets of the real axis, Algebra i Analiz 4 (1992), no 2, p. 1–61. [32] T. Stieltjes – Sur quelques théorèmes d’algèbre, C.R.A.S. 100 (1885), p. 439– 440 (= Œ. I, p. 440-441). [33] G. Szegő – Bemerkungen zu einer Arbeit von Herrn M. Fekete : Über die Verteilung der Wurzeln bei gewissen algebraischen Gleichungen mit ganzzahligen Koeffizienten, Math. Z. 21 (1924), no 1, p. 203–208. [34] J. Tate – Classes d’isogénie des variétés abéliennes sur un corps fini (d’après T. Honda), Séminaire Bourbaki, vol. 1968/1969, exposé no 352, Lecture Notes in Math., vol. 175, Springer, 1971, p. 95–110 (= Coll. Papers, no 32). [35] P. L. Tchebychef – Théorie des mécanismes connus sous le nom de parallélogrammes, Mém. Acad. Sci. Pétersb. 7 (1854), p. 539–568 (= Œ I, p. 111-143). [36] M. A. Tsfasman – Serre’s theorem and measures corresponding to abelian varieties over finite fields, https://hal.archives-ouvertes.fr/ hal-02134139/, 2019.
ASTÉRISQUE 414
(1146)
VALEURS PROPRES DES ENDOMORPHISMES DE FROBENIUS
425
[37] M. A. Tsfasman & S. G. Vlădut, – Asymptotic properties of zeta-functions, J. Math. Sci. (New York) 84 (1997), no 5, p. 1445–1467. [38] M. Tsuji – Potential theory in modern function theory, Maruzen Co., Ltd., Tokyo, 1959 ; second edition, Chelsea, New York, 1975.
Jean-Pierre SERRE Collège de France 3 rue d’Ulm 75005 Paris E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1147, p. 427 à 476 doi:10.24033/ast.1091
Juin 2018
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE [d’après Bridgeland, Bayer-Macrì,...] par François CHARLES
INTRODUCTION L’objet principal de ce texte est la notion de condition de stabilité sur une catégorie triangulée D. Inspiré par des travaux de physique théorique, Bridgeland a introduit cette notion dans [16]. Un des aspects particulièrement frappants de celle-ci est le fait que l’ensemble des conditions de stabilité sur D — supposées se factoriser par un groupe de type fini — est une variété différentielle Stab(D) de dimension finie, étale sur un espace vectoriel complexe. L’espace D est muni de structures de décomposition en chambres et murs associées à certains paramètres. Un cas particulier important est celui où la catégorie D est la catégorie dérivée Db (X) de la catégorie des faisceaux cohérents sur une variété X projective lisse sur C. Dans ce cas, la notion de condition de stabilité étend, au moins si X est une surface, celle de condition de stabilité à la Gieseker, et la décomposition en chambres et murs étend de telles décompositions venant de la théorie des variations de quotient GIT. Dans le cas où X est une surface K3, Bayer-Macrì dans [10, 9] relient la décomposition d’une composante de Stab(X) à la décomposition de certains cônes de diviseurs dans des espaces de modules M de faisceaux sur X, qui sont des variétés symplectiques holomorphes. Ils montrent, en un sens précis, que le programme du modèle minimal sur un tel M est induit par des phénomènes de wall-crossing sur Stab(X). Le but de ce travail est d’exposer ces développements. Nous avons dû laisser de côté plusieurs applications importantes des conditions de stabilité à la géométrie algébrique. Nous ne mentionnerons donc pas le lien avec (∗) La rédaction de ce texte a bénéficié d’un financement du Conseil Européen de la Recherche (ERC) dans le cadre du Programme Horizon 2020 (projet 715747).
© Astérisque 414, SMF 2019
428
F. CHARLES
la symétrie miroir ou la géométrie énumérative. Nous n’évoquerons pas non plus les récents développements autour de la construction de conditions de stabilité en dimension 3 et des inégalités de Bogomolov en dimension supérieure. Nous renvoyons aux beaux textes de survol [18, 26, 37, 23] pour des compléments sur cet exposé. Les deux premières sections de ce texte sont consacrées à un exposé des résultats de Bridgeland [16], revus par Kontsevich-Soibelman [30] sur les conditions de stabilité sur une catégorie triangulée arbitraire. Nous adaptons des simplifications de Bayer [5]. Dans la section 3, nous donnons des exemples de condition de stabilité sur les courbes et les surfaces, d’après notamment [3], et décrivons d’après [17] une composante de l’espace des conditions de stabilité sur une surface K3, simplifiant là encore la preuve en adaptant [5]. Les sections 4 et 5 sont consacrées aux travaux de Bayer-Macrì [10, 9]. Remerciements. — Je remercie chaleureusement Arend Bayer, Tom Bridgeland et Daniel Huybrechts pour leurs commentaires précieux sur une première version de ce texte, ainsi qu’Antoine Chambert-Loir pour ses nombreuses remarques, et Viviane Le Dret pour sa relecture attentive.
1. CONDITIONS DE STABILITÉ DANS UNE CATÉGORIE TRIANGULÉE Dans cette section, nous introduisons la définition, due à Bridgeland [16], de condition de stabilité sur une catégorie triangulée arbitraire. La question de la construction de conditions de stabilité sera abordée plus bas dans le texte, nous nous contentons ici de considérations abstraites. 1.1. Stabilité sur une catégorie abélienne Fixons dans ce qui suit une catégorie abélienne A . On notera comme d’habitude K0 (A ) le groupe de Grothendieck de A . Définition 1.1. — Une fonction de stabilité sur A est un morphisme de groupes additifs Z : K0 (A ) → C tel que pour tout objet non nul A de A , Z(A) appartienne à la réunion du demi-plan de Poincaré et de la demi-droite réelle strictement négative R∗− . Étant donnée une telle fonction de stabilité Z, on notera souvent Z(X) = −d(X) + i r(X),
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
429
où d(X) et r(X) sont des nombres réels, appelés respectivement le degré et le rang généralisés de l’élément X de K0 (A ). La pente généralisée de X est le réel d(X) r(X) , défini si r(X) est non nul. La pente généralisée n’étant pas toujours bien définie, il est plus agréable de travailler avec la phase. Cela nous permet de définir les objets stables et semistables. Définition 1.2. — Soit Z une fonction de stabilité sur A . Si X est un élément non nul de K0 (A ), la phase de X, notée φ(X), est l’unique réel φ ∈]0, 1] tel que Z(X) ∈ R∗+ eiπφ . Définition 1.3. — Soit Z une fonction de stabilité sur A , et soit A un objet non nul de A . On dit que A est stable (resp. semistable) si pour tout sous-objet strict non nul B de A, on a φ(B) < φ(A) (resp. φ(B) ≤ φ(A)). Si 0 → B → A → C → 0 est une suite exacte d’objets non nuls de A , on a Z(A) = Z(B) + Z(C). Les trois nombres complexes Z(A), Z(B) et Z(C) étant tous trois des éléments de H ∪ R∗− , on a φ(B) ≤ φ(A) ⇐⇒ φ(C) ≥ φ(A) et φ(B) ≥ φ(A) ⇐⇒ φ(C) ≤ φ(A). En particulier, un objet A de A est (semi)stable si et seulement si pour tout quotient strict non nul C de A, on a φ(C) > φ(A) (resp. φ(C) ≥ φ(A)). Les définitions ci-dessus sont habituelles si A est la catégorie des faisceaux cohérents sur une courbe intègre projective et lisse sur un corps. Dans ce cas, les fonctions d et r qui à un faisceau cohérent associent respectivement son degré et son rang au point générique s’étendent en des morphismes de groupes d, r : K0 (A ) → R, d’où une fonction de stabilité Z = −d + i r. La définition 1.3 étend aux faisceaux cohérents arbitraires la notion de (semi)stabilité exprimée d’habitude en fonction des pentes [28], de telle sorte que les faisceaux de torsion sont tous semistables de pente 1. Les notions de pente, phase, stabilité, etc. définies ci-dessus dépendent de la fonction de stabilité Z — autant que possible, nous garderons implicite cette dépendance. Nous pouvons maintenant définir la notion de précondition de stabilité.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
430
F. CHARLES
Définition 1.4. — Soit A une catégorie abélienne, et soit Z : K0 (A ) → C une fonction de stabilité. On dit que le couple (A , Z) est une précondition de stabilité abélienne si tout objet non nul A de A admet une filtration finie 0 = A0 ⊂ A1 ⊂ · · · ⊂ An = A telle que – pour tout i ≥ 0, Ai+1 /Ai est semistable ; – pour tout i ≥ 0, φ(Ai+1 /Ai ) > φ(Ai+2 /Ai+1 ). L’unicité de la filtration qui apparaît dans la définition ci-dessus est garantie par le lemme élémentaire suivant — nous appellerons donc cette filtration la filtration de Harder-Narasimhan de A. Lemme 1.5. — Soit Z une fonction de stabilité sur A , et soient A et B deux objets semistables de A . Si φ(A) > φ(B), alors il n’existe pas de morphisme non nul de A vers B. Démonstration. — Soient A et B comme dans l’énoncé, et soit f un morphisme non nul de A vers B. Soit C l’image de f . Puisque C est un quotient de A, qui est semistable, on a φ(A) ≤ φ(C). Comme C est un sous-objet de B, on a de même φ(C) ≤ φ(B), d’où une contradiction. 1.2. Stabilité dans une catégorie triangulée Dans la suite de ce texte, on étudiera les familles de conditions de stabilité. Un des points clés de la théorie est le fait que, dans la plupart des cas, on souhaitera non seulement déformer la fonction de stabilité Z, mais aussi la catégorie abélienne A à l’intérieur de la catégorie triangulée Db (A ). Pour ce faire, il est plus commode de travailler avec des préconditions de stabilité sur une catégorie triangulée. Soit (A , Z) une condition de stabilité sur une catégorie abélienne, et considérons la catégorie triangulée D = Db (A ). Si φ est un réel dans ]0, 1], soit P (φ) la souscatégorie pleine de A dont les objets sont les objets de A semistables de phase φ. Si φ est un réel arbitraire de la forme φ = n + φ0 , avec n ∈ Z et 0 < φ0 ≤ 1, soit P (φ) la sous-catégorie P (φ0 )[n] de D. Les P (φ) sont des catégories additives. Les propriétés qu’elles vérifient justifient la définition suivante. Définition 1.6. — Soit D une catégorie triangulée. Un découpage de D est la donnée, pour tout nombre réel φ, d’une sous-catégorie additive pleine P (φ) de D, de telle façon que les conditions suivantes soient vérifiées :
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
431
1. Pour tout φ ∈ R, P (φ + 1) = P (φ)[1] ; 2. Soient φ1 et φ2 deux réels, et soit Ai un objet de P (φi ), i = 1, 2. Si φ1 > φ2 , alors HomD (A1 , A2 ) = 0 ; 3. Soit A un objet de D. Il existe des réels φ1 > · · · > φn , des objets A0 = 0, . . . , An = A de D, et des triangles distingués Ai → Ai+1 → Ei → Ai [1], où Ei est un objet non nul de P (φi ). Remarque 1.7. — Si A est un objet de D isomorphe à un objet de P (φ), alors A est un objet de P (φ) : les catégories P (φ) sont strictement pleines — utiliser la condition 3 pour A et le lemme 1.8 ci-dessous. Nous laissons au lecteur le soin de vérifier que si (A , Z) est une précondition de stabilité sur une catégorie abélienne, alors la construction ci-dessus munit Db (A ) d’un découpage naturel. La première propriété est satisfaite par construction, la seconde grâce au lemme 1.5, et la troisième grâce à l’existence des filtrations de HarderNarasimhan. Soit P un découpage d’une catégorie triangulée D. Comme dans le cas des filtrations de Harder-Narasimhan, on vérifie que la condition 2 ci-dessus garantit l’unicité à isomorphisme près des triangles apparaissant dans 3. En particulier, les phases φ0 , . . . , φn−1 associées à un objet A de D comme dans 3 sont bien définies. On notera φ+ (A) = φ0 , φ− (A) = φn−1 . Remarquons que l’on a φ+ (A) = φ− (A) si et seulement si A est un objet de P (φ) pour φ = φ+ (A) = φ− (A). La notion de découpage est étroitement reliée à celle de t-structure, expliquons en quel sens. Si I est un intervalle de R, soit P (I) la sous-catégorie pleine de D dont les objets sont les A tels que φ− (A) et φ+ (A) sont dans I. Autrement dit, P (I) est la plus petite sous-catégorie pleine de D contenant les P (φ), φ ∈ I et stable par extensions. On note P (≥ φ) (resp. P (≤ φ), P (> φ), P (< φ)) pour la catégorie P ([φ, ∞[) (resp. P (]−∞, φ]), P (]φ, ∞[), P (]−∞, φ[)). La condition 2 de la définition a pour conséquence immédiate la propriété suivante d’orthogonalité pour les catégories P (I). Lemme 1.8. — Soient A1 et A2 deux objets de D. Si φ− (A1 ) > φ+ (A2 ), alors HomD (A1 , A2 ) = 0.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
432
F. CHARLES
En particulier, si I et J sont deux intervalles disjoints de R, avec i > j pour tous i ∈ I, j ∈ J, alors pour tous A1 ∈ P (I), A2 ∈ P (J), HomD (A1 , A2 ) = 0. Proposition 1.9. — Soit D une catégorie triangulée munie d’un découpage P . Si φ est un réel arbitraire, les sous-catégories de D D
≥0
:= P (≤ φ + 1), D≤0 := P (> φ)
définissent une t-structure bornée sur D, de cœur P (]φ, φ + 1]). Démonstration. — Si n est un entier, on a D
≥n
= D≥0 [−n] = P (≤ φ + 1)[−n] = P (≤ φ − n + 1)
D
≤n
= D≤0 [−n] = P (> φ)[−n] = P (> φ − n).
et
En particulier, on a bien D≤−1 ⊂ D≤0 . Le lemme ci-dessus garantit que pour A1 ∈ D≤0 = P (> φ), A2 ∈ D≥1 = P (≤ φ), on a HomD (A1 , A2 ) = 0. Enfin, si A est un objet arbitraire de D, considérons des objets A0 = 0, . . . , An = A de D, et des triangles distingués Ai → Ai+1 → Ei → Ai [1], où Ei est un objet de P (φi ), avec φ0 > · · · > φn−1 . Soit i le plus grand entier entre 0 et n tel que φj > φ pour tout j < i. Alors Ai est extension successive d’objets E0 , . . . , Ei−1 de P (> φ) = D≤0 , et l’on a un triangle distingué Ai → A → E → A[1], où E est extension successive d’objets Ei , . . . , En−1 de P (≤ φ) = D≥1 . On vient de montrer que D≥0 = P (≤ φ + 1), D≤0 = P (> φ) définit bien une t-structure sur D. On a de plus [ [ [ ≥n ≤m D ∩D = P (> φ−m)∩P (≤ φ−n+1) = P (]φ−m, φ+n]) = D, m,n∈Z
m,n∈Z
m,n≥0
ce qui montre que la t-structure est bornée. Un découpage d’une catégorie triangulée D fournit donc une famille compatible de t-structures bornées sur D. Par convention, nous dirons que le cœur du découpage P est la catégorie abélienne P (]0, 1]). C’est bien le cœur d’une t-structure bornée sur D.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
433
Bien entendu, le groupe des bijections croissantes f : R → R telles que f (φ + 1) = f (φ) + 1 pour tout φ ∈ R agit sur l’ensemble des découpages de D via P (φ) 7→ P (f (φ)). On rigidifie la situation en introduisant l’analogue triangulé de la fonction de stabilité. Définition 1.10. — Soit D une catégorie triangulée. Une précondition de stabilité sur D est un couple σ = (P , Z), où P est un découpage de D, et Z est un morphisme de groupes additifs Z : K0 (D) → C tel que pour tout réel φ et tout objet non nul A de P (φ), on ait Z(A) ∈ R∗+ eiπφ . On dit que la fonction Z est la fonction charge centrale. Si φ est un réel quelconque, les objets non nuls de P (φ) sont les objets (σ-)semistables de phase φ. Les objets simples sont les objets (σ-)stables de phase φ. La discussion précédente montre l’équivalence de nos deux définitions de précondition de stabilité, au sens suivant. Nous en laissons les détails au lecteur [16, Proposition 5.3]. Proposition 1.11. — Soit D une catégorie triangulée. La donnée d’une précondition de stabilité sur D est équivalente à la donnée d’une catégorie abélienne A , cœur d’une t-structure bornée sur D, et d’une fonction de stabilité K0 (A ) → C telles que (A , Z) est une précondition de stabilité abélienne. Dans ce qui suit, nous utiliserons sans la mentionner l’équivalence des définitions précédentes. Une précondition de stabilité σ sur D sera donc considérée comme un couple (A , Z) ou (P , Z) selon la situation. Les notations rendront clair l’objet considéré. Proposition 1.12. — Soit (P , Z) une précondition de stabilité sur une catégorie triangulée D, et soit φ ∈ R. La catégorie P (φ) est abélienne. Démonstration. — Quitte à décaler, on peut supposer φ ∈]0, 1]. En particulier, P (φ) est une sous-catégorie pleine du cœur A = P (]0, 1]) de P . Pour montrer le résultat, il suffit de montrer que si f : A → B est un morphisme entre objets de P (φ), l’image et le noyau de f dans A sont des objets de P (φ). Cela garantit que ce sont aussi l’image et le noyau de f dans P (φ). Soit I l’image de f . Comme I est un quotient de A qui est semistable de phase φ, et comme I admet par définition un quotient semistable de phase φ− (I), on a φ = φ(A) ≤ φ− (I). De même, on a φ+ (I) ≤ φ(B) = φ. Ainsi, φ− (I) = φ+ (I) = φ, ce qui montre que I est un objet de P (φ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
434
F. CHARLES
Soit K le noyau de f . On a une suite exacte 0 → K → A → I → 0. D’après ce qui précède, I est un objet de P (φ). De Z(A) = Z(K) + Z(I) avec Z(A), Z(I) ∈ R∗+ eiπφ , on tire Z(K) ∈ R∗+ eiπφ . Par ailleurs, comme précédemment, on a φ+ (K) ≤ φ, donc les phases φi de K sont toutes inférieures ou égales à φ. Par définition, K est un objet de A , donc ces phases sont toutes strictement positives. La filtration de Harder-Narasimhan de K permet ainsi d’écrire Z(K) comme somme d’éléments de R∗+ eiπφi avec 0 < φi ≤ φ. Cela n’est possible que si K n’a qu’une seule phase, égale à φ, soit si K est semistable de phase φ.
1.3. Actions de groupes +
g2 (R) le revêtement universel du groupe GL+ (R), composante neutre Soit GL 2 de GL2 (R). Ce groupe s’identifie au groupe des couples (a, g), où g ∈ GL+ 2 (R) et a est une fonction continue, nécessairement croissante, de R dans R, telle que pour φ ∈ R, a(φ + 1) = a(φ) + 1 et g(cos(πφ), sin(πφ)) ∈ R∗+ (cos(πa(φ)), sin(πa(φ))). +
g2 (R) agit à droite sur l’ensemble des préconditions de stabilité sur Le groupe GL une catégorie triangulée D par la formule (P , Z).(a, g) = (P ◦ a, g −1 ◦ Z), où g agit sur C via l’identification naturelle de l’espace vectoriel C à R2 et où P ◦a est le découpage de D tel que pour tout φ ∈ R, (P ◦ a)(φ) = P (a(φ)). +
g2 (R) préserve l’ensemble des objets semistables de D, Remarquons que l’action de GL ainsi que le noyau de la charge centrale. Soit Aut(D) le groupe des autoéquivalences exactes de D. Le groupe Aut(D) agit à gauche sur l’ensemble des préconditions de stabilité sur D par la formule T (P , Z) = (T.P , Z ◦ T −1 ). +
g2 (R). Cette action commute manifestement à l’action de GL
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
435
1.4. La condition de support Soit D une catégorie triangulée. Dans la suite de ce texte, quand il sera question de (pré)conditions de stabilité sur D, on aura toujours fixé a priori un groupe abélien libre de type fini Λ et un morphisme de groupes abéliens v : K0 (D) → Λ. On imposera toujours aux charges centrales Z : K0 (D) → C de se factoriser par v, via un morphisme lui aussi noté Z : Λ → C. On gardera souvent v et Λ implicites. Dans ce contexte, le groupe AutΛ (D) constitué des couples (T, φ) formés d’une autoéquivalence exacte T de D et d’un automorphisme φ de Λ tels que v ◦ T = φ ◦ v agit comme plus haut sur l’ensemble des préconditions de stabilité sur D qui se factorisent par v. La notion de condition de stabilité s’obtient en imposant une propriété de finitude aux préconditions de stabilité. Nous utiliserons l’approche de Kontsevich-Soibelman [30], plus restrictive que celle originale de Bridgeland mais suffisante dans le cas qui nous occupe. Elle repose sur la remarque suivante. Proposition 1.13. — Soit D une catégorie triangulée, et soit σ = (P , Z) une précondition de stabilité sur D. Supposons que Z se factorise par v : K0 (D) → Λ, où Λ est un groupe abélien libre de type fini. Les conditions suivantes sont équivalentes : 1. Pour toute norme k.k sur ΛR , il existe une constante C > 0 telle que pour tout objet σ-semistable A de D, on ait |Z(A)| ≥ Ckv(A)k. 2. Il existe une forme quadratique sur ΛR , définie négative sur le noyau de Z, telle que si A est un objet σ-semistable de D, alors Q(v(A)) ≥ 0. Démonstration. — Supposons la première condition satisfaite. Soit k.k une norme euclidienne sur ΛR , et C la constante correspondante. Soit Q la forme quadratique sur ΛR telle que, pour tout w ∈ Λ, Q(w) = |Z(w)|2 − C 2 kwk2 . Manifestement, Q vérifie les propriétés de la seconde condition. Réciproquement, supposons l’existence de Q comme dans 2. Soit Λ0 l’orthogonal du noyau de Z dans ΛR . Alors la restriction de Z à Λ0 est injective, et la forme quadratique a + b 7→ ka + bk2 := −Q(a) + |Z(b)|2 , où a ∈ Ker Z et b ∈ Λ0 définit une norme k.k sur ΛR . Il suffit de vérifier la condition 1 pour cette norme.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
436
F. CHARLES
Soit K > 0 une constante telle que pour tout b dans Λ0 , on ait KQ(b) ≤ |Z(b)|2 . Soit A un objet σ-semistable de D. On écrit v(A) = a + b, a ∈ Ker Z, b ∈ Λ0 . Alors KQ(v(A)) = KQ(a) + KQ(b) ≥ 0, d’où KQ(a) + |Z(b)|2 = KQ(a) + |Z(A)|2 ≥ 0. Ainsi, on a |Z(A)|2 ≥ −KQ(a) = Kkv(A)k2 − K|Z(A)|2 , i.e. |Z(A)|2 ≥
K kv(A)k2 , 1+K
ce qui conclut. Remarque 1.14. — La preuve montre en fait le résultat suivant : étant donnée une forme quadratique Q sur ΛR , il existe une constante C > 0 telle que si σ est une condition de stabilité satisfaisant la condition du second énoncé, le premier énoncé vaut pour σ avec la constante C. Remarque 1.15. — Il suffit de vérifier les deux conditions de la proposition pour les objets σ-semistables de phase dans ]0, 1], i.e., pour les objets semistables dans le cœur de P . La définition suivante est fondamentale. Définition 1.16. — Soit D une catégorie triangulée, et soit σ = (P , Z) une précondition de stabilité sur D. On dit que σ satisfait la condition de support si les conditions équivalentes de la proposition précédente sont satisfaites. Une condition de stabilité sur D est une précondition de stabilité qui satisfait la condition de support. On dira aussi que σ satisfait la condition de support par rapport à la forme quadratique Q sur ΛR si Q satisfait la seconde condition de la proposition précédente. +
g2 (R) et AutΛ (D) sur l’ensemble Remarque 1.17. — Les actions naturelles de GL des préconditions de stabilité induisent des actions sur l’ensemble des conditions de stabilité. Plus précisément, si σ satisfait la condition de support par rapport à Q, alors + g (R)-orbite la discussion de 1.3 montre que toute condition de stabilité dans la GL 2 de σ satisfait la condition de support par rapport à Q. On peut tester la condition de support sur les objets stables. Proposition 1.18. — Soit σ = (P , Z) une précondition de stabilité sur la catégorie triangulée D. Soit Λ un groupe abélien libre de type fini par lequel Z se factorise, et soit Q une forme quadratique sur ΛR définie négative sur le noyau de Z. Alors σ satisfait la condition de support par rapport à Q si et seulement si pour tout objet σ-stable de D, on a Q(v(A)) ≤ 0.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
437
Démonstration. — La nécessité de la condition est évidente. Montrons qu’elle est suffisante. Notons p la projection orthogonale ΛR 7→ Ker Z, et écrivons, pour tout v ∈ Λ, Q(v) = R(Z(v)) − kp(v)k2 , où R est une forme quadratique sur R2 ' C, et k.k est la norme euclidienne induite par −Q sur Ker Z. Soit A un objet σ-semistable de D, et soient A1 , . . . , An ses facteurs de JordanHölder. Par hypothèse, les Q(v(Ai )) sont tous positifs, donc les R(Z(Ai )) aussi. On a X» 2 R(Z(A)) = R(Z(Ai )) i
car les Z(Ai ) sont tous sur la même demi-droite passant par l’origine, et ont pour somme Z(A). De plus, les Ai étant σ-stables, ce qui précède montre X» X R(Z(Ai )) ≥ kp(v(Ai ))k ≥ kp(v(A))k i
i
par inégalité triangulaire, ce qui prouve bien Q(v(A)) ≥ 0. Proposition 1.19. — Soit D une catégorie triangulée, et soit σ = (P , Z) une précondition de stabilité sur D satisfaisant la condition de support. Alors l’image par Z de l’ensemble des objets σ-semistables de D est un sous-ensemble discret de C. Démonstration. — Si l’ensemble en question n’est pas discret, la propriété de support permet de trouver un ensemble infini de v ∈ Λ dans un compact de ΛR , ce qui est bien sûr impossible. Voici une première conséquence de la condition de support. Rappelons qu’une catégorie abélienne A est de longueur finie si toute suite de monomorphismes dans A A1 ← A2 ← · · · ← Ai ← · · · est stationnaire, ainsi que toute suite d’épimorphismes A1 → A2 → · · · → Ai → · · · . Proposition 1.20. — Soit σ = (P , Z) une condition de stabilité sur une catégorie triangulée D. Pour tout φ ∈ R, la catégorie abélienne P (φ) est de longueur finie. Démonstration. — Supposons par exemple donnée une suite infinie d’inclusions strictes · · · ⊂ Ai ⊂ · · · ⊂ A1 dans laquelle les Ai sont tous semistables de phase φ. Soit vi = v(Ai ) ∈ Λ. Alors on peut écrire vi = ri eiπφ avec ri > 0. La suite exacte 0 → Ai+1 → Ai → Ai /Ai+1 → 0
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
438
F. CHARLES
dans la catégorie abélienne P (φ) nous permet d’écrire ri eiπφ = ri+1 eiπφ + Z(Ai /Ai+1 ), avec Z(Ai /Ai+1 ) ∈ R∗+ eiπφ , ce qui montre que la suite (ri )i≥1 est strictement décroissante, et que par conséquent la suite des Z(Ai /Ai+1 ) converge vers 0. D’après la proposition 1.19, la suite des Z(Ai /Ai+1 ) est stationnaire à 0, contradiction. La proposition précédente garantit l’existence de filtrations de Jordan-Hölder dans P (φ) : tout objet semistable de phase φ a une filtration par des sous-objets semistables de phase φ dont les quotients successifs sont stables. Introduisons une dernière condition de finitude parfois utile. Définition 1.21. — Soit σ une condition de stabilité sur une catégorie triangulée D. On dit que σ est rationnelle si la charge centrale de σ est à valeurs dans Q[i].
2. L’ESPACE DES CONDITIONS DE STABILITÉ Dans cette section, nous fixons une catégorie triangulée D et un morphisme de groupes abéliens v : K0 (D) → Λ, où Λ est un groupe abélien libre de type fini. 2.1. Préliminaires topologiques Soit Dec(D) l’ensemble des découpages de D. Si P est un élément de Dec(D), et si A est un objet de D, on note φ− (A) et φ+ (A) la plus petite et la plus grande P P phase respectivement qui apparaissent dans la filtration de Harder-Narasimhan de A. On munit l’ensemble Dec(D) d’une distance d — à valeurs dans [0, +∞] — par la formule d(P , Q) =
(A) − φ− (A)|}. (A) − φ+ (A)|, |φ− sup {|φ+ Q Q P P
A∈Ob(D)
C’est bien légitime car d(P , Q) = 0 implique que pour tout réel φ, et tout A ∈ Ob(P (φ)), on a φ+ (A) = φ− (A) = φ, soit A ∈ Ob(Q(φ)), et P = Q. On Q Q peut réécrire la distance d comme suit, voir [16, Lemma 6.1]. Lemme 2.1. — Soient P et Q deux découpages de D. On a d(P , Q) = inf{ε ≥ 0, ∀φ ∈ R, Ob(Q(φ)) ⊂ Ob(P ([φ − ε, φ + ε]))}. Soit maintenant Stab(D) l’ensemble des conditions de stabilité sur D qui se factorisent par v. On dispose de deux projections naturelles p : Stab(D) → Dec(D), (P , Z) 7→ P
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
439
et q : Stab(D) → Hom(Λ, C), (P , Z) 7→ Z. Dans tout ce qui suit, nous munissons Stab(D) de la topologie la plus fine qui rende les applications p et q continues. Les deux projections font de Stab(D) un sous-espace de Dec(D) × Hom(Λ, C), qui est muni de la topologie produit. En particulier, Stab(D) est un espace topologique séparé. Le résultat suivant est élémentaire. +
g (R) et AutΛ (D) Proposition 2.2. — Les actions naturelles des groupes GL 2 sur Stab(D) sont continues. Remarque 2.3. — On peut munir Stab(D) d’une métrique naturelle pour laquelle AutΛ (D) agit par isométries. 2.2. Le théorème de déformation de Bridgeland L’énoncé ci-dessous est le théorème principal de [16], tel que raffiné dans [11, Appendix A]. Nous suivons essentiellement Bayer [5]. Théorème 2.4. — Soit Q une forme quadratique sur ΛR , et soit σ une condition de stabilité sur D qui satisfait la condition de support par rapport à Q. Soit Z la charge ‹ l’ouvert de Hom(Λ, C) constitué des Z 0 : Λ → C tels centrale associée à σ, soit U ‹ que Q est définie négative sur le noyau de Z 0 , et soit U la composante connexe de U contenant Z. Soit enfin V la composante connexe de q −1 (U ) contenant σ. Alors : 1. La restriction à V de la projection naturelle q : Stab(D) → Hom(Λ, C), (P , Z) 7→ Z est un revêtement de U ; 2. Toute condition de stabilité dans V vérifie la condition de support par rapport à Q. En particulier, l’espace topologique Stab(D) est muni d’une structure naturelle de variété complexe, qui rend q localement biholomorphe. Donnons les grandes lignes de la démonstration. Nous supposerons dans la suite — c’est le cas non dégénéré — que Q est de signature (2, rgΛ − 2). En particulier, si Z 0 est un élément de U , alors ZR : ΛR → C est surjective. On commence par un énoncé d’injectivité locale. Lemme 2.5. — Soient P et Q deux découpages de D tels que d(P , Q) < 1. Si (P , Z) et (Q, Z) sont deux conditions de stabilité sur D, alors P = Q. En particulier, la projection q : Stab(D) → Hom(Λ, C) est localement injective.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
440
F. CHARLES
Démonstration. — Soit φ ∈ R, et supposons par exemple que P (φ) est non nulle. Soit A un objet non nul de P (φ). On veut montrer que A est un objet de Q(φ), raisonnons par l’absurde et supposons que ce n’est pas le cas. Comme d(P , Q) < 1, on a φ − 1 < φ− (A) ≤ φ+ (A) < φ + 1. Si φ− (A) > φ, alors Q Q Q ∗ iπφ Z(A) ∈ R+ e est somme de réels de la forme ri eiπφi avec ri > 0, φ < φi < φ + 1, contradiction. On a donc, par un argument symétrique, φ − 1 < φ− (A) ≤ φ ≤ φ+ (A) < φ + 1. Q Q Supposons par exemple φ+ (A) > φ. On peut trouver un triangle distingué Q A1 → A → A2 → A1 [1] dans lequel A1 est un objet non nul de Q(]φ, φ + 1[) et A2 est un objet non nul de Q(]φ − 1, φ]). Comme plus haut, on montre que ψ := φ+ (A1 ) > φ. Il existe donc P un objet non nul B de P (ψ), et un morphisme non nul B → A1 . Comme A est dans P (φ), le morphisme composé B → A1 → A est nul, donc B → A1 se factorise par un morphisme B → A2 [−1], contradiction car A2 [−1] est un objet de Q(≤ φ − 1), donc de P (≤ φ). On va maintenant construire des sections locales de q. Le lemme suivant est clair. Lemme 2.6. — Il existe un élément g de GL+ 2 (R) tel que pour tout v ∈ Λ, on ait Q(v) = |g(Z(v))|2 + Q(p(v)), où p est la projection orthogonale de ΛR sur Ker Z. Avec les notations du lemme précédent, supposons que l’on puisse prendre g = 1. Lemme 2.7. — Soit W l’ensemble des éléments Z 0 de U tels que Z | . = Z 0| Ker Z ⊥ Ker Z ⊥ 0 0 Alors Z est dans W si et seulement si Z = Z + u ◦ p , où u est un morphisme de Ker Z dans C tel que kuk < 1. Ici, k.k est la norme d’opérateur, Ker Z étant muni de la norme −Q et C de la valeur absolue usuelle. Démonstration. — Pour vérifier cette assertion, si kuk < 1 et si v ∈ Λ \ {0} est tel que Z(v) + u ◦ p(v) = 0, on a Z(v) = −u(p(v)), donc Q(v) = |Z(v)|2 + Q(p(v)) = |u(p(v))|2 + Q(p(v)) < 0. Réciproquement, si Z 0 est dans W , Z 0 −Z s’annule sur Ker Z ⊥ , donc s’écrit u◦p comme plus haut. Si kuk ≥ 1, on peut trouver α ∈ Ker ZR tel que Q(α) = −1 et |u(α)| ≥ 1. On a supposé que ZR est une surjection. Soit donc β ∈ Ker Z ⊥ tel que Z(β) = −u(α). Alors Z 0 (α + β) = 0
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
441
et Q(α + β) = −1 + |Z(β)|2 = |u(α)|2 − 1 ≥ 0, contradiction. Soit WR l’ensemble des éléments Z + u ◦ p de W tels que u ∈ Hom(Ker Z, R). Le résultat suivant contient le calcul clé. Lemme 2.8. — On garde les notations précédentes. 1. On peut trouver un voisinage V de σ dans Stab(D) tel que la restriction de q à V ∩ q −1 (WR ) est un homéomorphisme sur WR . 2. Toute condition de stabilité dans V ∩ q −1 (WR ) vérifie la condition de support par rapport à Q. Démonstration. — Écrivons σ = (P , Z), et soit A le cœur de P . Si u est un élément de WR , soit σu = (A , Z + u ◦ p). On vérifie immédiatement que Z + u ◦ p est une fonction de stabilité. On vérifie ensuite que σu est une précondition de stabilité, i.e. que les filtrations de Harder-Narasimhan associées à σu existent. Nous renvoyons à [5, 4.6 à 4.10] pour une preuve détaillée. Le point-clé, qui suit de la condition de support, est de montrer que pour tout objet A de A , et pour tout C ∈ R, il n’existe qu’un nombre fini d’éléments de Λ de la forme v(B), où B est un sous-objet de A et 0 petit, ne dépendant que de u. De même, on a dans ce cas φ− 0 (A) ≥ φ − η. On a finalement, pour η tendant vers 0 avec u, + φ − η ≤ φ− 0 (A) ≤ φ0 (A) ≤ φ + η,
ce qui conclut. Les énoncés que l’on vient de montrer, avec l’injectivité locale, prouvent le résultat.
Voici une version faible du théorème, qui contient essentiellement tous les arguments nécessaires à la preuve complète.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
443
Lemme 2.9. — L’application q est un homéomorphisme local. Démonstration. — Il suffit de montrer le résultat au voisinage de σ, et l’on peut supposer quitte à faire agir GL+ 2 (R) que l’on peut prendre g = 1 dans le lemme 2.6. Pour montrer le résultat, il faut montrer, vue l’injectivité locale, que si Z 0 ∈ Hom(Λ, C) est suffisamment proche de Z, alors Z 0 est la charge centrale d’une condition de stabilité τ proche de σ. 0 Comme Z 0 est proche de Z, on peut choisir g ∈ GL+ 2 (R), proche de 1, tel que g ◦ Z ⊥ 0 0 et Z coïncident sur (Ker Z) . On peut remplacer Z par g ◦ Z et supposer que Z 0 s’écrit Z 0 = Z + u ◦ p + iv ◦ p, où p est la projection orthogonale de ΛR sur Ker Z et u, v ∈ Hom(Ker Z, R) sont proches de 0. Notons Z1 = Z + u ◦ p. Alors Z1 est proche de Z et le lemme ci-dessus fournit une condition de stabilité σ1 de charge centrale Z1 , proche de σ. On peut remplacer Z par Z1 , σ par σ1 , et supposer donc Z 0 = Z + i v ◦ p0 , où p0 est proche de p. Quitte à encore remplacer Z 0 par g ◦ Z 0 avec g proche de 1, on peut supposer p0 = p. On a −iZ 0 = −iZ + v ◦ p. +
g2 (R), le lemme précédent Notant T un relèvement de la multiplication par i dans GL fournit une condition de stabilité −T τ , proche de −T σ, de charche centrale −iZ 0 . Alors τ est bien une condition de stabilité proche de σ, de charge centrale Z 0 . Soit V la composante connexe de p−1 (U ) contenant Z. On peut adapter l’argument précédent pour montrer la surjectivité de q | : V → U . Mieux, on peut montrer de V même la surjectivité locale de q | , ce qui implique par [25, Proposition 5.6] que q | est V V bien un revêtement de U . Enfin, les arguments ci-dessus, joints à la seconde propriété du lemme 2.8 et à la remarque 1.17, montrent que les conditions de stabilité dans V vérifient la condition de support par rapport à Q. La remarque 1.14, jointe au second énoncé du théorème, a la conséquence importante suivante qui traduit l’uniformité de la condition de support. Corollaire 2.10. — Soit k.k une norme sur Λ, et soit σ une condition de stabilité sur D. Alors il existe un voisinage ouvert U de σ dans Stab(D), et une constante C > 0, tels que pour tout τ = (Q, Z 0 ) ∈ U , et pour tout objet A de D qui est τ -semistable, on ait |Z(A)| ≥ Ckv(A)k.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
444
F. CHARLES
2.3. Murs et chambres On décrit maintenant la variation des ensembles d’objets (semi)stables dans D quand la condition de stabilité varie continûment. Dans ce qui suit, nous noterons Aσ la catégorie abélienne cœur d’une condition de stabilité σ. Voici d’abord un lemme catégorique. Lemme 2.11. — Soit ε > 0. Il existe un recouvrement de Stab(D) par des ouverts U tels que si σ = (P , Z) est dans U , et si A est un objet de P (]ε, 1 − ε[), alors pour tout τ ∈ U , A est un objet de Aτ . Pour un tel ouvert U , et σ = (P , Z) ∈ U , si f : B → C est un monomorphisme entre objets de P (]ε, 1 − ε[), vus comme objets de Aσ , dont le conoyau est dans P (]ε, 1 − ε[), alors, pour tout τ ∈ U , f est un monomorphisme. Démonstration. — La définition de la topologie de Stab(D) montre que les fonctions + σ 7→ φ− σ (A), φσ (A)
sont toutes les deux continues, ce qui montre le premier point. Pour prouver le second point, remarquons que f est un monomorphisme dans Aσ si et seulement si le cône de f est dans D≥0 = P (≤ 1) — on utilise ici la t-structure de la proposition 1.9 associée à Aσ . Dans ce cas, le cône de f dans D est isomorphe au conoyau C de f dans Aσ , ce qui permet de conclure. Proposition 2.12. — Soit E un objet de D. L’ensemble des σ ∈ Stab(D) tel que E est σ-semistable (resp. stable) est fermé (resp. ouvert) dans Stab(D). + Démonstration. — Les fonctions σ 7→ φ− σ (A), φσ (A) sont toutes les deux continues. + Par ailleurs, A est σ-semistable si et seulement si φ− σ (A) = φσ (A). Cela montre que l’ensemble des σ tel que A est σ-semistable est fermé dans Stab(D). Soit σ = (P , Z) une condition de stabilité sur D, et soit A un objet σ-stable + g (R) — que la de D. Supposons pour fixer les idées — quitte à faire agir GL 2
phase φσ (A) est 1/2. Soit v = v(A) ∈ Λ. Soit A le cœur de P , et soit U un voisinage ouvert de σ dans Stab(D) tel que pour tout τ = (Q, Z 0 ) ∈ U , A est un objet de Q(]1/3, 2/3[). Soit W l’ensemble des éléments w de Λ tels que ∃(Q, Zτ ) ∈ U,
0 ≤ ImZτ (w) ≤ ImZτ (v)
et w ∈ R∗+ eiπφ , avec φ ∈ ]1/3, 2/3[. Quitte à retrécir U , on peut supposer que l’ensemble des |Z(w)|, w ∈ W , est borné. Soit Wd l’ensemble des w ∈ W tels qu’il existe τ = (Q, Zτ ) ∈ U, et un monomorphisme B → A d’objets de Q(]1/3, 2/3[), vus comme objets de Aτ ,
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
445
de conoyau dans Q(]1/3, 2/3[), avec B τ -semistable et v(B) = w. Le corollaire 2.10 garantit que Wd est un ensemble fini, quitte à encore retrécir U . Soit τ = (Q, Zτ ) ∈ U , et supposons que A n’est pas τ -stable. Alors on peut trouver w ∈ Wd , avec Im(Zτ (w)/Zτ (v)) ≥ 0, un monomorphisme B → A d’objets de Q(]1/3, 2/3[), vus comme objets de Aτ , de conoyau dans Q(]1/3, 2/3[), avec B τ -semistable et v(B) = w — prendre B maximal semistable de phase φ+ τ (A). Soit maintenant τ 0 = (Q0 , Zτ 0 ) ∈ U tel que Im(Zτ 0 (w)/Zτ 0 (v)) ≥ 0 — c’est une condition fermée dans U . Le lemme précédent montre que pour tout tel τ 0 , le morphisme B → A est un monomorphisme dans Aτ 0 . On a par ailleurs φτ 0 (B) ≥ φτ 0 (A), donc A n’est pas τ -stable. Finalement, pour chaque w ∈ Wd , on a construit un fermé Fw de U (vide ou défini par l’équation Im(Zτ (w)/Zτ (v)) ≥ 0) de telle sorte que l’ensemble des τ ∈ U tels que A n’est pas τ -stable est la réunion des Fd . Cela montre bien que l’ensemble des τ ∈ U tels que A est τ -stable est ouvert. La proposition précédente donne en fait une description précise du lieu où un objet A peut être déstabilisé. Reprenant l’exact argument de la preuve, nous obtenons le résultat suivant, dû essentiellement à Bridgeland [17] et Toda [52]. Nous reprenons essentiellement les énoncés de [8, Proposition 3.3] et [10, Proposition 2.3]. Proposition 2.13. — Soit v un élément de Λ. Il existe un ensemble W de sousvariétés à bord de codimension 1 dans Stab(D), appelées murs, tels que, appelant chambres les composantes connexes du complémentaire de l’ensemble des W ∈ W , on ait les propriétés suivantes : 1. W est une famille localement finie : tout compact de Stab(D) n’intersecte qu’un nombre fini de murs ; 2. Soit W ∈ W . On peut trouver w ∈ Λ non proportionnel à v tel que W est l’adhérence d’un ouvert de {σ = (P , Z) ∈ Stab(D), Z(w)/Z(v) ∈ R∗ }. De plus, pour tout σ = (P , Z) ∈ W , on peut trouver φ ∈ R, et un monomorphisme B → A dans P (φ), tels que v(A) = v et v(B) = w ; 3. Si C est une chambre, A un objet de D, et σ, τ ∈ C (resp. C), alors A est σ-stable (resp. semistable) si et seulement si A est τ -stable (resp. semistable) ; 4. Si W est un mur, il existe un objet A de D qui est semistable sur W , et instable dans une des chambres adjacentes (1) à W . T De plus, si (Wi )i∈I est un ensemble fini de murs, la famille des W ∩ i∈I Wi , W ∈ W , T définit une famille de murs et de chambres dans i∈I Wi satisfaisant les propriétés précédentes. (1)
I.e., dont l’adhérence intersecte W .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
446
F. CHARLES
+
g (R) laisse invariants les murs — et les chambres Remarque 2.14. — L’action de GL 2 — décrits ci-dessus. En effet, elle préserve l’ensemble des catégories P (φ), φ ∈ R, donc les ensembles d’objets stables et semistables. Dans la situation précédente, une strate est une composante connexe de l’intersection d’un ensemble fini de murs. Voici une remarque utile, dont la démonstration est évidente. Proposition 2.15. — Pour tout v ∈ Λ, l’ensemble des conditions de stabilité rationnelles est dense dans chaque strate de la décomposition en murs et chambres de Stab(D) associée à v.
3. EXEMPLES Dans la suite de ces notes, nous allons appliquer la théorie générale décrite ci-dessus à des situations venant de la géométrie. Soit X une variété complexe. On note Db (X) la catégorie dérivée bornée de la catégorie abélienne Coh(X) des faisceaux cohérents sur X. Supposons X projective et lisse. Si A et B sont deux objets de Db (X), alors pour tout entier i, l’espace Hom(A, B[i]) est de dimension finie sur C, et il est nul si i est assez grand en valeur absolue. La caractéristique d’Euler X χ(A, B) := (−1)i dim Hom(A, B[i]) i∈Z
est donc bien définie. Elle induit une forme bilinéaire sur le groupe de Grothendieck K(X) = K0 (Db (X)). Disons que A et A0 sont numériquement équivalents, et notons A ∼ A0 si pour tout objet B de Db (X), on a χ(A, B) = χ(A0 , B). La relation ∼ est bien une relation d’équivalence : l’équivalence numérique. Le théorème de dualité de Serre montre que la forme bilinéaire χ descend en une forme bilinéaire non dégénérée sur Knum (X) := K(X)/ ∼. On sait — c’est une conséquence du théorème de Hirzebruch-Riemann-Roch — que le groupe Knum (X) est un groupe abélien libre de type fini. On le notera Λ. Définition 3.1. — Une condition de stabilité numérique sur X est une condition de stabilité sur Db (X) qui se factorise par la flèche naturelle K0 (X) → Knum (X). On note Stab(X) l’espace des conditions de stabilité numériques sur X.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
447
Si X est une courbe irréductible, la flèche K(X) → Z2 , [A] 7→ (− deg A, rg(A)) identifie Knum (X) à Z2 . Si X est une surface irréductible, notons NS(X) le groupe des fibrés en droites sur X modulo équivalence numérique. Alors Knum (X) ⊗ Q s’identifie à Q ⊕ NS(X) ⊕ Q via E 7→ ch(E). Dans la suite de ce texte, une condition de stabilité sera toujours une condition de stabilité numérique. 3.1. Courbes Le cas des courbes est parfaitement compris. Soit X une courbe lisse, projective, irréductible de genre g. On dispose sur la catégorie abélienne d’une fonction de stabilité Z : Coh(X) → C, A 7→ − deg A + i rg(A). L’existence des filtrations de Harder-Narasimhan pour Z est classique. Par ailleurs, toute forme quadratique définie positive sur R2 = Knum (X)R satisfait manifestement la condition de support pour (Coh(X), Z), puisque Z est une injection. On a donc montré que σ = (Coh(X), Z) est une condition de stabilité sur X. Soit Stab0 (X) la composante connexe de Stab(X) contenant la condition de stabilité σ. Soit U la composante connexe contenant Z de l’ouvert de Hom(K(X), C) constituée des applications Z 0 telles que ZR0 : R2 → C est une injection. Alors U est l’orbite de Z sous l’action de GL+ 2 (R). D’après le théorème 2.4, la préimage V de U dans Stab0 (X) est un revêtement de U . + g2 (R)-équivariante, et l’on vérifie immédiatement que L’application q : V → U est GL +
+
g (R). En g (R) sur Stab0 (X) est libre. V est donc l’orbite de σ sous GL l’action de GL 2 2 0 0 particulier, tout objet σ-semistable est σ -semistable pour tout σ ∈ V . Supposons un moment que l’inclusion de V dans Stab0 (X) soit stricte. Alors on peut trouver une condition de stabilité τ = (A , Z 0 ) sur X, appartenant au bord de V , dont la charge centrale Z 0 n’est pas injective. Soit Q une forme quadratique sur R2 = K(X)R qui satisfait la condition de support par rapport à σ. Alors Q est strictement négative sur un cône ouvert de R2 , et positive ou nulle sur tout v ∈ Z2 qui est la classe d’un objet σ-semistable. La fermeture de la semistabilité prouvée dans la proposition 2.12 et le paragraphe précédent montrent que tout objet σ-semistable est τ -semistable. Si le genre g de X est au moins 0, i.e. si X n’est pas isomorphe à P1C , on sait que tout couple (−d, r) avec r > 0 est de la forme (− deg E, rgE), avec E σ-semistable
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
448
F. CHARLES
sur X. En particulier, tout cône ouvert de R2 rencontre l’ensemble des v(E), où E parcourt les faisceaux localement libres σ-semistables sur X. L’espace Stab0 (X) est donc un revêtement de U ' GL+ 2 (R). L’application de revêtement correspondante Stab0 (X) → GL+ 2 (R) +
+
g2 (R)-équivariante, et l’on vérifie immédiatement que l’action de GL g2 (R) est GL 0 sur Stab (X) est libre. Il en résulte le résultat suivant. Proposition 3.2. — Soit X une courbe irréductible de genre positif ou nul, et soit Stab0 (X) la composante de Stab(X) contenant la condition de stabilité σ définie + › (R). Il est ci-dessus. Alors Stab0 (X) est un espace principal homogène sous GL 2
biholomorphe à C × H. Il est en fait possible de prouver le résultat suivant, plus fort, [16, 36], qui montre en outre que Stab(X) est connexe. Théorème 3.3. — Soit X une courbe irréductible de genre positif ou nul. Alors + › 2 (R). On a de plus Stab(P1 ) ' C2 . Stab(X) est un espace principal homogène sous GL C 3.2. Basculement Dans la suite de ce texte, nous allons concentrer notre attention sur la catégorie Db (X), où X est de dimension 2. Il est immédiat de remarquer que la stabilité via la pente ne peut pas donner de condition de stabilité de cœur Coh(X) : les faisceaux supportés sur les points fermés seraient dans le noyau de la charge centrale. Plus généralement, il n’est pas très difficile de montrer que Coh(X) n’est le cœur d’aucune condition de stabilité numérique sur Db (X). Dans ce qui suit, nous montrons comment construire des catégories abéliennes intéressantes dans Db (X) par un procédé dit de basculement. Cette construction est due à Happel-Reiten-Smalø [20]. Définition 3.4. — Soit A une catégorie abélienne. Un couple de torsion sur A est un couple de sous-catégories additives pleines (F , T ) de A qui satisfait les deux propriétés suivantes : 1. Pour tous objets F de F et T de T , on a Hom(T, F ) = 0 ; 2. Pour tout objet E de A , on peut trouver des objets F de F et T de T , ainsi qu’une suite exacte 0 → T → E → F → 0.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
449
Remarque 3.5. — La propriété d’annulation garantit l’unicité de la suite exacte en 2. Par ailleurs, si T est un objet de T et T → Q un quotient de T , la propriété 2 fournit une suite exacte 0 → T 0 → Q → F 0 → 0, dans laquelle T 0 et F 0 sont des objets de T et F respectivement. La composition T → Q → F 0 est un épimorphisme, nul par la propriété d’annulation, donc F 0 est nul et Q est un objet de T . De même, tout sous-objet d’un objet de F est un objet de F . Il est agréable de se souvenir de la définition en pensant à l’exemple de Coh(X), où X est une variété algébrique, F est la sous-catégorie des faisceaux sans torsion, et T la catégorie des faisceaux de torsion. Ce qui suit n’est pas difficile, mais c’est un point clé. Proposition 3.6. — Soit A une catégorie abélienne, cœur d’une t-structure bornée sur une catégorie triangulée D, et soit (F , T ) un couple de torsion sur A . Soit A ] la sous-catégorie pleine de D dont les objets sont les objets E de D tels que H −1 (E) est un objet de F , H 0 (E) est un objet de T , et H i (E) = 0 si i 6= −1, 0, où les H i sont calculés pour la t-structure de cœur A . Alors A ] est le cœur d’une t-structure bornée sur A . Définition 3.7. — La catégorie A ] est le basculement de A par rapport au couple de torsion (F , T ). Voici une façon peut-être plus claire de comprendre ce qui précède : par construction, la catégorie A ] contient les catégories T et F [1], et tout objet de A ] est extension — nécessairement unique — d’un objet de F [1] par un objet de T . Autrement dit, (T , F [1]) est un couple de torsion sur A ] . Le basculement de A ] par rapport à (T , F [1]) est la catégorie abélienne A [1]. Les suites exactes courtes dans A ] correspondent aux triangles distingués A → B → C → A[1] dans D dont tous les termes sont des objets de A ] . En particulier, si A est un objet de A ] , on a une suite exacte dans A ] 0 → H −1 (A)[1] → A → H 0 (A) → 0, où là encore les H i sont calculés pour la t-structure de cœur A . On peut décrire précisément certains sous-objets.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
450
F. CHARLES
Proposition 3.8. — Soit A une catégorie abélienne, cœur d’une t-structure bornée sur une catégorie triangulée D, et soit (F , T ) un couple de torsion sur A . On note A ] le basculement de A correspondant. Soit A un objet de T . Alors les sous-objets de A dans A ] sont exactement les objets B de T munis d’une flèche B → A dont le noyau dans A est un objet de F . Démonstration. — Soit f : B → A comme dans l’énoncé. Complétons cette flèche en un triangle distingué dans D B → A → C → B[1], où C est le complexe B → A, B étant placé en degré −1. Alors H −1 (C) = Ker f est un objet de F par hypothèse, et H 0 (C) = Cokerf est un objet de T comme quotient dans A d’un objet de T — voir la remarque 3.5. Ainsi, C est un objet de A ] , d’où une suite exacte 0→B→A→C→0 dans A ] , qui montre que B est bien un sous-objet de A dans A ] . L’énoncé réciproque a une preuve similaire. Exemple 3.9. — Soit A une catégorie abélienne, cœur d’une t-structure bornée sur une catégorie triangulée D, et soit Z une fonction de stabilité sur A . Soit P le découpage de D correspondant. Alors, pour tout φ ∈ ]0, 1], le couple (P (]0, φ]), P (]φ, 1])) est un couple de torsion sur A . C’est le cœur de la condition de stabilité obtenue par action de la rotation d’angle φ sur (A , Z). Exemple 3.10. — Soit D une catégorie triangulée, et soient P et Q deux découpages de D. Notons A (resp. B) le cœur de P (resp. Q), et supposons que tout objet de A soit extension d’objets de B et B[1] dans D — autrement dit, supposons que P (]0, 1]) soit une sous-catégorie pleine de Q(]−1, 1]). Alors le couple (A ∩ Q(]−1, 0]), A ∩ Q(]0, 1])) est un couple de torsion sur A , dont le basculement est B. Les deux exemples précédents ont pour conséquence immédiate l’énoncé suivant, qui souligne l’importance de la notion de basculement dans l’étude des conditions de stabilité. Proposition 3.11. — Soit D une catégorie triangulée, soit ε > 0, et soit σ = (P , Z) une condition de stabilité sur D. Il existe un voisinage ouvert U de σ dans Stab(D) tel que pour tout τ dans U , le cœur de τ est un basculement de P (] − ε, 1 − ε]).
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
451
3.3. Surfaces Soit X une surface projective complexe. La construction de conditions de stabilité sur les surfaces apparaît dans [17] pour les surfaces K3, et dans [3]. La version du théorème 2.4 que nous avons donnée ici, due à Bayer, permet de simplifier largement les preuves de ces résultats. Dans ce qui suit, on note rg(A) pour le rang d’un faisceau cohérent A sur X au point générique. Commençons par quelques rappels sur la stabilité pour les faisceaux sans torsion sur les surfaces — voir par exemple [28]. Soit ω un élément du cône ample de NS(X) ⊗ R. Définition 3.12. — Soit A un faisceau cohérent sur X. 1. La pente de A est l’élément µω (A) de R ∪ {+∞} défini par µω (A) =
ω.c1 (A) rg(A)
si rg(A) > 0, et +∞ sinon. 2. On dit que A est µ-semistable (resp. µ-stable) si pour tout sous-faisceau strict non nul B de A, on a µω (B) ≤ µω (A) (resp. µω (B) < µω (A)). 3. Supposons que A est pur (2) de dimension d ∈ {0, 1, 2}. Notons Pω,A le polynôme Z n 7→ enω ch(A) tdX , X
et pω,A le polynôme unitaire de degré d qui lui est proportionnel. On dit que A est semistable (resp. stable) au sens de Gieseker si pour tout sous-faisceau strict B de A et tout n suffisamment grand, on a pω,B (n) ≤ pω,A (n). On parlera souvent de stabilité pour désigner la stabilité au sens de Gieseker. La µ-stabilité implique la stabilité, et la semistabilité implique la µ-semistabilité. Remarque 3.13. — Les définitions ci-dessus impliquent que les faisceaux de torsion sont tous µ-semistables de pente +∞, et que les faisceaux µ-semistables de rang non nul sont sans torsion. Remarque 3.14. — Si ω est la classe d’équivalence numérique d’un fibré en droites H, le théorème de Hirzebruch-Riemann-Roch montre que l’on a Pω,A (n) = χ(A ⊗ H ⊗n ) (2)
A est pur de dimension d si le support de tout sous-faisceau cohérent non nul de A est de dimension d.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
452
F. CHARLES
pour tout entier n. Un faisceau semistable au sens de Gieseker sera toujours supposé pur. On utilisera l’existence de filtrations de Harder-Narasimhan pour la µ-stabilité : tout objet A de Coh(X) a une filtration finie 0 = A0 ⊂ A1 ⊂ · · · ⊂ An = A telle que – pour tout i ≥ 0, Ai+1 /Ai est µ-semistable ; – pour tout i ≥ 0, µω (Ai+1 /Ai ) > µω (Ai+2 /Ai+1 ). En particuler, A1 est le sous-faisceau de torsion de A. Les µω (Ai+1 /Ai ) sont les pentes − de A, et l’on notera µω (A1 ) = µ+ ω (A), µω (A/An−1 ) = µω (A). La µ-stabilité ne permet pas de donner directement une condition de stabilité sur Coh(X) ou Db (X). En effet, si A est un faisceau cohérent sur X supporté en codimension 2, alors ω.c1 (A) = 0 et rg(A) = 0. Cependant, l’existence de filtrations de Harder-Narasimhan permet de construire des catégories abéliennes dans Db (A) par basculement comme dans l’exemple 3.9. Par ailleurs, la notion de stabilité au sens de Gieseker est plus adaptée pour traiter des faisceaux cohérents arbitraires, mais elle n’est pas formulée a priori en terme de pentes. Pour motiver l’introduction de la charge centrale adaptée, considérons un faisceau A sans torsion sur X. Notons Z 2 Pω,A (X) = a(X + bX + c) = eXω ch(A) tdX , X
et considérons Z Wnω (A) = −i
einω ch(A) tdX = −i Pω,A (in) = a(bn + i(n2 − c)).
X
Pour n suffisamment grand, la partie imaginaire de Wnω (A) est strictement positive, et la pente généralisée de Wnω (A), au sens de 1.1, est bn . n2 − c Soit maintenant B un sous-faisceau cohérent de A, avec Pω,B (X) = a0 (X 2 + b0 X + c0 ). Supposons pour fixer les idées b et b0 positifs. Alors, pour n suffisamment grand, on a b0 n bn ≤ 2 2 0 n −c n −c si et seulement si b0 < b ou b = b0 et c0 ≤ c. Autrement dit, c’est le cas si et seulement si Pω,B (n) ≤ Pω,A (n)
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
453
pour tout n suffisamment grand. On retrouve ainsi la stabilité au sens de Gieseker — à la condition de positivité de b et b0 près, que l’on assurera par un procédé de basculement, puisque b est, à une constante multiplicative strictement positive près, la pente µω (A). La discussion ci-dessus suggère de considérer des charges centrales de la forme Z A 7→ −i einω ch(A) tdX . X
Plus généralement, la stabilité au sens de Gieseker n’étant pas stable par tensorisation avec un fibré en droites, on est amené à tordre les données comme suit. Soit β un élément arbitraire de NS(X)R — qui n’est donc pas nécessairement la classe d’un fibré en droites. On définit, pour tout faisceau cohérent de rang strictement positif µω,β (A) =
ω.(c1 (A) − rg(A)β) ω.c1 (A) = − ω.β rg(A) rg(A)
et l’on pose µω,β (A) = +∞ si le rang de A est nul. Si β est de la forme c1 (L), alors bien sûr, µω,β (A) = µω (A ⊗ L∨ ). Tout comme µω dont elle se déduit par translation, la pente µω,β définit une notion de stabilité pour laquelle existent des filtrations de Harder-Narasimhan. On notera encore µ± ω,β (A) pour les plus petites et plus grandes pentes correspondantes. Considérons maintenant Z Zω,β : K(X) → C, A 7→ −
e−iω−β ch(A).
X
Là encore, si β = c1 (L), on a Zω,β (A) = Zω,0 (A ⊗ L∨ ). C’est la charge centrale que nous allons considérer. Remarque 3.15. — Les normalisations dans la définition de Zω,β varient dans la R littérature suivant les auteurs et le contexte. Les signes devant X , ω et β peuvent + g (R) et à des basculements varier, ce qui est bien entendu accessoire à l’action de GL 2
près. Dans le cas où X est une surface K3, on introduit plutôt Z p Zω,β (A) = − e−iω−β ch(A) tdX , X
pour des raisons liées à l’utilisation systématique du réseau de Mukai. Dans ce qui suit, notons chβ (A) = e−β ch(A), chβi (A) = (e−β ch(A))i ,
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
454
F. CHARLES
où l’indice i ∈ {0, 1, 2} désigne la composante de codimension i. On a alors chβ0 (A) = rg(A), chβ1 (A) = c1 (A) − rg(A)β,
(1)
1 chβ2 (A) = ch2 (A) − β.c1 (A) + β 2 rg(A), 2 Z 1 B −iω rg(A)ω 2 − chβ2 + i rg(A)µω,β (A). Zω,β (A) = − e ch (A) = 2 X
Si Zω,β est la charge centrale d’une condition de stabilité sur Db (X), son cœur doit être une catégorie abélienne dont les objets sont des objets A de Db (X) tels que rg(A)µω,β (A) ≥ 0. Soient donc Fω,β et Tω,β les sous-catégories pleines de Coh(X) dont les objets − non nuls sont les faisceaux cohérents A tels que µ+ ω,β (A) ≤ 0 et µω,β (A) > 0 respectivement. Les propriétés de base de la µ-stabilité garantissent que (Fω,β , Tω,β ) est un couple de torsion. Définition 3.16. — Avec les notations précédentes, on note Cohω,β (X) la catégorie abélienne obtenue comme basculement de Coh(X) à partir de (Fω,β , Tω,β ). C’est le cœur basculé de Coh(X). Voici le théorème principal d’existence [17, 3]. Théorème 3.17. — Soit A le cône ample de X dans NS(X)R . Pour tout ω ∈ A, β ∈ NS(X)R , σω,β = (Cohω,β (X), Zω,β ) est une condition de stabilité sur Db (X). De plus, la flèche +
g2 (R) × A × NS(X)R → Stab(X) , GL
(g, ω, β) 7→ σω,β .g
est une immersion ouverte. Donnons quelques éléments de preuve — nous renvoyons à [37] pour détails et références et donnerons par ailleurs des arguments plus précis dans le cas où X est une surface K3. L’énoncé difficile est celui qui affirme que σω,β est une condition de stabilité pour tout couple (ω, β) — la continuité suit d’arguments de rigidité, et la propriété d’immersion ouverte est facile à vérifier car le théorème de déformation de Bridgeland nous permet de le faire après projection sur Hom(K(X)num , C). La stratégie est simple : on commence par traiter le cas où ω et β sont des classes de fibrés en droites, et l’on montre que σω,β est une condition de stabilité vérifiant la condition de support par rapport à une forme quadratique explicite. Ensuite, le théorème 2.4, dans la version effective sous laquelle nous l’avons formulé, permet par
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
455
prolongement de montrer que σω0 ,β 0 est une condition de stabilité quand ω 0 et β 0 appartiennent à un voisinage contrôlé de (ω, β). Dans tout cela, l’ingrédient clé est le suivant, voir par exemple [28]. Théorème 3.18 (Inégalité de Bogomolov). — Soit A un faisceau sans torsion, µ-semistable par rapport à un certain fibré en droites ample. Soit β ∈ NS(X)R . Alors chβ1 (A)2 ≥ 2rg(A) chβ2 (A). C’est l’inégalité quadratique ci-dessus qui, à quelques manipulations près pour faire intervenir ω, fournit la condition de support. Montrons tout d’abord que Z = Zω,β est une fonction de stabilité sur Cohω,β (X). Un objet E de Cohω,β (X) s’insère dans une suite exacte 0 → A[1] → E → B → 0, où A et B sont des objets de Fω,β et Tω,β respectivement. Notant Z(A[1]) = −Z(A), la construction de Fω,β et Tω,β , considérant (1), assure que les parties imaginaires de Z(A[1]) et Z(B) sont positives — il en va donc de même de celle de Z(E). Par ailleurs, si le support de B est de dimension strictement positive, la partie imaginaire de Z(B) est non nulle elle aussi. Supposons que Z(E) soit réelle. Alors B est de longueur finie, Z(B) est strictement négatif si B est non nul par (1), et 1 Z(E) = Z(B) − Z(A) = Z(B) + chβ2 (A) − rg(A)ω 2 , 2 tandis que chβ1 (A).ω = 0. Le théorème de l’indice de Hodge montre que l’on a (chβ1 (A))2 ≤ 0, et l’inégalité de Bogomolov implique chβ2 (A) ≤ 0, ce qui montre bien que Z(E) est strictement négatif sauf si B = 0, rg(A) = 0 et chβ2 = 0. Dans ce cas, A est de torsion, mais chβ1 (A) est alors effectif, ce qui contredit l’égalité chβ1 (A).ω = 0 si chβ1 (A) est non nul. Nous avons bien montré que Z est une fonction de stabilité sur Cohω,β (X). Il faut ensuite montrer l’existence de filtrations de Harder-Narasimhan. Dans le cas qui nous occupe, la discrétude de l’image de Z nous permet — par le même argument que pour la stabilité usuelle — de montrer seulement que Cohω,β (X) est une catégorie noethérienne, voir [17, Section 7]. Enfin, il faut montrer la condition de support par rapport à une forme quadratique explicite. L’idée est la suivante : soit n un entier suffisamment grand. Si E est un objet σnω,β -semistable, le choix de Z, comme nous l’avons expliqué au début de cette
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
456
F. CHARLES
section, permet de montrer que E est — à décalage près — un fibré semistable au sens de Gieseker — voir par exemple [17, Section 14]. L’inégalité de Bogomolov fournit une inégalité pour E telle que demandée par la condition de support. Il s’agit ensuite de montrer que cette inégalité vaut pour les objets σω,β -semistables. Partant d’un tel objet E, on applique la méthode de wall-crossing pour les formes quadratiques utilisée dans la preuve du lemme 2.8. On considère le wall-crossing pour E le long du chemin t 7→ σtω,β . On montre alors qu’il existe un entier n tel que les facteurs de Harder-Narasimhan de E pour σnω,β sont semistables au sens de Gieseker. Cela permet de conclure à la validité d’une inégalité à la Bogomolov pour E à partir de celle de ses facteurs pour σnω,β . 3.4. Surfaces K3 Soit maintenant X une surface K3 — rappelons qu’il s’agit d’une surface projective lisse, irréductible, simplement connexe, de fibré canonique trivial. On renvoie à [27] pour les propriétés générales de ces surfaces. Suivant [17], décrivons plus précisément une composante connexe de l’espace des conditions de stabilité. Soit Λ = Z ⊕ NS(X) ⊕ Z le réseau de Mukai de X, que l’on munit de la forme quadratique (r, c, s)(r0 , c0 , s0 ) = c.c0 − rs0 − r0 s. Le réseau de Mukai est pair. √ Si A est un élément de K(X), on note v(A) = ch(A) tdX ∈ Λ le vecteur de Mukai de A. Dans le cas présent, le théorème de Riemann-Roch montre χ(A, B) = −(v(A), v(B)) pour tous A, B dans K(X). Étant donnée une charge centrale Z : K(X) → C supposée se factoriser par l’équivalence numérique, nous noterons encore Z : Λ → C le morphisme tel que pour tout A ∈ K(X), Z(A) = Z(v(A)). Proposition 3.19. — Soit σ une condition de stabilité sur X, et soit A un objet σ-stable de Db (X). Alors (v(A), v(A)) ≥ −2. Démonstration. — Il faut montrer l’inégalité χ(A, A) ≤ 2, i.e. X (−1)i dim Hom(A, A[i]) ≤ 2. i∈Z
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
457
Soit φ la phase de A. Pour tout entier i, A[i] est stable de phase φ + i. En particulier, pour i < 0, on a Hom(A, A[i]) = 0. Par dualité de Serre, on a dim Hom(A, A[i]) = dim Hom(A[i], A[2]) = dim Hom(A, A[2 − i]), donc Hom(A, A[i]) = 0 pour tout i > 2, et Hom(A, A[2]) = Hom(A, A), qui est de dimension 1 car A est stable — considérer image et noyau d’un endomorphisme de A. Finalement, on a χ(A, A) = 2 − dim Hom(A, A[1]) ≤ 2. Comme on l’a mentionné plus haut, les normalisations liées aux conditions de stabilité que l’on vient de construire sont différentes dans le cas des surfaces K3, ce afin de travailler de manière compatible à la structure quadratique du réseau de Mukai. Nous écrirons donc, avec les notations de 3.3, Z p Zω,β (A) = − e−iω−β ch(A) tdX . X
La partie imaginaire de Zω,β étant inchangée par rapport à la convention de 3.3, on ne change pas la notation Cohω,β (X). Le théorème 3.17 devient dans ce contexte l’énoncé suivant — remarquer la condition supplémentaire sur ω, qui vient du changement de normalisation. Théorème 3.20 ([17]). — Soit A le cône ample de X dans NS(X)R . Pour tous ω ∈ A, β ∈ NS(X)R tels que ω 2 > 2, σω,β = (Cohω,β (X), Zω,β ) est une condition de stabilité sur Db (X). De plus, la flèche induite +
g2 (R) × {ω ∈ A, ω 2 > 2} × NS(X)R → Stab(X) , GL
(g, ω, β) 7→ σω,β .g
est une immersion ouverte. Soit Stab0 (X) une composante connexe de Stab(X) contenant les conditions de stabilité du théorème ci-dessus. Soit P0 (X) le sous-ensemble de Hom(Λ, C) constitué des Z : Λ → C tels que Ker Z est un sous-espace défini négatif de ΛR , et ne contient pas de racine de Λ, i.e. de δ ∈ Λ tel que (δ, δ) = −2. On peut montrer que P0 (X) est ouvert dans Hom(Λ, C), [17, Proposition 8.1 et Proposition 8.3]. Théorème 3.21 ([17]). — Il existe une composante connexe P0+ (X) de P0 (X) telle que l’application naturelle q : Stab0 (X) → Hom(Λ, C) est un revêtement de P0+ (X).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
458
F. CHARLES
Remarque 3.22. — La forme de Mukai identifie Hom(Λ, C) à ΛC . Sous cette identification, P0 (X) devient l’ensemble des éléments de ΛC dont les parties réelles et imaginaires engendrent un 2-plan positif dans ΛR , privé des δ ⊥ , où δ parcourt les racines de Λ. Remarque 3.23. — En général, si X est une surface arbitraire et Stab0 (X) une composante de Stab(X), il est faux que l’application q : Stab0 (X) → Hom(Λ, C) soit un revêtement de son image, voir par exemple [43]. Démonstration. — On commence par montrer que q −1 (P0+ (X)) → P0+ (X) est un revêtement, en suivant les idées de [5]. L’idée est de remarquer que, pour σ ∈ q −1 (P0+ (X)), la proposition 3.19 n’est pas loin de fournir une forme quadratique qui prouve la condition de support pour σ. Soit Z ∈ P0+ (X). Notons p la projection orthogonale ΛR 7→ Ker Z, et écrivons (v, v) = kZ(v)k2 − p(v)2 , où k.k est une forme quadratique définie positive sur R2 ' C, et . la norme euclidienne induite par −(., .) sur Ker Z. Soit ∆ l’ensemble des racines de Λ, et soit δ ∈ ∆. Par hypothèse, Z(δ) 6= 0, et la formule ci-dessus montre p(δ)2 = 2 + kZ(δ)k2 . En particulier, pour toute constante K, il n’existe qu’un nombre fini de δ ∈ ∆ tels que kZ(δ)k ≤ K. On peut donc trouver une constante C > 0 telle que pour tout δ ∈ ∆, kZ(δ)k ≥ C. Considérons la forme quadratique QZ (v) = (v, v) + avec α2 =
C 2 +2 C2
2 kZ(v)k2 = α2 kZ(v)k2 − p(v)2 , C2
et α > 0. Alors QZ est définie négative sur Ker Z.
Soit σ une condition de stabilité. La proposition 3.19 et la définition de C montrent que si A est un objet σ-stable de Db (X), alors QZ (v(A)) ≥ 0. En particulier, la proposition 1.18 montre que σ satisfait la condition de support par rapport à QZ si et seulement si q(σ) appartient à l’ouvert P (Z) des éléments W de Hom(Λ, C) tels que Ker W est un sous-espace défini négatif de QZ . Si un tel σ existe, le théorème 2.4 montre que q −1 (P (Z)) → P (Z) est un revêtement. En particulier, Z est dans l’image de q. Le théorème 2.4 montre que l’image de Stab0 (X) par q est ouverte. Soit U l’intersection de cette image avec P0+ (X), et soit S la préimage de U dans Stab0 (X). Si U 6= P0+ (X), on peut trouver un élément Z dans P0+ (X) adhérent à U mais pas
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
459
dans U . L’argument précédent montre que Z est dans l’image de q, contradiction. On a donc U = P0+ (X). L’argument précédent montre que q −1 (P0+ (X)) → P0+ (X) est un revêtement localement au-dessus de P0+ (X). C’est donc un revêtement. Pour conclure, il reste seulement à montrer que l’image de q est contenue dans P0+ (X). Il faut un type d’argument différent : comme dans le cas des courbes et de la preuve de la proposition 3.2, on a besoin d’un résultat d’existence d’objets stables. On va donc utiliser l’énoncé profond suivant, qu’on ne démontrera pas. Proposition 3.24. — Soit σ un élément de Stab0 (X), et soit v un élément du réseau de Mukai Λ. Si v 2 ≥ −2, il existe un objet σ-semistable A de Db (X) tel que v(A) = v. L’énoncé correspondant pour la stabilité à la Gieseker est dû à Kuleshov [31], O’Grady [47] et Yoshioka [53]. Dans le cas qui nous occupe, il est dû à Toda [52], voir [10, Theorem 6.8]. L’idée est de se ramener au cas de la stabilité à la Gieseker en considérant des conditions de stabilité σnω,β avec n → ∞, puis d’étudier en détail le wall-crossing pour passer de σnω,β à une condition de stabilité arbitraire dans la composante connexe Stab0 (X). Ce type d’argument utilise les espaces de modules d’objets semistables dont nous discuterons les propriétés dans la section suivante. Il s’agit de montrer que certains invariants motiviques des espaces de modules sont préservés par wall-crossing. Soit maintenant σ un élément de Stab0 (X) de charge centrale Z. Si δ est une racine de Λ, la proposition montre que δ est de la forme v(A) pour A σ-semistable. Cela implique Z(v(A)) 6= 0 par condition de support. Par ailleurs, supposons par l’absurde que Ker Z ne soit pas un sous-espace défini négatif de ΛR . Quitte à remplacer Z par une petite déformation, on peut supposer qu’il existe un élément v de Λ tel que v 2 ≥ 0 et Z(v) = 0, ce qui est là encore une contradiction. La géométrie du revêtement Stab0 (X) → P0+ (X) est mal comprise. Dans [17], Bridgeland montre que le groupe des transformations de ce revêtement s’identifie au groupe des automorphismes de Db (X) qui laissent la composante Stab0 (X) globalement invariante et agissent trivialement sur Λ. Il conjecture que Stab0 (X) est simplement connexe, et globalement invariant par tous les automorphismes de Db (X). Cette conjecture est démontrée dans [6] quand X a nombre de Picard 1.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
460
F. CHARLES
4. ESPACES DE MODULES 4.1. Généralités Nous décrivons brièvement les problèmes de modules associés aux conditions de stabilité à la Bridgeland. Par rapport à la construction des espaces de modules de faisceaux stables au sens de Gieseker, deux difficultés supplémentaires apparaissent : il semble difficile en général de borner le problème de modules et, même en supposant une telle finitude, l’espace de modules n’est pas a priori obtenu par une construction de théorie géométrique des invariants. En particulier, rien ne garantit qu’il soit projectif. Les techniques en jeu dans les énoncés qui suivent étant assez différentes de celles discutées dans ce texte, nous ne donnons pas de preuve. Soit X une variété projective lisse sur C. Si S est un schéma — ou un espace algébrique — localement de type fini sur C, rappelons qu’un complexe S-parfait est un complexe (pas nécessairement borné) de faisceaux quasi-cohérents sur X × S qui est, localement sur S, quasi-isomorphe à un complexe borné de faisceaux plats de présentation finie. On dira aussi qu’il s’agit d’une famille plate d’objets de Db (X). Soit M le 2-foncteur en groupoïdes qui envoie un schéma S localement de type fini sur C sur le groupoïde des complexes S-parfaits E tels que pour tout i < 0, et tout point complexe s de S, on ait Hom(Es , Es [i]) = 0. D’après [34], M est un champ d’Artin, localement de type fini sur C. Soit σ une condition de stabilité (numérique) sur Db (X), et soit v une classe d’équivalence numérique d’éléments de K(X). Soit Z la charge centrale associée à σ, et soit φ un nombre réel tel que Z(v) ∈ R∗+ eiφ . On note Mσ (v, φ) le sous-champ de M qui paramètre les objets σ-semistables dans Db (X), de classe v et de phase φ. On note Msσ (v, φ) le sous-champ qui paramètre les objets stables. Dans cette généralité, on sait très peu de choses sur les champs Mσ (v, φ) et Msσ (v, φ). Voici un exemple important où l’on peut contrôler ces objets. Supposons que X est de dimension 2. Soit ω un élément du cône ample de NS(X)R , et β un élément de NS(X)R . Soit σω,β la condition de stabilité du théorème 3.17, et notons Mω,β (v, φ) et Msω,β (v, φ) pour les champs correspondant à σω,β . Théorème 4.1 ([52, 48]). — Le champ Mω,β (v, φ) est un champ d’Artin de type fini sur C, et Msω,β (v, φ) en est un ouvert. s Le champ Msω,β (v, φ) est une Gm -gerbe au-dessus d’un espace algébrique Mω,β (v, φ), s qui est propre si Mω,β (v, φ) = Mω,β (v, φ).
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
461
Les champs Mω,β (v, φ) et Msω,β (v, φ) ne dépendent pas, à isomorphisme canonique près, du choix de φ — on les notera donc Mω,β (v) et Msω,β (v). Remarque 4.2. — Si X est une surface K3, nous nous écarterons légèrement des √ notations ci-dessus et remplacerons v par v tdX . Ce qui suit permet de relier espaces de modules au sens de la stabilité classique et au sens précédent. Par souci de simplicité, nous ne considérons que le cas où β = 0, le cas général en étant une modification immédiate. Proposition 4.3. — Avec les notations précédentes, supposons le rang de v non nul, et µω (v) > 0. Alors, pour tout réel t suffisamment grand, le champ Mtω (v) admet pour espace de modules grossier l’espace de modules des faisceaux sans torsion semistables au sens de Gieseker. Démonstration. — C’est essentiellement [17, Proposition 14.2]. Les arguments du début de 3.3 montrent directement que, sous les hypothèses de la proposition, les objets σtω -semistables de classe v de Cohtω (X) sont exactement les faisceaux sans torsion sur X qui sont semistables au sens de Gieseker, ce qui est ce que l’on voulait démontrer. 4.2. Le lemme de positivité Soit X une variété projective lisse sur C. Soit S un espace algébrique propre, irréductible sur C — dans la discussion ci-dessous, nous supposerons S lisse et projectif pour éviter l’introduction de complexes parfaits. Soit E un objet de Db (X × S), dont on note [E] la classe dans K(X × S)num . Soient p et q les projections de X × S sur X et S respectivement. On définit, comme dans le cas où E est un faisceau [32], [28, 8.1] λE : K(X)num → NS(S) par la composition K(X)num
p∗
/ K(X × S)num
.[E]
/ K(X × S)num
q∗
/ K(S)num
det
/ NS(S).
Soit v la classe de Es dans K(X)num , où s est un point quelconque de s. Le calcul de [28, Lemma 8.1.2, (iv)] montre que si F est un faisceau localement libre de rang r sur X, on a 1 (2) (λE )| ⊥ = (λE⊗p∗ F )| ⊥ . v v r Dans le cas classique, la flèche λE est utilisée pour produire des fibrés amples sur S. On peut faire de même dans le cas des familles d’objets stables — c’est le contenu de [10, Theorem 1.1].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
462
F. CHARLES
Donnons-nous donc une condition de stabilité σ sur Db (X), v un élément de K(X)num , et E ∈ Ob(Db (X × S)) une famille plate d’objets σ-semistables de classe v dans Db (X). Soit Z la charge centrale de σ. Soit Ω ∈ K(X)num,R tel que pour tout w ∈ K(X)num , on ait Z(w) = χ(Ω, w), Im − Z(v) où χ est la caractéristique d’Euler. En particulier, Ω ∈ v ⊥ . On note `σ,E = λE (Ω) ∈ NS(S)R . Des arguments standard utilisant (2) montrent que cette construction définit une classe d’équivalence numérique de fibrés en droites `σ sur le champ Mσ (v), et sur l’espace de module grossier Mσ (v) s’il existe. La construction de `σ,E montre immédiatement : Proposition 4.4. — Si σ est rationnelle, alors `σ,E est rationnel. Le théorème fondamental est le suivant. Théorème 4.5 (Lemme de positivité). — La classe `σ,E est nef. De plus, si C est une courbe dans S, alors `σ,E .C = 0 si et seulement si pour tous points complexes s et s0 généraux de S, les objets σ-semistables Es et Es0 ont les mêmes facteurs de Jordan-Hölder à permutation près. Démonstration. — Donnons une idée de l’argument. Quitte à faire agir le + g2 (R), on peut supposer Z(v) = −1, de sorte que la classe Ω ci-dessus soit groupe GL caractérisée par χ(Ω, w) = ImZ(w) pour tout w. Étant donnée une courbe irréductible et réduite C dans S, un calcul via la formule de projection donne `σ,E .C = Im(Z(p∗ E | )). X×C
On peut donc supposer S = C. Soit A le cœur de σ. Si p∗ E est un objet de A , alors bien sûr Im(Z(p∗ E)) ≥ 0 par définition d’une condition de stabilité. En général, p∗ E n’est pas un objet de A , mais un argument délicat dû à Abramovich-Polishchuk et Polishchuk [1, 49] permet de montrer que p∗ (E ⊗ q ∗ O (ns))
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
463
est un objet de A , où s est un point lisse de S et n est un entier suffisamment grand. Pour conclure, il suffit de montrer que pour tout n positif, on a Im(Z(p∗ (E ⊗ q ∗ O (ns)))) = Im(Z(p∗ E)), donc que pour tout n positif, Im(Z(p∗ (E ⊗ q ∗ O (ns)))) = Im(Z(p∗ (E ⊗ q ∗ O ((n + 1)s)))). Les deux termes diffèrent manifestement de la quantité Im(Z(p∗ (Es ))) = Im(Z(Es )) = Im(Z(v)) = 0 car Z(v) = −1. Cela montre le premier énoncé. Montrons une des deux directions du second énoncé : supposons que S soit une courbe irréductible et que l’on ait Z(p∗ E)) ∈ R. Soit s un point lisse de S. L’argument précédent montre que tous les Z(p∗ (E ⊗ q ∗ O (ns))) sont des nombres réels négatifs — en particulier, les p∗ (E ⊗ q ∗ O (ns)) sont semistables. La suite exacte dans A , pour n assez grand, 0 → p∗ (E ⊗ q ∗ O (ns)) → p∗ (E ⊗ q ∗ O ((n + 1)s)) → Es montre que les facteurs de Jordan-Hölder de Es sont des facteurs de Jordan-Hölder de p∗ (E ⊗ q ∗ O ((n + 1)s)). En particulier, ils ne dépendent pas de s, ce qui conclut.
5. GÉOMÉTRIE BIRATIONNELLE DE CERTAINES VARIÉTÉS SYMPLECTIQUES HOLOMORPHES Dans cette section, on décrit les travaux de Bayer-Macrì [10, 9]. 5.1. Variétés symplectiques holomorphes : rappels On renvoie à [12, 24, 38] pour plus de détails sur les variétés symplectiques holomorphes et leur importance en géométrie algébrique et complexe, et à [21] pour des éléments de leur géométrie birationnelle. Définition 5.1. — Une variété symplectique holomorphe est une variété X projective lisse sur C, simplement connexe, telle que l’espace H 0 (X, Ω2X/C ) est engendré par une 2-forme partout non dégénérée.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
464
F. CHARLES
En particulier, une variété symplectique holomorphe est de dimension paire, et son fibré canonique est trivial. Il suit qu’une application birationnelle entre variétés symplectiques holomorphes induit un isomorphisme entre les complémentaires de fermés de codimension 2. En particulier, une telle application induit un isomorphisme entre les groupes de Néron-Severi des deux variétés. Remarque 5.2. — Une variété symplectique holomorphe de dimension 2 est une surface K3. Si X est une variété symplectique holomorphe de dimension 2n, le groupe de cohomologie singulière (modulo torsion) H 2 (X, Z) est muni d’une forme quadratique naturelle q, la forme de Beauville-Bogomolov. Elle est de signature (3, b − 3) et se caractérise par l’existence d’une constante C > 0 telle que pour tout α ∈ H 2 (X, Z), on ait Z α2n = Cq(α)n .
X
Fixons une variété symplectique holomorphe X de dimension 2n. Le cône ample de X, noté Amp(X), est le cône dans NS(X)R engendré par les classes de diviseurs amples dans X. Le cône ample birationnel de X, noté BAmp(X), est la réunion des f ∗ Amp(X 0 ), où f : X 99K X 0 parcourt l’ensemble des applications birationnelles de X vers une variété symplectique holomorphe X 0 . Le cône ample birationnel n’a pas de raison d’être un cône, mais son adhérence en est un. Notons par ailleurs Big(X) et Mov(X) les cônes dans NS(X)R engendrés par les classes de diviseurs big et mobiles — i.e. dont le lieu base d’une puissance positive est de codimension au moins 2 — respectivement. On vérifie immédiatement que le cône ample birationnel de X est contenu dans l’intersection de Big(X) et Mov(X). Soit par ailleurs D un élément du cône big de X. Alors la paire (X, D) est de log-type général, on peut donc appliquer le programme du modèle minimal à la paire (X, λD) pour λ > 0 suffisamment petit — [14] et [42] pour ce cas précis — et en déduire l’existence d’un morphisme birationnel entre variétés symplectiques holomorphes f : X 0 99K X tel que f ∗ D est big et nef. On vérifie que si de plus f ∗ D est ample, alors X 0 est unique. On dira que (X 0 , f ∗ D) est un modèle minimal de (X, D). Soit X une surface K3, soit Λ le réseau de Mukai de X, et soit v un élément primitif de Λ. Soient ω un élément du cône ample de X, et β un élément de NS(X)R . On étend
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
465
la définition 3.12 de semistabilité (au sens de Gieseker) en remplaçant Z Pω,A : n 7→ enω ch(A) tdX X
par β Pω,A : n 7→
Z
enω chβ (A) tdX .
X
On note Mωβ (v) l’espace de modules grossier des faisceaux sur X semistables correspondant. Le théorème suivant suit de [31, 47, 53]. Disons que v = (r, c, s) ∈ Λ = Z ⊕ NS(X) ⊕ Z est strictement positif si v 2 ≥ −2 et si l’une des conditions suivantes est vérifiée : 1. r > 0 ; 2. r = 0, c est effectif et s 6= 0 ; 3. r = 0, c = 0 et s > 0. Théorème 5.3. — On reprend les notations précédentes : 1. Si v est de la forme nv 0 , avec n > 0 et v 0 strictement positif, alors Mωβ (v) est non-vide et projectif. 2. Si de plus v est primitif et ω est générique, alors Mωβ (v) paramètre des objets stables, et c’est une variété symplectique holomorphe de dimension v 2 + 2. Supposons la seconde condition vérifiée, et v 2 > 0. Alors il existe une isométrie canonique θ : v ⊥ → NS(Mωβ (v)), où l’espace NS(Mωβ (v)) est muni de la forme de Beauville-Bogomolov. Si v 2 = 0, il existe une isométrie canonique θ : v ⊥ /hvi → NS(Mωβ (v)). Remarque 5.4. — Dans le théorème, nous ne considérons que le groupe de NéronSeveri NS(Mωβ (v)) et non toute la cohomologie de degré 2. La notation v ⊥ désigne donc l’orthogonal de v dans Λ, la partie algébrique du réseau de Mukai usuel. Remarque 5.5. — Nous n’aurons pas besoin de préciser la condition de généricité sur ω — elle vaut sur un ouvert dense du cône ample de X. Remarque 5.6. — L’isométrie θ est induite à un facteur strictement positif près par la flèche −λE de 4.2, où E est une famille quasi-universelle sur X × Mωβ (v) au sens de [28, 4.6].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
466
F. CHARLES
5.2. Projectivité et géométrie des espaces de modules Soit X une surface K3, soit Λ le réseau de Mukai de X, et soit v un élément de Λ. On dit qu’une condition de stabilité numérique σ sur X est générique (par rapport à v) si σ appartient à une chambre de la décomposition de Stab(X) associée à v par la proposition 2.13. On note encore Stab0 (X) la composante connexe de Stab(X) contenant les σω,β . On peut généraliser le théorème 4.1 comme suit dans le cas des surfaces K3, par le même genre d’arguments. Théorème 5.7 ([52]). — Soit σ ∈ Stab0 (X). Le champ Mσ (v) est un champ d’Artin de type fini sur C, et Msσ (v) en est un ouvert. Le champ Msσ (v) est une Gm -gerbe au-dessus d’un espace algébrique Mσs (v), qui est propre si Mσ (v) = Msσ (v). La proposition 3.24 garantit que les champs Mσ (v) sont non-vides dès que v 2 ≥ −2. De plus, un argument de déformation montre le résultat suivant. Proposition 5.8. — Supposons v primitif et v 2 ≥ −2. Si σ est générique, alors Mσ (v) = Msσ (v). L’espace de modules grossier Mσ (v) := Mσs (v) est un espace algébrique symplectique holomorphe de dimension v 2 + 2. Si σ est une condition de stabilité sur X, notons `σ la classe d’équivalence numérique de fibrés en droites sur Mσ (v) (ou sur l’espace de modules grossier associé s’il existe) de 4.2. Le théorème 4.5 montre que `σ est nef. On peut calculer `σ comme suit, en suivant la construction de 4.2. Soit E un objet quasi-universel sur Mσ (v) — qu’on obtient par une multisection de degré d de la Gm -gerbe Mσ (v) → Mσ (v). Soit Ωσ ∈ ΛR tel que (Ωσ , w) = Im
(3)
Z(w) Z(v)
pour tout w dans Λ. Alors
1 `σ = − λE (Ωσ ). d
Théorème 5.9 ([10, Theorem 1.3]). — Supposons σ générique. Alors l’espace de modules grossier Mσ (v) est une variété projective. Démonstration. — Donnons une indication, suivant Bayer-Macrì dans [10], qui s’inspirent du résultat partiel de [44]. On traite le cas v 2 > 0. Soit Z la charge centrale de σ. On commence par montrer par un argument explicite que l’on peut supposer, quitte à remplacer σ par une condition de stabilité dans la même chambre pour v, qu’il existe un élément primitif w de Λ tel que w2 = 0 tel que Z(v) et Z(w) soient alignés.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
467
Si σ est générique par rapport à w, ce que nous allons supposer pour simplifier, alors la proposition 5.8 montre que Mσ (w) est une surface K3 Y , qui est automatiquement projective. La catégorie dérivée Db (X) est équivalente à une catégorie de la forme Db (Y, α), où α est un élément du groupe de Brauer de Y . Fixons une telle équivalence. La catégorie Db (Y, α) est une variante de Db (Y ) dans laquelle les faisceaux cohérents sont remplacés par les faisceaux cohérents tordus par α, voir [35] pour cette notion. La théorie des conditions de stabilité pour les surfaces K3 s’étend à Db (Y, α) — on parle de surface K3 tordue — et l’on peut montrer que la condition d’alignement de Z(v) et Z(w) permet d’identifier Mσ (v), via l’équivalence ci-dessus, à un espace de modules d’objets semistables dans Db (Y, α) pour une condition de stabilité de la forme σω,β , et que de plus la numérologie de v et w identifie cet espace de modules à un espace de modules de faisceaux (tordus) stables au sens de Gieseker pour (ω, β) — qui est projectif par la variante tordue de la construction classique. La démonstration précédente montre plus : en identifiant Mσ (v) à un espace de modules pour la stabilité au sens de Gieseker, elle permet d’étendre, en suivant l’identification, le résultat du théorème 5.3 aux espaces de modules à la Bridgeland. Prenant en compte (3) et la remarque 5.6, on trouve : Corollaire 5.10. — Si v est primitif, et σ générique, alors Mσ (v) est une variété symplectique holomorphe de dimension v 2 + 2 si v 2 ≥ −2, vide sinon. Elle paramètre des objets stables. Si v 2 > 0, alors il existe une isométrie canonique θσ : v ⊥ → NS(Mσ (v)), où l’espace NS(Mσ (v)) est muni de la forme de Beauville-Bogomolov. Si v 2 = 0, il existe une isométrie canonique θσ : v ⊥ /hvi → NS(Mσ (v)). De plus, on a θσ (Ωσ ) = `σ . Là encore, θσ est induit à un facteur près par −λE , avec les notations précédentes. Corollaire 5.11. — Si v est primitif, et σ générique, alors `σ est ample. Démonstration. — On peut supposer Z(v) = −1, ce qui implique que Ωσ est la partie imaginaire de l’élément α de ΛC tel que Z(w) = (α, w) pour tout w. La proposition 2.15 et le caractère ouvert de l’amplitude permettent de supposer que σ est rationnelle, donc que `σ est dans NS(Mσ (v))Q . Le théorème 4.5 montre que `σ a degré strictement positif sur toute courbe, et le corollaire précédent montre que, q étant la forme de Beauville-Bogomolov, q(`σ ) = Ω2σ > 0, d’après
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
468
F. CHARLES
le théorème 3.21 et la remarque 3.22. D’après [24, 6.3], cela implique l’amplitude de `σ . Remarque 5.12. — L’amplitude de `σ est vraie même si v n’est pas primitif. Supposons v primitif, de carré au moins 2. Soit C une chambre de Stab0 (X) par rapport à v. La proposition 2.13 fournit une identification naturelle de tous les Mσ (v), quand σ varie dans C, à une même variété symplectique holomorphe M . Ce qui précède fournit une application ` : C → Amp(M ), σ 7→ `σ , dont on vérifie immédiatement qu’elle est analytique. Les fibrés `σ permettent d’étudier les phénomènes de wall-crossing comme suit. Soit W un mur de Stab0 (X) par rapport à v, et soient C+ et C− les deux chambres adjacentes à W . Soient σ± deux conditions de stabilité dans C+ et C− respectivement, et soit σ0 une condition de stabilité générique dans W . La fermeture de la semiamplitude montre que les familles quasi-universelles portées par chacun des espaces Mσ± (v) sont des familles d’objets σ0 -semistables, de sorte que l’on dispose de fibrés en droite `σ0 ,± sur Mσ± (v). On a θσ± (Ωσ0 ) = `σ0 ,± , ce qui montre encore q(`σ0 ,± ) > 0. Comme `σ0 ,± est nef, cela implique que `σ0 ,± est big par [24, Corollary 3.10], puis que `σ0 ,± est semiample par [29, Theorem 3.3]. On dispose donc de deux contractions birationelles π± : Mσ± (v) → M± vers des variétés normales. La géométrie des contractions π± est essentielle pour ce qui suit. 5.3. Modèles birationnels et wall-crossing Nous pouvons enfin décrire les résultats de [9]. Théorème 5.13. — Soit v un vecteur primitif de Λ avec v 2 > 0. Soit σ un élément générique de Stab0 (X). Alors il existe une application canonique ` : Stab0 (X) → NS(Mσ (v))R vérifiant les propriétés suivantes : 1. ` est continue, analytique sur chaque chambre de Stab0 (X). Son image est l’intersection du cône big et du cône mobile de Mσ (v) ;
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
469
2. Soit C une chambre de Stab0 (X), et soit τ ∈ C. Alors (Mτ (v), `τ ) est un modèle minimal de (Mσ (v), `(τ )). Il existe une application birationnelle canonique f : Mσ (v) 99K Mτ (v) telle que `(τ ) = f ∗ `τ , et `(C) = f ∗ Amp(Mτ (v)). Remarque 5.14. — Dans le second énoncé, puisque `τ est ample sur Mτ (v), (Mτ (v), `τ ) est l’unique modèle minimal de (Mσ (v), `(τ )). Si C est la chambre de Stab0 (X) contenant σ, alors f est l’identification naturelle donnée par le programme du modèle minimal. Remarque 5.15. — Les conditions du théorème montrent que la flèche ` se factorise par la flèche Stab0 (X) → P0+ (X) ⊂ ΛC → U ⊂ ΛR , où Stab0 (X) → P0+ (X) est la flèche qui à une condition de stabilité associe sa charge centrale, P0+ (X) ⊂ ΛC est l’inclusion de la remarque 3.22, et U est l’image de P0+ (X) par l’application partie imaginaire. Par analyticité, il suffit en effet de le montrer sur les conditions de stabilité génériques, auquel cas le résultat suit de la définition des `σ . En particulier, pour des raisons de dimension et d’analyticité de `, les murs de Stab0 (X) sont envoyés par ` sur des fermés d’intérieurs vides. Remarque 5.16. — Si σ et τ ont même charge centrale, un théorème de Bridgeland déjà mentionné montre que σ et τ diffèrent d’un automorphisme de Db (X), ce qui montre a priori que Mσ (v) et Mτ (v) sont isomorphes. Voici un corollaire immédiat et important. Corollaire 5.17. — Soit v un vecteur primitif de Λ avec v 2 > 0, et soient σ et τ deux éléments génériques de Stab0 (X). Alors Mσ (v) et Mτ (v) sont birationnels. De plus, tout modèle birationnel symplectique holomorphe de Mσ (v) est isomorphe à Mτ (v) pour un certain τ générique. Démonstration. — Le premier énoncé est un cas particulier du théorème. Soit par ailleurs f : Mσ (v) 99K M une application birationnelle, avec M symplectique holomorphe. Soit H un fibré ample sur M , et soit `0 = f ∗ H. Alors `0 est big et mobile, donc on peut trouver une condition de stabilité τ ∈ Stab0 (X) telle que `0 = `(τ ). Quitte à déformer H dans le cône ample de M , la remarque 5.15 permet de supposer que τ est générique. Par construction, (M, H) est l’unique modèle minimal de (Mσ (v), `(τ )), donc le théorème précédent montre que M est isomorphe à Mτ (v).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
470
F. CHARLES
Le théorème 5.13 donne une relation précise entre conditions de stabilité et wallcrossing d’une part, et programme du modèle minimal pour les espaces de modules d’autre part. Ce thème a été étudié par plusieurs auteurs, d’abord via les variations de quotient GIT comme dans [51, 19]. Pour les surfaces à canonique trivial, les premiers exemples de wall-crossing sont dans [3], et le caractère birationnel du wallcrossing est prouvé pour les surfaces abéliennes dans [45]. Le cas du plan projectif est étudié notamment dans [4, 33], voir [15] pour des résultats sur certaines surfaces plus générales, et [23] pour un survol de résultats récents. La preuve du théorème 5.13 repose sur une analyse détaillée du wall-crossing : étant donné un mur W , soient C+ et C− les deux chambres adjacentes à W . Soient σ± deux conditions de stabilité dans C+ et C− respectivement, et soit σ0 une condition de stabilité générique dans W . Il s’agit de montrer une version raffinée du corollaire 5.17 pour montrer la birationalité des espaces Mσ± (v) par une application birationnelle explicite, qui permette d’en déduire le théorème principal par recollement du comportement local au voisinage de chaque mur. Il s’agit de comprendre comment le mur W déstabilise certains objets stables pour σ+ et σ− . Par construction, notant Z0 la charge centrale associée à σ0 , on peut trouver w0 ∈ Λ, qui n’est pas proportionnel à v, tel que Z(v) et Z(w0 ) sont alignés dans H ∩ R− , et des objets D, σ0 -stables de classe w0 dans Db (X), qui déstabilisent des objets E, σ+ -stables de classe v, au sens où Z(E) = v, Z(D) = w0 , et D est un sous-objet de E dans le cœur de σ0 . Avec les notations précédentes, l’hypothèse de généricité sur σ0 montre que le réseau primitif de rang 2 contenant v et w0 ne dépend que de W . On le note HW . Les propriétés des charges centrales données par le théorème 3.21 montrent facilement que HW est hyperbolique. L’image par Z0 de W est contenue dans une demi-droite passant par l’origine. La construction de HW relie les espaces de modules Mσ± (v) par la proposition suivante, essentiellement formelle étant donnée la finitude locale des murs. Proposition 5.18. — Supposons σ± suffisamment proches l’une de l’autre. Alors, si E est un objet σ+ -stable de Db (X), les facteurs de Harder-Narasimhan de E pour σ− ont pour vecteur de Mukai des éléments de HW . Cette proposition permet d’étudier la relation entre Mσ± (v) via les propriétés du réseau HW . Bayer-Macrì parviennent à déduire de cela une classification détaillée des murs dans Stab0 (X) que nous ne pouvons reproduire ici. Le cas le plus difficile est celui où le mur W est totalement semistable, i.e. où il n’existe pas d’objets σ0 -stables. Dans ce cas, il est possible qu’aucun objet
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
471
σ+ -semistable soit σ− -semistable. Donnons un exemple des méthodes utilisées pour contrôler ce phénomène. On reprend les notations précédentes. On va montrer comment les propriétés de HW permettent de contrôler la géométrie du wall-crossing. Nous ne traiterons qu’un cas particulier. Rappelons que dans 5.2, nous avons construit une contraction birationnelle π+ : Mσ+ (v) → M+ qui contracte exactement les courbes paramétrant les objets σ+ stables dont les facteurs de Jordan-Hölder pour σ0 sont génériquement constants. Par ailleurs, supposons pour fixer les idées que Mσ+ (v) est un espace de modules fin, et soit E une famille universelle. On considère des filtrations de Harder-Narasimhan pour σ− . On peut montrer qu’elles existent en famille pour E . Soient a1 , . . . , am les vecteurs de Mukai des facteurs de Harder-Narasimhan de E pour σ− en un point générique de Mσ+ (v). Prenant les facteurs de la filtration de Harder-Narasimhan relative, on obtient une application rationnelle HN : Mσ+ (v) 99K Mσ− (a1 ) × · · · × Mσ− (am ). La proposition 5.18 montre que les ai sont des éléments de HW . On a de plus v = a1 + · · · + am , et a2i ≥ −2 par la proposition 3.19. Soit C une courbe dans Mσ+ (v) contractée par HN. Alors les facteurs de HarderNarasimhan Ei pour σ− des objets paramétrés par deux points génériques de C sont les mêmes, ce qui implique que les facteurs de Jordan-Hölder de tels objets, pour σ0 , sont les mêmes, puisque ce sont des facteurs de Jordan-Hölder d’objets Ei , qui sont en nombre fini. On a donc montré : Proposition 5.19. — Toute courbe contractée par HN est contractée par π+ . En particulier, v 2 + 2 = dim M+ ≥ dim(Mσ− (a1 ) × · · · × Mσ− (am )) =
m X (a2i + 2). i=1
L’égalité m = 1 est équivalente au fait qu’un objet générique σ+ -stable de vecteur v est σ− -stable. En particulier, Mσ+ (v) ont un ouvert en commun, donc sont birationnels, ce qui est essentiellement ce que l’on souhaitait montrer. La suite de la démonstration consiste en l’exploitation de l’inégalité v 2 ≥ 2(m − 1) +
m X
a2i .
i=1
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
472
F. CHARLES
Il s’agit de classifier précisément les cas qui permettent d’avoir m = 1. Nous renvoyons à l’article [9] pour une analyse détaillée. On montre que les cas m > 1 correspondent toujours à l’apparition de certains vecteurs isotropes dans HW ou de racines de Λ. La géométrie correspondant à l’existence de ces classes peut être décrite explicitement. Dans le cas de l’existence de classes isotropes, on montre que π+ est essentiellement le morphisme de contractions de l’espace de modules de faisceaux stables au sens de Gieseker vers un espace de modules de faisceaux stables au sens de la pente. Le second cas est plus difficile. On montre que les racines de Λ apparaissant dans HW et contrôlant la géométrie du morphisme HN ci-dessus induisent des automorphismes de Db (X) — les twists sphériques. Composant avec ces automorphismes, on peut se ramener au cas où m = 1. 5.4. Applications Les théorèmes précédents permettent de contrôler précisément les bords des cônes nef et mobiles des espaces Mσ (v). Des arguments de densité permettent d’étendre ces résultats aux variétés hyperkähleriennes déformations de Mσ (v) [7, 46]. On renvoie à [22] pour un survol de ce cercle d’idées. Notons par ailleurs que des arguments de théorie ergodique permettent à Amerik et Verbitsky [2] d’étudier des problèmes semblables pour des variétés symplectiques holomorphes arbitraires. Donnons brièvement une application du corollaire 5.17. Théorème 5.20 ([9], Theorem 1.5). — Soient X une surface K3, v un vecteur de Mukai primitif tel que v 2 = 2n−2 ≥ 0, et σ une condition de stabilité générique sur X. Soit L un fibré en droites non trivial sur Mσ (v) tel que q(L) = 0, où q est la forme de Beauville-Bogomolov. Alors il existe une variété symplectique holomorphe M , birationnelle à Mσ (v), qui admet une fibration M → Pn à fibres lagrangiennes. Markushevich [40] et Sawon [50] avaient auparavant obtenu ce résultat pour certains schémas de Hilbert sur les surfaces K3. Un résultat similaire a été démontré dans [39], et il est étendu dans [41] à toutes les déformations des Mσ (v). Un cas particulier du théorème est celui où Mσ (v) est remplacé par un espace de modules de faisceaux stables au sens de Gieseker. De manière encore plus spéciale, on peut examiner le cas où Mσ (v) est un espace de modules de faisceaux stables de rang zéro — on vérifie alors immédiatement que l’hypothèse du théorème est automatiquement satisfaite. Dans ce cas, étudié en détail dans [13], les points de Mσ (v) paramètrent essentiellement la donnée d’une courbe C dans X dans un système linéaire donné, et d’un fibré en droites sur X de degré fixé sur C. La projection sur le système linéaire fournit la fibration lagrangienne désirée.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
473
La preuve du théorème se ramène au cas précédent par transformées de FourierMukai, puis déformation des conditions de stabilité pour déformer les espaces de modules en espaces de modules de faisceaux stables à la Gieseker. Plus précisément, on interprète la classe de L dans NS(X) comme un vecteur de Mukai isotrope, qui fournit donc une surface K3, Y , espace de modules d’objets sur X. Mσ (v) est alors un espace de modules d’objets sur Y , pour une certaine condition de stabilité, et un vecteur de Mukai de rang 0. Déformant la condition de stabilité, et utilisant le corollaire 5.17 qui garantit que tous les espaces de modules en jeu sont birationnels les uns aux autres, on se ramène au cas de [13].
RÉFÉRENCES [1] D. Abramovich & A. Polishchuk – Sheaves of t-structures and valuative criteria for stable complexes, J. reine angew. Math. 590 (2006), p. 89–130. [2] E. Amerik & M. Verbitsky – Morrison-Kawamata cone conjecture for hyperkähler manifolds, Ann. Sci. Éc. Norm. Supér. 50 (2017), no 4, p. 973–993. [3] D. Arcara & A. Bertram – Bridgeland-stable moduli spaces for K-trivial surfaces, J. Eur. Math. Soc. (JEMS) 15 (2013), no 1, p. 1–38. [4] D. Arcara, A. Bertram, I. Coskun & J. Huizenga – The minimal model program for the Hilbert scheme of points on P2 and Bridgeland stability, Adv. Math. 235 (2013), p. 580–626. [5] A. Bayer – A short proof of the deformation property of Bridgeland stability conditions, Math. Ann. 375 (2019), nos 3-4, p. 1597–1613. [6] A. Bayer & T. Bridgeland – Derived automorphism groups of K3 surfaces of Picard rank 1, Duke Math. J. 166 (2017), no 1, p. 75–124. [7] A. Bayer, B. Hassett & Y. Tschinkel – Mori cones of holomorphic symplectic varieties of K3 type, Ann. Sci. Éc. Norm. Supér. 48 (2015), no 4, p. 941–950. [8] A. Bayer & E. Macrì – The space of stability conditions on the local projective plane, Duke Math. J. 160 (2011), no 2, p. 263–322. [9]
, MMP for moduli of sheaves on K3s via wall-crossing : nef and movable cones, Lagrangian fibrations, Invent. math. 198 (2014), no 3, p. 505–590.
[10]
, Projectivity and birational geometry of Bridgeland moduli spaces, J. Amer. Math. Soc. 27 (2014), no 3, p. 707–752.
[11] A. Bayer, E. Macrì& P. Stellari – The space of stability conditions on abelian threefolds, and on some Calabi-Yau threefolds, Invent. math. 206 (2016), no 3, p. 869–933.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
474
F. CHARLES
[12] A. Beauville – Variétés Kähleriennes dont la première classe de Chern est nulle, J. Differential Geom. 18 (1983), no 4, p. 755–782. [13] , Systèmes hamiltoniens complètement intégrables associés aux surfaces K3, in Problems in the theory of surfaces and their classification (Cortona, 1988), Sympos. Math., XXXII, Academic Press, London, 1991, p. 25–31. [14] C. Birkar, P. Cascini, C. D. Hacon & J. McKernan – Existence of minimal models for varieties of log general type, J. Amer. Math. Soc. 23 (2010), no 2, p. 405–468. [15] B. Bolognese, J. Huizenga, Y. Lin, E. Riedl, B. Schmidt, M. Woolf & X. Zhao – Nef cones of Hilbert schemes of points on surfaces, Algebra Number Theory 10 (2016), no 4, p. 907–930. [16] T. Bridgeland – Stability conditions on triangulated categories, Ann. of Math. 166 (2007), no 2, p. 317–345. , Stability conditions on K3 surfaces, Duke Math. J. 141 (2008), no 2, [17] p. 241–291. [18] , Spaces of stability conditions, in Algebraic geometry—Seattle 2005. Part 1, Proc. Sympos. Pure Math., vol. 80, Amer. Math. Soc., 2009, p. 1–21. [19] I. V. Dolgachev & Y. Hu – Variation of geometric invariant theory quotients, Inst. Hautes Études Sci. Publ. Math. (1998), no 87, p. 5–56. [20] D. Happel, I. Reiten & S. O. Smalø – Tilting in abelian categories and quasitilted algebras, vol. 120, Mem. Amer. Math. Soc., no 575, 1996. [21] B. Hassett & Y. Tschinkel – Rational curves on holomorphic symplectic fourfolds, Geom. Funct. Anal. 11 (2001), no 6, p. 1201–1228. , Extremal rays and automorphisms of holomorphic symplectic varieties, [22] in K3 surfaces and their moduli, Progr. Math., vol. 315, Birkhäuser, 2016, p. 73– 95. [23] J. Huizenga – Birational geometry of moduli spaces of sheaves and Bridgeland stability, in Surveys on recent developments in algebraic geometry, Proc. Sympos. Pure Math., vol. 95, Amer. Math. Soc., 2017, p. 101–148. [24] D. Huybrechts – Compact hyper-Kähler manifolds : basic results, Invent. math. 135 (1999), no 1, p. 63–113. [25] , A global Torelli theorem for hyperkähler manifolds [after M. Verbitsky], Séminaire Bourbaki, vol. 2010/2011, exposé no 1040, Astérisque (2012), no 348, p. 375–403. [26] , Introduction to stability conditions, in Moduli spaces, London Math. Soc. Lecture Note Ser., vol. 411, Cambridge Univ. Press, 2014, p. 179–229. [27] , Lectures on K3 surfaces, Cambridge Studies in Advanced Math., vol. 158, Cambridge Univ. Press, 2016.
ASTÉRISQUE 414
(1147)
CONDITIONS DE STABILITÉ ET GÉOMÉTRIE BIRATIONNELLE
475
[28] D. Huybrechts & M. Lehn – The geometry of moduli spaces of sheaves, second éd., Cambridge Mathematical Library, Cambridge Univ. Press, 2010. [29] J. Kollár & S. Mori – Birational geometry of algebraic varieties, Cambridge Tracts in Mathematics, vol. 134, Cambridge Univ. Press, 1998. [30] M. Kontsevich & Y. Soibelman – Stability structures, motivic DonaldsonThomas invariants and cluster transformations, prépublication arXiv:0811.2435. [31] S. A. Kuleshov – Stable bundles on a K3 surface, Izv. Akad. Nauk SSSR Ser. Mat. 54 (1990), no 1, p. 213–220, 223. [32] J. Le Potier – Fibré déterminant et courbes de saut sur les surfaces algébriques, in Complex projective geometry (Trieste, 1989/Bergen, 1989), London Math. Soc. Lecture Note Ser., vol. 179, Cambridge Univ. Press, 1992, p. 213–240. [33] C. Li & X. Zhao – Birational models of moduli spaces of coherent sheaves on the projective plane, Geom. Topol. 23 (2019), no 1, p. 347–426. [34] M. Lieblich – Moduli of complexes on a proper morphism, J. Algebraic Geom. 15 (2006), no 1, p. 175–206. [35] , Moduli of twisted sheaves, Duke Math. J. 138 (2007), no 1, p. 23–118. [36] E. Macrì – Stability conditions on curves, Math. Res. Lett. 14 (2007), no 4, p. 657–672. [37] E. Macrì& B. Schmidt – Lectures on Bridgeland stability, in Moduli of curves, Lect. Notes Unione Mat. Ital., vol. 21, Springer, 2017, p. 139–211. [38] E. Markman – A survey of Torelli and monodromy results for holomorphicsymplectic varieties, in Complex and differential geometry, Springer Proc. Math., vol. 8, Springer, 2011, p. 257–322. [39] , Lagrangian fibrations of holomorphic-symplectic varieties of K3[n] -type, in Algebraic and complex geometry, Springer Proc. Math. Stat., vol. 71, Springer, 2014, p. 241–283. [40] D. Markushevich – Rational Lagrangian fibrations on punctual Hilbert schemes of K3 surfaces, Manuscripta Math. 120 (2006), no 2, p. 131–150. [41] D. Matsushita – On isotropic divisors on irreducible symplectic manifolds, in Higher dimensional algebraic geometry—in honour of Professor Yujiro Kawamata’s sixtieth birthday, Adv. Stud. Pure Math., vol. 74, Math. Soc. Japan, Tokyo, 2017, p. 291–312. [42] D. Matsushita & D.-Q. Zhang – Zariski F -decomposition and Lagrangian fibration on hyperkähler manifolds, Math. Res. Lett. 20 (2013), no 5, p. 951–959. [43] S. Meinhardt – Stability conditions on generic complex tori, Internat. J. Math. 23 (2012), no 5, 1250035, 17. [44] H. Minamide, S. Yanagida & K. Yoshioka – Some moduli spaces of Bridgeland’s stability conditions, Int. Math. Res. Not. 2014 (2014), no 19, p. 5264–5327.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
476
[45]
F. CHARLES
, The wall-crossing behavior for Bridgeland’s stability conditions on abelian and K3 surfaces, J. reine angew. Math. 735 (2018), p. 1–107.
[46] G. Mongardi – A note on the Kähler and Mori cones of hyperkähler manifolds, Asian J. Math. 19 (2015), no 4, p. 583–591. [47] K. G. O’Grady – The weight-two Hodge structure of moduli spaces of sheaves on a K3 surface, J. Algebraic Geom. 6 (1997), no 4, p. 599–644. [48] D. Piyaratne & Y. Toda – Moduli of Bridgeland semistable objects on 3-folds and Donaldson-Thomas invariants, J. reine angew. Math. 747 (2019), p. 175–219. [49] A. Polishchuk – Constant families of t-structures on derived categories of coherent sheaves, Mosc. Math. J. 7 (2007), no 1, p. 109–134. [50] J. Sawon – Lagrangian fibrations on Hilbert schemes of points on K3 surfaces, J. Algebraic Geom. 16 (2007), no 3, p. 477–497. [51] M. Thaddeus – Stable pairs, linear systems and the Verlinde formula, Invent. math. 117 (1994), no 2, p. 317–353. [52] Y. Toda – Moduli stacks and invariants of semistable objects on K3 surfaces, Adv. Math. 217 (2008), no 6, p. 2736–2781. [53] K. Yoshioka – Moduli spaces of stable sheaves on abelian surfaces, Math. Ann. 321 (2001), no 4, p. 817–884.
François CHARLES Laboratoire de mathématiques d’Orsay UMR 8628 du CNRS Université Paris-Sud, Bâtiment 425 91405 Orsay cedex, France E-mail : [email protected]
ASTÉRISQUE 414
Séminaire BOURBAKI 70e année, 2017–2018, no 1148, p. 477 à 504 doi:10.24033/ast.1092
Juin 2018
ON THE MONGE-AMPÈRE EQUATION by Alessio FIGALLI
1. INTRODUCTION The Monge-Ampère equation is a nonlinear partial differential equation arising in several problems from analysis and geometry, such as the prescribed Gaussian curvature equation, affine geometry, optimal transportation, etc. In its classical form, this equation is given by (1)
det D2 u = f (x, u, ∇u)
in Ω,
where Ω ⊂ Rn is some open set, u : Ω → R is a convex function, and the function f : Ω × R × Rn → R+ is given. In other words, the Monge-Ampère equation prescribes the product of the eigenvalues of the Hessian of u, in contrast with the “model” elliptic equation ∆u = f which prescribes their sum. As we shall explain later, the convexity of the solution u is a necessary condition to make the equation degenerate elliptic, and therefore to hope for regularity results. The goal of this note is to give first a general overview of the classical theory, and then discuss some recent important developments on this beautiful topic. For our presentation of the classical theory, we follow the survey paper [25].
2. HISTORICAL BACKGROUND The Monge-Ampère equation draws its name from its initial formulation in two dimensions by the French mathematicians Monge [53] and Ampère [9]. The first notable results on the existence and regularity for the Monge-Ampère equation are due to Minkowski [51, 52]: by approximating a general bounded convex set with convex polyhedra with given faces areas, he proved the existence of a
© Astérisque 414, SMF 2019
478
A. FIGALLI
weak solution to the “prescribed Gaussian curvature equation” (now called “Minkowski problem”). Later on, using convex polyhedra with given generalized curvatures at the vertices, Alexandrov also proved the existence of a weak solution in all dimensions, as well as the C 1 smoothness of solutions in two dimensions [4, 5, 6]. In higher dimension, based on his earlier works, Alexandrov [2] (and also Bakelman [10] in two dimensions) introduced a notion of generalized solution to the MongeAmpère equation and proved the existence and uniqueness of solutions to the Dirichlet problem (see Section 3.2). The notion of weak solutions introduced by Alexandrov (now called “Alexandrov solutions”) has continued to be frequently used in recent years, and a lot of attention has been drawn to prove smoothness of Alexandrov solutions under suitable assumptions on the right hand side and the boundary data. The regularity of weak solutions in high dimensions is a very delicate problem. For n ≥ 3, Pogorelov found a convex function in Rn which is not of class C 2 but satisfies the Monge-Ampère equation in a neighborhood of the origin with positive analytic right hand side (see (15) below). It became soon clear that the main issue in the lack of regularity was the presence of a line segment in the graph of u. Indeed, Calabi [20] and Pogorelov [58] were able to prove a priori interior second and third derivative estimate for strictly convex solutions, or for solutions which do not contain a line segment with both endpoints on the boundary. However, in order to perform the computations needed to deduce these a priori estimates, C 4 regularity of the solution had to be assumed. Hence, a natural way to prove existence of smooth solutions was to approximate the Dirichlet problem with nicer problems for which C 4 solutions exist, apply Pogorelov and Calabi’s estimates to get C 2 /C 3 a priori bounds, and then take the limit in the approximating problems. This argument was successfully implemented by Cheng and Yau [21] and Lions [48] to obtain the interior smoothness of solutions. Concerning boundary regularity, thanks to the regularity theory developed by Ivochkina [40], Krylov [45], and Caffarelli-Nirenberg-Spruck [19], one may use the continuity method and Evans-Krylov’s estimates [29, 44] to obtain globally smooth solutions to the Dirichlet problem (see Section 3.3). In particular, Alexandrov solutions are smooth up to the boundary provided all given data are smooth. In all the situations mentioned above, one assumes that f is positive and sufficiently smooth. When f is merely bounded away from zero and infinity, Caffarelli proved the C 1,α regularity of strictly convex solutions [14]. Furthermore, when f is continuous (resp. C 0,α ), using perturbation arguments Caffarelli proved interior W 2,p estimate for any p > 1 (resp. interior C 2,α estimates) [12]. As explained in Section 3.5, these results can be applied to obtain both the regularity in the Minkowski problem and in the optimal transportation problem. Of course, these are just some examples of possible applications of the regularity theory for Monge-Ampère. For instance, as described in the survey paper [65, Sections 5 and 6],
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
479
Monge-Ampère equations play a crucial role in affine geometry, for example in the study of affine spheres and affine maximal surfaces.
3. CLASSICAL THEORY In this section we give a brief overview of some relevant results on the MongeAmpère equation. Before entering into the concept of weak solutions and their regularity, we first discuss convexity of solutions and the terminology “degenerate ellipticity” associated to this equation. 3.1. On the degenerate ellipticity of the Monge-Ampère equation Let u : Ω → R be a smooth solution of (1) with f = f (x) > 0 smooth. A standard technique to prove regularity of solutions to nonlinear PDEs consists in differentiating the equation solved by u to obtain a linear second-order equation for its first derivatives. More precisely, let us fix a direction e ∈ Sn−1 and differentiate (1) in the direction e. Then, using the formula d det(A + εB) = det(A) tr(A−1 B) ∀ A, B ∈ Rn×n with A invertible, dε ε=0 we obtain the equation (2)
det(D2 u) uij ∂ij ue = fe
in Ω.
Here uij denotes the inverse matrix of uij := (D2 u)ij , lower indices denotes partial derivatives (thus ue := ∂e u), and we are summing over repeated indices. Since det D2 u = f > 0, the above equation can be rewritten as (3)
aij ∂ij ue =
fe f
in Ω,
where aij := uij .
Thus, to obtain some regularity estimates on ue , we would like the matrix aij to be positive definite in order to apply elliptic regularity theory for linear equations. But for the matrix aij = uij to be positive definite we need D2 u to be positive definite, which is exactly the convexity assumption on u. (1) We also observe that, without any a priori bound on D2 u, the matrix aij may have arbitrarily small eigenvalues and this is why one says that (1) is “degenerate elliptic”.
(1)
Of course the theory would be similar if one assumes u to be concave. The real difference arises if the Hessian of u is indefinite, since (3) becomes hyperbolic (and the equation is then called “hyperbolic Monge-Ampère”). This is still a very interesting problem, but the theory for such equation is completely different from the one of the classical Monge-Ampère equation and it would go beyond the scope of this note.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
480
A. FIGALLI
Notice that if one can show that c0 Id ≤ D2 u ≤ C0 Id
(4)
inside Ω
for some positive constants c0 , C0 > 0, then C0−1 Id ≤ (aij )1≤i,j≤n ≤ c−1 0 Id and the linearized Equation (3) becomes uniformly elliptic. For this reason, proving (4) is one of the key steps for the regularity of solutions to (1). In this regard we observe that, under the assumption f (x) ≥ λ > 0, the product of the eigenvalues of D2 u (which are positive) is bounded from below. Thus, if one can prove that |D2 u| ≤ C, one easily concludes that (4) holds (see [32, Remark 1.1] for more details). In conclusion, the key step towards the smoothness of solutions consists in proving that D2 u is bounded. 3.2. Alexandrov solutions In his study of the Minkowski problem, Alexandrov introduced a notion of weak solution to the Monge-Ampère equation that allowed him to give a meaning to the Gaussian curvature of non-smooth convex sets. We now introduce this fundamental concept. Given an open convex domain Ω, the subdifferential of a convex function u : Ω → R is given by ∂u(x) := {p ∈ Rn : u(y) ≥ u(x) + p · (y − x) ∀ y ∈ Ω}. One then defines the Monge-Ampère measure of u as follows: µu (E) := |∂u(E)|
for every Borel set E ⊂ Ω,
where ∂u(E) :=
[
∂u(x)
x∈E
and | · | denotes the Lebesgue measure. It is possible to show that µu is a Borel measure (see [32, Theorem 2.3]). Note that, in the case u ∈ C 2 (Ω), the change of variable formula gives Z |∂u(E)| = |∇u(E)| = det D2 u(x) dx for every Borel set E ⊂ Ω, E
therefore µu = det D2 u(x) dx (see [32, Example 2.2]). This discussion motivates the following definition:
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
481
Definition 3.1 (Alexandrov solutions). — Given an open convex set Ω and a function f : Ω × R × Rn → R+ , a convex function u : Ω → R is called an Alexandrov solution to the Monge-Ampère equation det D2 u = f (x, u, ∇u)
in Ω
if µu = f (x, u, ∇u) dx as Borel measures, namely Z µu (A) = f (x, u, ∇u) dx ∀ A ⊂ Ω Borel. A
Note that because convex functions are locally Lipschitz, they are differentiable a.e. Thus f (x, u, ∇u) is defined a.e. and the above definition makes sense. To simplify the presentation, we shall discuss only the case f = f (x), although all the arguments can be extended to the case f = f (x, u, ∇u) under the assumption that ∂u f ≥ 0 (this is needed to ensure that the maximum principle holds, see [36, Chapter 17]). Actually, even if one is interested in solving the Monge-Ampère equation with a smooth right hand side, in order to prove existence of solutions it will be useful to consider also Borel measures as right hand sides. So, given a nonnegative Borel measure ν inside Ω, we shall say that u is an Alexandrov solution of det D2 u = ν if µu = ν. A fundamental property of the Monge-Ampère measure is that it is stable under uniform convergence (see [32, Proposition 2.6]): Proposition 3.2. — Let uk : Ω → R be a sequence of convex functions converging locally uniformly to u. Then the associated Monge-Ampère measures µuk weakly∗ converge to µu , i.e., Z Z ϕ dµuk → ϕ dµu ∀ ϕ ∈ Cc (Ω). Ω
Ω
Another crucial property of this definition is the validity of a comparison principle (see [32, Theorem 2.10]): Proposition 3.3. — Let U ⊂ Ω be an open bounded set, and let u, v : Ω → R be two convex functions satisfying ( µu ≤ µv in U u≥v
on ∂ U .
u≥v
in U .
Then
A direct consequence of this result is the uniqueness and stability of solutions (see [32, Corollaries 2.11 and 2.12]):
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
482
A. FIGALLI
Corollary 3.4. — Let Ω be an open bounded set, and νk : Ω → R a family of nonnegative Borel measures satisfying supk νk (Ω) < ∞. Then, for any k there exists at most one convex function uk : Ω → R solving the Dirichlet problem ( µuk = νk in Ω uk = 0
on ∂Ω.
In addition, if νk *∗ ν∞ and the solutions uk exist, then uk → u∞ locally uniformly, where u∞ is the unique solution of ( µu∞ = ν∞ in Ω u∞ = 0
on ∂Ω.
Finally, exploiting these results, one can prove existence of solutions (see [32, Theorem 2.13]): Theorem 3.5. — Let Ω be an open bounded convex set, and let ν be a nonnegative Borel measure with ν(Ω) < ∞. Then there exists a unique convex function u : Ω → R solving the Dirichlet problem ( µu = ν in Ω (5) u=0 on ∂Ω. Sketch of the proof. — Since uniqueness follows from Corollary 3.4, one only needs to show existence. By the stability in Corollary 3.4, since any finite measure can be approximated in the weak∗ topology by a finite sum of Dirac deltas, it suffices to solve the Dirichlet PN problem (5) when ν = i=1 αi δxi with xi ∈ Ω and αi > 0. To prove existence of a solution, one uses the so-called “Perron Method”: one defines S [ν]
:= {v : Ω → R convex : v|∂Ω = 0, µv ≥ ν in Ω},
and shows that this set is nonempty and that it is closed under maximum (namely, v1 , v2 ∈ S [ν] ⇒ max{v1 , v2 } ∈ S [ν]). Thanks to these properties, one obtains that u := supv∈S [ν] v is still an element of S [ν], and then one exploits the maximality of u to deduce that µu = ν. We refer to [32, Proof of Theorem 2.13] for more details. Actually, if Ω is strictly convex, a similar argument combined with the existence of suitable barriers allows one to prove the existence of solutions for any continuous boundary datum (see for instance [32, Theorem 2.14]):
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
483
Theorem 3.6. — Let Ω be an open bounded strictly convex set, let ν be a nonnegative Borel measure with ν(Ω) < ∞, and let g : ∂ Ω → R be a continuous function. Then there exists a unique convex function u : Ω → R solving the Dirichlet problem ( µu = ν in Ω (6) u=g on ∂Ω. 3.3. Existence of smooth solutions and global regularity As shown in the previous section, uniqueness of solutions to the Dirichlet problem holds even at the level of weak solutions. So, the main issue is existence. Existence of smooth solutions to the Monge-Ampère equation dates back to the work of Pogorelov [58]. This is obtained through the well-celebrated method of continuity that we now briefly describe (we refer to [36, Chapter 17] and [32, Section 3.1] for a more detailed exposition). Assume that Ω is a smooth uniformly convex domain, (2) and consider u ¯:Ω→Ra ¯ smooth uniformly convex function that vanishes on ∂ Ω. Then, if we set f := det D2 u ¯, we have that f¯ > 0 in Ω and u ¯ solves ( det D2 u ¯ = f¯ in Ω u ¯=0
on ∂Ω.
Now, assume we want to solve ( (7)
det D2 u = f
in Ω
u=0
on ∂Ω
for some given f : Ω → R with f > 0. Define {ft := (1 − t)f¯ + tf }t∈[0,1] , and consider the 1-parameter family of problems ( det D2 ut = ft in Ω (8) ut = 0 on ∂Ω. The method of continuity consists in showing that the set of t ∈ [0, 1] such that (8) is smoothly solvable is both open and closed. Since the problem is solvable for t = 0 (because u ¯ is a solution), this implies the existence of a smooth solution to (7). (2)
We say that a domain is uniformly convex if there exists a radius R such that Ω ⊂ BR (x0 + Rνx0 )
for every x0 ∈ ∂ Ω,
where νx0 is the interior normal to Ω at x0 . Note that, for a smooth domain, this is equivalent to asking that the second fundamental form of ∂ Ω is uniformly positive definite.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
484
A. FIGALLI
More precisely, assuming that Ω is a uniformly convex domain of class C 2,α for some α ∈ (0, 1), it follows that the function f¯ = detD2 u ¯ belongs to C 0,α (Ω). Then, 0,α assuming that f ∈ C (Ω), we can consider the set of functions C
:= {v : Ω → R convex functions of class C 2,α (Ω), v = 0 on ∂Ω},
and define the nonlinear map F
: C × [0, 1] −→ C 0,α (Ω) (v, t) 7−→ det D2 v − ft .
The goal is show that the set T
:= {t ∈ [0, 1] : there exists a ut ∈ C such that F (ut , t) = 0}
is nonempty, and it is both open and closed inside [0, 1]. We now explain the main steps of the argument. • Nonemptyness follows from the fact that F (¯ u, 0) = 0, thus 0 ∈ T . • Openness follows from the Implicit Function Theorem in Banach spaces (see [36, Theorem 17.6]). Indeed, the Fréchet differential of F with respect to v is given by the linearized Monge-Ampère operator (compare with (2)) (9)
Du F (v, t)[h] = det(D2 u)uij hij ,
h = 0 on ∂Ω,
where we set hij := ∂ij h, uij is the inverse of uij := ∂ij u, and we are summing over repeated indices. Notice that if a function v is bounded in C 2,α and det D2 v is bounded from below, then the smallest eigenvalue of D2 v is bounded uniformly away from zero and the linearized operator becomes uniformly elliptic with C 0,α coefficients (cp. Section 3.1). Therefore, classical Schauder’s theory gives the invertibility of Du F (ut , t) whenever ut solves F (ut , t) = 0 (see for instance [36, Chapter 6]). • The proof of closedness is done via global a priori estimates. More precisely, the following fundamental a priori bound holds (see [32, Theorem 3.2]): (3) Theorem 3.7. — Let Ω be a uniformly convex domain of class C 3 , and let u ∈ C 4 (Ω) be a solution of (7) with f ∈ C 2 (Ω) and 0 < λ ≤ f ≤ 1/λ. Then there exists a constant C, depending only on Ω, λ, kf kC 2 (Ω) , such that kD2 ukC 0 (Ω) ≤ C. The assumption u ∈ C 4 (Ω) in Theorem 3.7 is not essential, as it is needed only to justify the computations in the proof.
(3)
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
485
As already noticed in Section 3.1, once a uniform bound on D2 u inside Ω holds, the Monge-Ampère equation becomes uniformly elliptic and classical elliptic regularity theory yields C 2,α estimates for solutions of F (ut , t) = 0, proving the desired closedness of T . Thanks to this argument, one concludes the validity of the following existence result: Theorem 3.8. — Let Ω be a uniformly convex domain of class C 3 . Then, for all f ∈ C 2 (Ω) with 0 < λ ≤ f ≤ 1/λ, there exists a unique u ∈ C 2,α (Ω) solution to (7). Recalling that uniqueness holds also at the level of Alexandrov solutions, this proves the C 2,α regularity (for any α < 1) of Alexandrov solutions in C 3 uniformly convex domains with C 2 right hand side. It is interesting to remark that the C 3 regularity assumption on the boundary is necessary, as shown by Wang in [68]. 3.4. Caffarelli’s regularity theory We now investigate the regularity of Alexandrov solutions under weaker smoothness assumptions on the right hand side. In the 90s Caffarelli developed a regularity theory for Alexandrov solutions, showing that strictly convex solutions of (1) are locally C 1,γ provided λ ≤ f ≤ 1/λ for some λ > 0 [13, 14, 15]. We emphasize that, for weak solutions, strict convexity is not implied by the positivity of f (unless n = 2) and it is actually necessary for regularity, see Section 4.1 below. The following result is proved in [14]: Theorem 3.9. — Let u : Ω → R be a strictly convex Alexandrov solution of 1,γ µu = f dx with 0 < λ ≤ f ≤ 1/λ. Then u ∈ Cloc (Ω) for some γ = γ(n, λ) > 0. To explain the idea behind the proof of the above theorem, let us point out the following simple property of solutions to the Monge-Ampère equation (this is another manifestation of its degenerate ellipticity): if A : Rn → Rn is an affine transformation with det A = 1, (4) and u is a solution of the Monge-Ampère equation with right hand side f , then u ◦ A is a solution to the Monge-Ampère equation with right hand side f ◦ A. This affine invariance creates serious obstructions to obtain a local regularity theory. Indeed, for instance, the functions uε (x1 , x2 ) =
x2 εx21 + 2 −1 2 2ε
(4) Given an affine transformation Ax := M x + v, by abuse of notation we write det A in place of det M .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
486
A. FIGALLI
are solutions to det D2 uε = 1 inside the convex set {uε < 0}. Thus, unless the level set {uε = 0} is sufficiently “round,” there is no hope to obtain a priori estimates on u. The intuition of Caffarelli was to use the so-called John’s Lemma [43]: Lemma 3.10. — Let K ⊂ Rn be a bounded convex set with non-empty interior. Then there exists an ellipsoid E satisfying E ⊂ K ⊂ nE,
(10)
where nE denotes the dilation of E by a factor n with respect to its center. We say that a convex set K is normalized if B1 ⊂ K ⊂ nB1 . Then Lemma 3.10 states that, for every bounded open convex set K , there is an affine transformation A : Rn → Rn such that A(K ) is normalized. Note that, if u is strictly convex, given a point x ∈ Ω and p ∈ ∂u(x) one can choose t > 0 small enough so that the convex set S(x, p, t) := {z ∈ Ω : u(z) − u(x) − p · (z − x) < t}
(11)
is strictly contained inside Ω, namely S(x, p, t) ⊂ Ω. Then, if we replace u(z) with ux (z) := u(z) − u(x) − p · (z − x) − t, it follows that λ dx ≤ µux ≤
1 dx in S(x, p, t), λ
ux = 0 on ∂ S(x, p, t) .
Also, if A : Rn → Rn normalizes S(x, p, t), then v := (det A)2/n ux ◦ A−1 solves 1 dx in A(S(x, p, t)), v = 0 on ∂ A(S(x, p, t)) . λ Thanks to the above discussion, it suffices to prove the result when u is a solution inside a normalized convex set. In other words, Theorem 3.9 is a direct consequence of the following result:
(12)
λ dx ≤ µv ≤
Theorem 3.11. — Let Ω be a normalized convex set, and u be a solution of µu = f dx
in Ω,
u=0
on ∂ Ω,
1,γ with 0 < λ ≤ f ≤ 1/λ. Then u is strictly convex inside Ω, and u ∈ Cloc (Ω) for some γ = γ(n, λ) > 0.
In the proof of the above theorem, a key step consists in showing that solutions of (7) inside normalized domains have a universal modulus of strict convexity. A fundamental ingredient to prove this fact is the following important result of Caffarelli [13] (see also [32, Theorem 4.10]):
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
487
Proposition 3.12. — Let u be a solution of 1 dx λ inside a convex set Ω, x ∈ Ω, and p ∈ ∂u(x). Let `(z) := u(x) + p · (z − x). If the convex set W := {z ∈ Ω : u(z) = `(z)} λ dx ≤ µu ≤
contains more than one point, then it cannot have extremal points inside Ω. This statement says that if a solution coincides with one of its supporting planes on more than one point (that is, it is not strictly convex), then the contact set has to cross the domain. In particular this is not possible if u|∂ Ω = 0 (as otherwise one would deduce that u ≡ 0 by the convexity of u), proving that solutions to (12) are strictly convex. Sketch of the proof of Theorem 3.11. — As mentioned above, Proposition 3.12 implies that u is strictly convex. Also, by compactness, one can prove that the modulus of strict convexity of u is universal (see [32, Section 4.2.2]). We then apply this information at all scales. More precisely, given any point x ∈ Ω, p ∈ ∂u(x), and t > 0 small, we consider ux (z) := u(z) − u(x) − p · (z − x) − t. Then, if A : Rn → Rn normalizes S(x, p, t), the function v := (det A)2/n ux ◦ A−1 enjoys the same strict convexity properties as u. Using this fact at all points x and for all small values of t, a careful iteration argument proves the validity of Theorem 3.11 (see the proof of [32, Theorem 4.20] for more details). Note that Theorem 3.8 is unsatisfactory from a PDE viewpoint: indeed, it requires the C 2 regularity of f to prove the C 2,α regularity of the solution, while the usual elliptic regularity theory would suggest that f ∈ C 0,α should be enough. This is indeed true, as proved by Caffarelli in [12] (again, it suffices to consider normalized convex sets): Theorem 3.13. — Let Ω be a normalized convex set, and u be a solution of µu = f dx with 0 < λ ≤ f ≤ 1/λ and f ∈
in Ω,
0,α Cloc (Ω).
u=0
Then u ∈
on ∂ Ω,
2,α Cloc (Ω).
The proof of the above theorem is based on the property that, under the assumption that f is almost constant (say, very close to 1), u is very close to a solution of µv = dx. Since this latter function is smooth (by Theorem 3.8), an iteration argument permits to show that the C 2,α norm of u remains bounded (see also [32, Theorem 4.42]). With this line of reasoning one can also prove the following theorem [12]:
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
488
A. FIGALLI
Theorem 3.14. — Let Ω be a normalized convex set, and u be a solution of µu = f dx
in Ω,
u=0
on ∂ Ω.
Then, for every p > 1 there exists a positive constant δ(p) such that if kf −1k∞ ≤ δ(p) 2,p then u ∈ Wloc (Ω). Since any continuous function is arbitrarily close to a constant at small scales, one obtains the following: Corollary 3.15. — Let Ω be a normalized convex set, and u be a solution of µu = f dx
in Ω,
u=0
on ∂ Ω,
2,p with f > 0 continuous. Then u ∈ Wloc (Ω) for any p < ∞.
Remark 3.16. — As shown in [31], exploiting the ideas introduced in [24, 27] one can find an explicit estimate for δ(p) in terms of p in Theorem 3.14, namely δ(p) ' e−C p for some dimensional constant C > 0. 3.5. Some applications We now briefly describe two applications of the regularity theory developed before. 3.5.1. The Minkowski problem. — A classical problem in convex geometry is to prescribe some geometric quantity (the surface area, the Gaussian curvature, etc.) and find necessary and sufficient conditions ensuring that such a quantity comes from a convex domain. In this section we briefly discuss the “prescribed Gaussian curvature” problem. Let K ⊂ Rn be an open bounded convex domain containing the origin, and parameterize ∂K in polar coordinates as follows: ∂K = ρ(x) x : x ∈ Sn−1 , ρ : Sn−1 → R+ . Then, to any point z ∈ ∂K we associated the normal mapping n o NK (z) := y ∈ Sn−1 : K ⊂ {y : hy, w − zi ≤ 0} . Geometrically, the normal mapping finds the normals of all supporting hyperplanes at z, and we can think of NK as an analog of the subdifferential map. Finally, we consider the (multivalued) Gauss map GK : Sn−1 → Sn−1 defined by GK (x) := NK ρ(x) x , and define the Gaussian curvature measure µK (E) := H n−1 GK (E)
∀ E ⊂ Sn−1 Borel,
where H n−1 denotes the (n − 1)-dimensional Hausdorff measure on Sn−1 .
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
489
As for the Monge-Ampère measure, one can show that µK is a Borel measure. One then asks the following question: Given a Borel measure ν on Sn−1 , can we find an open bounded convex set K containing the origin and such that µK = ν? In [3, 4], Alexandrov found necessary and sufficient conditions to ensure the existence of a solution to this problem. As for the existence of Alexandrov solutions to the Monge-Ampère equation, the existence of K is first proved when ν is a finite sum of Dirac deltas, and then one obtains the general case by approximation. The original existence proof of Alexandrov when ν is discrete was based on a topological argument relying on the Invariance of Domain Theorem [3] (see also [6]). Thanks to the regularity theory developed by Caffarelli, one obtains the following regularity result: Theorem 3.17. — Let K ⊂ Rn be an open bounded convex domain containing the origin, and assume that µK = f dH n−1 for some f : Sn−1 → R, with 0 < λ ≤ f ≤ 1/λ. Then ∂K is strictly convex and of class C 1,γ . If in addition f ∈ C 0,α for some α ∈ (0, 1), then ∂K ∈ C 2,α . Sketch of the proof. — Since K is convex, one can locally parameterize the boundary as the graph of a convex function u : Ω ⊂ Rn−1 → R . It is a classical fact that the Gaussian curvature of the graph of a C 2 function v : Ω ⊂ Rn−1 → R is given by det D2 v (1 + |∇v|2 )
n+1 2
.
Then, by the assumption µK = f dH n−1 , an approximation argument based on Proposition 3.2 yields the validity of the equation n+1 µu = f (x) 1 + |∇u|2 2 dx, where ∇u exists at almost every point since u is locally Lipschitz (being convex). In particular, µu is locally bounded. Applying Proposition 3.12 and Theorem 3.9, one deduces that ∂K is strictly convex and of class C 1,γ . Finally, the C 2,α regularity when f ∈ C 0,α follows from Theorem 3.13. Remark 3.18. — The regularity theory for Monge-Ampère plays a crucial role in many other variants of the Minkowski problem. For instance, it appears in the proof of existence and uniqueness of convex domains with prescribed harmonic measure [41]. 3.5.2. The optimal transport problem. — Let µ and ν denote two probability measures on Rn . The optimal transport problem (with quadratic cost) consists in finding the “optimal” way of transporting µ onto ν given that the transportation cost to move a point from x to y is |x − y|2 . Hence, one is naturally led to minimize Z |S(x) − x|2 dµ(x) Rn
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
490
A. FIGALLI
among all maps S that “transport µ onto ν”. Mathematically, this corresponds to saying that S# µ = ν, that is, for any bounded Borel function ϕ : Rn → R, Z Z ϕ(y) dν(y) = ϕ S(x) dµ(x). Rn
Rn
By a classical theorem of Brenier [11] (see also [22, 59, 50]), existence and uniqueness of optimal maps hold provided that µ is absolutely continuous. Moreover, such a map is given by the gradient of a convex function. This is summarized in the next theorem: Theorem 3.19. — Let µ, ν be probability measures on Rn with µ = f dx and ν = g dy. Then: – There exists a µ-a.e. unique optimal transport map T . – There exists a lower semicontinuous convex function u : Rn → R ∪ {+∞} such that T = ∇u µ-a.e. and f det(D2 u) = µ-a.e. g ◦ ∇u The above theorem shows that optimal transport maps solve a Monge-Ampère equation in a weak sense, that is usually referred to as “Brenier sense”. While for Alexandrov solutions one may apply the regularity theory developed in the previous sections, Caffarelli observed in [15] that even for smooth densities one cannot expect any general regularity result for Brenier solutions without making some geometric assumptions on the support of the target measure. Indeed, let n = 2 and suppose that X = B1 is the unit ball centered at the origin and Y = B1+ + e1 ∪ B1− − e1 is the union of two half-balls, where B1+ := B1 ∩ {x1 > 0} , B1− := B1 ∩ {x1 < 0} , and (e1 , e2 ) denotes the canonical basis of R2 . Then if f = optimal transport map is given by ( x + e1 if x1 > 0 T (x) := x − e1 if x1 < 0,
1 |X| 1X
and g =
1 |Y | 1Y
, the
which corresponds to the gradient of the convex function u(x) = |x|2 /2 + |x1 |. Thus, in order to hope for a regularity result for u we need at least to assume the connectedness of Y . However, starting from the above construction and considering a sequence of domains Yε where one adds a small strip of width ε > 0 to glue together B1+ + e1 ∪ B1− − e1 , one can also show that for ε > 0 small enough the optimal map will still be discontinuous (see [15, 30]). Hence, connectedness is not enough to ensure regularity. As shown by Caffarelli [15, 17], convexity of Y is the right assumption to ensure that a Brenier solution is also an Alexandrov solution, so that the general regularity theory from the previous sections apply (see also [28, 66]):
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
491
Theorem 3.20. — Let X, Y ⊂ Rn be two bounded open sets, let f, g : Rn → R+ be two probability densities that are zero outside X, Y and are bounded away from zero and infinity on X, Y , respectively. Denote by T = ∇u : X → Y the optimal transport map provided by Theorem 3.19, and assume that Y is convex. Then there exists γ > 0 0,γ such that T ∈ Cloc (X). Furthermore, if f ∈ C k,α (X) and g ∈ C k,α (Y ) for some integer k ≥ 0 and some α ∈ (0, 1), and if both X and Y are smooth and uniformly convex, then T : X → Y is a global diffeomorphism of class C k+1,α . As shown for instance in [35], the convexity of the target is necessary for the continuity of the optimal transport map. Even worse, as recently shown in [42], even with constant densities one can construct a discontinuous optimal transport map from a smooth convex domain to a small Lipschitz deformation of itself. All these facts motivate the following very natural question: What can one say when the convexity assumption on the target is removed? As shown in [34, 26] (see also [30] for a more precise description of the singular set in two dimensions, and [37] for a recent variational proof of the result in [34]), one can always prove that the optimal transport map is smooth outside a closed set of measure zero.
4. RECENT DEVELOPMENTS I: INTERIOR REGULARITY In [67] Wang showed that for any p > 1 there exists a function f satisfying 2,p 0 < λ(p) ≤ f ≤ 1/λ(p) such that u 6∈ Wloc . This counterexample shows that the results of Caffarelli are more or less optimal. However, an important question which remained open was whether strictly convex solutions of µu = f dx with 0 < λ ≤ f ≤ 1/λ 2,1 2,1+ε could be at least Wloc , or even Wloc for some ε = ε(n, λ) > 0. The question of 2,1 Wloc regularity has been recently solved by De Philippis and Figalli in [24]. Following 2,1+ε the ideas introduced there, the result has been refined to u ∈ Wloc for some ε > 0 (see [27, 64]). Theorem 4.1. — Let Ω be a normalized convex set, and u be a solution of µu = f dx
in Ω,
u=0
on ∂ Ω,
2,1+ε with 0 < λ ≤ f ≤ 1/λ. Then there exists ε = ε(n, λ) > 0 such that u ∈ Wloc (Ω).
Again, as in Section 3.4, the previous result holds for strictly convex solutions of µu = f dx with 0 < λ ≤ f ≤ 1/λ. Sketch of the proof. — Given x ∈ Ω and t > 0 small, we consider the family {S(x, ∇u(x), t)}x∈Ω, t>0 as defined in (11). Thinking of St (x) := S(x, ∇u(x), t) as the “ball centered at x with radius t,” any subdomain Ω0 ⊂⊂ Ω endowed with this
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
492
A. FIGALLI
family of “balls” is a space of homogeneous type in the sense of Coifman and Weiss, see [18, 38, 1]. In particular Stein’s Theorem implies that if Z 2 M (D u)(x) := sup |D2 u| ∈ L1loc (Ω), t>0
S(x,∇u(x),t)
then |D2 u| ∈ L log Lloc , that is Ω0 |D2 u| log(2 + |D2 u|) ≤ C(Ω0 ) for any Ω0 ⊂⊂ Ω. The key estimate in [24] consists in showing that R
kM (D2 u)kL1loc (Ω) ≤ CkD2 ukL1loc (Ω) , for some constant C = C(n, λ). Once this estimate is proved, it follows by the convexity of u that the L1loc norm of D2 u is locally bounded (see [32, Equation (4.74)]), thus (5) (13)
|D2 u| log(2 + |D2 u|) ∈ L1loc (Ω).
By this a priori estimate and an approximation argument with smooth solutions, as 2,1 shown in [24] one easily deduces that D2 u is an L1 function, and therefore u ∈ Wloc . 2,1+ε We now explain how this argument actually implies that u ∈ Wloc . In view 2 of (13), the measure of the set where |D u| is large decays in a quantitative way: Z 1 C |{|D2 u| ≥ M }| ≤ |D2 u| log(2 + |D2 u|) ≤ , M log M {|D2 u|≥M }| M log M
for any M large. In particular, choosing first M sufficiently large and then taking ε > 0 small enough, we deduce (a localized version of) the bound |{|D2 u| ≥ M }| ≤
1 |{|D2 u| ≥ 1}|. M 1+2ε
Applying this estimate at all scales (cp. the sketch of the proof of Theorem 3.11) together with a covering lemma yields |{|D2 u| ≥ M k }| ≤
1 |{|D2 u| ≥ 1}| M (1+2ε)k
∀ k ≥ 1,
and the local L1+ε integrability for |D2 u| follows (see for instance [32, Section 4.8.4] for more details). Here the reader may be confused by the sentence “Since u is convex, the L1loc norm of D2 u is 2,1 locally bounded”. Indeed, this seems to say that the Wloc regularity of u is trivial since the integral of |D2 u| is locally finite. This is not the case because, for a convex function, D2 u may be a measure R 2,1 and so E |D2 u| denotes the integral over a set E of the measure |D2 u|. So, to prove that u ∈ Wloc , R 2 2 it is not enough to show that |D u| is locally finite but one needs to show that |D u| is absolutely continuous with respect to the Lebesgue measure. (5)
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
493
4.0.1. An application: the semigeostrophic equations. — The semigeostrophic equations are a simple model used in meteorology to describe large scale atmospheric flows, and can be derived from the 3-d Euler equations, with Boussinesq and hydrostatic approximations, subject to a strong Coriolis force [23]. Since for large scale atmospheric flows the Coriolis force dominates the advection term, the flow is mostly bi-dimensional. For this reason, the study of the semigeostrophic equations in 2-d or 3-d is pretty similar, and in order to simplify our presentation we focus here on the 2-dimensional periodic case. The semigeostrophic system can be written as ⊥ ∂t ∇pt + (ut · ∇)∇pt + ∇ pt + ut = 0 (14)
∇ · ut = 0 p = p¯ 0
2
2
where ut : R → R and pt : R2 → R are periodic functions corresponding respectively to the velocity and the pressure, and ∇⊥ pt is the π/2 counterclockwise rotation of ∇p. As shown in [23], energetic considerations show that it is natural to assume that pt is (−1)-convex, i.e., the function Pt (x) := pt (x) + |x|2 /2 is convex on R2 . Let Pt∗ be the convex conjugate of Pt , namely Pt∗ (y) := sup y · x − Pt (x) . x∈R2
Then, assuming that 0 < λ ≤ det(D P0∗ ) ≤ 1/λ, one can prove that 2
0 < λ ≤ det(D2 Pt∗ ) ≤ 1/λ
∀t > 0
in the Alexandrov sense (see [7] for more details). Thanks to Theorem 4.1 this implies 2,1+ε that Pt∗ ∈ Wloc , which is one of the key ingredients to prove the global existence of distributional solutions to (14) on the 2-dimentional torus [7] and in three dimensional domains [8]. Remark 4.2. — From a physical point of view, the lower bound on det(D2 P0∗ ) is not natural and it would be very useful if the W 2,1 regularity of solutions to µu ≤ λ1 dx was true, at least in two dimensions. Unfortunately this is false, as shown by Mooney in [56]. On a different direction, one would like to prove global existence of smooth solutions of (14) when the initial datum is smooth. Motivated by the analogous result for the 2d incompressible Euler equation, a possible strategy to prove this result would be to show that strictly convex solutions of µu = f dx with f ∈ C 0,α such that 0 < λ ≤ f ≤ 1/λ satisfy kD2 ukC 0,α ≤ C(n, λ, α)kf kC 0,α (namely, the control is linear with respect to the norm of f ). As shown in [33] this is false, and the global existence of smooth solutions is still an open problem.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
494
A. FIGALLI
4.1. On the strict convexity of weak solutions As already mentioned, strict convexity is not just a technical assumption but it is necessary to obtain regularity. Indeed, as discovered by Pogorelov, there exist Alexandrov solutions to the Monge-Ampère equation with smooth positive right-hand side which are not C 2 . For instance, the function (15)
u(x1 , x0 ) := |x0 |2−2/n (1 + x21 ),
(x1 , x0 ) ∈ R × Rn−1 ,
n ≥ 3,
is C 1,1−2/n and solves det D2 u = cn (1 + x21 )n−2 (1 − x21 ) > 0 inside B1/2 . Furthermore, the bound 0 < λ ≤ det D2 u ≤ 1/λ is not even enough for C 1 regularity: the function u(x1 , x0 ) := |x0 | + |x0 |n/2 (1 + x21 ),
(x1 , x0 ) ∈ Rn ,
n ≥ 3,
is merely Lipschitz and solves 0 < λ ≤ det D2 u ≤ 1/λ in a small convex neighborhood of the origin. (6) Alexandrov showed in [5] that, in contrast with the above counterexamples, every two dimensional solution of µu ≥ λ dx > 0 is strictly convex. In [16], Caffarelli generalized these examples to solutions that degenerate along subspaces, and he proved that solutions can degenerate only on subspaces of dimension less than n/2. Since one cannot hope for C 1 regularity of non-strictly convex solutions, it is natural to ask whether one can obtain some integrability estimates for the second derivatives. In the previous section we showed that strictly convex solutions of 2,1+ε 0 < λ dx ≤ µu ≤ λ1 dx are Wloc for some ε = ε(n, λ) > 0. If one denotes by Σ the “singular set” of points where u is not strictly convex, that is Σ := {x ∈ Ω : ∃ z ∈ Ω \ {x} and p ∈ ∂u(x) s.t. u(z) = u(x) + hp, z − xi}, then one may wonder whether the second derivatives of u can concentrate on Σ. This fact has been recently ruled out by Mooney [54] who showed that the (n − 1)-dimensional Hausdorff measure of Σ vanishes. From this, he deduced the W 2,1 regularity 2 Actually, for n ≥ 3, one can even construct a LipschitzÄAlexandrov solution of ä det D u = 1 in a small ball Bρ (0). To see this, let η > 0 and set vη (x) := η |x0 | + |x0 |n/2 (1 + x21 ) . Then, if η > 0 is large enough, it follows that det D2 vη ≥ 1 inside Bρ (0) for some ρ > 0 small. . It is a classical fact that det D2 wη = 0 Let wη : Bρ (0) → R be the convex envelope of vη |
(6)
∂Bρ (0)
in the Alexandrov sense (see for instance [57]). Also, since vη ≥ 0 it follows that wη ≥ 0. Finally, since vη (x1 , 0) = 0 for x1 = ±ρ, we have wη (x1 , 0) = 0 for |x1 | ≤ ρ. Now, let u be the Alexandrov solution of ( det D2 u = 1 in Bρ , u = vη
on ∂Bρ ,
provided by Theorem 3.6. Then it follows by Proposition 3.3 that vη ≤ u ≤ wη inside Bρ . This implies in particular that u(x1 , 0) = 0 for |x1 | ≤ ρ, that combined with u(x1 , x0 ) ≥ vη (x1 , x0 ) ≥ η|x0 | shows that u is merely Lipschitz continuous.
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
495
of solutions without any strict convexity assumptions. Actually, in a subsequent paper [55], he was able to strengthen this result by showing a small logarithmic integrality improvement and proving that such a result is optimal. Theorem 4.3. — Let Ω ⊂ Rn be an open set, and u : Ω → R be a convex function satisfying µu = f dx for some 0 < λ ≤ f ≤ 1/λ. Then H n−1 (Σ) = 0 and 2,1 u ∈ Wloc (Ω). In addition, there exists η = η(n) > 0 such that Z η |D2 u| log 2 + |D2 u| dx < ∞ ∀ Ω0 ⊂⊂ Ω. Ω0
On the other hand, if M > 0 is sufficiently large, one can construct a solution u with f ≡ 1 such that Z M dx = +∞ for some Ω0 ⊂⊂ Ω. |D2 u| log 2 + |D2 u| Ω0
5. RECENT DEVELOPMENTS II: BOUNDARY REGULARITY The interior regularity theory for Alexandrov solutions relies on several geometric properties of sections S(x, p, y) of u that are strictly contained inside Ω (see (11)). In particular one can prove that, if u is a strictly convex solution of λ dx ≤ µu ≤ λ1 dx and St (x) := S(x, ∇u(x), t) is is compactly contained inside Ω, then St (x) is comparable to an ellipsoid of volume tn/2 (see for instance [32, Lemma 4.6]). In order to develop a boundary regularity theory, it is crucial to understand the geometry of sections St (x) when x ∈ ∂Ω. This has been done by Savin in [60, 62, 61], where he recently introduced new techniques to obtain global versions of all the previous regularity results under suitable regularity assumptions on the boundary data. Let us describe the main results. Assume that 0 ∈ ∂Ω, that Ω ⊂ Rn is a bounded open convex set satisfying Bρ (ρ en ) ⊂ Ω ⊂ B1/ρ (0) ∩ {xn > 0}
(16)
for some ρ > 0, and that u : Ω → R satisfies µu = f dx
(17)
in Ω
for some 0 < λ ≤ f ≤ 1/λ. Extend u by letting it being equal to +∞ in Rn \ Ω, and up to subtracting a linear function assume that `(x) ≡ 0 is the tangent plane to u at 0, that is (18)
u ≥ 0,
u(0) = 0,
and
u(x) 6≥ ε xn
∀ ε > 0.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
496
A. FIGALLI
The main result in [60] shows that if u ≈ |x|2 along ∂Ω ∩ {xn ≤ ρ}, then the sections St (0) := {x ∈ Ω : u(x) < t} are comparable to half-ellipsoids for t small. More precisely, the following holds: Theorem 5.1. — Let Ω ⊂ Rn be a bounded open convex set satisfying (16), and u : Ω → R be a convex function satisfying (17) for some 0 < λ ≤ f ≤ 1/λ. Assume that (18) holds, and that (19)
β |x|2 ≤ u(x) ≤
1 2 |x| β
on ∂Ω ∩ {xn ≤ ρ}
for some β > 0. Then, for any t > 0 small, there exists an ellipsoid Et of volume tn/2 such that 1 Et ∩ Ω ⊂ St (0) ⊂ K Et ∩ Ω, K where K > 1 depends only on n, λ, ρ, and β. In addition, the ellipsoid Et is comparable √ to a ball of radius t, up to a possible translation along the xn -direction of size | log t|. Specifically, there exists a linear transformation At : Rn → Rn of the form At (x) = x − τ xn ,
τ = (τ1 , . . . , τn−1 , 0) ∈ Rn ,
and
|τ | ≤ K | log t|,
such that Et = At B√t (0) . The last part of the above result provides information about the behavior of the second derivatives near the origin. Indeed, heuristically, this result states that inside St (0) the tangential second derivatives are uniformly bounded both from above and below, while the mixed second derivatives are bounded by | log t|. This is very interesting given that µu is only bounded from above and below, and that the boundary data as well as the boundary are only C 1,1 . As a consequence of Theorem 5.1 and the interior estimates proved in Section 3.4, in [62, 61] Savin obtained the following global C 2,α and W 2,p estimates. Theorem 5.2. — Let Ω ⊂ Rn be a bounded open uniformly convex set, u : Ω → R be a convex function satisfying (17) for some 0 < λ ≤ f ≤ 1/λ, and assume that both u| and ∂Ω are of class C 1,1 . Suppose also that u separates quadratically on ∂Ω from ∂Ω its tangent plane, that is u(z) − u(x) ≥ h∇u(x), z − xi + β |z − x|2
∀ x, z ∈ ∂Ω
for some β > 0. Then: – There exists ε > 0 such that u ∈ W 2,1+ε (Ω). – For any p > 1, if kf − 1kL∞ (Ω) ≤ e−Cp then u ∈ W 2,p (Ω). – Assume that f ∈ C 0,α (Ω) and that both u|∂Ω and ∂Ω are of class C 2,α . Then u ∈ C 2,α (Ω).
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
497
As observed in [60], the assumption that u separates quadratically on ∂Ω from its tangent plane is verified, for instance, whenever ∂Ω and u|∂Ω are of class C 3 with Ω uniformly convex.
6. RECENT DEVELOPMENTS III: SMOOTHNESS OF THE FIRST EIGENFUNCTION Let Ω be a smooth uniformly convex set. In the paper [49], P.-L. Lions investigated the existence and uniqueness of the first eigenvalue for the Monge-Ampère operator, namely the existence of a nontrivial convex function ψ1 ∈ C 1,1 (Ω) ∩ C ∞ (Ω) and a positive constant λ1 such that (20)
(det D2 ψ1 )1/n = −λ1 ψ1
in Ω,
ψ1 = 0 on ∂ Ω.
As shown in [49], the couple (λ1 , ψ1 ) is essentially unique. More precisely, if ψ : Ω → R is a nontrivial convex function and λ a positive constant such that (det D2 ψ)1/n = −λψ
in Ω,
ψ = 0 on ∂ Ω,
then λ = λ1 and ψ = θψ1 for some positive constant θ. Using the algebraic formula n 1 o (21) (det A)1/n = inf tr(AB) : B symm. pos. def., det B ≥ n , n one can prove that n 1 o λ1 = inf λ1 (aij ) : aij ∈ C(Ω), aij symm. pos. def., det(aij ) ≥ n , n where λ1 (aij ) is the first eigenvalue of the linear elliptic operator aij ∂ij . In addition, again using (21), one can approximate the Monge-Ampère equation with HamiltonJacobi-Bellman equations of the form n 1 1o A ψ := inf aij ∂ij ψ : aij ∈ C(Ω), aij symm. pos. def., det(aij ) ≥ n , tr(aij ) ≤ , n and deduce some interesting stochastic interpretation for λ1 (see [47, 49] for more details). As observed in Section 3.2, many results for the equation µu = f (x) dx can be extended to the general case µu = f (x, u, ∇u) dx provided ∂u f ≥ 0, as this ensures the validity of the maximum principle. An interesting consequence of Lions’ result is the validity of a maximum principle also when f is slightly decreasing with respect to u. More precisely, the equation µu = F (x, u) dx has a unique solution provided ∂u F (x, u)1/n > −λ1 (see [49, Corollary 2]).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
498
A. FIGALLI
Note that, in view of the C 1,1 regularity of ψ1 , near the boundary of Ω one can write |ψ1 (x)| = g(x)d∂ Ω (x), where g : Ω → R is a strictly positive Lipschitz function, and d∂ Ω (x) = dist(x, ∂ Ω) denotes the distance function to the boundary. In other words, ψ1 solves a Monge-Ampère equation of the form det D2 ψ1 (x) = G(x) d∂ Ω (x)n
(22)
in Ω,
ψ1 = 0 on ∂ Ω,
where G(x) ≥ c0 > 0 is Lipschitz. Because the right hand side vanishes of the equation on ∂ Ω, (22) is degenerate near the boundary and it has been an open problem for more than 30 years whether ψ1 is smooth up to the boundary. The solution to this question has been given only recently, first by Hong, Huang, and Wang in two dimensions [39], and then by Savin [63] and by Le and Savin [46] in arbitrary dimensions. More precisely, consider the general class of Monge-Ampère equations (23)
µu = f dx
in Ω,
u = 0 on ∂ Ω,
f (x) = G(x)d∂ Ω (x)s ,
where s > 0 and G is a continuous strictly positive function. In [63] Savin proved the following C 2 regularity estimate at the boundary: Theorem 6.1. — Let Ω ⊂ Rn be a bounded open convex set satisfying (16), and u : Ω → R be a convex function satisfying (23). Assume that (18) and (19) hold, and that u|∂ Ω∩Bρ (0) is of class C 2 for some ρ > 0. Then u is C 2 at 0. More precisely, there exist a vector τ perpendicular to en , a quadratic polynomial Q : Rn−1 → R, and a constant a > 0, such that u(x + τ xn ) = Q0 (x0 ) + ax2+s + o(|x0 |2 + x2+s n n )
∀ x = (x0 , xn ) ∈ Bρ (0).
As a consequence of this result, since (20) is of the form (23) with s = n, Savin obtained the global C 2 regularity of the first eigenfunction: Corollary 6.2. — Let Ω ⊂ Rn be a uniformly convex set of class C 2 , and let ψ1 be the first eigenfunction (see (20)). Then ψ1 ∈ C 2 (Ω). By a perturbative approach based on Theorem 6.1, Le and Savin improved the boundary C 2 regularity to C 2,β . More precisely, they showed the following pointwise estimate: Theorem 6.3. — Let Ω ⊂ Rn be a bounded open convex set satisfying (16), and u : Ω → R be a convex function satisfying (23).Ä Assume ä that (18) and (19) hold, and 2 that u|∂ Ω∩Bρ (0) is of class C 2,β for some β ∈ 0, 2+s and ρ > 0. Also, assume that G ∈ C 0,γ (Ω ∩ Bρ (0)) for some γ ≥
ASTÉRISQUE 414
β(2+s) . 2
Then u is C 2,β at 0. More precisely, there
(1148)
ON THE MONGE-AMPÈRE EQUATION
499
exist a vector τ perpendicular to en , a quadratic polynomial Q : Rn−1 → R, and a constant a > 0, such that 1+β/2 u(x + τ xn ) = Q0 (x0 ) + ax2+s + O(|x0 |2 + x2+s n n )
∀ x = (x0 , xn ) ∈ Bρ (0).
As a consequence of this result, one obtains the global C 2,β regularity of the first 2 eigenfunction for any β < 2+n . We note that usually, when dealing with elliptic questions, once one obtains C 2,β regularity then the higher regularity follows easily by Schauder estimates. This is not the case in this situation because of the high degeneracy of the equation. The key idea in [46] consists in performing both an hodograph transform and a partial Legendre transform in order to deduce that (a suitable transformation of) the first eigenfunction satisfies a degenerate Grushin-type equation with Hölder coefficients. Once this is achieved, Le and Savin conclude the global smoothness of ψ1 by applying Schauder estimates for Grushin-type operators: Corollary 6.4. — Let Ω ⊂ Rn be a uniformly convex set of class C ∞ , and let ψ1 be the first eigenfunction (see (20)). Then ψ1 ∈ C ∞ (Ω). Acknowledgments. — The author is thankful to Yash Jhaveri and Connor Mooney for useful comments on a preliminary version of the manuscript. The author is supported by the ERC Grant “Regularity and Stability in Partial Differential Equations (RSPDE)”.
REFERENCES [1] H. Aimar, L. Forzani & R. Toledano – “Balls and quasi-metrics: a space of homogeneous type modeling the real analysis related to the Monge-Ampère equation”, J. Fourier Anal. Appl. 4 (1998), nos. 4-5, p. 377–381. [2] A. D. Aleksandrov – “Dirichlet’s problem for the equation Det ||zij || = ϕ(z1 , . . . , zn , z, x1 , . . . , xn ). I”, Vestnik Leningrad. Univ. Ser. Mat. Meh. Astr. 13 (1958), no. 1, p. 5–24. [3] A. Alexandroff – “Application of the theorem on domain invariance to existence proofs”, Izv. AN USSR 3 (1939), p. 243–256. [4]
, “Existence and uniqueness of a convex surface with a given integral curvature”, C. R. (Doklady) Acad. Sci. URSS (N.S.) 35 (1942), p. 131–134.
[5]
, “Smoothness of the convex surface of bounded Gaussian curvature”, C. R. (Doklady) Acad. Sci. URSS (N.S.) 36 (1942), p. 195–199.
[6] A. D. Alexandrov – Convex polyhedra, Springer Monographs in Math., Springer, 2005.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
500
A. FIGALLI
[7] L. Ambrosio, M. Colombo, G. De Philippis & A. Figalli – “Existence of Eulerian solutions to the semigeostrophic equations in physical space: the 2-dimensional periodic case”, Comm. Partial Differential Equations 37 (2012), no. 12, p. 2209–2227. [8]
, “A global existence result for the semigeostrophic equations in three dimensional convex domains”, Discrete Contin. Dyn. Syst. 34 (2014), no. 4, p. 1251– 1268.
[9] A. Ampère – “Mémoire contenant l’application de la théorie”, Journal de l’École polytechnique (1820). [10] I. Y. Bakel man – “Generalized solutions of Monge-Ampère equations”, Dokl. Akad. Nauk SSSR (N.S.) 114 (1957), p. 1143–1145. [11] Y. Brenier – “Polar factorization and monotone rearrangement of vector-valued functions”, Comm. Pure Appl. Math. 44 (1991), no. 4, p. 375–417. [12] L. A. Caffarelli – “Interior W 2,p estimates for solutions of the Monge-Ampère equation”, Ann. of Math. 131 (1990), no. 1, p. 135–150. [13]
, “A localization property of viscosity solutions to the Monge-Ampère equation and their strict convexity”, Ann. of Math. 131 (1990), no. 1, p. 129– 134.
[14]
, “Some regularity properties of solutions of Monge Ampère equation”, Comm. Pure Appl. Math. 44 (1991), nos. 8-9, p. 965–969.
[15]
, “The regularity of mappings with a convex potential”, J. Amer. Math. Soc. 5 (1992), no. 1, p. 99–104.
[16]
, “A note on the degeneracy of convex solutions to Monge Ampère equation”, Comm. Partial Differential Equations 18 (1993), nos. 7-8, p. 1213–1217.
[17]
, “Boundary regularity of maps with convex potentials. II”, Ann. of Math. 144 (1996), no. 3, p. 453–496.
[18] L. A. Caffarelli & C. E. Gutiérrez – “Real analysis related to the MongeAmpère equation”, Trans. Amer. Math. Soc. 348 (1996), no. 3, p. 1075–1092. [19] L. A. Caffarelli, L. Nirenberg & J. Spruck – “The Dirichlet problem for nonlinear second-order elliptic equations. I. Monge-Ampère equation”, Comm. Pure Appl. Math. 37 (1984), no. 3, p. 369–402. [20] E. Calabi – “Improper affine hyperspheres of convex type and a generalization of a theorem by K. Jörgens”, Michigan Math. J. 5 (1958), p. 105–126. [21] S. Y. Cheng & S. T. Yau – “On the regularity of the Monge-Ampère equation det(∂ 2 u/∂xi ∂sxj ) = F (x, u)”, Comm. Pure Appl. Math. 30 (1977), no. 1, p. 41– 68. [22] J. A. Cuesta & C. Matrán – “Notes on the Wasserstein metric in Hilbert spaces”, Ann. Probab. 17 (1989), no. 3, p. 1264–1276.
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
501
[23] M. Cullen – A mathematical theory of large-scale atmosphere/ocean flow, Imperial College Press, 2006. [24] G. De Philippis & A. Figalli – “W 2,1 regularity for solutions of the MongeAmpère equation”, Invent. math. 192 (2013), no. 1, p. 55–69. [25]
, “The Monge-Ampère equation and its link to optimal transportation”, Bull. Amer. Math. Soc. (N.S.) 51 (2014), no. 4, p. 527–580.
[26]
, “Partial regularity for optimal transport maps”, Publ. Math. Inst. Hautes Études Sci. 121 (2015), p. 81–112.
[27] G. De Philippis, A. Figalli & O. Savin – “A note on interior W 2,1+ε estimates for the Monge-Ampère equation”, Math. Ann. 357 (2013), no. 1, p. 11–22. [28] P. Delanoë – “Classical solvability in dimension two of the second boundaryvalue problem associated with the Monge-Ampère operator”, Ann. Inst. H. Poincaré Anal. Non Linéaire 8 (1991), no. 5, p. 443–457. [29] L. C. Evans – “Classical solutions of fully nonlinear, convex, second-order elliptic equations”, Comm. Pure Appl. Math. 35 (1982), no. 3, p. 333–363. [30] A. Figalli – “Regularity properties of optimal maps between nonconvex domains in the plane”, Comm. Partial Differential Equations 35 (2010), no. 3, p. 465–479. [31]
, “Sobolev regularity for the Monge-Ampère equation, with application to the semigeostrophic equations”, Zap. Nauchn. Sem. S.-Peterburg. Otdel. Mat. Inst. Steklov. (POMI) 411 (2013), no. Teoriya Predstavleni
[32]
, The Monge-Ampère equation and its applications, Zurich Lectures in Advanced Mathematics, European Mathematical Society (EMS), 2017.
[33] A. Figalli, Y. Jhaveri & C. Mooney – “Nonlinear bounds in Hölder spaces for the Monge-Ampère equation”, J. Funct. Anal. 270 (2016), no. 10, p. 3808– 3827. [34] A. Figalli & Y.-H. Kim – “Partial regularity of Brenier solutions of the MongeAmpère equation”, Discrete Contin. Dyn. Syst. 28 (2010), no. 2, p. 559–565. [35] A. Figalli, L. Rifford & C. Villani – “Necessary and sufficient conditions for continuity of optimal transport maps on Riemannian manifolds”, Tohoku Math. J. 63 (2011), no. 4, p. 855–876. [36] D. Gilbarg & N. S. Trudinger – Elliptic partial differential equations of second order, second ed., Grundl. math. Wiss., vol. 224, Springer, 1983. [37] M. Goldman & F. Otto – “A variational proof of partial regularity for optimal transportation maps”, preprint arXiv:1704.05339. [38] C. E. Gutiérrez & Q. Huang – “Geometric properties of the sections of solutions to the Monge-Ampère equation”, Trans. Amer. Math. Soc. 352 (2000), no. 9, p. 4381–4396.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
502
A. FIGALLI
[39] J. Hong, G. Huang & W. Wang – “Existence of global smooth solutions to Dirichlet problem for degenerate elliptic Monge-Ampere equations”, Comm. Partial Differential Equations 36 (2011), no. 4, p. 635–656. [40] N. M. Ivochkina – “Classical solvability of the Dirichlet problem for the MongeAmpère equation”, vol. 131, 1983, Questions in quantum field theory and statistical physics, 4, p. 72–79. [41] D. Jerison – “Prescribing harmonic measure on convex domains”, Invent. math. 105 (1991), no. 2, p. 375–400. [42] Y. Jhaveri – “On the (in)stability of the identity map in optimal transportation”, Calc. Var. Partial Differential Equations 58 (2019), no. 3, Art. 96, 25. [43] F. John – “Extremum problems with inequalities as subsidiary conditions”, in Studies and Essays Presented to R. Courant on his 60th Birthday, January 8, 1948, Interscience Publishers, N. Y., 1948, p. 187–204. [44] N. V. Krylov – “Boundedly inhomogeneous elliptic and parabolic equations”, Izv. Akad. Nauk SSSR Ser. Mat. 46 (1982), no. 3, p. 487–523; English translation in Math. USSR. Izv. 20 (1983), 459–492. [45]
, “Boundedly inhomogeneous elliptic and parabolic equations in a domain”, Izv. Akad. Nauk SSSR Ser. Mat. 47 (1983), no. 1, p. 75–108; English translation in Math. USSR. Izv. 22 (1984), 67–97.
[46] N. Q. Le & O. Savin – “Schauder estimates for degenerate Monge-Ampère equations and smoothness of the eigenfunctions”, Invent. math. 207 (2017), no. 1, p. 389–423. [47] P.-L. Lions – “Bifurcation and optimal stochastic control”, Nonlinear Anal. 7 (1983), no. 2, p. 177–207. [48]
, “Sur les équations de Monge-Ampère. I”, Manuscripta Math. 41 (1983), nos. 1-3, p. 1–43.
[49]
, “Two remarks on Monge-Ampère equations”, Ann. Mat. Pura Appl. 142 (1985), p. 263–275.
[50] R. J. McCann – “Existence and uniqueness of monotone measure-preserving maps”, Duke Math. J. 80 (1995), no. 2, p. 309–323. [51] H. Minkowski – “Allgemeine Lehrsätze über die konvexen Polyeder”, Nachr. Ges. Wiss. Göttingen (1897), p. 198–219. [52]
, “Volumen und Oberfläche”, Math. Ann. 57 (1903), no. 4, p. 447–495.
[53] G. Monge – “Sur le calcul intégral des équations aux differences partielles”, Mémoires de l’Académie des Sciences (1784). [54] C. Mooney – “Partial regularity for singular solutions to the Monge-Ampère equation”, Comm. Pure Appl. Math. 68 (2015), no. 6, p. 1066–1084.
ASTÉRISQUE 414
(1148)
ON THE MONGE-AMPÈRE EQUATION
503
[55]
, “W 2,1 estimate for singular solutions to the Monge-Ampère equation”, Ann. Sc. Norm. Super. Pisa Cl. Sci. 14 (2015), no. 4, p. 1283–1303.
[56]
, “Some counterexamples to Sobolev regularity for degenerate MongeAmpère equations”, Anal. PDE 9 (2016), no. 4, p. 881–891.
[57] A. M. Oberman & L. Silvestre – “The Dirichlet problem for the convex envelope”, Trans. Amer. Math. Soc. 363 (2011), no. 11, p. 5871–5886. [58] A. V. Pogorelov – “The regularity of the generalized solutions of the equation det(∂ 2 u/∂xi ∂xj ) = ϕ(x1 , x2 , . . . , xn ) > 0”, Dokl. Akad. Nauk SSSR 200 (1971), p. 534–537. [59] L. Rüschendorf & S. T. Rachev – “A characterization of random variables with minimum L2 -distance”, J. Multivariate Anal. 32 (1990), no. 1, p. 48–54. [60] O. Savin – “A localization property at the boundary for Monge-Ampère equation”, in Advances in geometric analysis, Adv. Lect. Math. (ALM), vol. 21, Int. Press, 2012, p. 45–68. [61]
, “Global W 2,p estimates for the Monge-Ampère equation”, Proc. Amer. Math. Soc. 141 (2013), no. 10, p. 3573–3578.
[62]
, “Pointwise C 2,α estimates at the boundary for the Monge-Ampère equation”, J. Amer. Math. Soc. 26 (2013), no. 1, p. 63–99.
[63]
, “A localization theorem and boundary regularity for a class of degenerate Monge-Ampere equations”, J. Differential Equations 256 (2014), no. 2, p. 327– 388.
[64] T. Schmidt – “W2,1+ε estimates for the Monge-Ampère equation”, Adv. Math. 240 (2013), p. 672–689. [65] N. S. Trudinger & X.-J. Wang – “The Monge-Ampère equation and its geometric applications”, in Handbook of geometric analysis. No. 1, Adv. Lect. Math. (ALM), vol. 7, Int. Press, 2008, p. 467–524. [66] J. Urbas – “On the second boundary value problem for equations of MongeAmpère type”, J. reine angew. Math. 487 (1997), p. 115–124. [67] X. J. Wang – “Some counterexamples to the regularity of Monge-Ampère equations”, Proc. Amer. Math. Soc. 123 (1995), no. 3, p. 841–845. [68] X.-J. Wang – “Regularity for Monge-Ampère equation near the boundary”, Analysis 16 (1996), no. 1, p. 101–107.
Alessio FIGALLI ETH Zürich, Department of Mathematics Rämistrasse 101, 8092 Zürich, Switzerland E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1149, p. 505 à 532 doi:10.24033/ast.1093
Juin 2018
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE [d’après Benoist, Hulin, Lemm, Markovic,...] par François GUÉRITAUD
1. INTRODUCTION Le théorème suivant est le résultat principal de [6]. Théorème 1.1. — Soient X et Y des variétés de Hadamard dont toutes les courbures sectionnelles appartiennent à [−b2 , −a2 ], où 0 < a < b, et soit une fonction f : X → Y . S’il existe δ > 0 tel que pour tous x, x0 ∈ X on ait les implications dX (x, x0 ) ≤ δ =⇒ dY (f (x), f (x0 )) ≤ dX (x, x0 ) ≥
1 δ
1 δ
=⇒ dY (f (x), f (x0 )) ≥ δ,
alors il existe une unique application harmonique h : X → Y à distance bornée de f , i.e. telle que supx∈X dY (f (x), h(x)) soit fini. Cette quantité peut être bornée en fonction de a, b, δ et de k = dim X et ` = dim Y . Une variété de Hadamard X est une variété riemannienne complète, simplement connexe, de dimension k ≥ 2 finie et à courbure sectionnelle ≤ 0. Une telle variété X est homéomorphe à Rk , un homéomorphisme (faiblement dilatant) étant donné par l’application exponentielle expo : To X → X, où o ∈ X est un point base. La contrainte sur les courbures contenue dans l’énoncé est parfois appelée un pincement (strictement négatif) ; dans cet exposé on dira aussi que X et Y sont (−b2 , −a2 )-pincées, ou simplement pincées lorsqu’il existe de tels b > a > 0. Bien sûr dX est la fonction distance géodésique sur X. Une application f vérifiant l’hypothèse métrique de l’énoncé sera appelée un plongement faible (ou parfois : δ-faible). Cette classe comprend par exemple les plongements quasi-isométriques (q.i. en abrégé), c’est-à-dire les applications
© Astérisque 414, SMF 2019
506
F. GUÉRITAUD
f : X → Y telles qu’il existe c ≥ 1 et C ≥ 0 vérifiant pour tous x, x0 ∈ X : (1.1)
1 dX (x, x0 ) − C ≤ dY (f (x), f (x0 )) ≤ c dX (x, x0 ) + C. c
Corollaire 1.2. — Tout plongement q.i. entre variétés de Hadamard pincées est à distance finie d’une unique application harmonique. Une application est dite harmonique si elle minimise localement l’énergie calculée en intégrant la norme L2 de la différentielle ; nous reviendrons sur cette notion dans les rappels de la partie 3.
2. HISTOIRE ET CONTEXTE Eells et Sampson ont montré dans [9] que toute application lisse entre variétés riemanniennes compactes à courbure négative est homotope à une application harmonique ; leur argument consistait à déformer l’application selon le flot de la chaleur. Le théorème 1.1 remplace l’hypothèse de (co)-compacité par une hypothèse de plongement faible. Notons au passage que l’application h qu’il produit n’est pas toujours injective, même dans le cas d’un plongement q.i. avec une action cocompacte [11]. C’est avant tout le corollaire 1.2 qui a aiguillonné la curiosité des géomètres : il a été montré un peu avant le théorème 1.1. Les hypothèses de ce dernier peuvent sembler considérablement plus faibles ; cependant nous verrons à la partie 4 que la courbure strictement négative oblige les plongements faibles à suivre statistiquement, aux grandes échelles et dans la plupart des directions, un comportement très voisin des plongements quasi-isométriques. C’est en fait sous une telle condition statistique (résistant aux perturbations bornées, au contraire du plongement faible proprement dit) que nous établirons la conclusion : voir le théorème 5.1. Régularité au bord La question à laquelle répond le corollaire 1.2 émergea d’abord dans le contexte des applications quasi-conformes ϕ du bord d’un espace symétrique de rang un dans lui-même. Bien que leur incidence sur les résultats présentés ici ne soit qu’historique, attardons-nous brièvement sur ces questions de régularité au bord. Une variété de Hadamard pincée X est en particulier un espace Gromovhyperbolique, et admet donc un bord idéal ∂∞ X. Ce bord est une sphère topologique, munie d’une classe naturelle de métriques (mutuellement Hölder-équivalentes, et
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
507
même lipschitziennes) dont on peut fixer une représentante. Pour Y une autre variété de Hadamard pincée, et ϕ : ∂∞ X → ∂∞ Y continue, notons Qrϕ (ξ) :=
max d (ϕ(ξ 0 ), ϕ(ξ)) et qϕr (ξ) :=
d(ξ 0 ,ξ)≤r
min d (ϕ(ξ 0 ), ϕ(ξ))
d(ξ 0 ,ξ)≥r
où ξ ∈ ∂∞ X et r > 0. Considérons alors les propriétés suivantes : (i) ϕ est quasi-symétrique : pour tous 0 < r < R, le rapport une fonction continue de
R r
QR ϕ (ξ) r (ξ) qϕ
est majoré par
indépendante de ξ ;
Qrϕ (ξ) q r (ξ) ξ∈∂∞ X r→0 ϕ
(ii) ϕ est quasi-conforme : sup lim
< ∞; f
(iii) ϕ prolonge continûment un plongement quasi-isométrique X → Y ; (iv) on a (iii) et f : X → Y peut de plus être choisie harmonique. Les notions (i) et (ii) ne dépendent pas des métriques représentantes choisies sur ∂∞ X et ∂∞ Y . L’implication (i) ⇒ (ii) est évidente. Pour X, Y des espaces symétriques réels de rang un, la réciproque est vraie ([30], voir aussi [14]) : (i) ⇔ (ii). Le cas général reste ouvert. Les propriétés (iii) et (iv) sont en fait équivalentes à (i). L’implication (iii) ⇒ (i) est un résultat classique de Gromov [12, §7], préexistant dans [27]. La réciproque (i) ⇒ (iii), plus difficile, est due à Bonk et Schramm [7]. (Quand X = Y est un espace symétrique de rang un, elle remonte à un argument de Tukia [36] ; Paulin [31] en donnait une version pour les graphes de Cayley de groupes hyperboliques). L’implication (iii) ⇒ (iv), dont la réciproque est triviale, équivaut à la partie « existence » du corollaire 1.2.
Genèse du problème Schoen conjecturait dans [33] que toute application quasi-symétrique du cercle ∂∞ H2 dans lui-même étend un unique difféomorphisme quasi-conforme harmonique de H2 . Dans [22], Li et Wang observaient qu’on obtient une conjecture équivalente en remplaçant « difféomorphisme quasi-conforme » par « quasi-isométrie » (toujours harmonique), et étendaient conjecturalement ce nouvel énoncé à tout espace symétrique (1) de rang réel 1. Ils montraient en outre l’unicité de l’extension harmonique quasi-isométrique (si elle existe), d’après un argument de Li et Tam [21] que nous reprendrons à la partie 6. Sans hypothèse de quasi-isométrie,
(1)
Tous les espaces symétriques rencontrés dans cet exposé seront implicitement supposés de type non compact.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
508
F. GUÉRITAUD
pas d’unicité (2) : l’identité du demi-plan H2 ⊂ C et l’application harmonique x + iy 7→ x + i sinh(y) ont le même prolongement continu à ∂∞ H2 . L’implication (i) ⇒ (iii) étant connue, la conjecture de Schoen se ramenait donc à montrer (iii) ⇒ (iv) pour X = Y = H2 . Par ailleurs, Pansu montrait dès [30] que l’extension (existe et) est isométrique dès que X = Y est un espace hyperbolique quaternionique ou octonionique. Progrès récents La conjecture de Schoen a été finalement montrée par Markovic dans [25]. Il avait auparavant résolu dans [24] le cas de H3 , plus favorable en ce qu’il respecte le principe de rigidité de Mostow : toute application quasi-conforme du bord ∂∞ H3 ' S2 dans luimême est différentiable presque partout. Le cas de Hn (pour n ≥ 3) est traité dans [20], et le cas où X, Y sont des espaces symétriques de rang 1 quelconques (éventuellement distincts) dans [4]. Ce dernier résultat prouve en particulier la conjecture de Li-Wang. Ces progrès récents, ainsi que le théorème 1.1 (ou son corollaire 1.2) qui les contient tous, peuvent être vus comme des épures géométriques successives d’un même argument d’existence, les ingrédients analytiques étant progressivement absorbés par des principes généraux et classiques. Les difficultés liées à l’anisotropie ou à la courbure variable dans une variété de Hadamard pincée X sont séparément réglées par [5], dont le résultat principal (th. 3.6 ci-dessous) permet de comparer les mesures visuelle et harmonique sur une sphère de X, indépendamment de son rayon. Ces inégalités sont un pendant fini de [17], où Kifer et Ledrappier donnaient des estimations analogues sur la sphère à l’infini. La jeune postérité de ces arguments d’existence comprend déjà des prépublications offrant plusieurs directions de généralisation. Dans [34], Sidler et Wenger donnent une version du corollaire 1.2 (sans l’unicité, qui peut être mise en défaut) dans laquelle l’espace but Y est un espace Gromov-hyperbolique CAT(0) localement compact. La notion d’application harmonique dans ce contexte est due à Korevaar et Schoen [19]. Dans [29], Pankka et Souto étendent les arguments de [4] pour montrer que toute application quasi-régulière ϕ : ∂∞ Hn → ∂∞ Hn étend continûment une application harmonique f : Hn → Hn . La quasi-régularité est une généralisation de la quasi-conformité, pour des applications qui ne sont pas nécessairement des homéomorphismes. (2)
Ajoutons : sans hypothèse de plongement faible, pas d’existence dans le théorème 1.1. L’application x + iy 7→ x + i(y + y 2 ) n’est pas un plongement faible (pour n 1 les points ±n + in2/3 sont mutuellement lointains mais d’images proches) ; elle n’est à distance finie d’aucune application harmonique [6].
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
509
Résultats voisins Le corollaire 1.2 est aussi à rapprocher du lemme de Morse [26, 12], correspondant à X = R : tout plongement q.i. de la droite dans une variété de Hadamard pincée Y est à distance bornée d’une géodésique. En effet, les applications harmoniques (non constantes) de la droite dans une variété riemannienne sont les géodésiques paramétrées à vitesse uniforme. Dans le lemme de Morse cependant, il peut être nécessaire de reparamétrer la géodésique (i.e. le corollaire 1.2 ne s’étend pas littéralement au cas X = R). Il est concevable qu’on puisse affaiblir les hypothèses de pincement dans le théorème 1.1 ou son corollaire. Sans elles cependant, le lemme de Morse devient faux, même s’il subsiste sous une forme atténuée pour Y un espace symétrique irréductible de rang supérieur : voir [16, 13]. En revanche, si X = Y est un espace symétrique sans facteur de rang 1, alors tout plongement quasi-isométrique f : X → X est à distance bornée d’une isométrie. Ce résultat est dû à Kleiner-Leeb [18] ; voir aussi Eskin-Farb [10]. Étendre harmoniquement une fonction scalaire ϕ définie sur le bord d’une variété de Hadamard pincée, c’est possible sans autre hypothèse que la continuité de ϕ : ce résultat est dû indépendamment à Anderson et Sullivan [2, 35]. Pour ϕ à valeurs dans le bord d’une autre variété de Hadamard, la situation est moins favorable : bien qu’il y ait existence et unicité des extensions harmoniques pour ϕ lisse, dans [24] Markovic exhibe une suite de difféomorphismes du cercle qui convergent uniformément vers l’identité mais dont les extensions harmoniques au disque n’ont pas de limite continue. Une hypothèse plus forte que la continuité est donc bien nécessaire dans la conjecture de Schoen, du moins si l’on veut que le prolongement dépende continûment de la donnée. L’introduction de [22] contient de plus amples références.
3. NOTATIONS ET RAPPELS Dans tout l’exposé, pour X une variété de Hadamard, x, y, z ∈ X et r > 0, on notera : • BX (x, r) ou B(x, r) la boule de centre x et de rayon r ; • Sx la sphère unité de l’espace euclidien Tx X tangent à X en x ; (3.1) • ξr := expx (rξ) ∈ ∂B(x, r) pour tout ξ ∈ Sx ; • x ]zy ∈ [0, π] l’angle formé en x (supposé distinct de y et z) par les rayons géodésiques [xy) et [xz). Pour deux quantités u, v > 0, dans le contexte du théorème 1.1, nous utiliserons la notation u . v pour signifier que u ≤ M v où M dépend des constantes de
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
510
F. GUÉRITAUD
pincement a, b, des dimensions k, `, de la constante de plongement faible δ ainsi que d’éventuels paramètres supplémentaires placés en indice : par exemple u .ε v. On notera u ≈ v quand u . v et u & v. À l’inverse, u v signifiera que u/v est arbitrairement grand. 3.1. Fonctions et applications harmoniques Une application f : X → Y de classe C 2 entre variétés riemanniennes admet un laplacien ∆f : X → T Y tel que ∆f (x) ∈ Tf (x) Y pour tout x ∈ X : par définition, ∆ est la trace du carré de l’opérateur de différenciation D. Intuitivement, ∆f (x) mesure l’écart (de second ordre) entre f et son approximation par l’application tangente Dx f , moyenné sur une petite boule centrée en x. Le flot de la chaleur dont il a été brièvement question plus haut consiste à déformer f dans la direction de ∆f . 3.1.1. Définitions. — Concrètement, on peut munir un voisinage de x ∈ X d’un système de coordonnées osculatrices (ξ1 , . . . ξk ) dans lequel la forme quadratique donnant la métrique est constante au premier ordre, égale à X δij + o(kξk) dξi dξj 1≤i≤j≤k
près du point (0, . . . , 0) représentant x : par exemple, l’application exponentielle expx : Tx X → X envoie les coordonnées orthonormées de l’espace euclidien Tx X sur un tel système. En munissant un voisinage de y = f (x) ∈ Y d’un système de coordonnées (η1 , . . . η` ) satisfaisant la même propriété pour Y , et quitte à noter (f1 , . . . , f` ) les composantes de f selon ces coordonnées, on peut exprimer ! ` k X X ∂ 2 fj ∂ ∆f (x) = . 2 ∂ξi ∂ηj j=1 i=1 L’expression dans un système de coordonnées quelconque devient plus compliquée, mais en tout état de cause la formule de ∆f (x) dépend uniquement du 2-jet de f en x, et des 1-jets des métriques en x et f (x). Pour f une fonction scalaire (Y = R), elle prend la forme Å ã ∂f 1X ∂ vg ij ∆f = v i,j ∂xi ∂xj où (gij ) est le tenseur métrique, (g ij ) son inverse, et v = volume de X.
ASTÉRISQUE 414
p det(gij ) l’élément de
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
511
Définition 3.1. — L’application f est harmonique si ∆f = 0. Cela correspond au fait que f est un point critique (pour les perturbations à support compact) de R l’énergie L2 , définie comme X kDf k2 . Le problème de Dirichlet consiste à trouver une application harmonique sur un domaine ouvert borné B lorsqu’on connaît sa restriction à ∂B. Il admet toujours une unique solution sur les variétés de Hadamard : cela provient par convergence faible du fait que l’énergie L2 est une fonctionnelle convexe, car en courbure négative chaque distance dY (f (x), f (x0 )) est une fonction convexe de l’application f (pour l’interpolation géodésique entre applications). Le cas Y = R, correspondant au laplacien ordinaire, est d’un intérêt particulier. Une fonction f : X → R est appelée – harmonique si ∆f = 0, – sous-harmonique si ∆f ≥ 0, – super-harmonique si ∆f ≤ 0. Cette convention se justifie par le fait que si B est un domaine ouvert borné de X, trois fonctions f, f − , f + : B → R satisfaisant f − |∂B ≤ f |∂B ≤ f + |∂B et telles que ∆f = 0 et ∆f − ≥ 0 ≥ ∆f + satisfont toujours f − ≤ f ≤ f +. Aussi, une manière puissante de borner une fonction harmonique inconnue sur B est de trouver des « barrières » sous-harmoniques et super-harmoniques qui l’encadrent sur ∂B (donc sur B). 3.1.2. Estimations harmoniques. — Les quelques lemmes suivants sont une source naturelle de barrières. Lemme 3.2 ([4, lem. 2.5]). — Si la courbure sectionnelle est ≤ −a2 , alors la fonction distance ϕ = d(o, ·) vérifie ∆ϕ ≥ a. Lemme 3.3 ([4, lem. 3.2]). — Si h : X → Y est une application harmonique (partiellement définie) entre variétés de Hadamard, et ϕ : Y → R est convexe, alors ϕ ◦ h est sous-harmonique. Par exemple, pour tout y ∈ Y la fonction d(y, h(·)) est sous-harmonique sur X. Lemme 3.4 ([5, cor. 2.2]). — Sur une variété de Hadamard pincée, étant donné λ > 0, la fonction ϕ := e−λ d(x,·) est (i) super-harmonique pour λ assez petit ; (ii) sous-harmonique hors d’un petit voisinage de x pour λ assez grand. Les bornes sur λ peuvent être rendues explicites en fonction de la dimension et des constantes de courbure.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
512
F. GUÉRITAUD
La propriété suivante, tirée de [8], est analogue à l’inégalité de Schwarz rencontrée en analyse complexe. Lemme 3.5. — Si h : X → Y est une application harmonique entre variétés de Hadamard pincées, définie sur une boule B = BX (x, 1), alors kDh(x)k . diam (h(B)). On peut borner explicitement le rapport des deux membres en fonction des dimensions et des constantes de courbure. Rappelons aussi qu’une fonction sous-harmonique f définie sur un ouvert connexe satisfait le principe du maximum : si f atteint son supremum, alors f est constante. 3.1.3. Mesures harmoniques. — Soit B ⊂ X un ouvert borné à bord lisse. Tout point x de B définit une mesure σxB sur ∂B caractérisée par la propriété suivante : quelle que soit f : B → R continue et harmonique sur B, on a Z (3.2) f (x) = f dσxB . ∂B
La mesure σxB peut être vue comme la mesure de sortie (de B) du mouvement brownien issu de x. Une autre façon de le dire est que l’espérance d’une fonction harmonique, en un point soumis à un mouvement brownien, reste constante au cours du temps. En analyse complexe, on appelle aussi σxB le noyau de Poisson. La mesure σxB est intimement liée à la fonction de Green + GB x : B r {x} → R . B Par définition, GB x est la solution, au sens des distributions, de l’équation −∆Gx = δx B (mesure de Dirac en x), sous la contrainte GB x |∂B = 0. La fonction Gx possède en x 1 −(dim X−2) une singularité en r (ou en log r si dim X = 2), où r désigne le rayon 0 B0 mesuré depuis x. Si B ⊂ B , alors GB x ≤ Gx sur B r {x}. Le lien avec la mesure harmonique σxB est l’identité suivante :
(3.3)
dσxB ∂GB x (y) (y) = dλ∂B ∂n ˆ
pour tout y ∈ ∂B, où n ˆ désigne la normale rentrante en y, et dλ∂B est la mesure de Lebesgue induite par la métrique riemannienne de X sur l’hypersurface ∂B. L’identité (3.3) s’obtient à partir de (3.2) et de la deuxième identité de Green, ou « intégration par parties » Z Z Å ã ∂ϕ ∂ψ (ϕ∆ψ − ψ∆ϕ) = ψ −ϕ dλ∂B ∂n ˆ ∂n ˆ B ∂B en faisant ϕ = f (fonction test harmonique) et ψ = GB x. Pour X un espace symétrique et B une boule de centre x, la mesure σxB coïncide avec la mesure visuelle en x. En courbure variable, cette propriété d’isotropie
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
513
reste vraie en un sens grossier : dans [5], Benoist et Hulin montrent le résultat de comparaison suivant. Théorème 3.6. — Soient 0 < a < b et k ≥ 2. Il existe ν > 0 tel que pour toute variété de Hadamard (−b2 , −a2 )-pincée X de dimension k, pour toute boule B de centre x ∈ X et tout θ ∈ [0, π2 ], θ1/ν . σxB (C θ ∩ ∂B) . θν où C θ désigne n’importe quel cône de sommet x et d’ouverture θ. La preuve consiste essentiellement à donner de bonnes estimations de la fonction de Green GB x près de ∂B, en la bornant de part et d’autre par des « barrières » sousharmoniques et super-harmoniques bien choisies. Nous en donnerons une idée plus précise dans la partie 7. Pour la preuve du théorème 1.1, n’importe quelles bornes > 0 sur σxB (C θ ∩ ∂B) (continues, nulles en θ = 0) feraient l’affaire, du moment qu’elles ne dépendent que de θ et pas du rayon de B. Notons que la troisième mesure portée par ∂B, celle de Lebesgue, peut en courbure variable être très différente de la mesure harmonique σxB et de la mesure visuelle, lorsque la boule B est grande. Dans [17], Kifer et Ledrappier avaient donné des estimations du même type que le théorème 3.6 pour les mesures harmonique et visuelle à l’infini. Malgré ces bornes, ces deux mesures à l’infini sont en général singulières l’une par rapport à l’autre, et même étrangères : c’est par exemple ce qui se produit si X est le revêtement universel d’une surface compacte à courbure strictement négative non constante. 3.2. Géométrie hyperbolique Toute variété de Hadamard pincée X est un espace Gromov-hyperbolique : cela signifie qu’il existe δ > 0 (dépendant des constantes de courbure) tel que pour tout triangle ABC de X, le δ-voisinage de l’union des segments AB et AC contienne le segment BC. Voici quelques propriétés de géométrie hyperbolique que nous utiliserons. C Un triangle hyperbolique (fait 3.7.i–v) A
Ω
B
Fait 3.7. — Soit X un espace Gromov-hyperbolique. (i) Tout triplet de points (A, B, C) de X admet un centroïde Ω = O (A, B, C), i.e. un point situé à distance bornée de chacun des trois côtés. On a d(A, B) = d(A, Ω) + d(Ω, B) + O(1).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
514
F. GUÉRITAUD
(ii) Ce centroïde est unique à perturbation finie près, i.e. deux fonctions centroïdes O , O 0 : X 3 → X restent à distance bornée l’une de l’autre. (iii) Tout plongement quasi-isométrique f : X → Y entre espaces Gromovhyperboliques respecte les centroïdes : dY (f (O (A, B, C)), O (f (A), f (B), f (C))) est borné indépendamment de A, B, C ∈ X. (iv) Si, dans la suite, X est une variété de Hadamard (−b2 , −a2 )-pincée où 0 < a < b, −a d(A,Ω) alors A ]C , où Ω := O (A, B, C). B .e −b d(A,Ω) (v) En outre e . A ]C B , du moment que d(A, B) − d(A, Ω) 1 et d(A, C) − d(A, Ω) 1. 0 (vi) Si d(o, x) = d(o, x0 ) =: R ≥ 1 et d(x, x0 ) =: r ≤ 1, alors re−bR . o ]xx . re−aR . Ainsi, par exemple, le périmètre d’un disque croît exponentiellement avec son rayon. (vii) Si Γ ⊂ X est convexe, alors la projection orthogonale π : X → Γ est 1-lipschitzienne, et pour tous x, x0 ∈ X tels que d(x, x0 ) ≤ 1, on a d(π(x), π(x0 )) . e−a d(x,Γ) . L’argument d’unicité du théorème 1.1 fera aussi appel aux estimations CAT (Cartan–Alexandrov–Toponogov, dont l’intéressante histoire est retracée dans [28]) : rappelons qu’une variété de Hadamard X est (−b2 , −a2 )-pincée si, et seulement si, pour tout triangle ABC de X, et pour tous points P ∈ [AB] et Q ∈ [AC], (3.4)
dH2b (P b , Qb ) ≤ dX (P, Q) ≤ dH2a (P a , Qa )
où H2κ est un plan de courbure constante −κ2 et le triangle Aκ B κ C κ de H2κ a les mêmes longueurs de côtés que ABC, avec P κ ∈ [Aκ B κ ], Qκ ∈ [Aκ C κ ] vérifiant d(P κ , Aκ ) = d(P, A) et d(Qκ , Aκ ) = d(Q, A). Pour finir, les opérations de barycentre se comportent bien en courbure négative. Par exemple, le plongement faible f du théorème 1.1 est à distance bornée d’un lissage par convolution fe, lipschitzien, avec ∆fe borné. On ne peut pas toujours garantir que fe soit encore un plongement faible, mais c’est un plongement q.i. si f en est un.
4. GÉOMÉTRIE ASYMPTOTIQUE DES PLONGEMENTS FAIBLES Dans cette partie, qui peut être ignorée si l’on souhaite seulement établir le corollaire 1.2 sur les plongements q.i., nous montrons que pour un plongement faible entre variétés de Hadamard pincées, les distances croissent « essentiellement » linéairement, en un sens statistique qui sera rendu précis à la proposition 4.3.
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
515
Définition 4.1. — Soit ψ : R>0 → R>0 continue, croissante. On dira qu’une application f : X → Y entre espaces de Hadamard satisfait Cψ si pour tout α > 0, tout entier n > 0 et tout (x, y) ∈ X × Y , l’ensemble {ξ ∈ Sx | dY (y, f (ξn )) ≤ αn}
(cf. notations (3.1))
est contenu dans une union d’au plus ≈ eψ(α)n boules de taille ≈ e−an , où −a2 < 0 est une borne supérieure de courbure de X. Les constantes implicites sont supposées indépendantes de α, n, x et y. Toutes les applications ψ intervenant dans cet exposé seront linéaires. Proposition 4.2. — Tout plongement δ-faible f : X → Y entre variétés de Hadamard (−b2 , −a2 )-pincées satisfait Cψ pour ψ(α) = b(` − 1)α. Démonstration. — Rappelons ` := dim Y . La boule BY (y, αn) est couverte par ≈δ eb(`−1) αn boules de taille δ ≈ 1 (fait 3.7.(vi)), dont chacune par plongement faible a une f -préimage de diamètre ≤ 1/δ ≈ 1. Intersectée avec ∂BX (x, n), cette préimage est de diamètre apparent . e−an , vue depuis x (fait 3.7.(vi)). Notons que la propriété Cψ , au contraire de celle d’être un plongement faible, est préservée par les perturbations bornées (toujours parce qu’une boule unité de X, vue à distance n, est de diamètre apparent . e−an ). 4.1. Mesure harmonique des ensembles exceptionnels Soient X, Y des variétés de Hadamard (−b2 , −a2 )-pincées. Soit f : X → Y une application c-lipschitzienne vérifiant Cψ pour ψ linéaire, et soit ν > 0 assez petit pour vérifier le théorème 3.6 sur les mesures harmonique et visuelle. Soient α > β > 0 tels que (4.1)
α+c ψ(β α−β ) ψ(α) 00 ν := < ν et ν := < ν. a a 0
Pour x ∈ X et ξ ∈ Sx , soient pour tout N ≥ 0 les ensembles exceptionnels (4.2)
Ax,α (N ) := {η ∈ Sx | ∃n ≥ N, d(f (x), f (ηn )) ≤ αn}; ξ Zx,α,β (N ) := {η ∈ Sx | ∃n, m ≥ N, d(f (ηm ), f (ξn )) ≤ β(n + m)}.
Pour r > 0, soit enfin σr la mesure de probabilité sur Sx qui tire en arrière la mesure B(x,r) harmonique σx par l’homéomorphisme expx (r(·)) : ξ 7→ ξr . Selon le théorème 3.6, toute ε-boule B de Sx vérifie, quel que soit r > 0, (4.3)
σr (B) . εν .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
516
F. GUÉRITAUD
Proposition 4.3. — Avec les notations et hypothèses ci-dessus, pour tout x ∈ X, tous N, r ∈ N et ξ ∈ Sx r Ax,α (N ), on a (i)
σr (Ax,α (N ))
(ii)
ξ σr (Zx,α,β (N ))
.ν,α .ν,α,β
e−a(ν−ν
0
)N
;
00
−a(ν−ν )N
e
.
Démonstration. — (Note : dans ce qui suit, les constantes implicites des notations ≈, . pourront dépendre de ν, ψ, α, β, qui ont été choisis en fonction des bornes de courbure a, b, des dimensions k, ` de X, Y , et des constantes c, δ de Lipschitz et de plongement faible pour f : X → Y .) Pour (i), partitionnons Ax,α (N ) selon la valeur de la variable muette n de (4.2). Par la condition Cψ et par (4.3), on a X 0 eψ(α)n (e−an )ν ≈ e−a(ν−ν )N (4.4) σr (Ax,α (N )) . n≥N
où le dernier membre s’obtient en estimant la somme d’une série géométrique par un multiple de son plus gros terme (procédé qui resservira dans les sommes ci-après). Pour (ii), on a [ [ ξ Zx,α,β (N ) ⊂ {η ∈ Sx | d(f (ηm ), f (ξn )) ≤ β(n + m)}. m≥N n≥N
Or à m fixé, comme f est c-lipschitzienne et ξ ∈ / Ax,α (N ), le terme de l’union est vide α+c sauf si αn − cm ≤ β(n + m). Cette inégalité équivaut à n+m m ≤ α−β . On a donc X ξ σr (Zx,α,β (N )) ≤ σr {η ∈ Sx | d(f (ηm ), f (ξn )) ≤ (β n+m m )m} m,n≥N n+m ≤ α+c m α−β
.
≈
X
X
m≥N
n≥N n+m ≤ α+c m α−β
X
α+c
eψ(β
n+m m )m
(e−am )ν
eψ(β α−β )m (e−am )ν ≈ e−a(ν−ν
comme en (4.4)
00
)N
.
m≥N
Remarque 4.4. — (a) Les ensembles (4.2) sont une approximation par excès, de « granularité » N , des directions asymptotiquement exceptionnelles (dans lesquelles f ne s’échappe pas linéairement). La proposition 4.3 dit que cette approximation est petite pour la mesure harmonique σr , indépendamment du rayon r. (b) Quitte à prendre ν arbitrairement petit, la preuve de (i) ci-dessus peut se lire comme montrant que f (ξN ) s’éloigne à vitesse linéaire dans Y pour tout ξ de Sx , hors d’un ensemble de dimension de Hausdorff 0. Pour un tel ξ, comme f est lipschitzienne, on peut (fait 3.7.(vi)) définir une limite ∂f (ξ∞ ) ∈ ∂∞ Y . Quant ξ à (ii), nous verrons dans le lemme ci-après que η ∈ / Zx,α,β (N ) entraîne une
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
∂f (η
517
)
∞ minoration de l’angle f (x) ]∂f (ξ∞ ) : dans la même limite ν → 0, (ii) dit donc que les fibres de l’application ∂f sont elles aussi de dimension de Hausdorff 0. (c) Nous n’utiliserons pas ces énoncés aux limites. À titre de comparaison néanmoins, pour f un plongement q.i., l’application de bord ∂f est définie sur tout ∂∞ X, et injective (quasi-symétrique).
4.2. Longs triangles et angles minorés. Voici un lemme général. Lemme 4.5. — Soient (yn )n≥0 et (zm )m≥0 deux suites dans une variété de Hadamard (−b2 , −a2 )-pincée Y , telles que y0 = z0 , que d(yn , yn+1 ) et d(zm , zm+1 ) soient majorées par une constante c, et que pour tous n, m ≥ N on ait d(yn , zm ) ≥ β(n+m), où β > 0 et N ∈ N sont constantes. Alors pour tous n, m ≥ N assez grands on a −bcN zm . y0 ]yn & e Démonstration. — Comme les suites (yn ) et (zm ) s’échappent à l’infini, il suffit de montrer que le centroïde Ω de (y0 , yn , zm ) est à distance ≤ cN + O(1) de y0 (fait 3.7.(v)). De façon équivalente, montrons que pour tout rayon géodésique Γ issu de y0 , en notant π : Y → Γ la projection orthogonale, l’un des points π(yn ), π(zm ) est à distance ≤ cN + O(1) de y0 . Pour n = m = N , les deux ont lieu. Notons en général Inˆ = π([ynˆ , ynˆ +1 ]) et Jm ]). Pour tous n ˆ, m ˆ ≥ N , si Inˆ ∩ Jm ˆ = π([zm ˆ , zm+1 ˆ ˆ 6= ∅, alors d(ynˆ , Γ) ≥ β n ˆ − O(1) ou d(zm ˆ − O(1), par la minoration de d(ynˆ , zm ˆ , Γ) ≥ β m ˆ ). −aβ m ˆ 0 0 Le fait 3.7.(vii) donne alors |Inˆ | . e−aβ nˆ ou |Jm | . e . Soient I et J deux ˆ n ˆ m ˆ 0 −aβ m ˆ intervalles de Γ tels que |Inˆ0 | = Λe−aβ nˆ et |Jm , centrés aux mêmes points ˆ | = Λe 0 0 que Inˆ et Jm ˆ respectivement. En choisissant Λ assez grand, on a (In ˆ ∩Jm ˆ ) ⊂ (In ˆ ∪Jm ˆ) pour tous n ˆ, m ˆ ≥ N , si bien que [ [ [π(yN ), π(yn )] ∩ [π(zN ), π(zm )] ⊂ Inˆ ∩ Jm ˆ N ≤ˆ n0 linéaire. Alors il existe h : X → Y harmonique, à distance bornée de f . La partie « existence » du théorème 1.1 découle de la proposition 4.2 et de ce résultat, appliqué à un lissage lipschitzien d’un plongement faible X → Y , comme on l’a vu à la fin de la partie 3. Pour tout R > 0, soient BR := BX (o, R) et hR : BR → Y le prolongement harmonique de f |∂BR . Soit aussi ρR := maxx∈BR d(f (x), hR (x)), atteint en un point xR ∈ BR . Lemme 5.2. — On a
lim ρR < +∞.
R→+∞
Le lemme 5.2 entraîne le théorème 5.1. En effet, il dit que les fonctions harmoniques hR : BR → Y restent à distance bornée de f |BR quand R tend vers +∞. Par le lemme 3.5, les dérivées premières des hR restent bornées également, donc par le théorème d’Ascoli une sous-suite (hRn )n∈N converge uniformément sur tout compact. On peut montrer que les dérivées secondes convergent également (c’est une conséquence des estimations a priori, ou estimations de Schauder pour les équations différentielles elliptiques), de sorte que la limite h est harmonique — et, par construction, à distance bornée de f . Démonstration du lemme 5.2. — Supposons que limR→+∞ ρR = +∞ et cherchons une contradiction. Soient NR et rR tels que 1 NR rR log ρR .
(5.1)
La stratégie consiste à montrer qu’une proportion non nulle de la sphère ∂BX (xR , rR ) est envoyée par f dans une région proche, vue depuis f (xR ), de la direction où se trouve hR (xR ) ; et que sous la condition Cψ cela est incompatible avec la minoration d’angles du corollaire 4.6 (ou, a fortiori, avec la borne inférieure de (1.1) si f est un plongement q.i.). Plus précisément, on trouvera z, z 0 ∈ ∂BX (xR , rR ) tels que log
1 f (?) f (xR ) ]hR (xR )
ASTÉRISQUE 414
& rR pour ? ∈ {z, z 0 } mais log
1 f (z 0 ) f (xR ) ]f (z)
. NR
(1149)
d’où
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
f (z) f (xR ) ]hR (xR )
f (z 0 )
f (z 0 ) f (xR ) ]f (z) f (z 0 ) f (xR ) ]f (z) ≈ 1,
+ f (xR ) ]hR (xR )
519
qui est exclu. (Pour un plongement
q.i., on pourra en fait prendre donc se passer du paramètre NR .) La lenteur (5.1) de la croissance de rR est commandée, comme on le verra, par les estimations du théorème 3.6. Estimations de bord Le résultat préliminaire suivant dit que la distance de xR au bord ∂BR du domaine est & ρR : Lemme 5.3. — Il existe L > 0 tel que pour tout R > 0 et tout x ∈ BR , dY (f (x), hR (x)) ≤ L dX (x, ∂BR ). Démonstration. — Soit y ∈ Y un point de la demi-droite [hR (x), f (x)), très loin au delà de f (x) et de tout f (BR ). Choisissons une grande constante L et soit ϕ(z) := d(y, hR (z)) − d(y, f (z)) + L(d(o, z) − R) . | {z } | {z } | {z } ϕ1 (z)
ϕ2 (z)
ϕ3 (z)
On a ϕ(∂BR ) = 0 et il s’agit de montrer que ϕ(x) ≤ 0. Il suffit donc de montrer que ϕ est sous-harmonique (∆ϕ ≥ 0) sur BR . La fonction ϕ1 est sous-harmonique par le lemme 3.3, car h est harmonique. La fonction ϕ2 est de laplacien borné, par régularité de f sur BR et de d(y, ·) sur f (BR ). Comme le laplacien de d(o, ·) est minoré par la constante de pincement a > 0 de X (lemme 3.2), il suffit de choisir L assez grand pour que ∆ϕ ≥ 0. Notons désormais (h, ρ, x, r, N ) pour (hR , ρR , xR , rR , NR ) : ainsi ρ est simplement une (très) grande distance, égale à d(f (x), h(x)). On rappelle 1 N r log ρ. Soit Br := BX (x, r). Comme ρ > Lr, le lemme 5.3 implique Br ⊂ BR , i.e. que h est bien définie sur Br . On définit c ≥ Lip f (soumise à (1.1) si f est un plongement q.i.), et l’exposant ν > 0 comme dans le théorème 3.6. Estimations intérieures Montrons maintenant que ρ ne saurait être arbitrairement grand, en nous rapportant à la figure 1. La fonction
ρh :
Br
−→
R+
z
7−→
dY (f (x), h(z))
est sous-harmonique, par le lemme 3.3. Elle satisfait ρh (x) = ρ. Par maximalité de ρ, tout point de h(Br ) se trouve à distance ≤ ρ d’un point de f (Br ) ⊂ BY (f (x), cr) : donc ρh ≤ ρ + cr par l’inégalité triangulaire.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
520
F. GUÉRITAUD
Br B0
h(Br ) x
r
U
h(x) f (Br ) ρ
∂B
R
r0
z
f (x)
θ
N
θ0
harmonique
h X
Y
αr
f
h(z)
f (z)
b/ν convient dès que r est assez grand). On a alors par sous-harmonicité de ρh Z 0 ρ = ρh (x) ≤ ρh dσxBr0 ≤ (ρ + cr) + e−b r (−ρ/4) ∂Br0 b0 r
d’où ρ ≤ 4cre , qui est exclu puisque r log ρ. • Par conséquent, pour tout z ∈ ∂Br , h(z)
a
θ := f (x) ]h(x) ≤ e− 4 ρ ;
(5.2)
en effet, l’image par h du segment [xz], étant extérieure à la boule BY (f (x), ρ/2), est au moins aussi longue que sa projection sur cette boule, qui par le fait 3.7.(vi) serait a de longueur & e 4 ρ ρr si (5.2) n’avait pas lieu. Or h|Br est O(ρ)-lipschitzienne par le lemme 3.5 ; c’est donc exclu. • En plus de c, ν, définissons encore 0 < β < α < 1c et ν 0 , ν 00 ∈]0, ν[ comme en (4.1)(4.2). Montrons qu’alors f (z)
α
θ0 := f (x) ]h(z) . e−a 4 r pour tout z ∈ U r AN , où U := {z ∈ ∂Br | ρh (z) ≥ ρ − α4 r} AN
ASTÉRISQUE 414
:= expx (rAx,α (N )) ⊂ ∂Br
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
521
(pour f un plongement q.i., prendre AN = ∅ et ignorer β, ν 0 , ν 00 ). On a d(f (x), f (z)) ≥ αr pour un tel z, par définition de AN et α. Par le fait 3.7.(iv), il suffit de montrer que le centroïde Ω de f (x), h(z), f (z) vérifie Λ := d(Ω, f (x)) ≥ α 4 r + O(1). S’il en allait autrement, on aurait d(h(z), f (z)) ≥ d(h(z), Ω) + d(Ω, f (z)) − O(1) (fait 3.7.(i)) ≥ ρh (z) + d(f (x), f (z)) − 2Λ − O(1) ≥ ρ + α4 r − O(1) qui est exclu pour r 1, par maximalité de ρ. f (z)
α
• Ainsi f (x) ]h(x) ≤ θ+θ0 . e−a 4 r pour tout z ∈ U r AN . Mais la proportion u de ∂Br occupée par U , pour la mesure harmonique dσxBr , est minorée indépendamment de ρ : en effet, par sous-harmonicité de ρh Z ρ = ρh (x) ≤ ρh dσxBr ≤ (1 − u)(ρ − α4 r) + u(ρ + cr) ∂Br
d’où u = σxBr (U ) ≥ (1 + 4c/α)−1 ≈ 1. Or par la proposition 4.3, on a σxBr (AN ) . 0 e−a(ν−ν )N 1, si bien que U r AN 6= ∅. • Soit donc z ∈ U r AN . Pour obtenir une absurdité, il suffit de trouver z 0 ∈ U r AN α f (z 0 ) tel que f (x) ]f (z) e−a 4 r . — Si f est un plongement (c, C)-quasi-isométrique (1.1), par le fait 3.7.(iv)-(iii)0 (v) il suffit qu’on ait x ]zz & 1. Un tel z 0 ∈ U existe par le théorème 3.6, puisque u = σxBr (U ) & 1 : cela montre le corollaire 1.2. — Plus généralement, soient ξ ∈ Sx tel que z = ξr , et ZN
ξ := expx (rZx,α,β (N )) ⊂ ∂Br . 00
Par la proposition 4.3, on a σxBr (ZN ) . e−a(ν−ν )N 1 : prenons donc α f (z 0 ) z 0 ∈ U r (AN ∪ ZN ). Le corollaire 4.6 donne f (x) ]f (z) & e−bcN e−a 4 r , puisque N r. Le lemme 5.2 est démontré, ainsi que le théorème 5.1.
Remarque sur la preuve Des conditions N r log ρ, la preuve ci-dessus n’a réellement utilisé bc (avec marges uniformes). Un suivi méticuleux des que logr ρ > νb et Nr > 4 aα nombreuses constantes multiplicatives permettrait aussi de borner le plus petit N 1 pour lequel la contradiction apparaît, donc de borner explicitement la distance ρ de f à sa régularisée harmonique h.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
522
F. GUÉRITAUD
6. UNICITÉ L’unicité dans le théorème 1.1 procède d’un argument qui remonte à [21] et [22]. Il occupe près de la moitié de la longueur de [6] (hors résultats sur les plongements faibles ou Cψ ) ; cette technicité est due à des questions d’extraction de limites géométriques qui s’évanouissent en grande partie quand X et Y sont des espaces homogènes. Soient h0 , h1 : X → Y deux applications harmoniques, lipschitziennes et Cψ (plongements q.i. par exemple) entre variétés de Hadamard pincées, telles que ϕ(x) := d(h0 (x), h1 (x)) vérifie δ := supX ϕ < ∞. Supposons, par l’absurde, que h0 6= h1 , i.e. que δ > 0. Interpolations partielles Rappelons que toute application harmonique minimise localement l’énergie L2 , et que cette fonctionnelle énergie est une fonction convexe pour l’interpolation géodésique entre applications (par convexité de la fonction distance). Cette convexité de la fonctionnelle permettrait de montrer l’unicité si h0 , h1 étaient égales hors d’un compact. Comme ce n’est pas le cas, nous utiliserons une forme d’interpolation partielle. Supposons tout d’abord que ϕ atteigne son extremum δ. La fonction ϕ, en tant que composée de (h0 , h1 ) : X → Y × Y (harmonique) et de dY : Y × Y → R+ (convexe), est sous-harmonique par le lemme 3.3. Le principe du maximum dit alors que ϕ est constante : ϕ ≡ δ. Pour tout t ∈ [0, 1], soit ht (x) le point du segment géodésique [h0 (x), h1 (x)] situé à distance tδ de h0 (x). Soit (x, V ) ∈ T (X) : la convexité de la fonction distance entraîne que ΦVt := kdht (V )k2 est une fonction convexe de t ∈ [0, 1]. L’unicité dans le théorème 1.1 découle du raffinement suivant : Proposition 6.1. — ΦVt est une fonction affine de t ∈ [0, 1]. En effet, en courbure strictement négative, un tel comportement n’est possible que si h0 et h1 sont à valeurs dans une même droite (et égales à une translation de la droite près, puisque ϕ ≡ δ). Cela est impossible quand h0 , h1 sont des plongements q.i. (ou sont à distance bornée de plongements faibles, cf remarque 4.4.(b)) de la variété de Hadamard X, dont la dimension est k ≥ 2. Preuve de la proposition 6.1. — Soit η : X → [0, 1] une fonction lisse, à support compact contenant x. Pour 0 < ε < 1/2, considérons les interpolations partielles (figure 2) : fε (x) := hεη(x) (x) et gε (x) := h1−εη(x) (x).
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
523
La différenciation donne t (x) dfε (V ) = dhεη(x) (V ) + εdη(V ) ∂h∂t t=εη(x) ∂ht (x) dgε (V ) = dh1−εη(x) (V ) − εdη(V ) ∂t t=1−εη(x) . dh1 (V ) h1 (X) gε (X)
dh 1 (V ) 2
fε (X) h0 (X) dh0 (V )
Figure 2. Interpolation locale en courbure négative : sauf cas dégénérés, t 7→ ΦVt = kdht (V )k2 est strictement convexe.
Or la propriété ϕ ≡ δ (dans un voisinage de x) entraîne que le produit scalaire t (x) est indépendant de t. On obtient donc de dht (V ) et ∂h∂t kdfε (V )k2 + kdgε (V )k2 = ΦVεη(x) + ΦV1−εη(x) + 2ε2 kdη(V )k2 δ 2 ≤ ΦV0 + ΦV1 − 2εη(x) (ΦV0 + ΦV1 − 2ΦV1/2 ) + O(ε2 ) | {z } =:ΨV ≥0
par convexité de Φ. Il suffit de montrer que le terme noté ΨV est nul : supposons ΨV > 0. Cette inégalité reste vraie pour de petites perturbations de (x, V ). Or l’énergie E(h) d’une fonction h sur le support U de η est l’intégrale de kdh(V )k2 sur le fibré unitaire tangent de U . Intégrée, l’inégalité précédente donne donc (en prenant ε assez petit pour pouvoir négliger le terme quadratique) E(fε ) + E(gε ) ≤ E(h0 ) + E(h1 ). Comme h0 et h1 minimisent localement l’énergie, il y a égalité et finalement ΨV ≡ 0.
Limites géométriques Dans le cas où la fonction ϕ n’atteindrait pas son supremum δ, la stratégie est de se ramener au cas précédent par un argument de limites géométriques. Soit (xn )n∈N une suite de X telle que d(h0 (xn ), h1 (xn )) −→ δ. Plaçons les points base de X, Y en xn n→∞
et yn := h0 (xn ). On peut extraire de la suite d’espaces métriques pointés (X, xn ) une limite géométrique (X ∞ , x∞ ), au sens de Gromov-Hausdorff, qui est encore un espace
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
524
F. GUÉRITAUD
métrique pointé propre (i.e. dont les boules fermées sont compactes). Cet argument d’extraction, très général et dû à Cheeger–Gromov, repose uniquement sur la propriété suivante (conséquence ici des bornes inférieures de courbure) : pour tous R, ε > 0 il existe N tel que pour tout n, la boule BX (xn , R) soit recouverte par au plus N boules de rayon ε. On peut de même extraire une limite (Y ∞ , y ∞ ). Comme h0 est lipschitzienne, on ∞ ∞ ∞ ∞ peut encore extraire une application limite h∞ , y ) de même 0 : (X , x ) → (Y ∞ constante de Lipschitz que h0 , ainsi qu’une autre application h1 : X ∞ → Y ∞ à ∞ ∞ ∞ distance ≤ δ de la première. Par construction, d(h∞ 0 (x ), h1 (x )) = δ. Il reste donc uniquement à s’assurer que X ∞ , Y ∞ sont bien des variétés de Hadamard pincées, et ∞ que h∞ 0 , h1 sont bien harmoniques. L’outil principal est l’existence d’un système de cartes uniformément régulières de X et Y , dans lesquelles les tenseurs métriques et les applications h0 , h1 admettent aussi des expressions uniformément régulières. Plus exactement, le pincement de la courbure assure pour tout 0 < α < 1 l’existence d’un atlas de X tel que : (i) (ii) (iii) (iv) (v)
les cartes sont des boules de rayons uniformes ; les changements de cartes sont des fonctions de classe C 2,α ; les tenseurs métriques sont des fonctions de classe C 1,α ; les symboles de Christoffel sont de classe C 0,α (i.e. α-höldériens) ; toutes les normes C i,α qui précèdent sont uniformément bornées.
De telles cartes, sous une hypothèse de lissité C ∞ (non uniforme) de X qu’on peut probablement affaiblir, sont construites dans [15, 32] (en prenant pour fonctions coordonnées des fonctions harmoniques). Les bornes (v) assurent une propriété d’équicontinuité : une sous-suite d’atlas converge vers un atlas de X ∞ ayant les mêmes propriétés de régularité. La même chose vaut pour Y ∞ . Comme on l’a observé à la partie 3.1.1, la régularité (ii-iii) est suffisante pour donner un sens à la notion d’application harmonique X ∞ → Y ∞ . Les applications lipschitziennes et harmoniques h0 , h1 : X → Y sont soumises à des estimations a priori (ou estimations de Schauder, déjà rencontrées plus haut, pour les équations différentielles elliptiques) qui montrent qu’elles sont uniformément C 2,α . ∞ Par uniformité, h∞ 0 et h1 héritent de la même régularité, et sont encore harmoniques. La régularité (iii) du tenseur métrique est en revanche insuffisante (de justesse) pour appliquer la définition différentielle de la courbure sectionnelle à la limite. Cependant, les inégalités (3.4) de pincement CAT-(−b2 , −a2 ) auxquelles sont soumis les espaces X, Y sont héritées par les limites X ∞ , Y ∞ . La borne inférieure −b2 assure notamment l’unicité des géodésiques. Cela s’avère suffisant pour faire fonctionner l’argument d’interpolation partielle comme dans le cas lisse.
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
525
7. ESTIMATION DES MESURES HARMONIQUES Résumons ici pour finir la preuve du théorème 3.6, tirée de [5]. Nous utiliserons l’inégalité de Harnack [23] : Proposition 7.1. — Soit ε > 0 et soit X une variété de Hadamard à courbure ≥ −b2 . Il existe H > 0 tel que toute fonction harmonique h > 0 définie dans un ε-voisinage d’un segment [x, x0 ] de X vérifie 0
e−Hd(x,x ) ≤
0 h(x0 ) ≤ eHd(x,x ) . h(x)
Un autre ingrédient essentiel est la barrière d’Anderson-Schoen [3], sorte de variante du lemme 3.4.(i) : Proposition 7.2. — Sur une variété de Hadamard X pincée, il existe δ > 0 tel que pour tout rayon géodésique [xy) de X, il existe une fonction super-harmonique u[xy) > 0 sur X vérifiant (i) u[xy) (z) ≥ 1 quand x ]zy ≤ π2 ; (ii) u[xy) (z) . e−δd(x,z) quand x ]zy = π. Une inégalité d’Ancona [1], valable sur les variétés de Hadamard pincées, dit qu’étant donnés deux rayons 0 < r < r0 , une fonction de Green définie sur (au moins) un r0 -voisinage de son pôle x est ≈r,r0 1 à distance r de x. On utilisera aussi les propriétés suivantes, qui en sont une conséquence. Rappelons que GB x désigne la fonction de Green de pôle x définie sur un domaine B, et n ˆ la normale rentrante en un point de ∂B. Proposition 7.3. — Soient 0 < a < b, soit X une variété de Hadamard (−b2 , −a2 )-pincée et soit ε > 0. Pour toute boule B ⊂ X de rayon R > 1 et tous (x, ξ) ∈ B × ∂B, (i) si d(x, ξ) ≥ ε alors (ii) si d(x, ξ) ≤
1 ε
∂GB x (ξ) .ε 1 ; ∂n ˆ
et d(x, ∂B) ≥ ε alors
∂GB x (ξ) &ε 1. ∂n ˆ
Démonstration. — Choisissons λ > 0, grand au sens du lemme 3.4.(ii) : pour tout p ∈ X, la fonction e−λd(p,·) est sous-harmonique hors de B(p, 21 ). On a λ ≈ 1. Soit B ± la boule concentrique à B, de rayon R ± 1. Pour (i), soit p ∈ ∂B + tel que d(p, ξ) = 1. Il suffit de montrer que près de ξ −λ on a GB − e−λd(p,·) (qui s’annule en ξ). Par les estimations d’Ancona, x .ε ϕ := e B+ B Gx .ε 1 sur le bord de U := B(x, 2ε ) ; a fortiori GB x .ε 1 sur ∂ U ∩B. Donc Gx .ε ϕ
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
526
F. GUÉRITAUD
B U
x
ϕ0 ≤0 ϕ0 ≥0
B0 q
ϕ≥0 ϕ≤0
1
1 ξ
p
∂B +
Figure 3. Illustration de la proposition 7.3
sur ∂ U ∩ B. On a aussi 0 = GB x ≤ ϕ sur ∂B. Comme B r U est inclus dans la région X r B(p, 12 ) où ϕ est super-harmonique, on a GB x .ε ϕ sur B r U . Pour (ii), soit q ∈ ∂B − tel que d(q, ξ) = 1. Il suffit de montrer que près de ξ on 0 −λd(q,·) a GB − e−λ (qui s’annule en ξ). Par les estimations d’Ancona, x &ε ϕ := e ε B Gx &ε 1 à distance 2 de x, donc quitte à appliquer l’inégalité de Harnack sur un 1 0 0 segment de longueur .ε 1, on a encore GB x &ε 1 sur ∂B , où B := B(q, 2 ). Donc 0 0 B 0 0 GB x &ε ϕ sur ∂B . On a aussi 0 = Gx ≥ ϕ sur ∂B. Comme ϕ est sous-harmonique 0 0 0 B sur B r B , on a Gx &ε ϕ sur B r B . θ Soient à présent B := BX (x, R) et ξ ∈ ∂B, et C[xξ) un cône visuel de sommet x, θ θ d’axe [xξ) et d’angle θ. On notera parfois C := C[xξ) . Rappelons que par (3.2)-(3.3), pour tout x0 ∈ B, la mesure harmonique σxB0 sur ∂B vérifie Z ∂GB x0 (7.1) σxB0 (C θ ∩ ∂B) = hθR (x0 ) = (ξ) dξ ˆ C θ ∩∂B ∂ n
où hθR : B → [0, 1] est la fonction harmonique qui coïncide sur ∂B avec la fonction caractéristique de C θ , et où l’intégration se fait par rapport à la mesure de Lebesgue (k − 1)-dimensionnelle de ∂B. Le théorème 3.6 découle de l’égalité de gauche et de l’encadrement suivant. Proposition 7.4. — Soient 0 < a < b et X une variété de Hadamard (−b2 , −a2 )-pincée de dimension k. Soit H une constante de Harnack donnée par la propostion 7.1 pour ε = 1, et soit δ donné par la proposition 7.2. On peut supposer
ASTÉRISQUE 414
(1149)
δ b
≤ k−1 ≤ tout R > 0,
H a.
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
527
Alors pour tout cône C θ de sommet x ∈ X et d’ouverture θ, et θH/a . hθR (x) . θδ/b .
Démonstration. — Si R est borné, l’égalité de droite de (7.1) et la proposition 7.3 disent que hθR (x) est de l’ordre de la mesure de Lebesgue de C θ dans ∂B, et les estimations trigonométriques (fait 3.7.(vi)) montrent que celle-ci est de l’ordre de θk−1 : en d’autres termes, la densité relative des mesures visuelle et harmonique sur ∂B est contrôlée, et hθR (x) ≈R θk−1 . On suppose donc désormais R 1. Pour θ pas trop petit (en fonction de R), la stratégie est d’estimer hθR (x) par les propositions 7.1 et 7.2. Pour θ plus petit, on affinera en estimant d’abord, comme cidessus, les valeurs de hθR à distance ≈ 1 de ξ, au moyen de (7.1) et de la proposition 7.3. Majoration de hθR (x) À distance R, l’écartement atteint par les rayons de C θ est . θebR . Si ce nombre 0 est ≥ 1, soit R0 ≤ R tel que θebR = 1 : il existe un point x0 ∈ [xξ) à distance R0 −O(1) π/2 θ de x tel que C[xξ) ∩ ∂B ⊂ C[x0 ξ) ∩ ∂B (figure 4.i). La barrière super-harmonique u[x0 ξ) ≥ hθR donne 0 hθR (x) ≤ u[x0 ξ) (x) . e−δR = θδ/b . Si au contraire θebR ≤ 1, il existe x0 ∈ [xξ) à distance ≈ 1 de ξ tel que la boule B 0 := B(ξ, d(ξ, x0 )) contienne C θ ∩ ∂B (figure 4.ii). On peut en outre supposer que ∂B 0 reste à distance & 1 de C θ ∩ ∂B, dont la mesure de Lebesgue est notée s. On a alors hθR . s sur B ∩ ∂B 0 , par (7.1) et la proposition 7.3.(i). Ainsi, par superharmonicité, hθR . s.u[x0 ξ) sur B r B 0 . Comme s . (θebR )k−1 par les estimations trigonométriques, il vient δ
hθR (x) . s.u[x0 ξ) (x) . (θebR )k−1 e−δR = θk−1 (ebR )k−1− b ≤ θδ/b en utilisant
δ b
≤ k − 1 et ebR ≤
1 θ
pour la dernière inégalité.
Minoration de hθR (x) 0
Soit R0 > 0 tel que θeaR = 1, et supposons d’abord que R0 ≤ R − L, où L ≈ 1 est un nombre assez grand que nous allons déterminer. À distance R0 , l’écartement atteint 0 par les rayons de C θ est & θeaR = 1. Si la marge L est assez grande, on peut trouver x0 ∈ [xξ) ∩ B à distance R0 + O(1) π/2 θ de x tel que C[x0 ξ) ⊂ C[xξ) (figure 4.iii). Pour tout x00 ∈ [x0 , ξ), la barrière sousθ harmonique 1 − u[x0 x) ≤ hR donne hθR (x00 ) ≥ 1 − u[x0 x) (x00 ). 0
00
Rappelons que u[x0 x) (x00 ) . e−δd(x ,x ) . Si la marge L est assez grande, on peut donc prendre d(x0 , x00 ) ≈ 1 assez grand pour que u[x0 x) (x00 ) ≤ 21 . Alors l’inégalité ci-dessus
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
528
F. GUÉRITAUD
∂B 1
x0ξ
)
)
u[
u
≥1
≥ 0ξ [x
∂B
0
∂B
R
x
x0
θ
ξ
x
x0
θ
s
ξ
O(1)
R
0 hθ R .s
R
0
θebR = 1 (i)
(ii)
∂B
u
[x
0 x
)
≥
1
∂B
0
∂B
x
x0
θ
R
x00
ξ
x
x0
θ
hθ &s R
O(1)
s
ξ
R0 0
θeaR = 1 (iv)
(iii) R
Figure 4. Majorations (i–ii) et minorations (iii–iv) de hθR (x). Le cône θ C θ = C[xξ) est grisé.
donne hθR (x00 ) & 1, et l’inégalité de Harnack appliquée au segment [x, x00 ], de longueur R0 + O(1), donne 0
0
hθR (x) & e−HR hθR (x00 ) & e−HR = θH/a . Si au contraire R0 ≥ R − L, i.e. θeaR ≤ eaL ≈ 1, soit x0 ∈ [xξ) tel que d(x0 , ξ) = 1 (figure 4.iv). La boule B 0 := BX (ξ, 1) contient une boule de rayon ≈ θeaR de ∂B, contenue dans C θ , de mesure de Lebesgue s & (θeaR )k−1 . Or hθR (x0 ) & s, par (7.1) et la proposition 7.3.(ii). L’inégalité de Harnack appliquée au segment [xx0 ], de longueur R − 1, donne H
hθR (x) & e−HR hθR (x0 ) & e−HR (θeaR )k−1 = θk−1 (e−aR ) a −(k−1) & θH/a
ASTÉRISQUE 414
(1149)
en utilisant
H a
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
529
≥ k − 1 et e−aR & θ pour la dernière inégalité.
Remerciements. — Je remercie Y. Benoist, M. Bourdon, D. Hulin, F. Ledrappier ainsi qu’une incarnation de N. Bourbaki pour leurs précieuses explications et leurs commentaires sur ce texte.
RÉFÉRENCES [1] A. Ancona – Negatively curved manifolds, elliptic operators, and the Martin boundary, Ann. of Math. 125 (1987), no 3, p. 495–536. [2] M. T. Anderson – The Dirichlet problem at infinity for manifolds of negative curvature, J. Differential Geom. 18 (1983), no 4, p. 701–721. [3] M. T. Anderson & R. Schoen – Positive harmonic functions on complete manifolds of negative curvature, Ann. of Math. 121 (1985), no 3, p. 429–461. [4] Y. Benoist & D. Hulin – Harmonic quasi-isometric maps between rank one symmetric spaces, Ann. of Math. 185 (2017), no 3, p. 895–917. , Harmonic measures on negatively curved manifolds, prépublication [5] http://www.math.u-psud.fr/~benoist/prepubli/17harmonic3.pdf, 2017, à paraître dans Ann. Inst. Fourier. [6] , Harmonic quasi-isometric maps II : negatively curved manifolds, prépublication arXiv:1702.04369, à paraître dans J. Eur. Math. Soc. [7] M. Bonk & O. Schramm – Embeddings of Gromov hyperbolic spaces, Geom. Funct. Anal. 10 (2000), no 2, p. 266–306. [8] S. Y. Cheng – Liouville theorem for harmonic maps, in Geometry of the Laplace operator (Proc. Sympos. Pure Math., Univ. Hawaii, Honolulu, Hawaii, 1979), Proc. Sympos. Pure Math., XXXVI, Amer. Math. Soc., 1980, p. 147–151. [9] J. J. Eells & J. H. Sampson – Harmonic mappings of Riemannian manifolds, Amer. J. Math. 86 (1964), p. 109–160. [10] A. Eskin & B. Farb – Quasi-flats and rigidity in higher rank symmetric spaces, J. Amer. Math. Soc. 10 (1997), no 3, p. 653–692. [11] F. T. Farrell, P. Ontaneda & M. S. Raghunathan – Non-univalent harmonic maps homotopic to diffeomorphisms, J. Differential Geom. 54 (2000), no 2, p. 227–253. [12] M. Gromov – Hyperbolic groups, in Essays in group theory, Math. Sci. Res. Inst. Publ., vol. 8, Springer, 1987, p. 75–263. [13] O. Guichard – Groupes convexes-cocompacts en rang supérieur, d’après Labourie, Kapovich, Leeb, Porti..., Séminaire Bourbaki, vol. 2017/2018, exp. no 1138, Astérisque 414 (2019), p. 95–123.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
530
F. GUÉRITAUD
[14] J. Heinonen & P. Koskela – Quasiconformal maps in metric spaces with controlled geometry, Acta Math. 181 (1998), no 1, p. 1–61. [15] J. Jost – Harmonic mappings between Riemannian manifolds, Proceedings of the Centre for Mathematical Analysis, Australian National University, vol. 4, Australian National University, Centre for Mathematical Analysis, Canberra, 1984. [16] M. Kapovich, B. Leeb & J. Porti – A Morse lemma for quasigeodesics in symmetric spaces and Euclidean buildings, Geom. Topol. 22 (2018), no 7, p. 3827– 3923. [17] Y. Kifer & F. Ledrappier – Hausdorff dimension of harmonic measures on negatively curved manifolds, Trans. Amer. Math. Soc. 318 (1990), no 2, p. 685– 704. [18] B. Kleiner & B. Leeb – Rigidity of quasi-isometries for symmetric spaces and Euclidean buildings, Inst. Hautes Études Sci. Publ. Math. (1997), no 86, p. 115– 197. [19] N. J. Korevaar & R. M. Schoen – Sobolev spaces and harmonic maps for metric space targets, Comm. Anal. Geom. 1 (1993), nos 3-4, p. 561–659. [20] M. Lemm & V. Markovic – Heat flows on hyperbolic spaces, J. Differential Geom. 108 (2018), no 3, p. 495–529. [21] P. Li & L.-F. Tam – Uniqueness and regularity of proper harmonic maps. II, Indiana Univ. Math. J. 42 (1993), no 2, p. 591–635. [22] P. Li & J. Wang – Harmonic rough isometries into Hadamard space, Asian J. Math. 2 (1998), no 3, p. 419–442. [23] , Complete manifolds with positive spectrum. II, J. Differential Geom. 62 (2002), no 1, p. 143–162. [24] V. Markovic – Harmonic maps between 3-dimensional hyperbolic spaces, Invent. math. 199 (2015), no 3, p. 921–951. [25] , Harmonic maps and the Schoen conjecture, J. Amer. Math. Soc. 30 (2017), no 3, p. 799–817. [26] H. M. Morse – A fundamental class of geodesics on any closed surface of genus greater than one, Trans. Amer. Math. Soc. 26 (1924), no 1, p. 25–60. [27] G. D. Mostow – Strong rigidity of locally symmetric spaces, Annals of Math. Studies, vol. 78, Princeton Univ. Press, N.J. ; University of Tokyo Press, Tokyo, 1973. [28] V. Pambuccian & T. Zamfirescu – Paolo Pizzetti : the forgotten originator of triangle comparison geometry, Historia Math. 38 (2011), no 3, p. 415–422. [29] P. Pankka & J. Souto – Harmonic extensions of quasiregular maps, prépublication arXiv:1711.08287.
ASTÉRISQUE 414
(1149)
APPLICATIONS HARMONIQUES EN COURBURE NÉGATIVE
531
[30] P. Pansu – Métriques de Carnot-Carathéodory et quasiisométries des espaces symétriques de rang un, Ann. of Math. 129 (1989), no 1, p. 1–60. [31] F. Paulin – Un groupe hyperbolique est déterminé par son bord, J. London Math. Soc. 54 (1996), no 1, p. 50–74. [32] P. Petersen – Convergence theorems in Riemannian geometry, in Comparison geometry (Berkeley, CA, 1993–94), Math. Sci. Res. Inst. Publ., vol. 30, Cambridge Univ. Press, 1997, p. 167–202. [33] R. M. Schoen – The role of harmonic mappings in rigidity and deformation problems, in Complex geometry (Osaka, 1990), Lecture Notes in Pure and Appl. Math., vol. 143, Dekker, 1993, p. 179–200. [34] H. Sidler & S. Wenger – Harmonic quasi-isometric maps into Gromov hyperbolic CAT(0)-spaces, prépublication arXiv:1804.06286. [35] D. Sullivan – The Dirichlet problem at infinity for a negatively curved manifold, J. Differential Geom. 18 (1983), no 4, p. 723–732. [36] P. Tukia – Quasiconformal extension of quasisymmetric mappings compatible with a Möbius group, Acta Math. 154 (1985), nos 3-4, p. 153–193.
François GUÉRITAUD CNRS & Université de Lille Laboratoire Paul Painlevé 59655 Villeneuve d’Ascq Cedex, France E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 70e année, 2017–2018, no 1150, p. 533 à 572 doi:10.24033/ast.1094
Juin 2018
THE FARGUES-FONTAINE CURVE AND DIAMONDS [d’après Fargues, Fontaine, and Scholze] by Matthew MORROW
1. INTRODUCTION The goal of this text is to overview the Fargues-Fontaine curve, its role in p-adic Hodge theory, and its relation to Scholze’s theory of perfectoid spaces and diamonds. On the other hand, we do not touch on the role of the curve in local class field theory [11, 15] or in the local Langlands correspondence [14]. 1.0.1. The literature. — The definitive text on the foundations of the curve is the book by Fargues and Fontaine [17]. There exist several more introductory articles, in particular Colmez’s extensive preface [7] to the book, Fargues’ recent ICM text [13], and Fargues-Fontaine’s Durham survey [16]. In view of these articles, which were very useful when preparing the current text and which we highly recommend to readers with a background in p-adic arithmetic geometry, we have attempted to present the theory here with the non-expert in mind. In particular, Sections 2–3 should be accessible to any reader with a knowledge of elementary algebraic geometry. Concerning diamonds, Scholze’s Berkeley lecture notes [32] contain the main concepts, while [31] is the source for the technical foundations, and his ICM text [30] gives an overview. Section 4 on diamonds is sparse on details but we have attempted to indicate some of the main ideas of the theory. 1.0.2. What is the curve? — Let us begin by recalling the old analogy between the integers Z and the ring C[z] of polynomials in one variable over the complex numbers. They are both principal ideal domains, even Euclidean domains, with Euclidean function given respectively by the usual absolute value |·| coming from R and by polynomial degree. Geometrically, C[z] (whose monic prime polynomials identify with the complex plane via x 7→ z − x) is the set of functions on the Riemann sphere P1C whose only pole is at infinity, and the degree of a polynomial is precisely the order of
© Astérisque 414, SMF 2019
534
M. MORROW
this pole. Analogously, arithmetic geometry views Z as functions on the set of prime numbers, with an extra point at infinity being provided by the real numbers or equivalently by | · |. Motivated by this analogy, it is not uncommon to develop analogues of geometric tools for the Riemann sphere (e.g., vector bundles, sheaves, cohomology,. . . ) when doing arithmetic geometry over Z. This approach, although fruitful, can only be taken so far, since the point at infinity for Z is no longer algebraic and so the compactification-at-infinity {primes} ∪ {| · |} is no longer an algebro-geometric object. The theory of Fargues and Fontaine takes this analogy much further if we focus on a given prime number p and replace arithmetic geometry over Z by arithmetic geometry over Zp or Qp . The Euclidean domain Z or C[z] is now replaced by a certain Qp -algebra Be (coming from p-adic Hodge theory), which is again (almost) a Euclidean domain with the Euclidean structure arising from a point at infinity. But, whereas in the case of Z the point at infinity was outside the world of algebraic geometry, we are now in a situation much closer to that of the Riemann sphere: there exists an actual curve (in a sense of algebraic geometry) XFF whose functions regular away from a certain point at infinity are the ring Be and whose geometric and cohomological properties (which are similar to those of P1C ) encode significant information about arithmetic geometry over Qp . This is the fundamental curve of p-adic Hodge theory, or the Fargues-Fontaine curve. 1.0.3. Overview. — We will return to the above point-at-infinity perspective after Theorem 1.1 but first, given our goal of diamonds, we wish to introduce the FarguesFontaine curve as a space of untilts. Here “untilt” refers to the tilting–untilting correspondence of Scholze through which one passes between geometry over the characteristic zero field Qp and over the characteristic p field Fp [23, 29]. For example, let Cp be the “p-adic complex numbers,” i.e., the p-adic completion of the algebraic closure of Qp ; then its tilt C[p , whose definition we will recall in Section 2.1, is a field with similar superficial structure to Cp but it is an extension of Fp rather than of Qp . A fundamental motivating question for both the curve and for diamonds is the following: Putting F = C[p , do there exist fields C ⊇ Qp other than Cp such that C [ = F ? Informally, do there exist other ways of passing back to characteristic zero from characteristic p ? More precisely, since equality is clearly not the right notion, let |YF | denote the ' set of untilts (C, ι), where C is a suitable extension of Qp and ι : F → C [ is a specified isomorphism; such pairs are taken up to an obvious notion of equivalence. A coarser notion of equivalence is obtained by taking the Frobenius automorphism ' ϕ : F → F , x 7→ xp , into account, thereby leading to the set of untilts up to Frobenius
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
535
equivalence |YF |/ϕZ . The remarkable theorem of Fargues and Fontaine states that this set of untilts admits the structure of a “smooth, complete curve” (see Definition 2.6), now known as the Fargues-Fontaine curve XFFF of F . Theorem 1.1 (Fargues-Fontaine). — The set |YF |/ϕZ is the underlying set of points of a complete curve XFFF . We can now make more precise Paragraph 1.0.2 about points at infinity; see Sections 2.2–2.3 for details. The original field Cp is itself an untilt of F , thereby giving us a preferred point ∞ ∈ XFFF . The ring of functions on XFFF which are regular away ϕ=1 from ∞ turns out to equal the Frobenius-fixed subring Be := Bcrys of the classical crystalline period ring of Fontaine [21]; meanwhile, the completed germs of meromorphic functions at ∞ equals his classical de Rham period ring BdR . The classical (and subtle) so-called fundamental exact sequence of p-adic Hodge theory + 0 −→ Qp −→ Be −→ BdR /BdR −→ 0
then translates into a simple cohomological vanishing statement about the curve XFFF . In this way the Fargues-Fontaine curve may be viewed as subtly gluing together Be (which is almost a Euclidean domain) and BdR (which is a complete discrete valuation field), in the same way as the Riemann sphere P1C glues together C[z] (= functions on P1C regular away from infinity) and C(( z1 )) (= completed germs of meromorphic functions at infinity). Moreover, just as for P1C , the sum of the orders of zeros/poles of any meromorphic function on XFFF is zero, which is precisely what it means for XFFF to be “complete”. Another similarity between the Fargues-Fontaine curve and the Riemann sphere is their vector bundles. On the Riemann sphere, a theorem of Grothendieck states Lm that any vector bundle is isomorphic to i=1 OP1C (λi ) for some unique sequence of integers λ1 ≥ · · · ≥ λm , where OP1C (λ) is the usual twisted line bundle of degree λ. On the Fargues-Fontaine curve the situation is more complicated, as there exist nondecomposable “rational twists” OXFFF (λ), for λ ∈ Q (this is only a line bundle if λ ∈ Z; in general its rank is given by the denominator of λ), but then Fargues and Fontaine establish the following analog of Grothendieck’s theorem: Theorem 1.2 (Fargues-Fontaine). — Let E be a vector bundle on XFFF . Then there exists a unique sequence of rational numbers λ1 ≥ · · · ≥ λm such that E is isomorphic Lm to i=1 OXFFF (λi ). The proof of Theorem 1.2, which we discuss in Section 3.2 but which is beyond the scope of this survey, requires a range of deep techniques including p-divisible groups and p-adic period mappings. Conversely, it encodes enough information to have important applications to classical questions in p-adic Hodge theory. For example, we
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
536
M. MORROW
use it in Section 3.3 to explain a short proof of Fontaine’s “weakly admissible implies admissible” conjecture about Galois representations from 1988 [22] (resolved first by Colmez-Fontaine in 2000 [8]). The key idea is that many linear algebraic objects of p-adic Hodge theory (modules with filtration, with Frobenius,. . . ) may be used to build vector bundles on XFFF , which may then be analyzed through Theorem 1.2. An important technique in such analyses is the general rank-degree formalism of Harder and Narasimhan [25], which applies to vector bundles on any curve; we review their theory in Section 3.1. We now turn to Scholze’s theory of diamonds. Recall that our motivating goal is to classify untilts of the characteristic p field F . In the world of diamonds, such an untilt corresponds to a “morphism” from Qp to F : of course, algebraically there exist no homomorphisms between fields of different characteristic, but diamonds provide a theory of p-adic geometry in which everything is of characteristic p in some sense. Even more interestingly, the choice of two untilts of F (i.e., two points of |YF |) corresponds to a morphism from Qp ⊗Qp to F , where −⊗− refers to an absolute tensor product for diamonds. (To avoid misleading the reader, we caution that there is no set-theoretic object Qp ⊗ Qp , nor set-theoretic map Qp → F , only the associated diamond.) Weil’s simple proof [34] of the Riemann hypothesis for a curve C over a finite field Fq crucially depends on the geometry of the surface C ×Fq C , and a well-known philosophy predicts that there should exist a similar object “Z ⊗F1 Z” in arithmetic geometry. Diamonds appear to provide this object p-adically. (We emphasize that this is not an empty philosophy: the “shtukas” of Drinfeld [9] which are central in the geometric Langlands correspondence for C also involve C ×Fq C , and Fargues and Scholze’s ongoing work on arithmetic local Langlands uses diamonds to develop an analogous theory over Qp [18, 32].) In Section 4 we attempt to explain these ideas more precisely by defining the category of diamonds. Scholze associates to any reasonable adic space X (e.g., the analytification of a variety over a non-archimedean field such as Qp , Cp , or F ) a diamond which classifies certain untilts of perfectoid spaces. For example, Qp and F themselves give rise to diamonds Spd(Qp ) and Spd(F ) and, as we suggested in the previous paragraph, morphisms of diamonds Spd(F ) → Spd(Qp ) are exactly the untilts of F (the morphism has changed direction, as usual when passing from algebra to geometry). From the point of view of diamonds, the Fargues-Fontaine curve gains the following beautiful interpretation: Theorem 1.3 (Scholze). — The diamond associated to the Fargues-Fontaine curve XFFF is naturally isomorphic to the product Spd(F )/ϕZ × Spd(Qp ).
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
537
Finally, in Section 5 we give a detailed sketch of the construction of the FarguesFontaine curve; this is necessarily slightly technical (though, in principal, it only requires some elementary algebraic geometry and some comfort manipulating large p-adic algebras) and may be safely ignored by readers uninterested in the actual construction. It begins by observing that Fontaine’s infinitesimal period ring Ainf,F := W (OF ) (i.e., Witt vectors of the ring of integers of F ) may be naturally viewed as a ring of functions on the set |YF |. Fargues and Fontaine substantially develop this point of view by introducing a topological structure on |YF | and replacing Ainf,F by a larger ring of functions BF ; this is the largest reasonable ring of continuous functions on |YF | in the sense that y 7→ {f ∈ BF : f (y) = 0} identifies |YF | with the closed maximal ideals of BF (see Prop. 5.4). Moreover, each of these ideals is principal, generated by a so-called primitive element of degree one, indicating that |YF | is one-dimensional in some sense. The Frobenius action on |YF | from before Theorem 1.1 turns out to be properly discontinuous, whence |YF |/ϕZ inherits a topology making it locally homeomorphic to |YF |. The next step is to construct functions on |YF |/ϕZ . Unfortunately, the only ϕ-invariant functions on |YF | are constant. Instead, Fargues and Fontaine develop a theory of Weierstrass products to construct, for each point y ∈ |YF |, a function ty ∈ BF satisfying ϕ(ty ) = pty and with a simple zero at each point of the discrete set ϕZ (y) ⊆ |YF | and no other zeros or poles. So, given any other function g ∈ BF satisfying ϕ(g) = pg, we obtain a meromorphic function g/ty on |YF |/ϕZ which is regular away from the image of y. Fargues and Fontaine prove that this process generates all functions on |YF |/ϕZ or rather, in more precise algebro-geometric language: L ϕ=pk Theorem 1.4 (Fargues-Fontaine). — 1. The graded ring is graded k≥0 BF factorial, with irreducible elements of degree one. k L 2. The closed points of the scheme Proj( k≥0 BFϕ=p ) canonically identify with the set |YF |/ϕZ . Part (1) of Theorem 1.4 is a central result in the entire theory; in particular, it more or less formally implies that the Fargues-Fontaine curve, which we may now define, really is a curve: Definition 1.5. — The Fargues-Fontaine curve is M ϕ=pk XFFF := Proj( BF ). k≥0
We will see earlier in Section 2.3 a similar (and ultimately equivalent) definition of XFFF in terms of the crystalline period ring.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
538
M. MORROW
Acknowledgements. — I am grateful to Colmez, Fargues, Fontaine, and Scholze for their answers to my questions and their feedback on preliminary versions of the text. All results herein are due to Fargues, Fontaine, and Scholze, while all errors and excessive simplifications are due to the author.
2. EXISTENCE OF THE CURVE In this section we present two points of view on the Fargues-Fontaine curve. The first of these, in § 2.1, states that the curve classifies certain equivalence classes of untilts of a perfectoid field. The second, given in § 2.2, instead characterizes it via its functions (given by a certain period ring of p-adic Hodge theory) together with a point at infinity (corresponding to another period ring). In § 2.3 we use the second approach to derive and motivate a precise scheme-theoretic definition of the curve. 2.1. As a space of untilts of a perfectoid field The first interpretation of the Fargues-Fontaine curve which we will explore, which is the most important from the point of view of Scholze’s diamonds, is that it classifies untilts of perfectoid fields. We therefore begin by summarizing the essential ideas of tilting and untilting. Let C be a field with the following properties: (Pf0 ) C is algebraically closed, contains Qp , and is complete with respect to a nonarchimedean absolute value | · |C : C → R≥0 extending the usual p-adic absolute value on Qp . For example, the standard choice is to take C = Cp the “p-adic complex numbers,” i.e., the completion of the algebraic closure of Qp . The tilt F = C [ of C (to employ Scholze’s terminology [29]; the construction exists since the early days of p-adic Hodge theory) will be a field with the following similar properties but now of characteristic p: (Pfp ) F is algebraically closed, contains Fp , and is complete with respect to a non-trivial non-archimedean absolute value | · |F : F → R≥0 . There are other ways in which C and its tilt C [ are related: they have the same residue field and there is a multiplicative map # : C [ → C, called the untilting map. Let us now define the tilt C [ . As a set, C [ is the set of p-power compatible sequences in C, i.e., (1)
C [ := {(a0 , a1 , . . . ) : ai ∈ C, api = ai−1 }.
We define multiplication in C [ term-wise, while addition is defined by the rule (2) (a0 , a1 , . . . ) + (b0 , b1 , . . . ) := (c0 , c1 , . . . ),
ASTÉRISQUE 414
where ci :=
lim (an + bn )p
i≤n→∞
n−i
,
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
539
where the limit is a convergent limit in the complete field C. It is not hard to check, and in any case classical, that these operations give C [ the structure of a perfect field of characteristic p. The promised untilting map # : C [ → C is simply the canonical projection α = (a0 , a1 , . . . ) 7→ α# := a0 , and then the absolute value | · |C on C induces an absolute value on C [ by |α|C [ := |α# |C . It is easy to check that C [ is complete under this absolute value and has the same residue field as C; careful use of Hensel’s lemma shows that it is also algebraically closed. We refer the reader to [23, §1.3] [29] for more on tilting. Example 2.1. — 1. Fixing a compatible sequence of p-power roots of p (respectively, of unity), we obtain elements 2
p[ := (p, p1/p , p1/p , . . . ),
ε := (1, ζp , ζp2 , . . . )
of the field C [ which play an important role. 2. If C = Cp , then C [ is isomorphic to the completion of the algebraic closure of the Laurent series field Fp ((t)), in such a way that t 7→ p[ . Let us now attempt to go in the opposite direction: given a field F as in (Pfp ), does there exist a field C as in (Pf0 ) such that C [ = F ? Can we classify all such C ? To make this more precise, one defines an untilt of F to be a pair (C, ι) where C is a field ' with properties (Pf0 ) and ι : F → C [ is an isomorphism of valued fields. (1) We say that two untilts (C, ι) and (C 0 , ι0 ) are equivalent if there exists an isomorphism C ∼ = C0 such that the induced isomorphism between their tilts is compatible with ι and ι0 . Although it might not be clear at present, we will see using elementary algebra in Proposition 5.1 that F admits many untilts; in particular the following set |YF | is non-empty. Definition 2.2. — Let |YF | be the set of equivalence classes of untilts of F . Given an untilt (C, ι) of F , we may construct new untilts (C, ι ◦ ϕm ), for all m ∈ Z, ' where ϕ : F → F , x 7→ xp is the absolute Frobenius automorphism. These are not interesting new untilts: therefore we say that untilts (C, ι) and (C 0 , ι0 ) are Frobenius equivalent if there exists m ∈ Z such that (C, ι) and (C 0 , ι0 ◦ ϕm ) are equivalent. The set of Frobenius equivalence classes of untilts is given by the quotient |YF |/ϕZ where the infinite cyclic group ϕZ is acting on |YF | via ϕm (C, ι) := (C, ι ◦ ϕm ). The first existence statement of the Fargues-Fontaine curve asserts that this space of untilts |YF |/ϕZ admits the structure of a “smooth, complete curve,” and that it (1)
More precisely this would usually be called an “untilt of characteristic zero” in the literature.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
540
M. MORROW
therefore makes sense to study its geometric and cohomological properties. We refer to Definition 2.6 for the precise definition of a complete curve. Theorem 2.3 (Fargues-Fontaine). — There exists a complete curve XFFF whose points (2) are in natural bijection with |YF |/ϕZ . (Moreover, the point of XFFF corresponding to a given untilt (C, ι) has residue field C.) To simplify notation, we fix a field F as in (Pfp ) for the rest of the text, and write |Y | = |YF |,
XFF = XFFF .
The reader is welcome to suppose that F is the tilt of Cp . 2.2. As a period ring with a point at infinity The next point of view on the Fargues-Fontaine curve is that it is obtained by compactifying (the spectrum of) a period ring of p-adic Hodge theory by adding a point at infinity, in the same way as the Riemann sphere P1C is obtained from the complex plane by adding a point at infinity. We begin with some reminders on Riemann surfaces (3) and their functions. Let X be a Riemann surface (or more generally a smooth projective curve over any algebraically closed field) and let C(X) denote its field of meromorphic functions. Given a meromorphic function f ∈ C(X), its order of vanishing ordx (f ) at a point x ∈ X is P defined as usual: namely, expanding the function as f = n−∞ an zxn , where zx is a local coordinate at x, we have ordx (f ) := min{n : an 6= 0} ∈ Z ∪ {∞}. Each function ordx : C(X) → Z ∪ {∞} is a valuation, (4) and we recall the classical degree formula that X (3) ordx (f ) = 0 x∈X
for all f ∈ C(X), which reflects the compactness of X. The Fargues-Fontaine curve most closely parallels the Riemann sphere P1C , so let us now consider that case from a more algebraic point of view. Let ∞ ∈ P1C be the point at infinity, so that P1C \ {∞} identifies with the complex plane. The field of meromorphic functions on P1C is precisely C(z), i.e., the field of rational functions in one variable z; meanwhile, the meromorphic functions which are regular away from infinity form the algebra C[z] ⊆ C(z) of polynomials in z. (2)
Points mean closed points. Always compact and connected. (4) I.e., ordx is surjective, multiplicative, and satisfies ordx (f ) = ∞ ⇔ f = 0 and the nonarchimedean inequality ordx (f + g) ≤ max{ordx (f ), ordx (g)}. (3)
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
541
The theory of the Riemann sphere P1C is almost completely encoded in the algebra C[z], except that we have lost the point at infinity; to record this extra point, we keep track of the valuation ord∞ . In conclusion, we can completely encode the Riemann sphere in the following algebraic pair of data: algebra C[z], valuation on its field of fractions ord∞ : C(z) → Z ∪ {∞}. The degree formula (3) now takes the algebraic form X (4) ord∞ (f ) + ordp (f ) = 0 p⊆C[z]
for all f ∈ C[z], where p runs over the non-zero prime ideals of C[z] (each such ideal p is generated by z − x for some unique x ∈ C, and then ordx is precisely the associated p-adic valuation ordp on C[z]). The Fargues-Fontaine curve will provide us with another example of such a pair. We first further analyse the properties of the pair (C[z], ord∞ ). Given f ∈ C[z], its order of vanishing ord∞ (f ) at the point ∞ is simply − deg(f ): indeed, the expanPdeg f sion of f = n=0 an z n in terms of the coordinate z∞ = 1/z at infinity is exactly P0 n f = n=− deg f an z∞ . Thus − ord∞ = deg : C[z] → N ∪ {−∞} is the usual degree function, which is a Euclidean function on C[z]. Recall here that a Euclidean function on an integral domain B is a function deg : B → N ∪ {−∞} with the following properties: (E1) for f ∈ B, we have deg(f ) = −∞ if and only if f = 0; (E2) for non-zero f, g ∈ B, we have deg(f ) ≤ deg(f g); (E3) for all f, g ∈ B with g 6= 0, there exist q, r ∈ B such that f = gq + r and deg(r) < deg(g). The fact that C[z] is equipped with a Euclidean function implies in particular that it is a principal ideal domain. In conclusion, C[z] is a principal ideal domain, equipped with an extra valuation ord∞ on its field of fractions such that the degree formula (3) holds, and such that deg = − ord∞ is a Euclidean function on C[z]. For the Fargues-Fontaine curve, it turns out that unfortunately the analog of deg fails to be a Euclidean function, and therefore Fargues and Fontaine introduce the notion of an almost Euclidean function deg : B → N ∪ {−∞}, which is defined by replacing (E3) by the following pair of strictly weaker axioms [17, Déf. 5.2.1]: (E30 ) for f ∈ B such that deg(f ) = 0, we have f ∈ B × ; (E300 ) for f, g ∈ B with deg(g) ≥ 1, there exist q, r ∈ B such that f = gq + r and deg(r) ≤ deg(g). We reach the following axiomatisation of the algebraic pairs of interest to us (the following simplistic definition does not appear in the work of Fargues and Fontaine, but will be helpful for expository purposes):
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
542
M. MORROW
Definition 2.4. — An algebraic P1 is a pair (B, ν) consisting of a principal ideal domain B and a valuation ν : Frac(B) → Z ∪ {∞} such that −ν is an almost Euclidean function on B. We say that the pair is complete (5) if the degree formula X ν(f ) + ordp (f ) = 0 p⊆B
is satisfied for all f ∈ B. (As in (4), here p runs over the non-zero prime ideals of B and ordp denotes the associated p-adic valuation on B.) As explained above, the prototypical example of an algebraic P1 is (C[z], ord∞ ). We may now give an algebraic statement approximating the existence of the Fargues-Fontaine curve in terms of the classical crystalline and de Rham period rings Bcrys and BdR of p-adic Hodge theory. These are large Qp -algebras which have been central in p-adic Hodge theory since their introduction by Fontaine [20, 21, 24]; their role in the theory of p-adic Galois representations will be reviewed in § 3.3. Their precise definitions (which may be found in § 5.3) are for the moment unimportant as we will only need the following three properties: BdR is a complete discrete valuation field (on which we will denote the valuation by νdR ) of residue characteristic zero [21, §1.5.5]; Bcrys is a subring of BdR [21, §4.1]; Bcrys is equipped ϕ=1 be the with an endomorphism ϕ known as its Frobenius [21, §2.3.4]. Let Be := Bcrys ring of Frobenius-fixed points of Bcrys , and continue to write νdR for the restriction of νdR to Frac(Be ) ⊆ BdR . Theorem 2.5 (Fargues-Fontaine). — The pair (Be , νdR ) is a complete algebraic P1 . Theorem 2.5 succinctly encodes a range of fundamental results about the period rings. Firstly, the theorem states that the ring Be is in fact a principal ideal domain; the first indication of this was Berger’s surprising result [4, Prop. 1.1.9] that it is a Bézout ring (i.e., all its finitely generated ideals are principal). Secondly, the fact that −νdR is an almost Euclidean function on Be turns out to be a formal algebraic consequence (see [17, §5.2]) of the classical fundamental exact sequence of the period rings (5)
+ 0 −→ Qp −→ Be −→ BdR /BdR −→ 0
+ [6, Prop. 1.17] [8, Prop. 1.3(iv)], where BdR := {f ∈ BdR : νdR (f ) ≥ 0} is the ring of integers of the discrete valuation field BdR . Thus the fundamental exact sequence translates into the existence of an almost Euclidean function, which we will see in a moment corresponds to a cohomological vanishing statement on the Fargues-Fontaine
(5)
By analogy with Riemann surfaces one might prefer to say “compact,” but “complete” is the more traditional terminology in algebraic geometry.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
543
curve. Thus we see a first example of how the geometry of the curve encodes algebraic results of p-adic Hodge theory. The problem with Theorem 2.5 is that it is not a geometric statement: there is no actual curve. To remedy this, we adopt first the following definition (which was already used in Theorem 2.3 when stating the existence of XFF ): Definition 2.6 ([17, Déf. 5.1.1]). — A curve is a regular, Noetherian, separated, connected, one-dimensional scheme X; it is complete if the degree formula P (6) x∈X ordx (f ) = 0 holds for all f in the function field of X. Curves are related to algebraic P1 s by elementary algebraic geometry as follows. Suppose that X is a complete curve together with a chosen point ∞ ∈ X such that X \ {∞} is affine, say Spec(B). The point ∞ defines a valuation ord∞ on Frac(B) (= the function field of X), and we wish to characterize whether the pair (B, ord∞ ) is an algebraic P1 purely in terms of geometric properties of X and ∞: P P — One defines the degree of a Weil divisor x∈X nx [x] to be x∈X nx ; the assumption that X is complete states that this is trivial on the divisor of any rational function, and thus it induces deg : Pic(X) → Z. It is straightforward to see that B is a principal ideal domain if and only if the degree map deg : Pic(X) → Z is an isomorphism [17, Lem. 5.4.1]. Let OX (1) := OX (∞) be the line bundle on X associated to the Weil divisor [∞], and more generally OX (k) = OX (1)⊗k the line bundle associated to k[∞] for any k ∈ Z. — It is easy to check that − ord∞ defines a Euclidean function on B if and only if H 1 (X, OX (k)) = 0 for all k ≥ −1 [17, Prop. 5.4.2], e.g., X = P1C . — Similarly, − ord∞ defines an almost Euclidean function on B if and only if H 1 (X, OX (k)) = 0 for all k ≥ 0 [17, Prop. 5.4.2], e.g., X = XFF by Theorem 2.7. — The completeness of X tautologically implies the completeness of the pair (B, ord∞ ). In conclusion, the geometric and cohomological hypotheses (6)
'
deg : Pic(X) → Z
and
H 1 (X, OX (k)) = 0 for all k ≥ 0
imply that the pair (B = H 0 (X \ {∞}, OX ), ord∞ ) is a complete algebraic P1 in the sense of Definition 2.4. Fargues and Fontaine prove that the pair (Be , νdR ) from Theorem 2.5 arises in this way from their curve. To state the result, we should mention that the de Rham and (6)
More generally we could also include the data of a specified integer deg(x) ≥ 1 for each closed P point x ∈ X, and replace the degree formula by x∈X deg(x) ordx (f ) = 0. However, in this survey we have chosen to focus entirely on the Fargues-Fontaine curve associated to an algebraically closed field F , in which case the degrees deg(x) turn out to all be 1 and hence may be suppressed.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
544
M. MORROW
crystalline period rings implicitly depended on having chosen an untilt of F , thereby giving rise to a preferred point ∞ ∈ XFF via Theorem 2.3. Theorem 2.7 (Fargues-Fontaine). — XFF is a complete curve which, together with the point ∞, satisfies properties (6) ; the associated algebraic P1 is (Be , νdR ). Thus the Fargues-Fontaine curve “glues together” the period rings of p-adic Hodge theory to form a complete curve with similar geometric and cohomological properties to the Riemann sphere. Given the unwieldy nature and enormity of the period rings, it is remarkable that they underlie a reasonable geometric object. We warn the reader however that, although the ring of globally regular functions on the Fargues-Fontaine curve is H 0 (XFF , OXFF ) = Qp (to prove this, calculate Čech cohomology of OXFF using the fundamental exact sequence (5)), the curve is not at all of finite type over Qp : indeed, Theorem 2.3 tells us that its residue fields are all algebraically closed (hence are not finite extensions of Qp ). 2.3. First definition of the curve Now we address the following question, which will motivate our first definition of XFF : assuming the validity of Theorem 2.7, how can we reconstruct the curve XFF from the algebraic data (Be , νdR )? In the case of the Riemann sphere from § 2.2, we may recover P1C from the corresponding pair (C[z], ord∞ = − deg) by observing that there is an isomorphism of graded rings M ' C[z0 , z1 ] → Filk C[z], z0 , z1 7→ z, 1 ∈ Fil1 C[z], k≥0
∼ Proj(L where Filk C[z] := {f ∈ C[z] : deg f ≤ k}. Therefore P1C = k≥0 Filk C[z]). Analogously for the Fargues-Fontaine curve, Theorem 2.7 suggests that XFF might L be Proj of the graded ring k≥0 Filk Be , where Filk Be := {b ∈ Be : νdR (b) ≥ −k}. It is customary to rewrite this isomorphically by using the following classical facts + about the crystalline period ring: there exists a Qp -subalgebra Bcrys ⊆ Bcrys and an + element t ∈ Bcrys such that + — Bcrys = Bcrys [ 1t ],
— ϕ(t) = pt and νdR (t) = 1, and + + — if an element b ∈ Bcrys ∩ BdR satisfies ϕ(b) = pk b for some k ≥ 0 then b ∈ Bcrys k k + ϕ=p + ϕ=p [21, Th. 5.3.7(i)]; in short, Bcrys ∩ BdR = Bcrys . '
k
+ ϕ=p It formally follows that we have a bijection Filk Be → PkFF := Bcrys , b 7→ btk for each k ≥ 0. We may assemble these into an isomorphism of graded rings M M ' + ϕ=pk Filk Be −→ P FF = Bcrys k≥0
ASTÉRISQUE 414
k≥0
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
545
and so reach a definition of the Fargues-Fontaine curve: Definition 2.8. — The Fargues-Fontaine curve is the scheme XFF := Proj(P FF ). Revisiting the earlier results, Theorem 2.7 asserts in particular that Proj(P FF ) is a complete curve satisfying (6). This turns out to be a formal consequence of the following central result in the theory: Theorem 2.9 (Fargues-Fontaine). — The graded ring P FF is graded factorial with irreducible elements of degree one. That is, any non-zero element f ∈ PkFF may be written uniquely (up to re-ordering and multiples of Q× p ) as a product f = t1 · · · tk , where ti ∈ P1FF . Theorem 2.9 should be compared to the analogous fact that C[z0 , z1 ] is also graded factorial with irreducible elements of degree one: indeed, any homogeneous polynomial in C[z0 , z1 ] may be written uniquely (up to re-ordering and multiples of C× ) as a product of linear homogeneous polynomials. Moreover, just as points of P1C correspond to C-lines in the two-dimensional vector space Fil1 C[z] = C + Cz via ( z − x x ∈ C, 1 ' × PC → (Fil1 C[z])/C , x 7→ 1 x = ∞, so too do points of Proj(P FF ) correspond to Qp -lines in the infinite dimensional Qp -vector space P1FF . In fact, Theorem 2.9 is the essential result underlying the construction of XFF : Fargues and Fontaine check directly, using only elementary algebraic geometry, that L if a graded ring P = k≥0 Pk is graded factorial with irreducibles of degree one and P0 is a field (and a more technical hypothesis which we omit, but which in the case of the Fargues-Fontaine curve essentially follows from the fundamental exact sequence (5)), then Proj(P ) is a complete curve satisfying (6) for any choice of closed point ∞. See [17, Ths. 5.2.7 & 6.5.2]. However, it seems difficult to directly prove Theorem 2.9 using classical results about the crystalline period ring. Instead, Fargues and Fontaine return to the untilting point of view of § 2.1 and reconstruct the graded ring P FF by studying various rings of functions on |Y |. Their construction is the focus of § 5.
3. VECTOR BUNDLES In this section we explain how vector bundles on the Fargues-Fontaine curve are related to p-adic Galois representations and to various categories of linear algebraic objects which have appeared in p-adic Hodge theory. We begin by reviewing the
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
546
M. MORROW
classical slope theory of Harder and Narasimhan, which applies to vector bundles on any curve. 3.1. Harder-Narasimhan theory To review briefly the classical theory of Harder and Narasimhan, let X be a Riemann surface such as P1C , or more generally a smooth projective curve over any algebraically closed field. To any vector bundle E on X we may associate two fundamental invariants: — its rank rk E ∈ N; — its degree deg E ∈ Z, defined to be the degree of its determinant line bundle; recall here that the degree of a line bundle L is defined, for example, by identifying L P with a Weil divisor x∈X nx [x] up to rational equivalence and setting deg L := P x∈X nx . From these one defines the third invariant of E, its slope µ(E) := deg E/ rk E ∈ Q. The vector bundle E is said to be semi-stable if µ(E 0 ) ≤ µ(E) for every sub-bundle E 0 ⊆ E. (7) The following classical theorem was proved by Harder and Narasimhan in 1974 [25] and is fundamental in the study of vector bundles on curves: Theorem 3.1 (Harder-Narasimhan [25]). — Let E be a vector bundle on X. Then E posseses a unique filtration by sub-bundles 0 = E0 ⊂ E1 ⊂ · · · ⊂ Em = E with the following two properties: — the quotient bundle Ei /Ei−1 is semi-stable for each i = 1, . . . , m, and — µ(E1 /E0 ) > · · · > µ(Em /Em−1 ). There exist several axiomatisations of Harder and Narasimhan’s theory, the most general of which is due to André [1]. We do not adopt André’s formalism in greatest generality, but the special case which appears in [10, 17]. Let E be a category and assume that to each object E ∈ E there are associated two invariants rk E ∈ N,
deg E ∈ Z
(which only depend on E up to isomorphism), and then define the slope of E as µ(E) := deg E/ rk E. These are subject to the following additional assumptions in order that the theory should work: (HN1) E is an exact category (e.g., projective/free modules over a ring – possibly equipped with extra structure such as a filtration, endomorphism, etc. – or vector bundles on a scheme/space); (7)
By sub-bundle we mean that E 0 is locally a direct summand of E.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
547
(HN2) the rank function rk factors through an abelian category in a manner subject to certain hypotheses [17, §5.5.1], which we do not reproduce here. Under these assumptions, the category E behaves like vector bundles on a curve: in particular, any object of E possesses a Harder-Narasimhan filtration as in Theorem 3.1. We now turn to examples of categories which are subject to this axiomatic HarderNarasimham formalism; each category should be viewed as vector bundles on a curve in a generalized sense, even if the curve is not evident. (8) 3.1.1. Vector bundles on a curve. — Let X be a Riemann surface, or more generally a smooth projective curve over a field, or even more generally any complete curve in the sense of Definition 2.6; let Vect(X) be the category of vector bundles on X. Equipped with the usual notion of rank and degree, as defined above, the category Vect(X) satisfies the necessary axioms and we recover Harder-Narasimhan’s original theory. 3.1.2. Vector bundles on P1C . — We now restrict attention to P1C and give an algebraic description of its vector bundles purely in terms of the pair (C[z], ord∞ ) from § 2.2. Let E be a vector bundle on P1C . The sections of E on the complex plane form a finite free C[z]-module M , while the completed germ of sections of E at the remaining point ∞ ∈ P1C form a finite free C[[z∞ ]]-module M∞ , where z∞ = 1/z is our preferred coordinate at ∞. The fact that the modules M and M∞ arise from the same vector bundle corresponds to an identification of M∞ as a C[[z∞ ]]-lattice inside the finite dimensional C((z∞ ))-vector space M ⊗C[z] C((z∞ )). In this way we arrive at the following equivalence of categories (9) which describes vector bundles on P1C purely in terms of the pair (C[z], ord∞ ): '
Vect(P1C ) −→ {pairs (M, M∞ ), where M is a finite free C[z]-module and M∞ is a C[[z∞ ]]-lattice inside M ⊗C[z] C((z∞ ))}. Under this equivalence, the rank of a vector bundle is given by rkC[z] M = rkC[[z∞ ]] M∞ , while the degree can be expressed by comparing bases of the free modules M and M∞ .
(8)
Strictly speaking this is slightly misleading: if we impose extra structure such as a polarization, then the Harder-Narasimham formalism can in fact be extended to higher dimensional varieties [1, §3.1.2]. (9) Proving that this functor is really an equivalence of categories is a well-known application of the Beauville-Laszlo theorem [2].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
548
M. MORROW
3.1.3. (B, ν∞ )-pairs : vector bundles on an algebraic P1 . — Let (B, ν) be a complete algebraic P1 , in the sense of Definition 2.4. Motivated by Example 3.1.2, we may define a (B, ν)-pair, or more informally a “vector bundle over the pair (B, ν),” to be the data of a pair (M, M∞ ), where M is a finite free B-module and M∞ is an Oν -lattice inside the finite dimensional Kν -vector space M ⊗B Kν . Here Kν is the completion of K = Frac(B) with respect to the discrete valuation ν, and Oν denotes its ring of integers. In the case of the pair (P1C , ord∞ ), these are precisely C((z∞ )) and C[[z∞ ]]. The rank of a pair (M, M∞ ) is defined to be the rank of the module M (or, equivalently, of M∞ ), while its degree is defined by comparing bases of M and M∞ as in § 3.1.2. The category of (B, ν)-pairs is thus subject to the Harder-Narasimhan formalism. Suppose that (B, ν) arises from a complete curve X and a chosen point ∞ ∈ X satisfying hypotheses (6), as in § 2.2. Then the same argument as in § 3.1.2 shows that (B, ν)-pairs identify with actual vector bundles on X, and that moreover this identification is compatible with rank and degree. In the case of the algebraic P1 of the Fargues-Fontaine curve (Be , νdR ), such pairs were introduced first by Berger and called more simply B-pairs [4, §2], (10) whence our terminology. Repeating the above definition for clarity, a (Be , νdR )-pair is a + -lattice inpair (M, MdR ) where M is a finite free Be -module and MdR is a BdR side M ⊗Be BdR . (Here we have implicitly used that the inclusion Frac(Be ) ⊆ BdR becomes an equality upon νdR -adic completion, but this is an easy consequence of the surjectivity in the fundamental exact sequence (5).) By the previous paragraph, Theorem 2.7 implies the following: Proposition 3.2 ([17, §8.2.1.1]). — The category of (Be , νdR )-pairs identifies with the category Vect(XFF ) of actual vector bundles on the Fargues-Fontaine curve. 3.1.4. Filtered vector spaces. — Given a field extension L/F , let VectFilL/F be the category of pairs (V, Fil• VL ), where V is a finite dimensional F -vector space and Fil• is a separated and exhaustive filtration on VL := V ⊗F L. The rank and degree of (V, Fil• VL ) are defined to be X rk(V, Fil• VL ) := dimF V, deg(V, Fil• VL ) := i dimL (gri VL ). i∈Z
The category VectFilL/F is thus subject to the Harder-Narasimhan formalism.
(10)
More precisely, Berger’s B-pairs were also equipped with a Galois action.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
549
3.1.5. Isocrystals. — Now we turn to an example from the theory of p-adic cohomology, which will be used to build vector bundles on the Fargues-Fontaine curve. Let k be a perfect field of characteristic p and K0 := Frac(W (k)), where W (k) denotes the p-typical Witt vectors of k. Recall that K0 is a complete discrete valuation field of mixed characteristic (0, p) and with residue field k; moreover, the Frobenius au' tomorphism ϕ : k → k, x 7→ xp , induces a field automorphism of K0 , still denoted by ϕ. For example, if k = Fq , then K0 = Qp (ζq−1 ) and ϕ ∈ Gal(K0 /Qp ) is uniquely p characterized by the identity ϕ(ζq−1 ) = ζq−1 . We will review Witt vectors further at the start of § 5.1. An isocrystal over k is a pair (D, ϕD ) where D is a finite dimensional K0 -vector space and ϕD : D → D is a ϕ-semilinear isomorphism (here ϕ-semilinear means ϕD (ad) = ϕ(a)ϕD (d) for all a ∈ K0 and d ∈ D). The rank and degree of an isocrystal are defined by rk(D, ϕD ) := dimK0 D,
deg(D, ϕD ) := − deg+ det(D, ϕD ),
where deg+ of a rank one isocrystal (L, ϕL ) is defined by choosing any basis element e ∈ L, writing ϕL (e) = ae for some a ∈ K0 , and setting deg+ (L, ϕL ) := νp (a). The category ϕ -ModK0 of isocrystals is then subject to the Harder-Narasimhan formalism. (11) For example, given a rational number λ ∈ Q written uniquely as λ = d/h with d, h ∈ Z, h > 0, (d, h) = 1, we may define an isocrystal (Dλ , ϕλ ) ∈ ϕ -ModK0 as follows. We set Dλ = K0h as a K0 -vector space, with basis elements e1 , . . . , eh , and define ϕλ : Dλ → Dλ to be the unique ϕ-semilinear endomorphism satisfying ( ei+1 i = 1, . . . , h − 1, ϕλ (ei ) = −d p e1 i = d. The isocrystal (Dλ , ϕλ ) has rank h, degree d, and slope λ. 3.2. Classification of vector bundles on the Fargues-Fontaine curve We now focus our attention to vector bundles on the Fargues-Fontaine curve XFF ; recall from Proposition 3.2 that these correspond to (Be , νdR )-pairs. Berger observed that these may be constructed from isocrystals over Fp as follows [4, Ex. 2.1.2]; we omit the proof, although it is not difficult: (11) The seemingly strange minus sign in front of deg+ is designed to ensure that Lemma 3.3 and the resulting functor E (−) are compatible with degrees. In fact, deg+ itself is also a valid degree function on ϕ -ModK0 , leading to a different Harder-Narasimhan formalism. The two associated Harder-Narasimhan filtrations are the same but run in opposite directions, i.e., they are split; this gives the classical Dieudonné–Manin decomposition of the isocrystal.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
550
M. MORROW
Lemma 3.3. — Let (D, ϕD ) ∈ ϕ -ModQp be an isocrystal over Fp . Then + ((Bcrys ⊗Qp D)ϕ=1 , BdR ⊗Qp D)
is a (Be , νdR )-pair, with rank and degree (as in § 3.1.3) given by the rank and degree of the isocrystal (D, ϕD ) (as in § 3.1.5) The lemma functorially associates to any isocrystal (D, ϕD ) a vector bundle on XFF , which is denoted by E (D, ϕD ). In the particular case of the isocrystal (Dλ , ϕλ ), for λ ∈ Q, we write instead OXFF (λ) := E (Dλ , ϕλ ). Since both Proposition 3.2 and Lemma 3.3 are compatible with rank and degree, we see that the vector bundle OXFF (λ) has rank h, degree d, and slope λ. The following is the classification theorem of vector bundles on XFF : Theorem 3.4 (Fargues-Fontaine [17, Thm. 8.2.10]). — Let E be a vector bundle on XFF . Then there exists a unique sequence of rational numbers λ1 ≥ · · · ≥ λm such Lm that E is isomorphic to i=1 OXFF (λi ) Corollary 3.5. — 1. The functor E (−) : ϕ -ModQp → Vect(XFF ) is essentially surjective. 2. Let E be a vector bundle on X and let λ ∈ Q. Then E is semi-stable of slope λ if and only if it is isomorphic to OXFF (λ)m for some m ≥ 1. 3. The category of semi-stable, slope-zero vector bundles on XFF is equivalent to the category of finite dimensional Qp -vector spaces, via E 7→ H 0 (XFF , E),
V 7→ V ⊗Qp OXFF .
Proof. — The proof of the classification theorem is a tour de force beyond the scope of this text, requiring p-divisible groups and Hodge-Tate period mappings. We refer to [17, §8] for details and to [16, §6.3] for a sketch. The corollary is an easy consequence of the theorem. (For part (3), the reader should recall that H 0 (XFF , OXFF ) = Qp , as we saw just after Theorem 2.7.) Remark 3.6. — Theorem 3.4 may be used to show that the Fargues-Fontaine curve is geometrically simply connected [17, Th. 8.6.1]. In other words, every finite étale cover of XFF is of the form XFF ⊗Qp E for some finite extension E of Qp , and hence the étale fundamental group of the curve is the absolute Galois group of Qp : π1ét (XFF ) = Gal(Qp /Qp ). Since the goal of p-adic Hodge theory, local class field theory, and the local Langlands programme is, loosely, to understand Gal(Qp /Qp ), the above identification epitomizes the way in which the curve offers a new geometric approach to these subjects.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
551
3.3. An application to p-adic Galois representations We are now ready to present one of the main applications of the theory of vector bundles on the Fargues-Fontaine curve to the theory of p-adic Galois representations, which will reveal the strength of the classification theorem. Let K be an extension of Qp and GK = Gal(K/K) its absolute Galois group; let K0 = Frac(W (k)) ⊆ K be the maximal unramified subextension of K, where k is the residue field of K. The reader is welcome to assume K = K0 = Qp . The study of p-adic Galois representations is concerned with continuous representations of GK on finite dimensional Qp -vector spaces; we denote the category of such representations by Rep(GK ). Fontaine classically defined various classes of such representations, notably Hodge-Tate, de Rham, crystalline and (potentially) semi-stable representations in terms of his period rings, which reflect different types of reduction on the geometric side of the picture. We now recall his formalism [21, 22]. Let B be a (typically large) Qp -algebra, equipped with an action by GK ; write F = B GK for its subalgebra of fixed elements, which we assume is a field. Given a p-adic Galois representation V ∈ Rep(GK ), we may consider the F -vector space DB (V ) := (B ⊗Qp V )GK , where GK acts diagonally on B ⊗Qp V . The representation V is said to be B-admissible if dimF DB (V ) = dimQp V , which encodes a certain compatibility between the ring B and the representation V , and one writes RepB (GK ) ⊆ Rep(GK ) for the set of B-admissible representations. Under certain axiomatic hypotheses on B (namely that it is GK -regular [22, §1.4]), Fontaine showed that the functor DB : RepB (GK ) −→ {finite dim. F -vector spaces} is faithful [22, Prop. 1.5.2] (and moreover exact and compatible with tensor products). If the algebra B is equipped with additional structure, such as a grading, filtration, endomorphism, etc. compatible with the GK -action, then this structure is formally inherited by the vector space DB (V ); for example, if ϕ is an endomorphism of B which is Qp - and GK -linear, then ϕ ⊗ 1 defines an endomorphism of B ⊗Qp V and of DB (V ). In that case DB becomes a functor DB : RepB (GK ) −→ {finite dim. F -vector spaces with additional structure}, which we can hope is now fully faithful (since adding extra structure to vector spaces restricts the permitted morphisms). If so, and if we can identify the image of the functor, then we will have a purely linear algebraic description of the category of B-admissible p-adic Galois representations; this is a major goal of p-adic Hodge theory. Example 3.7. — 1. A p-adic Galois representation is said to be de Rham if it is BdR -admissible. Since BdR is a complete discrete valuation field, it is filtered by
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
552
M. MORROW
GK its valuation Filk BdR := {b ∈ BdR : νdR (b) ≥ k}. Moreover BdR = K [21, §1.5.7] and so Fontaine’s formalism provides a faithful functor
DdR : RepdR (GK ) −→ {finite dim. filtered K-vector spaces},
V 7→ (BdR ⊗Qp V )GK .
2. A p-adic Galois representation is said to be crystalline if it is Bcrys -admissible. Since Bcrys is equipped with the Frobenius endomorphism ϕ and is known to GK satisfy Bcrys = K0 [22, Prop. 5.1.2], Fontaine’s formalism yields a faithful functor Dcrys : Repcrys (GK ) −→ ϕ -ModK0 ,
V 7→ (Bcrys ⊗Qp V )GK .
Geometrically, de Rham (resp. crystalline) p-adic Galois representations arise from the étale cohomology of smooth p-adic varieties (resp. of good reduction). In these examples, although we have embedded de Rham and crystalline representations into linear algebraic categories, neither are the embeddings fully faithful nor have we identified the images; therefore we cannot claim to have yet provided a linear algebraic description of either class of p-adic Galois representations. Fontaine overcame this problem as follows by simultaneously taking both the filtration and Frobenius into account. Let ϕ -ModFilK/K0 denote the category of triples (D, ϕD , Fil• DK ) where D is a ' finite dimensional K0 -vector space, ϕD : D → D is a ϕ-linear isomorphism, and Fil• is a separated and exhaustive filtration on DK := D⊗K0 K; that is, (D, ϕD ) ∈ ϕ -ModK0 and (D, Fil• DK ) ∈ VectFilK/K0 . We define rank as usual and a degree by adding those on ϕ -ModK0 and VectFilK/K0 : rk(D, ϕD , Fil• DK ) := dimK0 D deg(D, ϕD , Fil• DK ) := deg(D, ϕD ) + deg(D, Fil• DK ). The resulting Harder-Narasimhan formalism on the category of filtered isocrystals ϕ -ModFilK/K0 encodes information about the interaction of the Frobenius and the filtration. If V is a crystalline Galois representation, then Fontaine’s formalism (and the inclusion of the period rings Bcrys ⊆ BdR ) implies that V is also de Rham and that DdR (V ) = Dcrys (V ) ⊗K0 K [22, §5.1.7]. Therefore combining the two parts of Example 3.7 upgrades Dcrys to a functor Dcrys : Repcrys (GK ) −→ ϕ -ModFilK/K0 . This can be shown moreover to be fully faithful by writing down an explicit left inverse Vcrys : ϕ -ModFilK/K0 −→ Repcrys (GK ) (D, ϕD , Fil• DK ) 7→ {v ∈ Bcrys ⊗K0 D : ϕ(v) = v and v ∈ Fil0 (BdR ⊗K DK )}
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
553
(this will gain a natural geometric interpretation in terms of the Fargues-Fontaine curve in the proof of Theorem 3.8). Fontaine conjectured that a filtered isocrystal was in the essential image of Dcrys if and only if it was weakly admissible [19, §5.2.6] [22, Conj. 5.4.4]; we do not reproduce Fontaine’s original definition of weakly admissible, but remark that in terms of the Harder-Narasimhan formalism on ϕ -ModFilK/K0 defined above, it is tautologically equivalent to asking that it be semi-stable and of slope zero. The “only if” direction in Fontaine’s conjecture is easy [22, Prop. 5.4.2]. Note that the resolution of the conjecture gives an equivalence of categories '
Dcrys : Repcrys (GK ) −→ ϕ -ModFilw.a. K/K0 , where w.a. denotes the full subcategory of weakly admissible filtered isocrystals. This indeed resolves a goal of p-adic Hodge theory by describing a large class of p-adic Galois representations purely in terms of linear algebraic data. Fontaine’s conjecture was proved first by Colmez-Fontaine in 2000 [8] and a different proof was given by Berger in 2008 [4, 5]. Both these papers contained important ideas which contributed to the discovery of the Fargues-Fontaine curve. Conversely, the Classification Theorem 3.4 of vector bundles on XFF provides a short conceptual proof of Fontaine’s conjecture: Theorem 3.8 (Colmez-Fontaine). — Fontaine’s above conjecture is true. Proof. — In § 3.2 we associated to any isocrystal (D, ϕD ) ∈ ϕ -ModQp a vector bundle • E (D, ϕD ) on X FF . More generally, given a filtered isocrystal D = (D, ϕD , Fil DK ) ∈ ϕ -ModFilK/K0 , it may be checked that ((Bcrys ⊗K0 D)ϕ=1 , Fil0 (BdR ⊗K DK )) is a (Be , νdR )-pair and hence defines a vector bundle E (D, ϕD , Fil• DK ) on XFF , of the same rank and degree as D. Now suppose that D is semi-stable of slope zero, i.e., weakly admissible, and put E := E (D, ϕD , Fil• DK ). Note that H 0 (XFF , E) = (Bcrys ⊗K0 D)ϕ=1 ∩ Fil0 (BdR ⊗K DK ) = Vcrys (D), where the first equality is a Čech cohomology calculation on the curve, and the second equality is by definition. This is the cohomological interpretation of Vcrys (D) which we mentioned earlier. Since D is semi-stable of slope zero, the vector bundle E is also: this is not completely automatic from Harder-Narasimhan formalism, but is not hard to check [7, Prop. 5.6(iii)]. Therefore Corollary 3.5 states that E is constant in the sense that '
H 0 (XFF , E) ⊗Qp OXFF −→ E,
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
554
M. MORROW
whence dimQp Vcrys (D) = dimK0 D. This equality of dimensions forces D to coincide with Dcrys (Vcrys (D)) [8, Prop. 4.5], which completes the proof. Remark 3.9. — More generally the above argument describes the category of semistable (12) p-adic Galois representations as weakly admissible filtered isocrystals with monodromy operator. This was also conjectured by Fontaine [21, §5.4.4] and proved first by Colmez-Fontaine. We refer the reader to Colmez’s preface [7, §5.2].
4. DIAMONDS, D’APRÈS SCHOLZE We now change direction slightly to give an introduction to Scholze’s theory of diamonds [31, 32] and the relation to the Fargues-Fontaine curve. This will require overviewing some aspects of the theory of adic and perfectoid spaces. 4.1. Huber pairs The theory of adic spaces, developed by Huber [26], is an approach to rigid analytic geometry, i.e., a theory of algebraic geometry in which topologies such as the p-adic topology are taken into account. The class of topological rings for which the theory works are the Huber rings: a topological ring R is called Huber if there exists an open subring R0 ⊆ R and a finitely generated ideal I of R0 such that the subspace topology on R0 is the I-adic topology. The possibilities R0 = R or I = 0 are not excluded. We stress that R0 and I are not part of the data: in general there are many choices. The easiest way to build a Huber ring is to start with a ring R0 and a non-zero-divisor π ∈ R0 , and to give R := R0 [ π1 ] the topology with basis f + π m R0 , for f ∈ R, m ≥ 0; such a Huber ring R is called a Tate ring. For example, given a field K topologised by a non-archimedean absolute value | · | : K → R≥0 , the rings K P and KhT i := { n≥0 an T n : an ∈ K, an → 0 as n → ∞} are Tate rings. Huber enriches the topology by specifying which elements of R should correspond to bounded functions: this enrichment takes the form of a chosen subring R+ ⊆ R which is open, integrally closed in R, and such that each element f ∈ R+ is “power-bounded” (i.e., the sequence f n does not tend to infinity as n → ∞). The pair R = (R, R+ ) is called a Huber pair, or a Tate-Huber pair if R is Tate. It is sometimes the case that R+ = R0 , but other times this is not even allowed (R0 might not be integrally closed); on the other hand there is always a largest possibility for R+ , namely the subring of all power-bounded elements of R. In the case of the field K of the previous paragraph, (12)
This use of “semi-stable” is completely unrelated to the semi-stable appearing in the HarderNarasimhan theory.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
555
one almost always takes K + = OK , and so writes K as shorthand for the Tate-Huber pair (K, OK ). We will be mainly interested in Tate-Huber pairs; (13) these are, in short, the “rings” which will underly our geometric objects (just as usual rings underlie schemes). A homomorphism of Tate-Huber pairs is a continuous map which restricts to the +-subrings. 4.2. Perfectoid pairs We say that a Tate-Huber pair S = (S, S + ) is perfect if S is topologically complete and is a perfect Fp -algebra (i.e., each element of S has a unique pth -root). Dropping the characteristic p assumption, a Tate-Huber pair T = (T, T + ) is said to be perfectoid [23, 29] if T is topologically complete and there exists an element π ∈ T + such that — the topology on T + is the π-adic topology; — p ∈ πp T + ; — given f ∈ T + there exists g ∈ T + such that f ≡ g p mod πT + . The hypotheses imply that T + (and hence T ) has many p-power roots. A Tate-Huber pair of characteristic p is perfectoid if and only if it is perfect [31, Prop. 3.5]. For example, if C (resp. F ) is a field as in (Pf0 ) (resp. (Pfp )), then (C, OC ) (resp. (F, OF )) is perfectoid. Moreover, the tilting formalism we have explained for fields in § 2.1 extends to perfectoid pairs: given a perfectoid Tate-Huber pair T = (T, T + ), its tilt T [ = (T [ , T +[ ) is a perfect Tate-Huber pair. Here the rings T [ and T +[ are defined exactly as we did for C in line (1), namely by equipping the set of compatible p-power sequences in T and T + with termwise multiplication and addition as in line (2). 4.3. Properties and examples of diamonds Just as any ring A gives rise to a scheme by taking its spectrum Spec(A) of prime ideals, any Tate-Huber pair R gives rise to a diamond spectrum Spd(R). Although we will not define the category of diamonds until § 4.4, we may nevertheless state some properties of this process (at the risk of oversimplifying the theory). Firstly, we warn the reader that the contravariant functor R 7→ Spd(R) loses information, unless we impose a suitable smoothness or perfectoid hypothesis: in particular, we will see that the contravariant functor (7)
Spd : Aff-Perf := {perfect Tate-Huber pairs} −→ {diamonds}
is fully faithful. (13)
For experts: we ignore the fact that the pair might not be sheafy.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
556
M. MORROW
Given a diamond X, its points with value in a perfect Tate-Huber pair S are the elements of the set X(S) := Homdiamonds (Spd(S), X). Such points provide a conservative family of test objects: a morphism f : X → Y of diamonds is an isomorphism if and only if X(S) → Y (S) is a bijection for all perfect Tate-Huber S. In particular, any diamond X is determined by its associated functor of points X(−) : Aff-Perf −→ Sets, and so we may use this perspective to completely describe some diamonds. For example, the functor of points associated to the diamond Spd(Qp ) := Spd(Qp , Zp ) will turn out to be S 7→ {equivalence classes of untilts of S}.
(8)
Similarly to § 2.1 for fields, here an untilt of S is a pair (T , ι) consisting of a perfectoid Tate-Huber pair T of characteristic zero (i.e., T ⊇ Qp ) and an isomorphism ' ι : S → T [ ; (14) the equivalence relation is as for fields. Since the category of diamonds has products we may form a new diamond Spd(Qp ) × Spd(Qp ), which was implicitly mentioned in the introduction: its S-points are pairs of untilts of S. More generally, given any Tate-Huber pair R = (R, R+ ), we may look at untilts over R of S: by definition such an untilt is a triple (T , ι, f ) consisting of a perfectoid ' Tate-Huber pair T , an isomorphism ι : S → T [ , and a homomorphism f : R → T . The notion of equivalence is the obvious one. The functor of points associated to Spd(R) is precisely S 7→ {equivalence classes of untilts over R of S}. Using this we can check the following: given any perfectoid Tate-Huber T , then there is a natural identification of diamonds Spd(T ) = Spd(T [ ). Indeed, in light of the above description of these diamonds, this follows from the following tilting equivalence: Proposition 4.1 (Scholze [29, Th. 5.2 & Lem. 6.2]). — Let T be a perfectoid TateHuber pair. Then tilting induces an equivalence of categories '
{perfectoid Tate-Huber pairs over T } → {perfect Tate-Huber pairs over T [ } Proof. — We stress that this is one of the easier tilting equivalences in the theory: it is essentially proved by repeating the arguments of Proposition 5.1 after replacing W (OC [ ) by W (T + ). See [29] [31, §3] for details. (14)
As in § 2.1, we abusively abbreviate “untilt of characteristic zero” to “untilt”.
ASTÉRISQUE 414
(1150)
557
THE FARGUES-FONTAINE CURVE AND DIAMONDS
Any algebraic variety X over Qp gives rise to a diamond X . Indeed, X is built from the spectra of various Qp -algebras, from which one may build Tate-Huber pairs via a p-adic completion process, then glue the associated diamond spectra. The process X 7→ X should be viewed as a generalization of tilting, which now applies to finite-type objects such as varieties, whereas tilting itself only applies to (large) perfectoid objects. Moreover, this process does not lose any information under suitable hypotheses: (15) Proposition 4.2 (Scholze [31, Prop. 10.2.4] + GAGA). — The ification functor
above
{proper smooth varieties over Qp } −→ {diamonds over Spd Qp },
diamondX 7→ X
is fully faithful. Remark 4.3. — The theory of diamonds also contains geometric objects which do not + -affine Grassmannian. We arise from varieties. One of the most important is the BdR restrict to the case of GLn , although the following discussion continues to work for other algebraic groups. It is known classically that the quotient GLn (C((t)))/ GLn (C[[t]]), which classifies C[[t]]-lattices inside C((t))n , admits the structure of an ind complex analytic space; alternatively, from an algebraic point of view, the functor (9)
C -Algs 3 A 7→ GLn (A((t)))/ GLn (A[[t]]) = {A[[t]]-lattices inside A((t))}
is represented by an ind projective scheme. This geometric object is known as the affine Grassmannian and is fundamental in the geometric Langlands programme [3, 28] (notably in the geometric Satake correspondence). In p-adic arithmetic geometry the analogs of C((t)) and C[[t]] are BdR and + BdR , as we have seen in § 2.2, and therefore one considers instead the quotient + + n ), which classifies BdR . Recall that BdR GLn (BdR )/ GLn (BdR -lattices inside BdR + and BdR implicitly depend on both F and a chosen untilt (C, ι). More generally, given any perfect Tate-Huber pair S and chosen untilt over C (i.e., morphism Spd(S) → Spd(C)), it is possible to define analogs of these de Rham period rings and (15)
For experts, let us explain what is really true. Firstly, we may replace Qp by any complete extension K. Then any rigid analytic variety X over K admits a diamond-ification X ∈ Diam, and the functor {seminormal rigid analytic varieties over K} −→ {diamonds over Spd K},
X 7→ X
is fully faithful. The seminormality hypothesis is a necessary consequence of the fact that all perfectoid rings are seminormal and so cannot detect the difference between a ring and its seminormalization. To obtain the proposition we restrict to the proper smooth case and apply GAGA.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
558
M. MORROW
therefore an analog of (9) on the category of perfect Tate-Huber pairs over Spd(C). + This so-called BdR -affine Grassmannian is an ind diamond [32, §19] which is expected to appear in the arithmetic Satake correspondence. 4.4. Definition of diamonds via adic spaces As we mentioned in § 4.1, Huber pairs are the building blocks of Huber’s approach to rigid analytic geometry. More precisely, to each Huber pair R = (R, R+ ) one associates its adic spectrum Spa(R), which is a topological space of continuous absolute values | · | on R such that |f | ≤ 1 for all f ∈ R+ . Such valuations arise from choosing a prime ideal p ⊆ R and writing down an absolute value on the fraction field of R/p; since the trivial absolute value is allowed, we see that Spa(R) is a refinement of Spec(R) by taking into account the topology on R and the boundedness of R+ . Just as varieties and schemes are built by gluing together the spectra of rings, adic spaces are built by gluing together the adic spectra of Huber pairs. As for schemes, there is a robust theory of étale cohomology for adic spaces, due to Huber under suitable finiteness hypotheses [26] and to Scholze in greater generality [31]. A perfectoid space is an adic space built by gluing the adic spectra of perfectoid Tate-Huber pairs. It can be shown (though it is somewhat technical [31, §6]) that the tilting process T 7→ T [ is compatible with gluing; therefore one may associate to any perfectoid space Z its tilt Z [ , which is a perfectoid space of characteristic p (i.e., an adic space built by gluing the adic spectra of perfect Tate-Huber pairs). Since perfectoid spaces are rather large, it is better to replace the étale topology by a pro-étale variant [31, §8], in which infinite limits of étale covers are allowed. Scholze uses this pro-étale topology on perfectoid spaces to define diamonds as follows: Definition 4.4 (Scholze [31, Def. 11.1] [32, §8]). — Let Perf denote the site of perfectoid spaces of characteristic p equipped with the pro-étale topology. A diamond X is a sheaf of sets on Perf of the form X = Z/R , where Z, R ∈ Perf and R ,→ Z × Z is a equivalence relation such that the two projection morphisms R → Z are pro-étale. (Here we identify Z with the sheaf HomPerf (−, Z) on Perf, and similarly for R .) In short, a diamond X is an algebraic space for the site Perf. Informally, X is obtained by gluing perfectoid spaces of characteristic p along pro-étale overlaps. To relate this definition to the discussion in § 4.3, the key is to check the following, in which we globalize in the obvious way the notion of “untilts over”: Proposition 4.5 (Scholze [31, Prop. 15.4]). — Let R be a Tate-Huber pair. Then Spd(R) : Perf −→ Sets,
Z 7→ {equivalence classes of untilts over Spa(R) of Z}
is a diamond in the sense of Definition 4.4.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
559
Proof. — By adding to R many p-power roots of elements it is possible to construct a perfectoid-isation R∞ of R, such that the resulting map of adic spectra Spa(R∞ ) → Spa(R) is a pro-étale cover [31, Prop. 15.4]. Proposition 4.1 then shows that Spd(R), as defined in the statement of the current proposition, is a quotient of the representable sheaf HomPerf (−, Spa(R[∞ )). It remains to check that we are quotienting by a pro-étale equivalence relation, which Scholze does by establishing various general results about pro-étale torsors. More generally, Proposition 4.5 associates a diamond X to any analytic adic space X, given by X : Perf −→ Sets,
Z 7→ {equivalence classes of untilts over X of Z}.
Here “analytic” means that that X is built from Tate-Huber pairs, not general Huber pairs, so Proposition 4.5 may be glued to define X . As already mentioned in § 4.3, the diamond X should be viewed as a generalized tilt of X. We now invite the reader to return to § 4.3 with the definition of diamonds and check some of the claims we made there. For example, the fully faithful embedding of line (7) is simply Spa : Aff-Perf ,→ Perf followed by the Yoneda embedding, while the functor of points view is valid since diamonds are by definition sheaves on Perf. In [31], Scholze puts diamonds on a firm geometric and cohomological footing by establishing a theory of étale cohomology, including a six functor formalism. The theory of diamonds is part of the framework in which Fargues and Scholze carry out their work on the local Langlands correspondence [18, 32]. 4.5. The Fargues-Fontaine curve as a diamond We now return to the Fargues-Fontaine curve XFF = XFFF associated to the field F as in (Pfp ). The appearance of topologies, convergent series, etc. in the construction of XFF from § 5 is a reflection of the fact that there exists a closely related adic space X FF , known as the adic Fargues-Fontaine curve [12]. To construct it, let Y be the adic space obtained by removing the vanishing loci of the elements p, [π] ∈ Ainf from Spa(Ainf , Ainf ). Here Ainf is defined in § 5.1, π is an arbitrary non-zero element of mF , and the topology on Ainf is the (p, [π])-adic topology. Just as we will see for the topological space |Y | in § 5.2, the Frobenius on Ainf induces a totally discontinuous Frobenius action on Y , and so X FF := Y /ϕZ is a well-defined adic space. Thus the adic Fargues-Fontaine curve may be defined relatively quickly. There is a morphism of ringed spaces X FF → XFF under which X FF behaves like an analytification of the scheme XFF . In particular, a GAGA theorem asserts that the two spaces have the same vector bundles and cohomology [27, Th. 8.7.7] [12, Th. 3.5].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
560
M. MORROW
As explained in § 4.4, there is then a diamond X FF associated to the adic FarguesFontaine curve. This turns out to have a beautifully simple description in terms of the diamond spectra of our fields: Theorem 4.6 (Scholze [31, §15.2.6]). — There are natural isomorphisms of diamonds FF ∼ Y ∼ X = Spd(F ) × Spd(Qp ), = Spd(F )/ϕZ × Spd(Qp ). Proof. — We will sketch the first isomorphism, the second then being obtained by modding out by the Frobenius action on F . According to the functor of points perspective explained in § 4.3, we must show that Y and Spd(F )×Spd(Qp ) naturally have the same S-points for all perfect Tate-Huber pairs S. We calculate these points: — By the full faithfullness of (7), an S-point of Spd(F ) is simply a morphism of Tate-Huber pairs f : (F, OF ) → (S, S + ). — By (8), an S-point of Spd(Qp ) is an untilt (T , ι) of S. — Using the definitions of YF and the diamond-ification process, it can be shown that an S-point of Y is an untilt (T , ι) of S together with a continuous homomorphism 1 Ainf → T + which extends to Ainf [ p1 , [π] ] → T (see the proof of [32, Prop. 11.2.1]). Therefore, to produce a map of diamonds Spd(F ) × Spd(Qp ) → Y we should show, given any morphism f : (F, OF ) → (S, S + ) and untilt (T , ι) of S, how to produce a 1 ] → T . For natural continuous homomorphism Ainf → T + which extends to Ainf [ p1 , [π] this homomorphism we take θ
T Ainf = W (OF ) −→ W (S + ) ∼ = W (T +[ ) −−→ T + ,
where the first arrow is induced by f , the isomorphism is induced by ι, and the θ map is a generalization of Fontaine’s map from Proposition 5.1. (Indeed, this whole construction is essentially the same argument as Proposition 5.1, but now phrased in the diamond language.) Conversely, every such homomorphism Ainf → T + can be constructed in this way (by a universal property of Witt vectors), which means that the map of diamonds is an isomorphism. Throughout this text we focus on the Fargues-Fontaine curve associated to a field F with properties (Pfp ); in fact, Fargues and Fontaine work more generally with the condition “F is perfect” rather than “F is algebraically closed”. Using perfectoid spaces and diamonds much more possible: there exists a Fargues-Fontaine “relative curve over Z” XZFF = YZ /ϕZ associated to any perfectoid space Z of characteristic p. The objects YZ and XZFF are again adic spaces, whose associated diamonds satisfy the analogous formulae of the previous proposition [32, §11.2 & §15.2].
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
561
5. CONSTRUCTION OF THE CURVE We now turn to the actual construction of the Fargues-Fontaine curve and to sketching the main theorems stated in § 2. As already mentioned, Fargues and Fontaine do not do this in terms of the classical period rings of § 2.2–2.3, but instead adopt the point of view of § 2.1 that the curve should be an enrichment of a space of untilts; they therefore introduce and study various rings of “holomorphic functions in p” on the spaces of untilts |Y | and |Y |/ϕZ . We have fixed a field F as in (Pfp ) and drop the subscript F from our notation wherever possible (including from the forthcoming rings Ainf , B b+ , B b , B + , B, all of which depend on F ). 5.1. The infinitesimal period ring Ainf We begin by recalling some theory of Witt vectors [33, §6]. Let W (F ) be the ring of p-typical Witt vectors of the field F : each element of W (F ) may be written uniquely as a sequence (α0 , α1 , . . . ), where αi ∈ F , and addition and multiplication are given by certain universal polynomials such as p−1 Ç å X 1 p i p−i (α0 , α1 , α2 , . . . ) + (β0 , β1 , β2 , . . . ) = (α0 + β0 , α1 + β1 − α0 β0 , . . . ) p i i=1 (α0 , α1 , α2 , . . . ) · (β0 , β1 , β2 , . . . ) = (α0 β0 , α0p β0 + β0p α1 + pα1 β1 , . . . ). The fact that F is a perfect field of characteristic p means that its Witt vectors are well-understood: W (F ) is a complete discrete valuation ring such that W (F )/pW (F ) = F . Any element of W (F ) may be expressed uniquely as a p-adically 2 P convergent sum n≥0 [αn ]pn = (α0 , α1p , α2p , . . . ) for some coefficients αn ∈ F ; here [α] := (α, 0, 0, 0, · · · ) denotes the Teichmüller lift of an element α ∈ F . We will in fact be more interested in the Witt vectors Ainf := W (OF ) of the ring P n of integers OF ; this is the subring Ainf ⊆ W (F ) consisting of series n≥0 [αn ]p such that all the coefficients αn belong to OF . The ring Ainf is known as the infinitesimal period ring, sometimes denoted by A or Ainf , and may be characterized as the unique p-complete and p-torsion-free ring such that Ainf /pAinf = OF [33, §II.5– II.6]. It is a foundational building block of Fontaine’s various p-adic period rings and of the Fargues-Fontaine curve. Although Ainf is a “large” ring (in particular, nonNoetherian), it is sufficiently explicit to be amenable. P An element ξ = n≥0 [αn ]pn ∈ Ainf is said to be primitive if α0 6= 0 and there exists k ≥ 0 such that αk ∈ OF× ; the smallest such k is called the degree of ξ. Let Primk ⊆ Ainf denote the set of primitive elements of degree k. It is easy to see that Prim0 = A× inf and that Primk · Priml ⊆ Primk+l ; in particular, if a principal ideal I ⊆ Ainf can be generated by a primitive element of degree k, then any generator of I is a primitive
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
562
M. MORROW
element of degree k. Primitive elements of degree one play an important role thanks to the following correspondence, which identifies the set |Y | as part of the prime ideal spectrum of Ainf and is a provisional form of Theorem 2.3. Proposition 5.1 ([27, Th. 3.6.5] [23, Prop. 1.1.1]). — There is a natural bijective correspondence between |Y | (i.e., equivalence classes of untilts of F ) and the set of ideals of Ainf generated by a primitive element of degree one. Proof. — Let us explain here how the correspondence is defined and give some notation which will be needed in the rest of the section. See [17, §2.2] for further details. Given a field C satisfying (Pf0 ), there is a distinguished surjective homomorphism θC : W (OC [ ) → OC which plays an important role throughout p-adic Hodge theory. It was introduced by Fontaine as X X θC : W (OC [ ) −→ OC , [αn ]pn 7→ αn# pn , n≥0
n≥0
where αn ∈ OC [ and # is the untilting map from § 2.1. The difficulty is to verify that θC is a ring homomorphism, which is done by examining the explicit rules for addition and multiplication in Witt vectors, or by judicious use of universal properties. The kernel Ker θC is a principal ideal of W (OC [ ) generated by p−[p[ ] (where p[ ∈ C [ is the element from Example 2.1), which is manifestly primitive of degree one in W (OC [ ). Changing the point of view, now suppose that y = (Cy , ιy ) is an untilt of F , i.e., a point of |Y |. Then the previous paragraph yields a surjective homomorphism θC θy : Ainf = W (OF ) ∼ = W (OC [ ) −−→ OC '
(where the isomorphism is induced by ιy : F → C [ ) with kernel py := Ker θy generated by a primitive element of degree one; such a generator is often denoted by ξy , which [ the previous paragraph shows may be taken to be p−[ι−1 y (p )]. This defines the desired correspondence |Y | −→ {ideals generated by a primitive element of degree one},
y 7→ py = Ker θy .
To prove that this is a bijection, one checks directly that if p ⊆ Ainf is an ideal generated by a primitive element of degree one, then (Ainf /p)[ p1 ] is indeed a field as in (Pf0 ) which untilts F . The proposition has two immediate consequences. Firstly, it means that elements of Ainf define functions on |Y |, with varying field of value in the usual sense of algebraic geometry: namely, given f ∈ Ainf and y ∈ |Y |, we may write f (y) := θy (f ) ∈ OCy . Strangely, p should be viewed as a variable. Secondly, Fargues and Fontaine use the proposition to equip the set |Y | with a topological structure [17, §2.3]. Given ideals I, J ⊆ Ainf , define the distance d(I, J)
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
563
between them to be the smallest ρ ∈ [0, 1] such that I + aρ = J + aρ , where aρ := {f ∈ Ainf : |f mod p|F ≤ ρ} ⊆ Ainf . Restricted to ideals generated by a primitive element of degree one, it is easy to check that d(−, −) is an ultrametric distance function and so turns |Y | into an ultrametric space. Moreover, the space |Y | resembles a punctured open disk in the following sense: given y ∈ |Y | with corresponding ideal py , define its distance to the origin to be r(y) := d(py , 0). This defines a continuous map r : |Y | −→ (0, 1) such that |Yρ | := {y ∈ |Y | : r(y) ≥ ρ} is complete (under the above distance function d) for any ρ > 0. Exploiting this geometric perspective on |Y |, Fargues and Fontaine establish the following preliminary form of Theorem 2.9: Theorem 5.2 (Fargues-Fontaine [17, Th. 2.4.1]). — Let f ∈ Ainf be a primitive element of degree k ≥ 1. Then there exist primitive elements ξ1 , . . . , ξk ∈ Ainf of degree one such that f = ξ1 · · · ξk . Corollary 5.3 (Weierstrass factorisation for Ainf ). — Let f ∈ Ainf be a primitive element of degree k ≥ 1. Then there exist non-zero x1 , . . . , xk ∈ mF and a unit u ∈ A× inf such that f = u(p − [x1 ]) · · · (p − [xk ]). Proofs. — The corollary is obtained from the theorem by recalling that any primitive element of degree one can be written up to unit as p − [x] for some non-zero x ∈ mF (as we saw in the proof of Proposition 5.1) To prove the theorem it suffices to show that f , viewed as a function on |Y |, has a zero. Indeed, given y ∈ |Y | such that f (y) = 0, this means precisely that f is divisible by any generator ξy of py ; writing f = gξy with g ∈ Ainf , one sees that g is necessarily primitive of degree k − 1 and then proceeds by induction on k. It remains to show that f has a zero, which is a key result in the theory. Write P f = n≥0 [αn ]pn and let Newt(f ) denote the decreasing Newton polygon in R2 associated to the points (n, − logp |αn |F )n≥0 . If f can be written as in the corollary, then the valuations of the elements xi are precisely the slopes of Newt(f ). Conversely, Fargues and Fontaine use the slopes of Newt(f ) to find approximate zeros, eventually taking the limit in |Y | (using that each |Yρ | is complete) to construct an actual zero of f . The appearance of Newton polygons in the previous sketch is not isolated: it is the main technique which Fargues and Fontaine use to analyse elements of Ainf and of the forthcoming rings B b+ , B b , B + , B.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
564
M. MORROW
5.2. Holomorphic functions on |Y | in the variable p As we have just seen in § 5.1, it is helpful to view Ainf as functions on the topological space |Y |. Fargues and Fontaine substantially develop this point of view by introducing further rings of functions B b+ , B b , B + , B on |Y | as follows. These will fit together as in the following diagram, in which we have also included the period rings for convenience:
Bb
⊇ ⊆ B = “functions on |Y |”
Bcrys
⊇
+ ⊆ BdR
⊆ BdR
⊆
W (F )[ p1 ] ⊇
+ ⊆ Bcrys
⊇
⊆ B + = “bounded functions on |Y |”
⊇
⊆ B b+
⊇
Ainf
Be . We begin by defining the incomplete rings of functions B b+ and B b : ( ) X b+ n 1 B := Ainf [ p ] = [αn ]p : αn ∈ OF ⊇
n−∞
( b
B :=
1 Ainf [ p1 , [π] ]
=
) X
n
[αn ]p : αn ∈ F, |αn |F is bounded as n → ∞ ,
n−∞
(where π is an arbitrary non-zero element of mF ). For any y ∈ |Y |, it is easy to check that the homomorphism θy : Ainf → OCy extends to θy : B b → Cy (but not all the way to W (F )[ p1 ]), and therefore we may think of B b+ and B b as rings as function on |Y | via f (y) := θy (f ). With this in mind we introduce the Gauss norms X || · ||ρ : B b → R≥0 , || [αn ]pn ||ρ := sup |αn |ρn n−∞
n
for all ρ ∈ (0, 1). These norms are multiplicative (this is rather subtle and is a novel observation of Fargues and Fontaine [17, Prop. 1.4.9]) and satisfy the maximum modulus principle that || · ||ρ ≤ max{|| · ||ρ1 , || · ||ρ2 } whenever 0 < ρ1 ≤ ρ ≤ ρ2 < 1. Let B + and B be the Fréchet Qp -algebras obtained by completing B b+ and B b with respect to this family of norms. Given y ∈ |Y |, the homomorphism θy : B b → Cy is continuous with respect to the Gauss norm || · ||r(y) and therefore again extends to a continuous homomorphism θy : B → Cy ; this shows that B + and B may also be viewed as rings of functions on |Y |, and also that py B is a closed maximal ideal of B equal to {f ∈ B : f (y) = 0}.
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
565
In fact B is the largest reasonable ring of continuous functions on |Y |, in the sense that its spectrum of closed maximal ideals identifies with |Y | (this also provides an intrinsic definition of |Y | without reference to primitive elements): Proposition 5.4 (Fargues-Fontaine [17, Cor. 2.5.4]). — The association y 7→ py B defines a bijection between |Y | and the set of closed maximal ideals of B. Proof. — This results from a finer statement about rings BI : here I is a compact interval of (0, 1) and BI is defined to be the completion of B b with respect to the Gauss norms || · ||ρ for ρ ∈ I. If I = [ρ1 , ρ2 ] then the maximum modulus principle shows that it is sufficient to complete with respect to max{|| · ||ρ1 , || · ||ρ2 }, and thus BI is a Qp -Banach algebra. Note that, by definition, we have B = limI BI , where I ←− varies over all compact intervals of (0, 1). The same argument as immediately before the proposition shows that py BI is a maximal ideal of BI for each y ∈ |Y | such that r(y) ∈ I. Fargues and Fontaine show that this association identifies the “closed annulus” |YI | := {y ∈ |Y | : r(y) ∈ I} with the set of maximal ideals of BI , and that moreover BI is a principal ideal domain. To do this, they write a typical element f ∈ BI as a limit f = limn→∞ fn of elements fn ∈ B b and then argue similarly to the proof of Theorem 5.2: namely, an examination of the Newton polygons of the fn allows them to construct a factor of f of the form p − [x] for some x ∈ mF such that |x|F ∈ I. Since the Newton polygon of f itself has only finitely many slopes (this is the crucial application of I being compact), this process may be repeated finitely many times to factor f into a product of primitive elements of degree one, which proves all the claims about BI . The assertion about B itself then follows by taking the limit over all compact intervals I ⊆ (0, 1). The previous proof also shows that |Y | is a curve in a certain sense : it is the increasing union of the subspaces |YI |, each of which identifies with the maximal ideal spectrum of a principal ideal domain BI . The fact that BI is a principal ideal domain also implies that its non-zero ideals, as a monoid under multiplication, is isomorphic P to Div+ (YI ); here Div+ (YI ) denotes the monoid of formal finite sums y∈|YI | ny [y] with ny ∈ N. Taking the limit over all compact intervals yields a description of the monoid of the non-zero closed ideals of B. To state it, Fargues and Fontaine introduce Div+ (Y ) = limI Div(YI ); in other words, Div+ (Y ) is the monoid of formal ←− P sums y∈|Y | ny [y] with ny ∈ N satisfying the following finiteness condition: for any compact interval I ⊆ (0, 1), the support {y ∈ |YI | : ny 6= 0} is finite. Taking the limit obtains: Corollary 5.5. — Div+ (Y ) is isomorphic to the monoid of non-zero closed ideals of B under multiplication.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
566
M. MORROW
To explicitly write the isomorphism of the previous corollary, let ordy : B → N ∪ {∞} be the discrete valuation associated to any y ∈ |Y |: indeed, we know that py B is a maximal ideal of B generated by a single element (namely the primitive element of degree one generating py ), whence Bpy B is a discrete valuation ring and so ordy is well-defined. The correspondence of the previous corollary is then given by '
Div+ (Y ) → {closed ideals of B} X ny [y] 7→ {f ∈ B : ordy (f ) ≥ ny for all y ∈ |Y |}. y∈|Y |
Alternatively, note that each non-zero f ∈ B defines a divisor X div(f ) := ordy (f )[y] ∈ Div+ (Y ), y∈|Y |
and then the previous correspondence may be rewritten D 7→ {f ∈ B : div(f ) ≥ D}. At this stage we have a good understanding of |Y | and of its ring of functions B. To construct the Fargues-Fontaine curve we must pass to |Y |/ϕZ by taking the Frobenius ϕ into account. Recall from § 2.1 that ϕ acts on |Y | by sending an untilt (C, ι) to (C, ι ◦ ϕ), where the latter ϕ denotes the absolute Frobenius automorphism of F . On the algebraic side Ainf also possesses a Frobenius automorphism, given P P by ϕ( n≥0 [αn ]pn ) := n≥0 [αnp ]pn ; this is easily seen to extend to automorphisms '
of B b+ , B b , B + and B, and to induce isomorphisms ϕ : B[ρ1 ,ρ2 ] → B[ρp1 ,ρp2 ] [17, §1.6.1]. An element ξ ∈ Ainf is primitive of degree one if and only if ϕ−1 (ξ) is, thereby inducing an automorphism ϕ of the set of ideals generated by a primitive element of degree one, which is compatible with the correspondence of Proposition 5.1. The action of ϕ on |Y | satisfies d(ϕ(y1 ), ϕ(y2 )) = d(y1 , y2 )1/p and r(ϕ(y)) = r(y)1/p ; in particular, the action of the group ϕZ on the topological space |Y | is properly discontinuous, whence the quotient |Y |/ϕZ inherits the structure of a Hausdorff space for which the quotient map π : |Y | → |Y |/ϕZ is a local homeomorphism. This also shows that Div+ (Y /ϕZ ), the monoid of formal finite sums of points of |Y |/ϕZ , identifies with {D ∈ Div+ (Y ) : ϕ∗ D = D} via the pull-back X X (10) Div+ (Y /ϕZ ) ,→ Div+ (Y ), ny [y] 7→ nπ(y) [y] y∈|Y |/ϕZ
y∈|Y |
[17, Lem. 6.2.3]. Using this identification, one clearly has div(f ) ∈ Div+ (Y /ϕZ ) for k any non-zero f ∈ B ϕ=p , thereby giving rise to a morphism of monoids G k div : (B \ {0})ϕ=p −→ Div+ (Y /ϕZ ). k≥0
ASTÉRISQUE 414
(1150)
THE FARGUES-FONTAINE CURVE AND DIAMONDS
567
Fargues and Fontaine establish the following fundamental isomorphism relating such Frobenius eigenspaces of B to the space |Y |/ϕZ ; from this we will easily construct the curve XFF and deduce its main properties in § 5.3. Theorem 5.6 (Fargues-Fontaine [17, Th. 6.2.1]). — The morphism of monoids G k + Z div : ( (B \ {0})ϕ=p )/Q× p −→ Div (Y /ϕ ) k≥0
is an isomorphism. Proof. — We first prove injectivity. Given non-zero f, g ∈ B with div(f ) = div(g) ∈ Div+ (Y ), projecting to Div+ (YI ) (which we have seen is isomorphic to the monoid of non-zero ideals of the principal ideal domain BI ) shows that the images of f, g in BI differ by a (unique) unit; this being true for every compact interval I, taking the limit k k0 implies there is u ∈ B × such that f = gu. If moreover f ∈ B ϕ=p and g ∈ B ϕ=p k−k0 then u ∈ B ϕ=p . But Newton polygon arguments show that ( 0 Qp k 0 = k ϕ=pk−k B = 0 k0 > k [17, Prop. 4.1.1, Prop. 4.1.2]. Next we explain the proof of surjectivity. Identifying Div+ (Y /ϕZ ) with a submonoid of Div+ (Y ) as in (10), we see that Div+ (Y /ϕZ ) is generated by its elements of the P form n∈Z [ϕn (y)], for y ∈ |Y |. Therefore it is enough, given any y ∈ |Y |, to find P ty ∈ B ϕ=p satisfying div(ty ) = n∈Z [ϕn (y)], i.e., a function ty with a simple zero at each ϕZ -translate of y and no other zeros or poles. Let ξy = p − [x] ∈ Ainf be a primitive element of degree one corresponding to y, where x ∈ mF . Consider first the infinite product Π+ (ξy ) :=
Y n≥0
ϕn (
ξy p )
=
Y
n
(1 −
[xp ] p ).
n≥0
This product converges in B + and satisfies ξy ϕ(Π+ (ξy )) = pΠ+ (ξy ) and div(Π+ (ξy )) = P n st roots in F n≥0 [ϕ (y)]. Secondly, the existence of Artin-Schreier roots and p − 1 b implies that, given any g ∈ B , the equation ϕ(T ) = gT has a non-zero solution in B b [17, Prop. 6.2.0]; in particular there exists a non-zero element Π− (ξy ) ∈ B b satisfying ϕ(Π− (ξy )) = ξy Π− (ξy ), which can be checked to satisfy automatiP cally div(Π− (ξy )) = 6.2.12]. In conclusion, the element n