192 53 15MB
English; French Pages 584 [602] Year 2019
407
ASTÉRISQUE
XXXXXXXXXXFIRSTPAGEXXXXXXXXXX
2019
SÉMINAIRE BOURBAKI VOLUME 2016/2017 EXPOSÉS 1120–1135
SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE
Astérisque est un périodique de la Société Mathématique de France. Numéro 407
Comité de rédaction Marie-Claude Arnaud
Fanny Kassel
Christophe Breuil
Alexandru Oancea
Damien Calaque
Nicolas Ressayre
Philippe Eyssidieux
Sylvia Serfaty
Nicolas Burq (dir.) Diffusion Maison de la SMF Case 916 - Luminy 13288 Marseille Cedex 9 France [email protected]
AMS P.O. Box 6248 Providence RI 02940 USA http://www.ams.org
Tarifs Vente au numéro: 70 e ($ 105) Abonnement Europe: 665 e, hors Europe: 718 e ($ 1 077) Des conditions spéciales sont accordées aux membres de la SMF. Secrétariat Astérisque Société Mathématique de France Institut Henri Poincaré, 11, rue Pierre et Marie Curie 75231 Paris Cedex 05, France Fax: (33) 01 40 46 90 96 [email protected]
•
http://smf.emath.fr/
© Société Mathématique de France 2019 Tous droits réservés (article L 122–4 du Code de la propriété intellectuelle). Toute représentation ou reproduction intégrale ou partielle faite sans le consentement de l’éditeur est illicite. Cette représentation ou reproduction par quelque procédé que ce soit constituerait une contrefaçon sanctionnée par les articles L 335–2 et suivants du CPI.
ISSN: 0303-1179 (print) 2492-5926 (electronic) ISBN 978-2-85629-897-8 doi:10.24033/ast.1057 Directeur de la publication: Stéphane Seuret
407
ASTÉRISQUE 2019
SÉMINAIRE BOURBAKI VOLUME 2016/2017 EXPOSÉS 1120–1135
SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE
Association des collaborateurs de Nicolas Bourbaki. École normale supérieure, 45, rue d’Ulm, F-75230 Paris Cedex 05. URL : http://www.bourbaki.ens.fr
Mots-clefs et classification mathématique par sujets (2000) Exposé no 1120. — General relativistic Cauchy problem, general relativistic constraint equations — 83C05. Exposé no 1121. — Nœud, nœud trivial, entrelac, mouvement de Reidemeister, surface normale, présentation par arcs — 57M25, 57N10, 68Q25. Exposé no 1122. — Positivité au sens de Nakano, métrique de Bergman, conjecture d’ouverture, métriques de Kähler-Einstein, théorème de Bando-Mabuchi — 32L20, 32Q20, 32L15. Exposé no 1123. — Rationalité, décomposition de Chow de la diagonale — 14E08, (14C15, 14D06). Exposé no 1124. — Mesures gaussiennes, corrélation positive, lois gamma multivariées — 60E15, 60G15. Exposé no 1125. — Isomorphismes de graphes, isomorphismes de chaînes, configurations cohérentes, designs [sic] combinatoires — 68Q25, 68R10, 20B25, 20B15, 05E18. Exposé no 1126. — Operad, deformation theory, deformation quantization, multiple zeta values, graph complex — 18D50, 14D15, 11M32, 53D55. Exposé no 1127. — Inégalités géométriques, isopérimétrie, courbure de Ricci, entropie, transport optimal, analyse non lisse, géométrie synthétique — 53C23, 49Q05, 53C21. Exposé no 1128. — D-modules holonomes, ind-faisceaux, cohomologie modérée — 32C38, 32S60, 18E35. Exposé no 1129. — Équation de Yang-Baxter, groupes quantiques, opérateurs d’entrelacement, géométrie symplectique, cohomologie équivariante, enveloppes stables, algèbres affines quantiques, catégorification, algèbres amassées, systèmes intégrables quantiques — 17B37, 13F60, 17B10, 82B23, 81R50, 53D05. Exposé no 1130. — Geometric hypoelliptic Laplacian, orbital integrals, Selberg trace formula, dynamical zeta functions, index theory and related fixed point theorems, analytic torsion, hypoelliptic equations, Hodge theory — 11F72, 58J20, 11M36, 35H10, 58J52, 58J65, 37C30. Exposé no 1131. — Structures de contact, h-principe, topologie symplectique — 57R17, 53D15. Exposé no 1132. — Graphes expanseurs, variétés hyperboliques, nœuds — 53C23. Exposé no 1133. — Empilements de sphères, réseau E8 , réseau de Leech, formes quasi-modulaires — 52C17; 11H31, 90B80. Exposé no 1134. — Vinogradov Mean Value Theorem, decoupling, efficient congruencing, restriction, Kakeya, Hardy-Littlewood circle method, Waring’s problem — 11L15, 11L07, 11P55. Exposé no 1135. — Fluides compressibles, viscosité dégénérée, construction de solutions faibles globales — 35A01, 35D30, 35Q30.
SÉMINAIRE BOURBAKI VOLUME 2016/2017 EXPOSÉS 1120-1135
Résumé. — Ce 69e volume du Séminaire Bourbaki contient les textes des quinze exposés de survol présentés pendant l’année 2016/2017 : correspondance de Langlands, empilements de sphères, entropie sofique, équation de Navier-Stokes, géométrie algébrique et géométrie analytique complexe, géométrie sous-riemannienne, problèmes de modules formels, propriété NIP en théorie des modèles, questions algorithmiques et géométriques en théorie des nœuds, relativité générale, théorie analytique des nombres. Abstract (Séminaire Bourbaki, volume 2016/2017, exposés 1120–1135) This 69th volume of the Bourbaki Seminar contains the texts of the fifteen survey lectures done during the year 2016/2017. Topics addressed covered Langlands correspondence, NIP property in model theory, Navier–Stokes equation, algebraic and complex analytic geometry, algorithmic and geometric questions in knot theory, analytic number theory formal moduli problems, general relativity, sofic entropy, sphere packings, subriemannian geometry.
© Astérisque 407, SMF 2019
TABLE DES MATIÈRES
Résumés des exposés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
v
vii
NOVEMBRE 2016 1120 1121 1122 1123
Piotr T. CHRUŚCIEL — Anti-gravity à la Carlotto-Schoen (after Carlotto and Schoen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
Arnaud de MESMAY — Nœuds, mouvements de Reidemeister et algorithmes (d’après Lackenby) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
27
Mihai PĂUN — Positivité des images directes et applications (d’après Bo Berndtsson) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
Emmanuel PEYRE — Progrès en irrationalité . . . . . . . . . . . . . . . . . . . .
91
JANVIER 2017 1124 1125 1126 1127
Franck BARTHE — L’inégalité de corrélation gaussienne (d’après Thomas Royen) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
117
Harald Andrés HELFGOTT — Isomorphismes de graphes en temps quasi-polynomial (d’après Babai et Luks, Weisfeiler-Leman, ...)
135
Maxim KONTSEVICH — Derived Grothendieck-Teichmüller group and graph complexes (after T. Willwacher) . . . . . . . . . . . . . . . . . . . . .
183
Cédric VILLANI — Inégalités isopérimétriques dans les espaces métriques mesurés (d’après F. Cavalletti & A. Mondino) . . . . . . .
213
MARS 2017 1128
1129
1130 1131
Stéphane GUILLERMOU — Le problème de Riemann-Hilbert dans le cas irrégulier (d’après des travaux de D’Agnolo, Kashiwara, Mochizuki et Schapira) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
267
David HERNANDEZ — Avancées concernant les R-matrices et leurs applications (d’après Maulik-Okounkov, Kang-KashiwaraKim-Oh, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
297
Xiaonan MA — Geometric hypoelliptic Laplacian and orbital integrals (after Bismut, Lebeau and Shen) . . . . . . . . . . . . . . . . . . . . . .
333
Patrick MASSOT — Flexibilité en géométrie de contact en grande dimension (d’après Borman, Eliashberg et Murphy) . . . . . . . . . . . .
391
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
vi
TABLE DES MATIÈRES
JUIN 2017 1132 1134 1135
Nicolas BERGERON — Variétés en expansion (d’après M. Gromov, L. Guth, ...) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
423
Lillian B. PIERCE — The Vinogradov Mean Value Theorem (after Wooley, and Bourgain, Demeter and Guth) . . . . . . . . . . . . . . . . . . . . .
479
Frédéric ROUSSET — Solutions faibles de l’équation de NavierStokes des fluides compressibles (d’après A. Vasseur et C. Yu) .
565
ASTÉRISQUE 407
RÉSUMÉS DES EXPOSÉS
vii
Piotr T. CHRUŚCIEL — Anti-gravity à la Carlotto-Schoen (after Carlotto and Schoen) The Einstein equations have, essentially, a hyperbolic nature. Their solutions can therefore be obtained by evolving initial data in time. One of the difficulties of the theory is that the initial data are not arbitrary, but subject to constraint equations. In the case where the velocity-part of the initial data vanishes, the equations reduce to the prescribed-scalarcurvature equation, which is of geometric interest of its own. One of the methods for the construction of initial data is the “gluing method,” introduced by Corvino and Schoen. In my talk I will describe the method and review its applications. In particular I will describe a recent construction of Carlotto and Schoen which shows that you can “screen gravitational fields with gravitational fields” by producing, for example, initial data which are exactly Minkowskian in one half-space and non-trivial in the other. Arnaud de MESMAY — Nœuds, mouvements de Reidemeister et algorithmes (d’après Lackenby) Un nœud est souvent représenté par un diagramme de nœud, c’est-à-dire une projection sur deux dimensions, où l’on indique à chaque croisement lequel des deux brins passe audessus de l’autre. Deux diagrammes représentent alors le même nœud si et seulement si ils peuvent être reliés par une série de mouvements locaux, appelés mouvements de Reidemeister. Dans cet exposé, nous présenterons un résultat de Lackenby montrant que, partant d’un diagramme à c croisements du nœud trivial, un nombre polynomial en c de tels mouvements suffit pour arriver au diagramme trivial. La preuve s’appuie sur la théorie des surfaces normales et les travaux de Dynnikov sur les présentations par arcs. En corollaire, cela fournit un algorithme (exponentiel) pour reconnaître les nœuds triviaux, et nous en profiterons pour discuter de quelques problèmes algorithmiques autour des nœuds et des entrelacs. Mihai PĂUN — Positivité des images directes et applications (d’après Bo Berndtsson) Les propriétés de positivité du faisceau canonique relatif correspondant à un espace fibré ont fait l’objet de beaucoup de recherches en géométrie algébrique (à commencer par les travaux de Ph. Griffiths), ainsi qu’en analyse complexe (cf. M. Suzuki, H. Yamaguchi). Il y a quelques années, B. Berndtsson a obtenu un théorème de positivité très général qui unifie les résultats précédents, en utilisant les méthodes L2 combinées avec la théorie de Hodge standard. Le but de notre exposé est de présenter son résultat principal, ainsi que les nombreuses applications qui en ont été déduites entre-temps. Emmanuel PEYRE — Progrès en irrationalité C. Voisin a inventé une nouvelle méthode pour prouver que des classes de variétés ne sont pas stablement rationnelles, c’est-à-dire que leur produit avec un espace affine n’est pas rationnel. Cette méthode repose sur la décomposition de la diagonale dans le groupe de Chow et sur des propriétés de spécialisation de cette décomposition. Parmi ces nouvelles familles, mentionnons les revêtements doubles de l’espace projectif de dimension trois ou quatre ramifiés le long d’une hypersurface quartique très générale et les solides quartiques très généraux. Ces méthodes permettent également de démontrer que la rationalité ne se conserve pas par déformation, même au sein d’une famille de variétés lisses de dimension quatre.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
viii
RÉSUMÉS DES EXPOSÉS
Franck BARTHE — L’inégalité de corrélation gaussienne (d’après Thomas Royen) La conjecture de corrélation gaussienne prédit que pour toute mesure gaussienne centrée et tout couple d’ensembles convexes symétriques par rapport à l’origine, la mesure de l’intersection des ensembles est plus grande que le produit des mesures individuelles. Elle a été démontrée en dimension 2 dans les années 70, et malgré sa popularité et la simplicité de son énoncé, elle a résisté jusqu’en 2014. La preuve de T. Royen utilise les lois gamma multivariées de manière très astucieuse. Harald Andrés HELFGOTT — Isomorphismes de graphes en temps quasi-polynomial (d’après Babai et Luks, Weisfeiler-Leman, ...) Soient donnés deux graphes Γ1 , Γ2 à n sommets. Sont-ils isomorphes ? S’ils le sont, l’ensemble des isomorphismes de Γ1 à Γ2 peut être identifié avec une classe H · π du groupe symétrique sur n éléments. Comment trouver π et des générateurs de H? Le défi de donner un algorithme toujours efficace en réponse à ces questions est resté longtemps ouvert. Babai a récemment montré comment résoudre ces questions — et d’autres qui y sont liées — en temps quasi-polynomial, c’est-à-dire en temps exp (log n)O(1) . Sa stratégie est basée en partie sur l’algorithme de Luks (1980/82), qui a résolu le cas de graphes de degré borné. Maxim KONTSEVICH — Derived Grothendieck-Teichmüller group and graph complexes (after T. Willwacher) Graph complex is spanned by equivalence classes of finite connected graphs with the dual differential given by the sum of all contractions of edges, with appropriate signs. This complex forms a differential graded Lie algebra, and acts as a universal derived infinitesimal symmetry of all graded Lie algebras of polyvector fields on finite-dimensional manifolds. Grothendieck-Teichmüller group, as defined by V. Drinfeld, is the group of symmetries of the tower of rationally completed braid groups. Recent breakthrough by T. Willwacher identifies the graph complex with the derived version of GT group. This result settles essentially all open questions in the subject of deformation quantization and little disk operads. Cédric VILLANI — Inégalités isopérimétriques dans les espaces métriques mesurés (d’après F. Cavalletti & A. Mondino) La théorie synthétique de la courbure de Ricci dans les espaces métriques mesurés a remporté ses premiers succès il y a une dizaine d’années, et s’est rapidement développée depuis ; elle achoppait cependant sur quelques questions aussi rebelles que fondamentales, telles que l’inégalité isopérimétrique de Lévy-Gromov ou d’autres inégalités géométriques où la dimension effective et les constantes optimales sont cruciales. Les travaux récents de Cavalletti et Mondino, adaptant les techniques de localisation de Klartag, viennent franchir ces obstacles et démontrer en particulier la première version non lisse de l’inégalité de LévyGromov. Stéphane GUILLERMOU — Le problème de Riemann-Hilbert dans le cas irrégulier (d’après des travaux de D’Agnolo, Kashiwara, Mochizuki et Schapira) À un D-module M (de façon grossière, un système d’EDP linéaires à coefficients holomorphes) sur une variété complexe X, on associe son faisceau de solutions holomorphes, Sol (M ). Si M est holonome (il contient “beaucoup” d’équations), alors Sol (M ) a des propriétés de finitude. Si de plus M est à singularités régulières, alors on sait depuis les années 80 que Sol (M ) détermine M . Des travaux récents de D’Agnolo, Kashiwara, Mochizuki, Schapira permettent de traiter le cas holonome général.
ASTÉRISQUE 407
RÉSUMÉS DES EXPOSÉS
ix
David HERNANDEZ — Avancées concernant les R-matrices et leurs applications (d’après Maulik-Okounkov, Kang-Kashiwara-Kim-Oh, ...) Les R-matrices sont les solutions de l’équation de Yang-Baxter. À l’origine de la théorie des groupes quantiques, elles peuvent être interprétées comme des opérateurs d’entrelacement. Très récemment, des avancées ont été réalisées indépendamment dans différentes directions. Maulik-Okounkov ont donné une approche géométrique des R-matrices avec de nouveaux outils de géométrie symplectique, les enveloppes stables. Kang-Kashiwara-Kim-Oh ont prouvé une conjecture de catégorification des algèbres amassées en s’appuyant de manière cruciale sur des R-matrices. Enfin, une meilleure compréhension de l’action des matrices de transfert issues de R-matrices a permis de démontrer plusieurs conjectures sur les systèmes intégrables quantiques associés. Xiaonan MA — Geometric hypoelliptic Laplacian and orbital integrals (after Bismut, Lebeau and Shen) Hodge theory for a hypoelliptic Laplacian acting on the total space of the cotangent bundle of a Riemannian manifold. This operator interpolates between the classical elliptic Laplacian on the base and the generator of the geodesic flow. We will describe recent developments of the theory of hypoelliptic Laplacians, in particular the explicit formula obtained by Bismut for orbital integrals and the recent solution by Shen of Fried’s conjecture (dating back to 1986) for locally symmetric spaces. The conjecture predicts the equality of the analytic torsion and the value at 0 of the dynamic zeta function. Patrick MASSOT — Flexibilité en géométrie de contact en grande dimension (d’après Borman, Eliashberg et Murphy) Les structures de contact sont des champs d’hyperplans apparaissant naturellement au bord de variétés symplectiques ou holomorphes et dont l’attrait provient d’un subtil mélange de rigidité et de flexibilité. Du côté rigide, les courbes holomorphes de Gromov démontrent, en toute dimension, que les invariants homotopiques ne suffisent pas à décrire les classes de déformation de structures de contact. Du côté flexible, dont il sera question dans cet exposé, Borman, Eliashberg et Murphy ont montré en 2014 l’existence, en toute dimension, d’une classe de structures de contact dont la géométrie est entièrement régie par la topologie algébrique. En particulier ils caractérisent homotopiquement les variétés portant des structures de contact. Nicolas BERGERON — Variétés en expansion (d’après M. Gromov, L. Guth, ...) Les variétés hyperboliques issues de constructions arithmétiques, dites “de congruences”, se comportent, à bien des égards, comme des graphes expanseurs. Une propriété fondamentale de ces derniers, qui est aussi la raison pour laquelle Kolmogorov et Barzdin les considèrent dès 1967, est qu’ils sont durs à plonger dans l’espace. Gromov et Guth proposent de penser aux variétés hyperboliques de congruences, et en particulier à celles qui sont de dimension 3, comme à des analogues topologiques des graphes expanseurs. Prolongeant le travail de Kolmogorov et Barzdin, Gromov et Guth prouvent notamment que, en un sens que l’on précisera dans l’exposé, les variétés hyperboliques de congruences sont particulièrement dures à plonger dans un espace euclidien. Enfin, dans un registre un peu différent, le lien intime entre variétés de dimension 3 et nœuds leur permet de retrouver un théorème récent de Pardon selon lequel il existe une suite de nœuds dont les plongements requièrent une distorsion arbitrairement grande.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
x
RÉSUMÉS DES EXPOSÉS
Joseph OESTERLÉ — Densité maximale des empilements de sphères en dimensions 8 et 24 (d’après Maryna S. Viazovska et al.) La densité maximale des empilements de sphères (de même rayon) dans un espace euclidien n’était jusqu’à récemment connue qu’en dimensions 1, 2 et 3. Une jeune mathématicienne ukrainienne, Maryna Viazovska, l’a déterminée en 2016 en dimension 8 et peu après, en collaboration avec d’autres mathématiciens, en dimension 24. Cette densité maximale est atteinte en dimension 8 lorsque les centres des sphères forment un réseau de racines de type E8 , en dimension 24 lorsqu’ils forment un réseau de Leech. Dans les deux cas, ce sont les seuls empilements de sphères périodiques de densité maximale (à homothétie et isométrie près). Lillian B. PIERCE — The Vinogradov Mean Value Theorem (after Wooley, and Bourgain, Demeter and Guth) In 1770, Waring proposed the study of representing an integer as a sum of s perfect kth powers. Over the past century, the Hardy-Littlewood circle method has been honed to produce an asymptotic for the number of such representations, with a central goal being to reduce the number of variables required. In the Hardy-Littlewood strategy, a critical step is to estimate a relevant exponential sum, which for the past seventy years has been approached via increasingly sophisticated versions of Vinogradov’s mean value method. In recent years, Wooley has pushed the field ever closer to a final resolution of the main conjecture, called the Vinogradov Mean Value Theorem, via his efficient congruencing method. Now, by approaching the problem from the perspective of l2 decoupling, Bourgain, Demeter and Guth have finally resolved the main conjecture. This lecture will survey these two approaches to the Vinogradov Mean Value Theorem, and several consequences for discrete restriction problems, Waring’s problem, and the Riemann zeta function. Frédéric ROUSSET — Solutions faibles de l’équation de Navier-Stokes des fluides compressibles (d’après A. Vasseur et C. Yu) Le but de l’exposé est de présenter un résultat d’existence globale de solutions faibles pour le système de Navier-Stokes des fluides compressibles avec des coefficients de viscosité dépendant de la densité. Dans le cas où ces coefficients sont constants, le résultat d’existence globale de solutions faibles est un résultat célèbre de P.-L. Lions. On décrira d’abord des travaux antérieurs de B. Desjardins et D. Bresch et de A. Mellet et A. Vasseur établissant des propriétés de stabilité des solutions faibles qui utilisent très finement la structure du système, puis on expliquera le procédé de construction de solution utilisé dans les travaux de Vasseur et Yu.
ASTÉRISQUE 407
Séminaire BOURBAKI 69e année, 2016–2017, no 1120, p. 1 à 26 doi:10.24033/ast.1058
Novembre 2016
ANTI-GRAVITY À LA CARLOTTO-SCHOEN [after Carlotto and Schoen] ´ by Piotr T. CHRUSCIEL
INTRODUCTION In [13] Carlotto and Schoen show that gravitational fields can be used to shield gravitational fields. That is to say, one can produce spacetime regions extending to infinity where no gravitational forces are felt whatsoever, by manipulating the gravitational field around these regions. A sound-bite version of the result reads: Theorem A (Carlotto & Schoen [13]). — Given an asymptotically flat initial data set for vacuum Einstein equations there exist cones and asymptotically flat vacuum initial data which coincide with the original ones inside the cones and are Minkowskian outside slightly larger cones, see Figure 1.
Figure 1. Left picture: The new initial data are Minkowskian outside the larger cone, and coincide with the original ones inside the smaller one. The construction can also be carried out the other way round, with Minkowskian data inside the smaller cone and the original ones outside the larger cone. Both cones extend to infinity, and their tips are located very far in the asymptotically flat region. Right picture: Iterating the construction, one can embed any finite number of distinct initial data sets into Minkowskian data, or paste-in Minkowskian data inside several cones into a given data set.
© Astérisque 407, SMF 2019
2
P. T. CHRUŚCIEL
Actually, the result is true for all cones with preassigned axis and pair of apertures provided the vertex is shifted sufficiently far away in the asymptotically flat regions. In the associated spacetimes (M , g) the metric coincides with the Minkowski metric within the domain of dependence, which we will denote by D, of the complement of the larger cones, which forms an open subset of M ; we return to this in Section 1.6 below. Physical objects in D do not feel any gravitational fields. The Carlotto-Schoen gluing has effectively switched off any gravitational effects in this region. This has been achieved by manipulating vacuum gravitational fields only. In this séminaire I will describe the context, define the notions used, highlight the key elements of the proof of Theorem A, and discuss some developments.
1. THE CONTEXT 1.1. Newtonian gravity Newtonian gravity is concerned with a gravitational potential field φ, which solves the equation ∆φ = 4πGρ,
(1.1)
where ∆ is the Laplace operator in an Euclidean R3 and G is Newton’s constant. Up to conventions on signs, proportionality factors, and units, ρ is the matter density, which is not allowed to be negative. Isolated systems are defined by the requirement that both ρ and φ decay to zero as one recedes to infinity. Freely falling bodies experience an acceleration proportional to the gradient of φ. So no gravitational forces exist in those regions where φ is constant. Suppose that ρ has support contained in a compact set K, and that φ is constant on an open set Ω. Since solutions of (1.1) are analytic on R3 \ K, φ is constant on any connected component of R3 \ K which meets Ω. We conclude that if Ω extends to infinity, then φ vanishes at all large distances. This implies, for all sufficiently large spheres S(R), Z Z Z 0= ∇φ · n d2 S = ∆φ d3 V = 4πG ρ d3 V. S(R)
B(R)
B(R)
Since ρ is non-negative, we conclude that ρ ≡ 0. Equivalently, for isolated systems with compact sources, Newtonian gravity cannot be screened away on open sets extending to large distances. The striking discovery of Carlotto and Schoen is, that this can be done in Einsteinian gravity.
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
3
The Newtonian argument above fails if matter with negative density is allowed. It should therefore be emphasized that the Carlotto-Schoen construction is done by manipulating vacuum initial data, without involvement of matter fields. 1.2. Einsteinian gravity, general relativistic initial data sets Mathematical general relativity is born around 1952 with the breakthrough paper of Yvonne Choquet-Bruhat [42], showing that Einstein’s field equations, 1 8πG Rµν − Rgµν + Λgµν = 4 Tµν , 2 c admit a well posed Cauchy problem. Here Rµν is the Ricci tensor of the spacetime metric g, R its Ricci scalar, Tµν the energy-momentum tensor of matter fields, Λ the “cosmological constant,” G is Newton’s constant as before, and c is the speed of light. In vacuum Tµν vanishes, in which case (1.2) is equivalent to the requirement that g be Ricci-flat when moreover the vanishing of Λ is imposed. The notation gµν indicates that the metric g is a two-covariant tensor field, similarly for Tµν , etc. The geometric initial data for the four-dimensional vacuum Einstein equations are a triple (S , g, K), where (S , g) is a three-dimensional Riemannian manifold and K is a symmetric two-covariant tensor field on S . One should think of S as a space-like hypersurface in the vacuum Lorentzian spacetime (M , g), then g is the metric induced by g on S , and K is the second fundamental form (“extrinsic curvature tensor”) of S in (M , g). It has already been recognized in 1927 by Darmois [37] that (g, K) are not arbitrarily specifiable, but have to satisfy a set of constraint equations, (1.2)
(1.3)
R = |K|2 − (trg K)2 + 2µ + 2Λ,
(1.4)
Di (Kij − trg Kgij ) = Jj ,
8πG µ ν µ where µ = 8πG c4 Tµν n n is the matter energy density on S and Jj = c4 Tµj n the µ matter momentum vector, with n being the unit normal to S in (M , g). The requirement of positivity of energy of physical matter fields translates into the dominant energy condition:
µ ≥ |J|g , p where of course |J|g ≡ g(J, J) ≡ gij J i J j (summation convention). In particular µ should be non-negative. The constraint equations are the source of many headaches in mathematical and numerical general relativity. On the other hand, together with the energy condition, they are the source of beautiful mathematical results (1) such as the positive energy (1.5)
p
(1)
The reader is invited to consult [4, 14, 26, 35] for more details and further references.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
4
P. T. CHRUŚCIEL
theorems [50, 51], the Penrose inequality [10, 44], the Corvino-Schoen [32, 36] or the Carlotto-Schoen gluings. 1.3. Asymptotic flatness Initial data for general relativistic isolated systems are typically modeled by asymptotically flat data with vanishing cosmological constant Λ. Actually, astrophysical observations indicate that Λ is positive. However, for the purpose of observing nearby stars, or for our stellar system, the corrections arising from Λ are negligible, they only become important at cosmological scales. The class of asymptotically flat systems should obviously include the Schwarzschild black holes. In those, on the usual slicing by t = const. hypersurfaces it holds that Kij ≡ 0 and m 4 gij = 1 + (1.6) δij + O(r−2 ), 2r in spacetime dimension four, or 4 m n−2 gij = 1 + n−2 (1.7) δij + O(r−(n−1) ), 2r in general spacetime dimension n + 1. Here δij denotes the Euclidean metric in manifestly flat coordinates. The asymptotics (1.6) is often referred to as Schwarzschildean, and the parameter m is called the ADM mass of the metric. Now, one can obtain initial data with non-vanishing total momentum by taking Lorentz-transformed slices in the Schwarzschild spacetime. This leads to initial data sets satisfying (1.8)
∂i1 · · · ∂i` (gij − δij ) = O(r−α−` ),
(1.9)
∂i1 · · · ∂ik Kij = O(r−α−k−1 ),
with α = n−2, for any k, ` ∈ N. Metrics g satisfying (1.8) will be called asymptotically Euclidean. The flexibility of choosing α ∈ (0, n − 2) in the definition of asymptotic flatness (1.8)-(1.9), as well as k, ` smaller than some threshold, is necessary in Theorem A. Indeed, the new initial data constructed there are not expected to satisfy (1.8) with α = n − 2. It would be of interest to settle the question, whether or not this is really the case. There does not appear to be any justification for the Schwarzschildean threshold α = n − 2 other than historical. On the other hand, the threshold (1.10)
α = (n − 2)/2
appears naturally as the optimal threshold for a well-defined total energy-momentum of the initial data set. This has been first discussed in [15–17, 41], compare [2].
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
5
1.4. Time-symmetric initial data and the Riemannian context Initial data are called time-symmetric when Kij ≡ 0. In this case, and assuming vacuum, the vector constraint equation (1.4) is trivially satisfied, while the scalar constraint equation (1.3) becomes the requirement that (S , g) has constant scalar curvature R: (1.11)
R = 2Λ.
In particular (S , g) should be scalar-flat when Λ = 0. (The “time-symmetric” terminology reflects the fact that a suitable reflection across S in the associated spacetime is an isometry.) So all statements about vacuum initial data translate immediately into statements concerning scalar-flat Riemannian manifolds. For example, the following statement is a special case of Theorem A: Theorem 1.1 (Carlotto & Schoen). — Given a scalar-flat asymptotically Euclidean metric g there exist cones and scalar-flat asymptotically Euclidean metrics which coincide with g inside of the cones and are flat outside slightly larger cones. This theorem was one of the motivations for the proof of Theorem A. For instance, the question of existence of non-trivial, scalar-flat, asymptotically flat metrics gˆ which are exactly flat in a half-space arises when studying complete, non-compact minimal hypersurfaces. If gˆ is such a metric, then all hyperplanes lying in the flat half-space minimize area under compactly supported deformations which do not extend into the non-flat region. So Theorem 1.1 shows that such metrics gˆ actually exist. This should be contrasted with the following beautiful result of Chodosh and Eichmair [12], which shows that minimality under all compactly supported perturbations implies flatness: Theorem 1.2 (Chodosh, Eichmair). — The only asymptotically Euclidean threedimensional manifold with non-negative scalar curvature that contains a complete non-compact embedded surface S which is a (component of the) boundary of some properly embedded full-dimensional submanifold of (M, g) and is area-minimizing under compactly supported deformations is flat R3 , and S is a flat plane. The above was preceded by a related rigidity result of Carlotto [11]: Theorem 1.3 (Carlotto). — Let (M, g) be a complete, three-dimensional, asymptotically Schwarzschildean Riemannian manifold with non-negative scalar curvature. If M contains a complete, properly embedded, stable minimal surface S, then (M, g) is the Euclidean space and S is a flat plane. Such results immediately imply non-compactness for sequences of solutions of the Plateau problem with a diverging sequence of boundaries. We note that compactness results in this spirit play a key role in the Schoen & Yau proof of the positive energy
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
6
P. T. CHRUŚCIEL
theorem. One could likewise imagine that convergence of such sequences of solutions of the Plateau problem could provide a tool to study stationary black hole solutions, but no arguments in this spirit have been successfully implemented so far. 1.5. Localised scalar curvature It is an immediate consequence of the positive energy theorem that, for complete asymptotically Euclidean manifolds with non-negative scalar curvature, curvature cannot be localized in a compact set. In other words, a flat region cannot enclose a non-flat one. A similar statement applies for general relativistic initial data sets satisfying the dominant energy condition (1.5). Indeed a metric which is flat outside of a compact set would have zero total mass and hence would be flat everywhere by the rigidity-part of the positive energy theorem [2, 49]. Similarly for initial data sets [6, 28]. One would then like to know how much flatness can a non-trivial initial data set carry? This question provided another motivation for Theorem A, which shows that non-flatness can be localized within cones. A previous family of non-trivial asymptotically Euclidean scalar-flat metrics containing flat regions is provided by the quasi-spherical metrics of Bartnik [3]. In Bartnik’s examples flatness can be localized within balls. In [13] it is noticed that non-flat regions cannot be sandwiched between parallel planes. This follows immediately from the following formula for ADM mass due to Beig [5] (compare [1, 16, 43]), Z 1 (1.12) m = lim Gij xi nj dS, R→∞ 16π r=R where Gij := Rij − 21 Rgij is the Einstein tensor, and xi is the coordinate vector in the asymptotically Euclidean coordinate system. Indeed, (1.12) together with a non-zero mass and asymptotic flatness imply that the region where the Ricci tensor has to have non-trivial angular extent as one recedes to infinity. But this is not the case for a region sandwiched between two parallel planes. 1.6. Focussed gravitational waves? Consider non-trivial asymptotically flat Carlotto-Schoen initial data set, at t = 0, with the “non-Minkowskianity” localized in a cone with vertex at ~a, axis ~ı and aperture θ > 0, which we will denote by C(~a,~ı, θ). It follows from [7] that the associated vacuum space-time will exist globally when the data are small enough, in a norm compatible with the Carlotto-Schoen setting. One can think of the associated vacuum space-time as describing a gravitational wave localized, at t = 0, in an angular sector of opening angle 2θ and direction defined
ASTÉRISQUE 407
(1120)
7
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
by the vector ~ı. The discussion of the previous section shows that θ can be made as small as desired but cannot be zero, so that all such solutions must have non-trivial angular extent. It is of interest to enquire how Carlotto-Schoen solutions evolve in time. In what follows we assume that θ < π/2. Standard results on Einstein equations show that the boundary enclosing the non-trivial region travels outwards no faster than the speed of light c. This, together with elementary geometry shows that at time t the space-time metric will certainly be flat outside of a cone c (1.13) C ~a − t~ı,~ı, θ . sin(θ) The reader will note that the tip of the cone (1.13) travels faster than light, which is an artifact of the rough estimate. A more careful inspection near the tip of the cone shows that the domain of dependence at time t consists of a cone of aperture θ spanned tangentially on the boundary of a sphere of radius t as shown in Figure 2. In any case the angular opening of the wave remains constant on slices of constant
-2
3
3
2
2
1
1
1
-1
-1
2
-2
t = 0 −→ t = 1
1
-1
2
-1
Figure 2. Left graph: The cone in the figure represents the exterior boundary of Ω at t = 0, with initial data Minkowskian below the graph. Right graph: At t = 1, the evolved space-time metric is Minkowskian below the graph. The three-dimensional picture is obtained by rotating the graphs around the vertical axis.
time. However, the wave is likely to spread and meet all generators of null infinity, but not before the intersection of S with the light-cone of the origin (t = 0, ~x = 0) is reached. 1.7. Many-body problem Given two initial data sets (Ωa , ga , Ka ), a = 1, 2, the question arises, whether one can find a new initial data set which contains both? An answer to this is not known in full generality. However, the Carlotto-Schoen construction gives a positive answer to
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
8
P. T. CHRUŚCIEL
this question when the original initial data are part of asymptotically flat initial data (Sa , ga , Ka ), provided that the sets Ωa ⊂ Sa can be enclosed in cones which do not intersect after “small angular fattenings”. Indeed, one can then apply the deformation ˆ a ) which coincide of Theorem A to each original data set to new initial data (Sa , gˆa , K with the original ones on Ωa and are Minkowskian outside the fattened cones. But then one can superpose the resulting initial data sets in the Minkowskian region, as shown in Figure 3. (M1 , g1 , k1 )
(M2 , g2 , k2 )
• O (M, g, k) Figure 3. Theorem A allows to merge an assigned collection of data into an exotic N −body solution of the Einstein constraint equations. From [13], with kind permission of the authors.
The construction can be iterated to produce many-body initial data sets. An alternative gluing construction with bounded sets Ωa ⊂ Sa has been previously carried out in [18, 19].
2. GLUING METHODS One of the central problems in mathematical general relativity is the construction of solutions to the constraint equations. In spite of an impressive body of work on
ASTÉRISQUE 407
(1120)
9
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
this by many researchers(1) we are still very far from understanding the problem at hand. Theorem A and its technique of proof are important contributions to the subject, the full consequences of which remain to be explored. The theorem belongs to the category of “gluing theorems” for initial data sets, initiated by Justin Corvino in his thesis supervised by Rick Schoen [32]; compare [36]. In those last two papers gluing theorems across annuli are developed. The basic ideas behind Theorem A are essentially identical to those of [32,36] with one key difference: the gluing region is now allowed to be non-compact. This introduces the need to develop new function spaces and establish some key inequalities in those spaces. We will return to those issues in Section 3 below, but before doing this let us shortly discuss some basic aspects of “gluing”. Consider, then, two initial data sets which are close to each other on a domain Ω ⊂ S . One further assumes that Ω has exactly two boundary components, with each component of Ω separating S into two. The reader can think of Ω as an annulus in S = Rn , or the region between the cones of Figure 1 in Rn . The basic idea is to use the inverse function theorem to construct a new initial data set which will coincide with the first initial data set near a component of the boundary, and with the second initial data set near the other component of ∂Ω. Let us denote by P the linearization of the map, say C , which to a pair (g, K) assigns the right-hand sides of (1.3)-(1.4): ! R(g) − |K|2 + (trK)2 − 2Λ . (2.1) C (g, K) := 2(−∇j Kij + ∇i trK) Let P ∗ denote the formal adjoint of P . A somewhat lengthy calculation gives: (2.2) P ∗ (N, Y ) = ∇l Yl Kij − 2K l (i ∇j) Yl + K q l ∇q Y l gij − ∆N gij + ∇i ∇j N + (∇p Klp gij − ∇l Kij )Y l − N Ric(g)ij + 2N K l i Kjl − 2N trKKij 2(∇(i Yj) − ∇l Yl gij − Kij N + trK N gij )
,
where the first two lines of the right-hand side should be understood as a single one. Consider the linearized equation: (2.3)
P (δg, δK) = (δρ, δJ).
Whenever P P ∗ is an isomorphism, solutions of (2.3) can be obtained by solving the equation (2.4)
P P ∗ (N, Y ) = (δρ, δJ)
for a function N and a vector field Y , and setting (δg, δK) = P ∗ (N, Y ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
10
P. T. CHRUŚCIEL
It turns out that P P ∗ is elliptic in the sense of Agmon, Douglis and Nirenberg [47]. So the only essential obstruction to solving (2.4) is the kernel of P P ∗ . Now, because of the form of the operator, the kernel of P P ∗ typically coincides with the kernel of P ∗ , with the latter contained in Ker P P ∗ in any case. Nontrivial elements of Ker P ∗ are called Killing Initial Data, abbreviated as KIDs. The terminology is due to the fact that KIDs are in one-to-one correspondence with Killing vectors in the vacuum spacetime obtained by evolving the initial data set [46]. KIDs (N, Y ) are thus solutions of the the KIDs equation: (2.5) ∇(i Yj) = N Kij , (2.6) ∇i ∇j N = Ric(g)ij − 2K l i Kjl + trKKij +
1 2 ql R + (trK) − K Kql gij N 1−n (∇p Klp − ∇l trK)gij Y l + 2K l (i ∇j) Yl .
1 n−1 In the time-symmetric case with K ≡ Y ≡ 0, KIDs are reduced to a single function N , and the KID equations reduce to the static KIDs equation, R (2.7) ∇i ∇j N = Ric(g)ij + N. 1−n + ∇l Kij +
2.1. A toy model: divergenceless vector fields To illustrate how this works in a simpler setting, consider the Maxwell constraint equation for a source-free (that is to say, divergence-free) electric field E, (2.8)
P (E) := divE = 0.
The formal adjoint of the divergence operator is the negative of the gradient, so that the “KID equation” in this case reads (2.9)
P ∗ (u) ≡ −∇u = 0.
The gradient operator has no kernel on a domain with smooth boundary if u is required to vanish on ∂Ω; in fact, the vanishing at a single point of the boundary would suffice. So the equation (2.10)
divE = ρ
can be solved by solving the Laplace equation for u, (2.11)
P P ∗ (u) ≡ −div∇u ≡ −∆u = ρ,
with zero Dirichlet data. Consider, then, the following toy problem:
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
11
Problem 2.1. — Let Ei , i = 1, 2, be two source-free electric fields on Rn . Find a source-free electric field E which coincides with E1 on a ball B(R1 ) of radius R1 and coincides with E2 outside a ball of radius R2 > R1 . Note that if E2 ≡ 0, and if we can solve Problem 2.1, we will have screened away the electric field E1 without introducing any charges in the system: this is the screening of the electric field with an electric field. We will also have constructed an infinite dimensional space of compactly supported divergence free vector fields as E1 varies, with complete control of E in B(R1 ). Note that the alternative construction of the space of such vector fields, by setting E = curl A for some compactly supported vector field A, does not provide explicit control of E | . B(R1 )
As a first attempt to solve the problem, let χ be a radial cut-off function which equals one near the sphere S(R1 ) and which equals zero near S(R2 ). Set Eχ = χE1 + (1 − χ)E2 . Since both Ei are divergence-free we have ρχ := divEχ = ∇χ · (E1 − E2 ), and there is no reason for ρχ to vanish. However, if u solves the equation P P ∗ (u) ≡ −∆u = −ρχ
(2.12)
with vanishing boundary data, then E = Eχ + P ∗ (u)
(2.13) will be divergence free:
divE = div(Eχ + P ∗ (u)) = ρχ + P P ∗ (u) = 0. Now, on S(Ri ) we have (2.14)
E|
S(Ri )
= Ei − ∇u,
and there is no reason why this should coincide with Ei . We conclude that this approach fails to solve the problem. Replacing Dirichlet data by Neumann data will only help if both Ei | are S(Ri ) purely radial, as suitable Neumann data will only guarantee continuity of the normal components of E. It turns out that there is trick to make this work in whole generality: modify (2.11) by introducing weight-functions ψ which vanish very fast at the boundary. An
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
12
P. T. CHRUŚCIEL
example, which will lead to solutions on the annulus which can be extended to the whole of Rn in a high-but-finite differentiability class, is provided by the functions (2.15)
ψ = (r − R1 )σ (R2 − r)σ ,
r ∈ (R1 , R2 ),
with some large positive number σ. Another useful example, which will lead to smoothly-extendable solutions, is s (2.16) ψ = (r − R1 )α (r − R2 )α exp − , r ∈ (R1 , R2 ), (r − R1 )(R2 − r) with α ∈ R and s > 0. (The prefactors involving α in (2.16) are useful when constructing a consistent functional-analytic set-up, but are essentially irrelevant as far as the blow-up rate of ψ near the S(Ri )’s is concerned.) As such, instead of (2.11) consider the equation (2.17)
P (ψ 2 P ∗ (u)) ≡ −div(ψ 2 ∇u) = −ρχ .
Solutions of (2.17) could provide a solution of Problem 2.1 if one replaces (2.13) by (2.18)
E = Eχ + ψ 2 P ∗ (u) = Eχ − ψ 2 ∇u.
Now, solutions of (2.17) are, at least formally, minima of the functional Z 1 2 (2.19) I= ψ |∇u|2 + ρχ u. 2 Ω Supposing that minimization would work, one will then obtain a solution u so that ψ∇u is in L2 . Since ψ goes to zero at the boundary very fast, ∇u is likely to blow up. In an ideal world, in which “L2 ” is the same as “bounded,” ∇u will behave as ψ −1 near the boundary. The miracle is that (2.17) involves ψ 2 ∇u, with one power of ψ spare, and so the derivatives of u would indeed tend to zero as ∂Ω is approached. This naive analysis of the boundary behavior turns out to be essentially correct: choosing the exponential weights (2.16), ψ 2 ∇u will extend smoothly by zero across the boundaries when the Ei ’s are smooth. A choice of power-law weights (2.15) will lead to extensions of differentiability class determined by the exponent σ, with a loss of a finite number of derivatives due to the fact that L2 functions are not necessarily bounded, and that there is a loss of differentiability when passing from Sobolev-differentiability to classical derivatives. It then remains to show that minimization works in a carefully chosen space. This requires so-called “coercitivity inequalities”. For the functional (2.19) the relevant inequality is the following weighted Poincaré inequality: Z Z 2 2 (2.20) ψ |u| ≤ C ϕ2 ψ 2 |∇u|2 . Ω
ASTÉRISQUE 407
Ω
(1120)
13
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
Here ϕ = (r − R1 )−1 (R2 − r)−1 when ψ is given by (2.15) with σ 6= −1/2, and ϕ = (r − R1 )−2 (R2 − r)−2 for the exponential weights ψ given by (2.16) with s 6= 0, cf. e.g., [21, 32]. There is an obvious catch here, namely (2.20) cannot possibly be true since it is violated by constants. However, (2.20) holds on the subspace, say F , of functions which are L2 -orthogonal to constants, when using the weights described above. This turns out to be good enough for solving Problem 2.1. For then one can carry out the minimization on F , finding a minimum u ∈ F . The function u will solve the equation up to an L2 -projection of the equation on constants. In other words, we will have Z (2.21) f (−div(ψ 2 ∇u) + ρχ ) = 0, Ω
R for all differentiable f such that Ω f = 0. Now, integrating the equation (2.17) against the constant function f ≡ 1 we find Z Z 2 (2.22) (div(ψ ∇u) − ρχ ) = div(ψ 2 ∇u − Eχ ) Ω Ω Z Z Z = (ψ 2 ∇u − Eχ ) · m = E1 · n − E2 · n, ∂Ω
S(R1 )
S(R2 )
where m is the outer-directed normal to ∂Ω, and n is the radial vector ~x/|~x|. Since the Ei ’s are divergence-free it holds that Z Z Ei · n = div(Ei ) = 0. S(Ri )
B(Ri )
It follows that the right-hand side of (2.22) vanishes, hence (2.21) holds for all differentiable functions f , and u is in fact a solution of (2.17). (Strictly speaking, when solving (2.17) by minimization using the inequality (2.20), Equation (2.17) should be replaced by (2.23)
div(ϕ2 ψ 2 ∇u) = ρχ .
This does not affect the discussion so far, and only leads to a shift of the powers α and σ in (2.15)-(2.16).) We conclude that the answer to Problem 2.1 is yes, as already observed in [35, 39]. One can likewise solve variants of Problem 2.1 with gluing regions which are not annuli, e.g., a difference of two coaxial cones with distinct apertures as in the CarlottoSchoen Theorem A. If one of the glued vector fields is taken to be trivial, one obtains configurations where the electric field extends all the way to infinity in open cones and vanishes in, e.g., a half-space.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
14
P. T. CHRUŚCIEL
The gluing construction for the linearized relativistic constraint equations proceeds essentially in the same way. There, in addition to the weighted Poincaré inequality (2.20) one also needs a weighted Korn inequality for vector fields X: Z Z (2.24) ψ 2 |X|2 ≤ C ϕ2 ψ 2 |S(X)|2 , Ω
Ω
where S(X) is the symmetric two-covariant vector field defined as (2.25)
S(X)ij =
1 (∇i Xj + ∇j Xi ). 2
In (2.24) one needs to assume σ 6∈ {−n/2, −n2/ − 1} for the weight (2.15), and s 6= 0 when ψ is given by (2.16). If the metric g has non-trivial Killing vectors, which are solutions of the equation S(X) = 0, then (2.24) will hold for vector fields X which are in a closed subspace transverse to the space of Killing vectors, with a constant depending upon the subspace. Because the space of KIDs is trivial for generic metrics [9], the problem of solving modulo kernel does not arise in generic situations. The full non-linear gluing problem for the scalar curvature, or for vacuum initial data, is solved using the above analysis of the linearized equation together with a tailor-made version of the inverse function theorem. The reader is referred to [21, 32] for details. There it is also shown how to treat problems where existence of KIDs cannot be ignored. 2.2. Previous generalizations As already mentioned, the original papers [32,36] were concerned with gluing across an annulus in Rn , with vanishing cosmological constant. This has been generalized to various other set-ups, and used to prove the following: 1. In [45] the method is used to construct non-trivial black hole spacetimes with smooth asymptotic structure. 2. In [20, 33] the gluing method was used to construct large families of vacuum spacetimes which are asymptotically simple in the sense of Penrose [48]. 3. In [21] it has been shown how to reduce the gluing problem to the verification of a few properties of the weight functions ϕ and ψ, and to the verification of the Poincaré and Korn inequalities. It has also been shown how to use the technique to control the asymptotics of solutions in asymptotically flat regions. 4. In [27] the method has been used to carry out localized vacuum connected-sums of vacuum initial data sets. 5. In [23] the method is used to construct constant negative scalar curvature metrics with exact Schwarzschild-anti de Sitter asymptotics.
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
15
6. It has been shown in [29–31] how to use the gluing method to construct manifolds with constant positive scalar curvature containing periodic asymptotic ends. 7. The differentiability thresholds for the applicability of the method have been lowered in [22]. It has also been shown there how to construct a Banach manifold structure for the set of vacuum initial data under various asymptotic conditions using the general ideas developed in the process of gluing. 8. In [38] gluings are done by interpolating scalar curvature. 9. In [39] the gluing method has been used to construct compactly supported solutions for a wide class of underdetermined elliptic systems. As a particular case, for any open set U one obtains an infinite-dimensional space of solutions of the vector constraint equation which are compactly supported in U . 10. In [40] the gluing is used to make local “generalized connected-sum” gluings along submanifolds. 11. As already pointed out, in [18,19] the gluing is used to construct initial data for the many-body problem in general relativity. 12. In [34] the gluing method is used to deform initial data satisfying the dominant energy condition to ones where the condition is strict. 13. In [8] the gluing is used to remove the previous smallness conditions in the assertion that maximal globally hyperbolic developments of asymptotically flat initial data sets contain null hypersurfaces with generators complete to the future.
3. FURTHER ELEMENTS OF THE PROOF As already mentioned, the main idea of the proof of Theorem A is essentially identical to that of the Corvino-Schoen gluing, summarized above. There is, however, a significant amount of new work involved, which fully justifies the length of the paper and publication in Inventiones. The first extraordinary insight is to imagine that the result can be true at all when Ω is the difference of two cones with different apertures, smoothed out at the vertex, see Figure 4. This is the geometry that we are going to assume in the remainder of this section. Next, all generalizations of [32, 36] listed in Section 2.2 involve gluing across a compact boundary. In the current case ∂Ω is not compact, and so some analytical aspects have to be revisited. In addition to weights governing decay at ∂Ω, radial weights need to be introduced in order to account for the infinite extent of the cone. Let d(p) denote the distance from p ∈ Ω to ∂Ω. Let θ1 < θ2 be the respective apertures of the inner and outer cones and let θ denote the angle away from the axis of the cones. A substantial part of the paper consists in establishing inequalities in the
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
16
P. T. CHRUŚCIEL
θ2 θ1 ΩI Ω
• (S , g, k)
ΩO
Figure 4. Regularized cones and the gluing region Ω, from [13] with kind permission of the authors. ΩI ⊂ Ω is the interior cone, ΩO is the region outside the larger cone.
spirit of (2.20) and (2.24) with ϕ = r and with weight functions ψ which are smooth everywhere, behave like dσ for small d, and are equal to ψ = rn/2−q (θ − θ1 )σ (θ2 − θ)σ ,
(3.1)
for large distances, with q, σ > 0. More precisely, let σ > 0 be large enough, and assume that 0 < q < (n − 2)/2, with q 6= (n − 4)/2 for n ≥ 5. Suppose that g is the Euclidean metric and let Ω be as above. Let φ be a positive function which for large distances equals θ − θ1 and θ2 − θ close to the inner and outer cones, respectively, and which behaves as the distance from ∂Ω otherwise. Then there exists a constant C such that for all differentiable functions u and vector fields X, both with bounded support in Ω (no conditions at ∂Ω), the following inequalities are true: Z Z 2 −n+2q σ (3.2) |u| r φ ≤C |∇u|2 r2−n+2q φσ , Ω Ω Z Z 2 −n+2q σ (3.3) |Y | r φ ≤C |S(Y )|2 r2−n+2q φσ . Ω
Ω
A clever lemma relying on the coarea formula ( [13, Lemma 4.1]) reduces the proof of the inequalities (3.2)-(3.3) to the case φ ≡ 1. A key point in the proof of (3.3) is the inequality established in [13, Proposition 4.5] (also known in [13] as “Basic Estimate II”), which takes the form Z Z (3.4) |∇Y |2 r2−n+2q φσ ≤ C |S(Y )|2 r2−n+2q φσ . Ω
Ω
The justification of (3.4) requires considerable ingenuity. It is simple to show that (3.2)-(3.3) continue to hold for asymptotically Euclidean metrics which are close enough to the Euclidean one, with uniform constants. As
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
17
explained in Section 2.1, these inequalities provide the stepping stones for the analysis of the linear equations. Note that the radial weights in (3.2) guarantee that affine functions are not in the space obtained by completing Cc1 (Ω) with respect to the norm defined by the right-hand side. A similar remark concerning vectors with components which are affine functions applies in the context of (3.3). This guarantees that neither KIDs, nor asymptotic KIDs, interfere with the construction, which would otherwise have introduced a serious obstruction to the argument. Once these decoupled functional inequalities are gained, a perturbation argument ensures coercivity of the adjoint linearised constraint operator (in suitable doublyweighted Sobolev spaces). This allows one to use direct methods to obtain existence of a unique global minimum for the functional whose Euler-Lagrange equations are the linearized constraints. We refer the reader to Propositions 4.6 and 4.7 of [13] for precise statements. The argument of [13] continues with a Picard iteration scheme, which allows one to use the analysis of the linear operator to obtain solutions to the nonlinear problem under a smallness condition. This is not an off-the-shelf argument: it involves some delicate choices of functional spaces for the iteration, where one takes a combination of weighted-Sobolev and weighted-Schauder norms. Alternatively one could use [20, Appendix G] at this stage of the proof, after establishing somewhat different estimates, compare [24]. To end the proof it suffices to start moving the cones to larger and larger distances in the asymptotic region, so that the metric on Ω approaches the flat one. When the tips of the cones are far enough the smallness conditions needed to make the whole machinery work are met, and Theorem A follows. An interesting, and somehow surprising, aspect of the result is the fact that no matter how small the cone angles are, the ADM energy-momentum of the glued data provides an arbitrarily good approximation of the ADM energy-momentum of the given data when the vertex of the cones is chosen far enough in the asymptotic region. This is proven in Section 5.6 of [13] and is then exploited in the construction of N -body Carlotto-Schoen solutions, already presented in Section 1.7. This is the object of Section 6 of their paper.
4. BEYOND THEOREM A The results of Carlotto and Schoen have meanwhile been extended in a few directions.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
18
P. T. CHRUŚCIEL
In the initial-data context, gluings in the same spirit have been done in [25] for asymptotically hyperbolic initial data sets. In terms of the half-space model for hyperbolic space, the analogs of cones are half-annuli extending to the conformal boundary at infinity. As a result one obtains e.g., non-trivial constant scalar curvature metrics which are exactly hyperbolic in half-balls centered at the conformal boundary. We provide more details in Section 4.1 below. In a Riemannian asymptotically Euclidean setting, with Kij ≡ 0 so that only the scalar curvature matters, the following generalizations are straightforward: 1. Rather than gluing an asymptotically Euclidean metric to a flat one, any two asymptotically metrics g1 and g2 are glued together. 2. In the spirit of [38], the gluings at zero-scalar curvature can be replaced by gluings where the scalar curvature of the final metric equals χR(g1 ) + (1 − χ)R(g2 ) where, as before, χ is a cut-off function varying between zero and one in the gluing region. Thus, the scalar curvature of the final metric is sandwiched between the scalar curvatures of the original ones. This reduces of course to a zero-scalar-curvature gluing if both g1 and g2 are scalar-flat. 3. The geometry of the gluing region can be allowed to be somewhat more general than the interface between two cones [24]. A few more details about this can be found in Section 4.2 below. 4.1. Asymptotically hyperbolic gluings Let us describe here one of the gluing constructions in [25], the reader is referred to that reference for some more general “exotic hyperbolic gluings”. The underlying manifold is taken to be the “half-space model” of hyperbolic space: H = {(z, θ) | z > 0, θ ∈ Rn−1 } ⊂ Rn . One wishes to glue together metrics asymptotic to each other while interpolating their respective scalar curvatures. The first metric is assumed to take the form, in suitable local coordinates, 1 (4.1) g = 2 (1 + O(z))dz 2 + hAB (z, θC )dθA dθB + O(z)A dz dθA , | {z } z =: h(z)
where h(z) is a continuous family of Riemannian metrics on Rn−1 . We define X Bλ := {z > 0, (θi )2 +z 2 < λ2 }, A,λ = Bλ \ B . i
| {z } =: |θ|2
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
19
The gluing construction will take place in the region (4.2)
Ω = A1,4 .
k+4 Let gˆ be a second metric on B5 which is close to g in C1,z −σ (A1,4 ). Here, for φ and k ϕ, smooth strictly positive functions on M, and for k ∈ N, we define Cφ,ϕ to be the space of C k functions or tensor fields for which the norm Pk i (i) kukCφ,ϕ k (g) = supx∈M i=0 kϕφ ∇ u(x)kg
is finite. Let χ be a smooth non-negative function on H , equal to 1 on H \ B3 , equal to zero on B2 , and positive on H \B2 . We set (4.3)
gχ := χˆ g + (1 − χ)g.
In [25] a gluing-by-interpolation of the constraint equations is carried out. In the time-symmetric case, the main interest is that of constant scalar curvature metrics, which then continue to have constant scalar curvature, or for metrics with positive scalar curvature, which then remains positive. Since the current problem is related to the construction of initial data sets for Einstein equations, in general-relativistic matter models such as Vlasov or dust, an interpolation of scalar curvature is of direct interest. One has [25]: n−1 Theorem 4.1. — Let n/2 < k < ∞, b ∈ [0, n+1 2 ], σ > 2 + b, suppose that k+4 k+4 g −˚ g ∈ C1,z−1 . For all gˆ close enough to g in C1,z−σ (A1,4 ) there exists a two-covariant symmetric tensor field h in C k+2−bn/2c (H ), vanishing outside of A1,4 , such that the tensor field gχ + h defines an asymptotically hyperbolic metric satisfying
(4.4)
R(gχ + h) = χR(ˆ g ) + (1 − χ)R(g).
A similar result is established in [25] for the full constraint equations. The proof involves “triply weighted Sobolev spaces” on A1,4 with ϕ = x/ρ,
ψ = xa z b ρc ,
where a and c are chosen large as determined by k, n and σ. Here z is the coordinate of (4.1), the function x is taken to be any smooth function on Ω which equals the z 2˚ g -distance to {|θ|2 + z 2 = 1} ∪ {|θ|2 + z 2 = 4} √ near this last set, while ρ := x2 + z 2 . The heart of the proof is the establishing of the relevant Poincaré and Korn inequalities. Once this is done, the scheme of the proof follows closely the arguments described so far.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
20
P. T. CHRUŚCIEL
One would like to have a version of Theorem 4.1 with weights which exponentially decay as x tends to zero. However, the triply-weighted Korn inequality needed for this has not been established so far. 4.2. Asymptotically Euclidean scalar curvature gluings by interpolation We finish this séminaire by describing a straightforward generalization of Theorem A in the time-symmetric asymptotically Euclidean setting. Let S(p, R) ⊂ Rn denote a sphere of radius R centered at p. Let Ω ⊂ Rn be a domain with smooth boundary (thus Ω is open and connected, and ∂Ω = Ω \ Ω is a smooth manifold). We further assume that ∂Ω has exactly two connected components, and that there exists R0 ≥ 1 such that ΩS := Ω ∩ S(0, R0 )
(4.5)
also has exactly two connected components, with Ω \ B(0, R0 ) = {λp | p ∈ ΩS , λ ≥ 1}.
(4.6)
The regularized differences of cones in the Carlotto-Schoen gluings provide examples of such sets. Another example is displayed in Figure 5. Since the construction
Figure 5. A possible set Ω, located between the two surfaces. The metric coincides with g1 above the first surface, with g2 below the second one, and is scalar-flat if both g1 and g2 were.
can be iterated, the requirement that Ω be connected is irrelevant. We let x : Ω → R be any smooth defining function for ∂Ω which has been chosen so that (4.7)
ASTÉRISQUE 407
x(λp) = λx(p) for λ ≥ 1 and for p, λp ∈ Ω \ B(0, R0 ).
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
21
Equivalently, for p ∈ ΩS and λ larger than one, we require x(λp) = λxS (p), where xS is a defining function for ∂ΩS within S(0, R0 ). We will denote by r a smooth positive function which coincides with |~x| for |~x| ≥ 1. By definition of Ω there exists a constant c such that the distance function d(p) from a point p ∈ Ω to ∂Ω is smooth for all d(p) ≤ cr(p). The function x can be chosen to be equal to d in that region. For β, s, µ ∈ R we define x 2 x σ x2 (4.8) ϕ= r= e−sr/x =: rµ xσ e−sr/x , ψ = r−n/2−β r r r on Ω. One can show that the weighted Poincaré inequality (2.20) holds with these weights, modulo a supplementary integral of |u|2 on a compact subset of Ω, for all tensor fields u compactly supported in Ω as long as s 6= 0 and β ≡ σ + µ + n/2 6= 0. The supplementary integral does not lead to any new difficulties in the proof, which proceeds as described above. In order to carry out the scalar-curvature interpolation, recall that ∂Ω has exactly two connected components. We denote by χ a smooth function with the following properties: 1. 0 ≤ χ ≤ 1; 2. χ equals one in a neighborhood of one of the components and equals zero in a neighborhood of the other component; 3. on Ω \ B(0, R0 ) the function χ is a function of x/r wherever it is not constant. The metric gχ is then defined as in (4.3). Letting Ω, x and r be as just described, with ψ, ϕ given by (4.8), in [24] the following is proved: Theorem 4.2. — Let > 0, k > n/2, β ∈ [−(n−2), 0), and β˜ < min(β, −). Suppose k+4 ∞ that g − δ ∈ Cr,r , where δ is the Euclidean metric. For all real numbers σ and ∩C s > 0 and k+4 all smooth metrics gˆ close enough to g in Cr,r ˜ (Ω), −β there exists on Ω a unique smooth two-covariant symmetric tensor field h such that the metric gχ + h solves (4.9)
R [gχ + h] = χR(ˆ g ) + (1 − χ)R(g).
The tensor field h vanishes at ∂Ω and can be C ∞ -extended by zero across ∂Ω, leading to a smooth asymptotically Euclidean metric gχ + h. There is little doubt that there is an equivalent of Theorem 4.2 in the full initialdata context. In fact, the only missing element of the proof at the time of writing of this review is a doubly-weighted Korn inequality with weights as in (4.8).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
22
P. T. CHRUŚCIEL
The smallness assumptions needed in the theorem can be realized by moving the set Ω to large distances, as in the Carlotto-Schoen theorem. When Ω does not meet S(0, 1), an alternative is provided by “scaling Ω up” by a large factor. This is equivalent to keeping Ω fixed and scaling-down the metrics from large to smaller distances. It should be clear that the metrics will approach each other, as well as the flat metric, when the scaling factor becomes large. Acknowledgements. — I am grateful to Alessandro Carlotto, Justin Corvino and Erwann Delay for useful comments on iterated drafts of this review. Supported in part by the grant FWF P 29517-N16.
REFERENCES [1] A. Ashtekar & R. O. Hansen – “A unified treatment of null and spatial infinity in general relativity. I. Universal structure, asymptotic symmetries, and conserved quantities at spatial infinity”, J. Math. Phys. 19 (1978), no. 7, p. 1542– 1566. [2] R. Bartnik – “The mass of an asymptotically flat manifold”, Comm. Pure Appl. Math. 39 (1986), no. 5, p. 661–693. [3]
, “Quasi-spherical metrics and prescribed scalar curvature”, J. Differential Geom. 37 (1993), no. 1, p. 31–71.
[4] R. Bartnik & J. Isenberg – “The constraint equations”, in The Einstein equations and the large scale behavior of gravitational fields, Birkhäuser, 2004, p. 1–38. [5] R. Beig – “Arnowitt-Deser-Misner energy and g00 ”, Phys. Lett. A 69 (1978/79), no. 3, p. 153–155. [6] R. Beig & P. T. Chruściel – “Killing vectors in asymptotically flat spacetimes. I. Asymptotically translational Killing vectors and the rigid positive energy theorem”, J. Math. Phys. 37 (1996), no. 4, p. 1939–1961. [7] L. Bieri – “An extension of the stability theorem of the Minkowski space in general relativity”, J. Differential Geom. 86 (2010), no. 1, p. 17–70. [8] L. Bieri & P. T. Chruściel – In preparation, 2016. [9] P. Bizoń, T. Chmaj & B. G. Schmidt – “Critical behavior in vacuum gravitational collapse in 4 + 1 dimensions”, Phys. Rev. Lett. 95 (2005), no. 7, 071102, 4. [10] H. L. Bray – “Proof of the Riemannian Penrose inequality using the positive mass theorem”, J. Differential Geom. 59 (2001), no. 2, p. 177–267. [11] A. Carlotto – “Rigidity of stable minimal hypersurfaces in asymptotically flat spaces”, Calc. Var. Partial Differential Equations 55 (2016), no. 3, Art. 54, 20.
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
23
[12] A. Carlotto, O. Chodosh & M. Eichmair – “Effective versions of the positive mass theorem”, Invent. math. 206 (2016), no. 3, p. 975–1016. [13] A. Carlotto & R. Schoen – “Localizing solutions of the Einstein constraint equations”, Invent. math. 205 (2016), no. 3, p. 559–615. [14] Y. Choquet-Bruhat – General relativity and the Einstein equations, Oxford Mathematical Monographs, Oxford Univ. Press, 2009. [15] P. T. Chruściel – “Boundary conditions at spatial infinity from a Hamiltonian point of view”, in Topological Properties and Global Structure of Space-Time (P. Bergmann & V. de Sabbata, eds.), Plenum Press, 1986, p. 49–59. [16] , “A remark on the positive energy theorem”, Class. Quantum Grav. 33 (1986), p. L115–L121. [17] , “On the invariant mass conjecture in general relativity”, Commun. Math. Phys. 120 (1988), p. 233–248. [18] P. T. Chruściel, J. Corvino & J. Isenberg – “Construction of N -body initial data sets in general relativity”, Comm. Math. Phys. 304 (2011), no. 3, p. 637–647. [19] , “Construction of N -body time-symmetric initial data sets in general relativity”, in Complex analysis and dynamical systems IV. Part 2, Contemp. Math., vol. 554, Amer. Math. Soc., 2011, p. 83–92. [20] P. T. Chruściel & E. Delay – “Existence of non-trivial, vacuum, asymptotically simple spacetimes”, Classical Quantum Gravity 19 (2002), no. 12, p. L71– L79 (erratum p. 3389). [21] , On mapping properties of the general relativistic constraints operator in weighted function spaces, with applications, Mém. Soc. Math. Fr., vol. 94, Soc. Math. de France, 2003. [22] , “Manifold structures for sets of solutions of the general relativistic constraint equations”, J. Geom. Phys. 51 (2004), no. 4, p. 442–472. [23] , “Gluing constructions for asymptotically hyperbolic manifolds with constant scalar curvature”, Comm. Anal. Geom. 17 (2009), no. 2, p. 343–381. [24] , “On Carlotto-Schoen-type scalar-curvature gluings”, in preparation, 2016. [25] , “Exotic hyperbolic gluings”, J. Differential Geom. 108 (2018), no. 2, p. 243–293. [26] P. T. Chruściel, G. J. Galloway & D. Pollack – “Mathematical general relativity: a sampler”, Bull. Amer. Math. Soc. 47 (2010), no. 4, p. 567–638. [27] P. T. Chruściel, J. Isenberg & D. Pollack – “Initial data engineering”, Comm. Math. Phys. 257 (2005), no. 1, p. 29–42. [28] P. T. Chruściel & D. Maerten – “Killing vectors in asymptotically flat spacetimes. II. Asymptotically translational Killing vectors and the rigid positive energy theorem in higher dimensions”, J. Math. Phys. 47 (2006), no. 2, 022502, 10.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
24
P. T. CHRUŚCIEL
[29] P. T. Chruściel, F. Pacard & D. Pollack – “Singular Yamabe metrics and initial data with exactly Kottler-Schwarzschild-de Sitter ends. II. Generic metrics”, Math. Res. Lett. 16 (2009), no. 1, p. 157–164. [30] P. T. Chruściel & D. Pollack – “Singular Yamabe metrics and initial data with exactly Kottler-Schwarzschild-de Sitter ends”, Ann. Henri Poincaré 9 (2008), no. 4, p. 639–654. [31] J. Cortier – “Gluing construction of initial data with Kerr–de Sitter ends”, Ann. Henri Poincaré 14 (2013), no. 5, p. 1109–1134. [32] J. Corvino – “Scalar curvature deformation and a gluing construction for the Einstein constraint equations”, Comm. Math. Phys. 214 (2000), no. 1, p. 137–189. [33]
, “On the existence and stability of the Penrose compactification”, Ann. Henri Poincaré 8 (2007), no. 3, p. 597–620.
[34] J. Corvino & L.-H. Huang – “Localized deformation for initial data sets with the dominant energy condition”, preprint arXiv:1606.03078. [35] J. Corvino & D. Pollack – “Scalar curvature and the Einstein constraint equations”, in Surveys in geometric analysis and relativity, Adv. Lect. Math. (ALM), vol. 20, Int. Press, 2011, p. 145–188. [36] J. Corvino & R. M. Schoen – “On the asymptotics for the vacuum Einstein constraint equations”, J. Differential Geom. 73 (2006), no. 2, p. 185–217. [37] G. Darmois – Les équations de la gravitation einsteinienne, Mémorial des sciences mathématiques, vol. 25, Gauthier-Villars, 1927. [38] E. Delay – “Localized gluing of Riemannian metrics in interpolating their scalar curvature”, Differential Geom. Appl. 29 (2011), no. 3, p. 433–439. [39]
, “Smooth compactly supported solutions of some underdetermined elliptic PDE, with gluing applications”, Comm. Partial Differential Equations 37 (2012), no. 10, p. 1689–1716.
[40] E. Delay & L. Mazzieri – “Refined gluing for vacuum Einstein constraint equations”, Geom. Dedicata 173 (2014), p. 393–415. [41] V. I. Denisov & V. O. Solov0 ev – “Energy defined in general relativity on the basis of the traditional Hamiltonian approach has no physical meaning”, Teoret. Mat. Fiz. 56 (1983), no. 2, p. 301–314. [42] Y. Fourès-Bruhat – “Théorème d’existence pour certains systèmes d’équations aux dérivées partielles non linéaires”, Acta Math. 88 (1952), p. 141–225. [43] M. Herzlich – “The positive mass theorem for black holes revisited”, J. Geom. Phys. 26 (1998), nos. 1-2, p. 97–111. [44] G. Huisken & T. Ilmanen – “The inverse mean curvature flow and the Riemannian Penrose inequality”, J. Differential Geom. 59 (2001), no. 3, p. 353–437.
ASTÉRISQUE 407
(1120)
ANTI-GRAVITY À LA CARLOTTO-SCHOEN
25
[45] J. Li & P. Yu – “Construction of Cauchy data of vacuum Einstein field equations evolving to black holes”, Ann. of Math. 181 (2015), no. 2, p. 699–768. [46] V. Moncrief – “Spacetime symmetries and linearization stability of the Einstein equations. I”, J. Mathematical Phys. 16 (1975), p. 493–498. [47] C. B. J. Morrey – Multiple integrals in the calculus of variations, Grundl. math. Wiss., vol. 130, Springer, 1966. [48] R. Penrose – “Asymptotic properties of fields and space-times”, Phys. Rev. Lett. 10 (1963), p. 66–68. [49] R. Schoen & S. T. Yau – “On the proof of the positive mass conjecture in general relativity”, Comm. Math. Phys. 65 (1979), no. 1, p. 45–76. [50]
, “Proof of the positive mass theorem. II”, Comm. Math. Phys. 79 (1981), no. 2, p. 231–260.
[51] E. Witten – “A new proof of the positive energy theorem”, Comm. Math. Phys. 80 (1981), no. 3, p. 381–402.
Piotr T. CHRUŚCIEL University of Vienna Erwin Schrödinger Institute and Faculty of Physics Boltzmanngasse 5 A-1090 Vienna, Austria E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 69e année, 2016–2017, no 1121, p. 27 à 52 doi:10.24033/ast.1059
Novembre 2016
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES [d’après Lackenby] par Arnaud de MESMAY
O time, thou must untangle this, not I. It is too hard a knot for me t’untie. Shakespeare, La Nuit des rois, acte 2, scène 2
INTRODUCTION Comme Shakespeare ci-dessus, le lecteur s’est peut-être déjà retrouvé face à un nœud particulièrement retors qu’il a eu bien du mal à dénouer. L’objectif de cet exposé est de présenter un résultat de Lackenby [18] montrant qu’un nœud trivial n’est jamais exponentiellement ardu, c’est-à-dire qu’un nombre polynomial de mouvements suffit toujours à le démêler. Formellement, nous nous intéressons dans cet exposé aux nœuds réguliers, c’est-àdire aux plongements polygonaux de S1 dans R3 . Deux nœuds sont dits équivalents s’il existe une isotopie ambiante (une déformation continue) de R3 envoyant l’un sur l’autre, et un nœud est trivial s’il est isotope au plongement standard de S1 . Un problème central de la théorie des nœuds est le suivant : Problème 1. — Étant donné un nœud, comment déterminer si celui-ci est trivial ?
Figure 1. Les trois mouvements de Reidemeister.
© Astérisque 407, SMF 2019
28
A. de MESMAY
Nous étudions ce problème dans le cadre combinatoire suivant. Une représentation courante d’un nœud est de projeter ce plongement sur un plan – de façon générique les points d’intersection ne seront pas plus que doubles. En précisant à chaque croisement quel brin passe au-dessus de l’autre, on obtient un diagramme de nœud. Génériquement, la projection d’une isotopie induit une isotopie, avec possiblement trois changements locaux autour des points doubles d’un diagramme de nœud, appelés mouvements de Reidemeister, voir la figure 1. Un diagramme trivial est un cercle plongé dans R2 , et on obtient ainsi le théorème de Reidemeister, stipulant que partant d’un diagramme d’un nœud trivial, il existe une suite de mouvements de Reidemeister et d’isotopies planaires transformant celui-ci en un diagramme trivial. Une approche naturelle pour s’attaquer au problème 1 est donc de trouver cette suite de mouvements de Reidemeister, ou de prouver qu’il n’y en a pas. Mais la question du nombre de mouvements suffisants pour simplifier le diagramme d’un nœud trivial est notoirement épineuse, comme le montre par exemple la discussion initiée par Gowers sur le forum MathOverflow [8]. Une des raisons est que la suite de mouvements de Reidemeister n’est pas nécessairement monotone : pour certains nœuds triviaux, il est nécessaire d’augmenter le nombre de croisements d’un diagramme avant de pouvoir le simplifier. Un exemple d’un tel nœud, dû à Goeritz, est illustré ci-contre, et des familles infinies de tels nœuds triviaux « difficiles » ont été construites par Kauffman et Lambropoulou [16]. Le théorème de Lackenby montre que malgré cette difficulté, on peut toujours dénouer un nœud trivial en utilisant un nombre de mouvements qui est polynomial en la complexité du diagramme initial. La meilleure borne connue précédemment, due à Hass et Lagarias, était exponentielle [10]. Théorème 0.1 (Lackenby [18]). — Soit D le diagramme d’un nœud trivial avec c croisements. Il existe une suite d’au plus (236c)11 mouvements de Reidemeister qui transforment D en le diagramme trivial. Hass et Nowik [12] montrent que certains nœuds nécessitent c2 /25 mouvements de Reidemeister pour être simplifiés. Un entrelacs est un plongement polygonal de deux(1) copies disjointes de S1 dans R3 , et un problème connexe est de déterminer si un entrelacs donné est séparé, c’est-à-dire s’il existe une sphère séparant les deux nœuds. Dans le même cadre combinatoire, un diagramme d’entrelacs déconnecté est un diagramme où les deux brins à chaque point double appartiennent entièrement à un nœud ou à l’autre : intuitivement les deux nœuds ont été séparés l’un de l’autre. Par des mouvements (1)
La définition habituelle d’un entrelacs autorise un nombre arbitraire de composantes connexes, mais dans cet exposé il n’y en aura toujours que deux.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
29
de Reidemeister, on peut transformer tout diagramme d’un entrelacs séparé en un diagramme déconnecté, et là encore, Lackenby montre qu’un nombre polynomial de mouvements suffit. Théorème 0.2 (Lackenby [18]). — Soit D le diagramme d’un entrelacs séparé avec c croisements. Alors il existe une suite d’au plus (49c)11 mouvements de Reidemeister qui le transforment en un diagramme déconnecté. Implications algorithmiques. — Ces bornes polynomiales fournissent un algorithme très simple pour détecter si un nœud est trivial, ou si un entrelacs est séparé : il suffit d’essayer toutes les combinaisons de O(c11 ) de mouvements de Reidemeister possibles (avec la constante correspondant au problème), et de conclure positivement si et seulement si l’un des diagrammes obtenus est trivial/déconnecté. Le nombre d’opérations est exponentiel, ce n’est donc pas un algorithme bien efficace, mais notons qu’aucun algorithme polynomial n’est connu pour ces problèmes (même si en pratique, les meilleurs algorithmes connus ont des bonnes performances, voir Burton et Ozlen [4]). Du point de vue de la théorie de la complexité, cela montre également que ces problèmes sont dans la classe NP, c’est-à-dire que si le nœud est trivial (ou l’entrelacs séparé), il existe un certificat de taille polynomiale qui permet de le vérifier en temps polynomial. Ici, le certificat est simplement la suite de mouvements de Reidemeister à effectuer. Ce résultat avait déjà été établi par Hass, Lagarias et Pippenger [11], mais leur certificat était bien moins naturel, en tout cas pour quelqu’un de non familier avec les surfaces normales. Une avancée très récente, également due à Lackenby [21], est que le problème de déterminer si un nœud est trivial est également dans co-NP, c’est-à-dire que si un nœud n’est pas trivial, il existe également un certificat polynomial permettant de le vérifier. Ce certificat est beaucoup moins évident : on ne peut pas utiliser les mouvements de Reidemeister pour certifier ce sens inverse, et Lackenby utilise la théorie des feuilletages tendus, étudiés par Gabai [7] et Thurston [24]. Une généralisation directe du Problème 1 est de chercher un algorithme qui permette de reconnaître un nœud fixé, par exemple un nœud de trèfle droit. Dans un travail annoncé [19] mais à ma connaissance pas encore publié, Lackenby étend le théorème 0.1 à ce cadre pour montrer que deux diagrammes d’un même nœud donné L diffèrent d’un nombre polynomial de mouvements de Reidemeister (où le polynôme dépend du nœud L). Cela fournit donc un algorithme exponentiel pour ce problème, et montre qu’il est également dans NP. Une autre généralisation, bien plus forte, du Problème 1 est, au lieu de reconnaître juste un nœud donné, de chercher un algorithme décidant si deux nœuds sont équivalents. Les connaissances actuelles sur cette question sont beaucoup plus réduites :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
30
A. de MESMAY
depuis les travaux de Haken, on connaît un algorithme pour résoudre ce problème(2) mais sa complexité est gigantesque, et nous renvoyons le lecteur au livre de Matveev [22] pour plus de détails. Pour conclure cette introduction, mentionnons que les problèmes difficiles, voire indécidables, sont monnaie courante en algorithmique, mais une des spécificités des problèmes venus de la théorie des nœuds (ou plus largement de la topologie en basse dimension) est qu’on ne sait souvent pas prouver qu’ils sont difficiles. Malgré des progrès récents sur quelques questions (notamment, encore une fois, par Lackenby [20]), on ne sait par exemple pas si le problème d’équivalence des nœuds est NP-difficile (ce qui serait un très fort indice qu’il n’admet pas d’algorithme polynomial). Pour une discussion plus en détail de ces questions algorithmiques (entre autres) de théorie des nœuds, nous renvoyons à l’excellent article de survol de Lackenby [19]. Organisation de cet exposé. — La preuve des théorèmes 0.1 et 0.2 repose sur deux théories d’apparence assez distinctes, d’une part la théorie des surfaces normales, d’autre part celle des présentations par arcs. Comme chacune de ces approches fournit indépendamment une borne exponentielle sur le nombre de mouvements de Reidemeister, c’est également une bonne raison pour commencer par les exposer, ce qui est fait en sections 1, 2 et 3. Nous expliquons ensuite la contribution de Lackenby en combinant ces deux approches dans la section 4. La borne polynomiale est obtenue suivant des idées identiques pour le problème de l’entrelacs séparé et du nœud trivial, mais dans le deuxième cas, d’importantes technicités apparaissent. Pour faciliter la présentation des idées principales, nous nous concentrons donc à partir de la section 3 sur le problème de l’entrelacs séparé, pour lequel nous pouvons expliquer presque toutes les étapes de la solution. Dans la section 5, nous discutons des différences à apporter pour traiter le cas du nœud trivial. Enfin, pour améliorer la lisibilité, nous restons vagues sur les constantes et les polynômes apparaissant dans les preuves, utilisant la notation poly(c) pour désigner un certain polynôme en c, dont le degré augmentera au fur et à mesure des arguments. Remerciements. — Je suis reconnaissant à Éric Colin de Verdière, Pierre Dehornoy, Francis Lazarus, Christine Lescop, Corentin Lunel et Jean-Baptiste Meilhan pour leurs nombreux commentaires sur une version préliminaire de cet exposé.
1. SURFACES NORMALES ET UNE PREMIÈRE BORNE EXPONENTIELLE Les surfaces normales sont la pierre angulaire de tout un pan de la théorie algorithmique des nœuds, entrelacs, et plus généralement des 3-variétés. Un très grand (2)
Plus généralement, il permet de tester l’homéomorphisme des variétés de Haken.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
31
nombre de problèmes algorithmiques reviennent à trouver une certaine surface dans une 3-variété triangulée, et une observation fondamentale dont l’idée remonte à Kneser [17] est que dans de nombreux cas, l’on peut supposer que cette surface n’est pas trop compliquée, c’est-à-dire qu’elle n’intersecte une triangulation donnée qu’en des morceaux élémentaires assez simples.
1.1. Triangulations Pour décrire la théorie des surfaces normales, il est nécessaire de trianguler l’espace tridimensionnel que l’on considère, et pour des problèmes sur un nœud ou entrelacs L, cet espace est le complémentaire S3 \ N (L), où N (L) désigne un voisinage régulier de L. Dans cet exposé, une triangulation d’une 3-variété (potentiellement à bord) M est un complexe simplicial pur de dimension 3 homéomorphe à M , tel que chaque point est localement homéomorphe à R3 ou à un demi-espace(3). Si L est un nœud, l’espace N (L) est un tore plein, et la classe d’homologie sur ∂M = ∂N (L) qui borde un disque dans N (L) est appelée méridienne. Une classe d’homologie ayant intersection algébrique 1 avec la méridienne et non liée avec L est appelée longitude. Lemme 1.1. — Un nœud L est trivial si et seulement si il existe un disque plongé dans S3 \ N (L) dont le bord est une longitude. Démonstration. — S’il existe un tel disque, on peut l’utiliser pour obtenir une isotopie de L vers le nœud trivial. Réciproquement, un diagramme trivial fournit un disque ayant pour bord une longitude, et cette propriété est maintenue durant l’isotopie. Pour un nœud L décrit par une succession de n segments dans R3 , ou bien pour un diagramme à c croisements, une triangulation de S3 \ N (L) peut être obtenue avec un nombre polynomial (en n ou en c) de tétraèdres, par exemple en commençant avec L dans le 1-squelette d’une triangulation de S3 , puis en itérant deux subdivisions barycentriques pour creuser et exclure un voisinage tubulaire de L. Nous ne nous attardons pas pour l’instant sur cette construction (voir par exemple Hass, Lagarias et Pippenger [11, Lemme 7.2] pour plus de détails) parce qu’une autre, plus adaptée à notre objectif final, sera décrite en section 4.
(3)
La théorie algorithmique des 3-variétés utilise généralement des triangulations plus souples, autorisant par exemple des tétraèdres à être recollés sur eux-mêmes, mais ce ne sera pas nécessaire ici.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
32
A. de MESMAY
1.2. Surfaces normales Soit M une 3-variété munie d’une triangulation T avec t tétraèdres. On dit qu’une surface S est proprement plongée dans M si elle est plongée et si S ∩ ∂M = ∂S. Une isotopie normale est une isotopie ambiante de M qui préserve la triangulation T . Une surface normale dans T est une surface plongée dans M qui intersecte chaque tétraèdre en une collection disjointe de disques normaux, qui sont soit : – un triangle, qui sépare un sommet du tétraèdre des autres, – ou un quadrilatère, qui sépare une paire de sommets des deux autres. À isotopie normale près, il y a exactement 4 types de triangles et 3 types de quadrilatères dans un tétraèdre, représentés sur la figure 2. Le bord d’un disque normal sur un tétraèdre décrit une courbe normale, qui se décompose en arcs normaux sur chaque face du tétraèdre. Il y a donc à isotopie normale près trois types d’arcs normaux par face (les trois cordes d’un triangle).
Figure 2. Les sept disques normaux dans un tétraèdre.
À isotopie normale près, une surface normale S peut être décrite par le nombre de triangles et de quadrilatères de chaque type dans chaque tétraèdre. Le vecteur de Z7t correspondant, noté [S], forme les coordonnées normales de la surface. Il est naturel de se demander quelles coordonnées normales correspondent à des surfaces proprement plongées, et la réponse est que celles-ci doivent satisfaire les conditions suivantes : – Positivité : Les éléments de [S] doivent être positifs. – Équations d’appariement : Pour chaque type d’arc normal sur une face entre deux tétraèdres, les nombres de disques normaux adjacents à ce type d’arc doivent être égaux de part et d’autre de la face. – Contraintes des quadrilatères : Dans chaque tétraèdre, au plus un des trois types de quadrilatères a une coordonnée non nulle. Lemme 1.2. — Un vecteur [S] ∈ Z7t décrit une surface normale proprement plongée si et seulement si il vérifie ces trois contraintes. De plus, la surface normale est unique à isotopie normale près.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
33
Démonstration. — La positivité est une contrainte évidente, et les équations d’appariement stipulent que pour une face qui n’est pas sur le bord, il y a autant de surfaces qui rentrent que de surfaces qui sortent. De plus, dans un tétraèdre donné, on ne peut plonger de façon disjointe deux quadrilatères d’un type différent. Ces trois contraintes sont donc nécessaires. Réciproquement, à partir d’un vecteur, on obtient une surface en plaçant les triangles et les quadrilatères dans chaque tétraèdre (en mettant les triangles au plus près des sommets pour qu’il n’y ait pas d’intersections), et en les recollant : les équations d’appariement assurent que c’est possible. L’unicité découle de la construction. Si elles n’ont pas de quadrilatères en conflit, deux surfaces normales peuvent être additionnées en additionnant leurs coordonnées normales. Une surface normale est dite fondamentale si elle ne peut être écrite comme une somme [S] = [S1 ] + [S2 ] pour [S1 ] et [S2 ] deux surfaces normales non vides. L’idée de base de la théorie des surfaces normales est que de nombreuses surfaces plongées « intéressantes » dans une 3-variété peuvent être mises sous forme normale. Ainsi, pour chercher une telle surface, il suffit de parcourir l’espace des surfaces normales, dont la structure est bien plus simple que l’espace des surfaces plongées. De plus, il suffit souvent de chercher parmi les surfaces normales fondamentales. Dans les cas qui nous intéressent, le résultat est dû à Haken : Théorème 1.3 (Haken [9]). — Si L est un nœud trivial, il existe une surface normale fondamentale qui est un disque dont le bord est une longitude. Si L est un entrelacs séparé, il existe une surface normale fondamentale qui est une sphère séparant les deux composantes de L. Esquisse de preuve. — Nous décrivons rapidement le cas du nœud trivial, l’entrelacs séparé étant similaire. Si L est un nœud trivial, on sait par le lemme 1.1 qu’il existe un disque ayant pour bord une longitude. Il s’agit alors de le normaliser : dans chaque tétraèdre, ce disque induit plusieurs composantes connexes. Quitte à réaliser des compressions (voir la figure 3), ces composantes connexes sont toutes des disques que l’on va tendre le plus possible, jusqu’à ce qu’il ne reste que des disques normaux. Ensuite, pour montrer que la surface normale peut être supposée fondamentale, il s’agit d’observer que si on l’écrit comme une somme non triviale, l’un des termes convient nécessairement aussi. Ces deux étapes sont non triviales, et nous renvoyons à Matveev [22, Chapitres 3 et 4] pour une preuve détaillée. Le théorème suivant fournit une borne sur la taille des coordonnées normales d’une surface fondamentale.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
34
A. de MESMAY
Figure 3. On normalise un tube en le comprimant le long d’un disque et en éliminant les sphères.
Théorème 1.4 (Hass, Lagarias et Pippenger [11, Lemme 6.1]) La taille des coordonnées normales d’une surface fondamentale [S] ∈ Z7t est bornée par |[S]i | ≤ t · 27t+2 . Avec une analyse minutieuse, ces techniques donnent la borne exponentielle suivante. Théorème 1.5 (Hass et Lagarias [10]). — Tout diagramme d’un nœud trivial à n croisements peut être transformé en un diagramme trivial en utilisant au plus 2c1 n mouvements de Reidemeister pour une certaine constante c1 . Idée de la preuve. — Partant d’un diagramme de nœud à n croisements, on peut obtenir un plongement polygonal du même nœud dans R3 avec O(n) segments. Toute la théorie des surfaces normales ci-dessus peut ensuite être réalisée de façon linéaire, où les tétraèdres sont des vrais tétraèdres et les disques normaux de vrais triangles ou des quadrilatères composés de deux vrais triangles. Par les théorèmes 1.3 et 1.4, il existe un disque normal dont les coordonnées ont une taille au plus exponentielle et ayant une longitude pour bord. On peut simplifier le nœud en le faisant glisser successivement le long de chaque disque normal qui lui est adjacent. Chacun de ces mouvements du nœud L dans R3 induit une fois projeté un nombre borné de mouvements de Reidemeister sur le diagramme de L. À la fin, le nœud sera le bord d’un seul disque fondamental, et on se retrouve avec un diagramme trivial, ce qui conclut la preuve. Telle quelle, cette approche a peu d’espoir d’être optimisée pour fournir une borne polynomiale : en effet Hass, Snoeyink et Thurston [13] ont fourni des exemples de nœuds triviaux constitués de O(n) segments, mais pour lesquels tout disque méridien a au moins 2n−1 faces triangulaires. Remarque 1.6. — Une approche similaire (voir Hayashi [14]) permet d’obtenir une borne sur le nombre de Reidemeister pour séparer un entrelacs, mais (à l’inverse des travaux présentés dans la suite de cet exposé), c’est significativement plus difficile, et
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
35
la borne obtenue est une tour d’exponentielles. Nous ne nous attardons pas là-dessus puisque la section suivante fournit une meilleure borne et de façon plus simple. Remarque 1.7. — Il existe une notion plus forte que celle de surface normale fondamentale : une surface normale S est une surface normale sommet si elle est connexe et si n[S] = [S1 ] + [S2 ] pour un certain n implique que S1 et S2 sont des multiples de S. Jaco et Tollefson [15] ont montré que le théorème 1.3 est aussi vrai avec des surfaces normales sommet, et le théorème 1.4 a également un analogue, avec des meilleures bornes (mais toujours exponentielles). Pour des raisons techniques, Lackenby introduit une notion supplémentaire, celle de surface normale sommet à bord (boundary vertex normal surface) et prouve des théorèmes similaires. Pour rester simple, nous serons imprécis dans cet exposé et amalgamons toutes ces notions sous le terme de surface normale fondamentale.
2. PRÉSENTATION PAR ARCS ET UNE SECONDE BORNE EXPONENTIELLE 2.1. Présentation par arcs Nous nous intéressons maintenant à la présentation par arcs des nœuds et des entrelacs. Introduite initialement par Birman et Menasco [2] pour étudier des tresses, puis étudiée par Cromwell [5], c’est un outil essentiel utilisé par Dynnikov [6] puis par Lackenby dans l’étude des mouvements de Reidemeister. Il y a deux façons équivalentes de décrire une présentation par arcs. Commençons par la plus combinatoire, en lien direct avec notre problématique. Un diagramme rectangulaire d’un nœud ou d’un entrelacs est un diagramme (au sens défini dans l’introduction) où tous les arcs sont soit horizontaux, soit verticaux, les arcs verticaux passent toujours au-dessus des horizontaux, et aucune paire d’arcs n’est colinéaire. La figure ci-contre montre un diagramme rectangulaire d’un entrelacs de Hopf. Dans un diagramme rectangulaire, il y a autant d’arcs horizontaux que verticaux, et leur nombre est l’indice d’arcs du diagramme. On peut facilement rendre tout diagramme de nœud ou d’entrelacs rectangulaire : Lemme 2.1. — Soit D le diagramme d’un nœud ou d’un entrelacs avec c croisements. Alors D est isotope à un diagramme rectangulaire avec indice d’arcs O(c). Esquisse de preuve. — En considérant les croisements comme des sommets, le diagramme D est un graphe planaire à c sommets où tous les sommets ont degré 4. Il s’agit de trouver un nouveau plongement de ce graphe (homéomorphe au premier)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
36
A. de MESMAY
où toutes les arêtes sont des concaténations d’un nombre contrôlé d’arcs horizontaux ou verticaux. C’est un vieux problème de dessin de graphes, voir Storer [23]. En perturbant un peu pour éviter les arêtes colinéaires, et en utilisant le gadget ci-dessous lorsque les arêtes horizontales passent au-dessus des verticales, le résultat suit.
Une autre façon de décrire ces diagrammes rectangulaires passe par les plongements dans un livre de S3 avec un nombre fini de pages. Précisément, considérons S3 comme le joint S1 ∗ S1 , où les deux cercles S1 forment un entrelacs de Hopf. Cela fournit des coordonnées (φ, τ, θ) pour S3 , où φ, θ ∈ R/2πZ sont les coordonnées du cercle S1 , et τ ∈ [0, 1]. Les points (φ, 0, θ1 ) et (φ, 0, θ2 ) sont identifiés pour toutes valeurs de θ1 et θ2 , tout comme (φ1 , 1, θ) et (φ2 , 1, θ) pour toutes valeurs de φ1 et φ2 . Les cercles τ = 0 et τ = 1 sont notés S1φ et S1θ respectivement, et les points satisfaisant θ = t et τ > 0 décrivent une page notée Dt . Un entrelacs L est présenté par arcs si L ∩ S1φ est un ensemble fini de points (les sommets de L), et pour tout t ∈ R/2πZ, l’intersection Dt ∩ L est soit vide, soit un arc reliant deux sommets distincts. Cela correspond à l’idée de dessiner L dans un livre ouvert, où la reliure est le cercle S1φ : voir la figure 4. L’indice d’arcs d’une telle présentation est le nombre de pages utilisées. Il se trouve que les présentations par arcs et les diagrammes rectangulaires sont rigoureusement le même objet. En effet, remarquons d’abord qu’à isotopie près, pour décrire une présentation par arcs il suffit de préciser les coordonnées φ1 , . . . , φn des sommets, les pages θ1 , . . . , θn des arcs et sur quels sommets sont attachés les arcs. Pour en déduire un diagramme rectangulaire, il suffit d’utiliser les θi , respectivement les φi , comme les abscisses x1 , . . . xn des arcs verticaux, respectivement comme les ordonnées y1 , . . . yn des arcs horizontaux, et en attachant ceux-ci de la même façon que les arcs étaient attachés aux sommets. Cette bijection peut se visualiser de la façon suivante, voir la figure 4 : – – – –
Dans chaque page, tracer les arcs avec des demi-rectangles. Éloigner les sommets de la reliure par des arcs de cercle d’un petit rayon ε. « Refermer » presque entièrement le livre. Regarder par la tranche.
Par construction, les arcs verticaux se retrouvent toujours devant les arcs horizontaux, conformément à la définition d’un diagramme rectangulaire.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
37
Figure 4. D’une présentation par arcs de l’entrelacs de Hopf à un diagramme rectangulaire.
2.2. Mouvements sur les diagrammes rectangulaires La construction précédente n’est pas tout à fait bien définie puisque les angles sont définis modulo 2π alors que les abscisses et ordonnées des segments sont des réels. Pour pallier ce problème, il est naturel de considérer les diagrammes rectangulaires modulo une permutation cyclique des arêtes verticales ou horizontales, voir la figure 5a. Deux autres types de mouvements vont également nous intéresser : les stabilisations/déstabilisations (figure 5b) et les échanges horizontaux ou verticaux (figure 5c) – ces derniers ne sont autorisés que lorsqu’il n’y a pas de segments entre les segments échangés et que les extrémités ne sont pas intercalées. Notons que ces mouvements préservent la classe d’isotopie de l’entrelacs, comme on peut le voir en les transcrivant dans le monde des présentations par arcs (figure 5d). En conséquence, ces mouvements peuvent être réalisés par des mouvements de Reidemeister, et le lemme suivant, dont la preuve est laissée en exercice, montre qu’il n’en faut pas trop.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
38
A. de MESMAY
a.
c.
b.
d. Figure 5. a. Permutation cyclique des arêtes verticales. b. Stabilisation (haut vers bas) et déstabilisation (bas vers haut). c. Mouvement d’échange horizontal. d. Mouvements d’échanges horizontaux et verticaux sur les présentations par arcs.
Lemme 2.2. — Soit D un diagramme rectangulaire d’indice d’arcs n. Une permutation cyclique, un mouvement d’échange ou une déstabilisation peuvent être réalisés par poly(n) mouvements de Reidemeister. Parmi les mouvements sur les diagrammes rectangulaires, seule la stabilisation augmente l’indice d’arcs du diagramme. Toute la force des diagrammes rectangulaires est alors illustrée dans le théorème de Dynnikov suivant : Théorème 2.3 (Dynnikov [6]). — Soit D le diagramme rectangulaire d’un nœud trivial (respectivement d’un entrelacs séparé), alors il existe une suite de permutations cycliques, déstabilisations et échanges transformant D en un diagramme trivial (respectivement en un diagramme déconnecté). C’est un résultat de simplification monotone : la complexité du diagramme n’augmente jamais au cours de la simplification. Comme nous l’avons vu dans l’introduction, un tel résultat serait impossible avec des mouvements de Reidemeister. La complexité n’est pas strictement décroissante pour autant, puisque les permutations et les échanges ne la changent pas. Mais comme le nombre de cartes planaires de degré 4 est simplement exponentiel (voir par exemple Bousquet-Mélou [3]), le nombre
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
39
de diagrammes rectangulaires d’indice d’arcs n est exponentiel en n2 , et cela fournit donc une borne exponentielle sur le nombre de mouvements nécessaire pour trivialiser un diagramme (ou séparer un diagramme d’entrelacs). En combinant cela avec les lemmes 2.1 et 2.2, cela donne également une borne exponentielle sur le nombre de mouvements de Reidemeister. On obtient de plus le corollaire suivant : Corollaire 2.4 (Dynnikov [6]). — Soit D le diagramme d’un nœud trivial avec c croisements. Alors il existe une suite de mouvements de Reidemeister le transformant en un diagramme trivial, telle que chaque diagramme a au plus poly(c) croisements. Afin d’améliorer le théorème 2.3 et d’obtenir des bornes polynomiales, nous rentrons maintenant dans la preuve du théorème 2.3.
3. SIMPLIFICATION MONOTONE 3.1. Surface caractéristique, feuilletage et graphe induit Comme vu plus haut (lemme 1.1), un nœud est trivial si et seulement si il borde un disque plongé. Similairement, un entrelacs est séparé si et seulement si il existe une sphère disjointe de l’entrelacs séparant ses composantes connexes. Appelons ces deux surfaces les surfaces caractéristiques du problème correspondant. L’approche pour prouver le théorème 2.3 consiste, partant d’une présentation par arcs d’un nœud ou d’un entrelacs, à placer la surface caractéristique S dans une certaine position générale vis-à-vis des cercles Sφ1 , Sθ1 et des pages Dt . Ensuite, les pages Dt induisent un feuilletage sur la surface S \ Sφ1 . Ce feuilletage permet de définir un graphe sur la surface caractéristique, et un argument de caractéristique d’Euler montre que ce graphe possède nécessairement certaines sous-structures. Celles-ci pourront être utilisées pour identifier certains mouvements (qui n’utilisent pas de stabilisation !) sur la présentation par arcs du nœud ou de l’entrelacs qui permettent de simplifier le graphe et donc la surface. Une fois que celle-ci est aussi simple que possible, le diagramme rectangulaire que l’on obtient est trivial ou déconnecté et le théorème 2.3 est établi. Pour rentrer un peu plus dans les détails, comme annoncé dans l’introduction nous nous concentrons à partir de maintenant sur le problème de la séparation d’un entrelacs. Remarquons que pour ce problème, les idées principales sont déjà présentes dans les travaux de Birman et Menasco [1] et Cromwell [5], la contribution essentielle de Dynnikov étant de les appliquer au cas du nœud trivial. Soit donc S une surface caractéristique d’un entrelacs séparé L, décrit par une présentation par arcs. Les pages Dt induisent un feuilletage F sur S \ S1φ , qui a peutêtre des singularités. On dit que la surface caractéristique est sous forme admissible si :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
40
A. de MESMAY
Figure 6. Les trois types de singularités du feuilletage les pôles et les selles.
F
: les sommets,
1. S est lisse. 2. S intersecte l’axe S1φ en un nombre fini de points, appelés sommets. 3. Le feuilletage F a un nombre fini de singularités, qui sont des points de tangence entre S et les pages Dt . 4. Toutes les singularités sont de type Morse, c’est-à-dire des minima ou maxima locaux ou des selles. 5. Chaque page Dt contient au plus un arc de L ou une singularité de F mais pas les deux. Des arguments de position générale montrent qu’on peut toujours supposer qu’une surface caractéristique pour l’entrelacs L est sous forme admissible. La complexité de la surface S est son nombre de sommets, noté v. D’après la condition 4, les singularités du feuilletage F sont soit des sommets, soit des maxima/minima, appelés pôles, soit des selles, voir la figure 6. Parmi les feuilles du feuilletage, celles qui sont adjacentes à une selle sont appelées séparatrices. Considérons le graphe G dont les sommets(4) sont les sommets et les selles, et les arêtes sont les séparatrices. C’est un graphe planaire, puisque plongé sur la sphère S, et il a donc des faces. Par construction, les selles ont toujours quatre arêtes incidentes, désignons leur nombre par s, par vi le nombre des sommets ayant degré i (c’est-à-dire i arêtes incidentes) et par p le nombre de pôles. La surface caractéristique est appelée finale si elle n’a pas de singularités et uniquement deux sommets de degré 0 : en effet le diagramme rectangulaire correspondant est alors déconnecté. Les observations suivantes sont laissées en exercices (très instructifs) pour le lecteur : 1. 2. 3. 4. 5.
(4)
Une séparatrice ne relie jamais deux selles distinctes. Si la surface n’est pas finale, v0 = 0. v1 = 0. S’il n’y a pas de pôle, une séparatrice ne relie jamais une selle à elle-même. S’il n’y a pas de pôle, toutes les faces du graphe G ont degré 4 (c’est-à-dire qu’elles sont adjacentes à quatre arêtes).
La terminologie est un peu malheureuse.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
41
Lemme 3.1. — Si S n’est pas finale, le feuilletage F a au moins un pôle, ou bien le graphe G a au moins un sommet de degré 2 ou un sommet de degré 3. Démonstration. — Supposons que le feuilletage F n’ait pas de pôle. D’après les observations précédentes, G est une quadrangulation bipartie de la sphère. La caracP téristique d’Euler et un double comptage des arêtes nous donnent k kvk + 4s = P P 4( k vk + s) − 8, et donc 2v2 + v3 = 8 + k≥4 (k − 4)vk . En particulier, v2 ou v3 est strictement positif. 3.2. Mouvements de simplification Montrons maintenant que si la surface caractéristique contient une des structures indiquées par le lemme 3.1, on peut simplifier celle-ci, c’est-à-dire réduire sa complexité, en utilisant des mouvements sur l’entrelacs L qui n’utilisent pas de stabilisation. Suppression des pôles.— Un pôle peut en fait être supprimé par une modification locale de la surface sans même déplacer l’entrelacs. En effet, un pôle est nécessairement entouré par une séparatrice reliant une selle à elle-même. En « poussant » sur le pôle, on peut faire disparaître celui-ci, ainsi que la selle par la même occasion, comme sur la figure ci-contre. Il convient de vérifier que l’entrelacs L ne peut pas être sur le chemin de cette poussée, ce qui est le cas puisque chacun de ses arcs est contenu dans une seule page Dt . On obtient donc ainsi une surface caractéristique admissible avec un pôle et une selle de moins. Nous pouvons donc effectuer cette opération sur tous les pôles et supposer que le feuilletage F n’a pas de pôle. Il a donc des sommets de degré 2 ou 3. Suppression des sommets de degré 2.— Si G a un sommet de degré 2, désigné par v, ce sommet est relié à 2 selles notées s1 et s2 . Les deux faces adjacentes à v, s1 et s2 contiennent chacune un autre sommet, appelés v1 et v2 . La situation est alors illustrée dans l’image en haut à gauche de la figure 7. Encore une fois, l’idée est de pousser la surface S, cette fois de sorte qu’au lieu d’intersecter S1φ en trois points v, v1 et v2 , elle ne l’intersecte plus qu’une fois. Le problème est que des brins de l’entrelacs L peuvent être sur le chemin de cette isotopie, et il est donc nécessaire de les déplacer également. La figure 7 montre comment déplacer les brins pour atteindre cet objectif sans utiliser de stabilisation : les mouvements sont juste une succession d’échanges horizontaux et verticaux (et peut-être de permutations cycliques sur le diagramme rectangulaire). Cette illustration considère un cas simple où un seul arc de l’entrelacs est à déplacer de part et d’autre, mais si les arcs en question sont multiples, on peut réaliser les mêmes opérations sur tous les arcs en même temps : c’est ce que Dynnikov
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
42
A. de MESMAY
v1 S
S
S
v
s1 s2
L
L
v2 L
L
S1φ
S1φ
S1φ S
S
S
L
L S1φ
L
L
L
L S1φ
S1φ
Figure 7. Élimination d’un sommet de degré 2.
appelle un mouvement d’échange généralisé. À la dernière étape, l’entrelacs n’est plus sur le trajet de l’isotopie de la surface qu’on souhaite effectuer, il ne reste donc plus qu’à la faire pour éliminer le sommet de degré 2. La série de mouvements d’échanges et de permutations cycliques effectués ici sera résumée sous le terme mouvement de simplification. Le nombre d’arcs à déplacer étant borné par l’indice d’arcs de l’entrelacs, il découle du lemme 2.2 qu’un tel mouvement de simplification utilise un nombre polynomial de mouvements de Reidemeister. Suppression des sommets de degré 3. — Si G a un sommet v de degré 3, alors le graphe autour de v est illustré par la figure 8a, dont nous utiliserons les notations : les sommets, repérés avec des points noirs, sont v, v1 , v2 , v3 , v4 et v5 et les selles (avec des points blancs) sont notées s1 , s2 et s3 . L’objectif est de transformer ce graphe comme indiqué par la figure, de sorte que le sommet v ait maintenant un degré 2, que l’on pourra éliminer par la méthode précédente. Dans cette transformation, seules les selles s1 et s2 nous intéressent. Géométriquement, la situation est celle de la figure 8b où l’on voit les 6 sommets adjacents à ces deux selles. Pour correspondre à la représentation habituelle d’une selle, le cercle S1φ est ici représenté comme un cercle horizontal, les pages sont alors en première approximation des plans horizontaux. À gauche, v est connecté à la fois aux selles s1 et s2 , mais en montant un peu l’une
ASTÉRISQUE 407
(1121)
43
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
v2
v3
v4
s1
v1
v2
v3
s2
s2
s1 v5
v
v4
v1
v5
v
s3
s3 a.
s1
v2 v1
v5 s2
v1
v
v5
s2
v2
s1
v
b. Figure 8. a. Élimination d’un sommet de degré 3. b. L’isotopie consiste à monter s2 de façon à ce qu’elle « cache » s1 depuis v.
et en descendant l’autre, on peut faire en sorte que s1 soit « cachée » par s2 . Encore une fois, il faut déplacer les arcs de L (et peut-être d’autres morceaux de S) sur le chemin de cette isotopie, ce qui se réalise avec des mouvements d’échange montant ou descendant ces arcs. Notamment, on n’utilise encore une fois pas de stabilisation. Le lemme 2.2 montre que ce mouvement de simplification utilise aussi un nombre polynomial de mouvements de Reidemeister.
Ainsi, d’après le lemme 3.1, si la surface caractéristique est non triviale il y a forcément un sommet de degré 2 ou 3, et nous avons vu comment simplifier ceuxci sans utiliser de stabilisation. En itérant, cela montre le théorème 2.3 dans le cas d’un entrelacs séparé. Notons que si l’on disposait d’une borne sur la complexité de
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
44
A. de MESMAY
la surface caractéristique, cela en fournirait une sur le nombre de mouvements de Reidemeister effectués. Tout ceci nous amène à la section suivante.
4. UNE BORNE POLYNOMIALE Nous avons maintenant en main tous les éléments pour expliquer comment obtenir les théorèmes 0.1 et 0.2. L’idée essentielle de Lackenby est de combiner les mouvements de simplification monotone de la section précédente avec des surfaces normales. Il s’agit d’abord de travailler avec une triangulation adaptée aux présentations par arcs, et celle-ci permettra de supposer que la surface caractéristique est (plus ou moins) en position normale, et est même fondamentale. Sa complexité est alors directement corrélée avec la taille de ses coordonnées normales, qui est bornée par le théorème 1.4. Hélas, cette borne est exponentielle, ce qui a priori ne permet pas de progresser. Mais puisqu’on travaille avec une triangulation ayant un nombre polynomial de tétraèdres, cela signifie qu’un nombre exponentiel de disques normaux seront parallèles (c’est-à-dire de même type). Et lorsqu’on opère un mouvement de simplification, on observe qu’il simplifie non seulement la singularité en question, mais également toutes celles sur des morceaux de la surface caractéristique qui lui sont parallèles. On peut donc s’attendre à ce qu’un nombre polynomial de mouvements de simplification suffise à simplifier la surface caractéristique de complexité exponentielle en une surface triviale. Pour confirmer cette intuition, nous verrons qu’il s’agit de montrer que le nombre de sommets de degré 2 ou 3 représente une proportion importante des sommets du graphe G. Cela ne découle pas directement de l’argument de caractéristique d’Euler du lemme 3.1 : en effet, la complexité exponentielle de la surface normale pourrait être concentrée autour de sommets de degré 4. La contribution clé de Lackenby est d’observer que dans ce cas-là, la surface normale n’est pas fondamentale, car une telle surface est la somme d’un tore et d’une surface non triviale. Trouver ce tore est une affaire délicate, qui constitue une part très technique de la contribution de Lackenby ; nous ne présenterons que quelques idées de la preuve à la fin de la section. 4.1. La triangulation de Dynnikov Partant d’un diagramme d’entrelacs L rendu rectangulaire, on obtient une présentation par arcs de L, d’indice d’arcs n = O(c). Dynnikov a observé qu’une présentation par arcs induit naturellement une triangulation de S3 contenant l’entrelacs étudié dans son 1-squelette. Partant du joint S3 = S1θ ∗ S1φ , un entrelacs L en présentation par arcs d’indice d’arcs n intersecte S1φ en n points. Dans chaque page non vide, on peut supposer à isotopie près que L est une concaténation de deux segments adjacents à S1θ , et
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
S1φ
45
S1φ
v3 S1θ S1θ
v2 t3 t2
t1
v1 Figure 9. La triangulation de Dynnikov et le feuilletage induit sur des disques normaux.
qui peuvent donc chacun être décrits par des coordonnées (φ, τ, θ), avec φ et θ fixés et 0 ≤ τ ≤ 1. Notons v1 < · · · < vn les sommets de L ∩ S1φ , et par t1 < · · · < tn les points de L ∩ S1θ . Les simplexes [vi , vi+1 ] ∗ [tj , tj+1 ] (numérotés modulo n) triangulent alors S3 et la triangulation obtenue, notée T , contient L dans son 1-squelette, voir la figure 9. Cette triangulation contient O(c2 ) tétraèdres. Nous allons alors travailler avec les surfaces normales de cette triangulation comme des surfaces caractéristiques pour les arguments de la section 3. Cela pose des difficultés techniques : une telle surface n’est certainement pas lisse, et ses singularités peuvent ne pas être de type Morse. Néanmoins, la surface peut être réalisée de façon linéaire par morceaux : les triangles seront linéaires et les quadrilatères peuvent être séparés en deux triangles. Les singularités par rapport au feuilletage induit par les pages sont alors isolées, et le même genre d’étude qu’en section 3 peut être mené. On introduit donc une surface PL-admissible S plongée dans l’extérieur d’un entrelacs L dans ce nouveau contexte ainsi : 1. 2. 3. 4. 5.
S sépare les deux composantes de L. S est linéaire par morceaux dans chaque simplexe de T . S intersecte S1φ un nombre fini de fois. Par rapport au feuilletage induit par les pages, S a un nombre fini de singularités. Chaque page contient au plus un arc de L ou une singularité de S, mais pas les deux.
Une surface normale linéaire par morceaux vérifie ces hypothèses. On appelle comme précédemment un sommet tout point de S ∩ S1φ , et comme en section 3, on définit un graphe G plongé sur S en prenant pour sommets les sommets et les singularités et pour arêtes les feuilles adjacentes aux selles. Notons que les singularités par
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
46
A. de MESMAY
rapport au feuilletage sont encore soit des pôles, soit des selles, mais les selles peuvent être des selles généralisées, c’est-à-dire qu’elles peuvent avoir un degré pair supérieur à 4 dans le graphe G. Remarque 4.1. — Avant de continuer, adressons un avertissement au lecteur : nous étudions maintenant en même temps trois structures discrètes : 1. La triangulation T . 2. La surface S, vue comme une surface normale, donc décomposée en disques normaux. 3. Le graphe G plongé sur la surface S, et qui découpe celle-ci en faces. Il faut faire attention dans ce qui suit à ne pas confondre la deuxième et la troisième : par exemple une face de G peut contenir plusieurs disques normaux. La complexité d’une surface normale PL-admissible est la somme de ses coordonnées normales. Par le théorème 1.4, cette complexité est au plus exponentielle en le nombre de croisements de L, et c’est une borne supérieure sur le nombre de sommets de S. Encore une fois, on peut simplement se débarrasser des pôles. Lemme 4.2. — Une surface PL-admissible de complexité minimale n’a pas de pôle. Idée de la démonstration. — On observe d’abord que par construction, s’il y a un pôle, celui-ci est nécessairement sur une arête de S1θ , et qu’il n’est adjacent qu’à des triangles. De façon similaire à l’opération de la section 3.2, on peut alors « pousser » sur ce pôle pour le faire disparaître, ce qui réduira la complexité de la surface, contredisant l’hypothèse de minimalité. 4.2. Mouvements de simplification parallèles Concrétisons maintenant cette notion de surfaces parallèles. L’étoile d’un sommet v du graphe G est l’union des faces de G qui le contiennent. Deux sommets v1 et v2 de S ∩ S1φ sont dits de même type si leurs étoiles sont normalement parallèles, c’est-àdire qu’une isotopie normale envoie l’une sur l’autre. Lemme 4.3. — Le nombre de types de sommets dans S est polynomial en c. Démonstration. — Dans la surface normale S, considérons les disques normaux extrêmes, c’est-à-dire ceux qui ne sont pas intercalés entre deux disques normaux du même type. Puisqu’il y a 7 types de disques normaux par tétraèdre, et O(c2 ) tétraèdres, il y a également O(c2 ) disques normaux extrêmes. Pour chaque type de sommet, l’étoile d’un des sommets de ce type contient nécessairement un tel disque extrême. Comme un disque normal appartient à au plus deux étoiles, cela prouve le lemme.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
47
Le nombre potentiellement exponentiel de sommets est donc partitionné en un nombre polynomial de types. De plus, lorsqu’on applique un mouvement de simplification à un sommet, on l’applique en fait également à tous les sommets de même type, comme le montre la proposition suivante. Proposition 4.4. — Soit D une présentation par arcs d’un entrelacs L. Soit S une surface PL-admissible par rapport à la triangulation T . Si S contient m sommets de degré 2, ou m sommets de degré 3, tous avec des étoiles normalement parallèles, alors il y a un mouvement de simplification réduisant le nombre de sommets de S de 2m. La preuve consiste simplement à regarder de nouveau les figures 7 et 8 en remplaçant les surfaces par m surfaces parallèles : il suffit de réaliser un seul mouvement de simplification sur l’entrelacs L (le même que s’il y avait une seule surface), et l’on peut ensuite isotoper les m surfaces d’un coup pour faire disparaître 2m sommets de S. 4.3. La fin de la preuve Il « suffit » maintenant de montrer qu’un nombre important de sommets de S sont de degré 2 ou 3 du même type : alors la proposition 4.4 permet de les éliminer avec un unique mouvement de simplification. Regardons où nous mène le calcul du lemme 3.1 dans ce nouveau contexte. On sait qu’il n’y a pas de pôle, et la seule différence est donc que les selles peuvent avoir un degré supérieur à 4 ; notons sk le nombre de selles P P de degré k, et on obtient maintenant k k(vk + sk ) = k 4(vk + sk ) − 8 et donc P 8 = k (4 − k)(vk + sk ). On en déduit que si le nombre de sommets et de selles de degré 4 n’est pas trop grand par rapport au nombre de sommets, alors les sommets de degré 2 ou 3 doivent être nombreux pour compenser. La force de ce calcul s’arrête cependant ici : comme le montre l’exemple d’un cube où l’on subdivise les faces en petits carrés, il est tout à fait possible que l’essentiel des sommets soient de degré 4. Dans ce cas-là, Lackenby s’intéresse à la région euclidienne E sur la surface S : celle-ci est définie en prenant l’union de toutes les faces, des arêtes entre celles-ci et des sommets ou selles de degré 4. La région euclidienne peut être équipée de la métrique euclidienne obtenue en considérant les faces comme des carrés. Son bord ∂E est simplement l’ensemble des sommets et selles de degré différent de 4. Le théorème clé, permettant de borner le nombre de sommets de degré 4, est alors le suivant : Théorème 4.5. — Soit L un entrelacs séparé, présenté par arcs, d’indice d’arcs n et soit S une surface normale PL-admissible et fondamentale, et de complexité minimale parmi celles-ci. Alors tout point de E est à distance poly(n) du bord de E. Admettons pour l’instant ce résultat, et déduisons-en le corollaire suivant. Corollaire 4.6. — Le nombre v4 de sommets de degré 4 est au plus poly(c)|∂E|.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
48
A. de MESMAY
Démonstration. — D’après le théorème 4.5, tout point de E est à distance poly(n) = S poly(c) du bord de E. Donc E ⊆ x∈∂E B(poly(c), x), et donc l’aire de E est majorée par poly(c)|∂E| (où le polynôme a été mis au carré). Comme chaque sommet de degré 4 contribue d’au plus 1 à l’aire de E, cela prouve le corollaire. Nous avons enfin tous les éléments pour obtenir une borne polynomiale sur le nombre de mouvements de Reidemeister pour séparer un entrelacs. P Preuve du théorème 0.2. — Nous avons établi plus haut que 8 = k (4 − k)(vk + sk ), donc X X X X 2v2 + v3 = 8 + (k − 4)vk + (k − 4)sk ≥ vk + sk . k>4
k>4
k>4
k>4
De plus, par le corollaire 4.6, v4 ≤ poly(c)|∂E| ≤ poly(c)(
X
vk +
k6=4
⇒ v2 + v3 ≥
X
sk )
k>4
X X v4 − vk − sk . poly(c) k>4
k>4
En combinant les deux équations, on obtient : X X v4 5v2 + 3v3 ≥ + vk + sk poly(c) k>4
k>4
V ⇒ 6v2 + 4v3 ≥ poly(c) où V est le nombre de sommets de G. Donc non seulement il y a nécessairement des sommets de degré 2 ou 3, mais il y en a une fraction importante parmi tous les sommets. D’après le lemme 4.3, il n’y a qu’un nombre polynomial de types de sommets de degré 2 ou 3. Donc il y a une collection d’au moins V /poly(c) sommets de degré 2 ou 3, tous de même type. On applique maintenant la proposition 4.4 qui permet de réduire la complexité de S de V /poly(c) avec un seul mouvement de simplification. En renormalisant la surface S à chaque fois si nécessaire, on peut répéter cette simplification jusqu’à obtenir la sphère triviale. Rappelons enfin qu’initialement, le nombre de sommets V est en 2poly(c) par le théorème 1.4. En notant x le nombre de mouvements de simplifications à effectuer pour obtenir un diagramme séparé, nous avons donc : x−1 1 poly(c) 2 1− ≥ 1. poly(c) On obtient x ≤ poly(c), ce qui conclut la preuve puisqu’un mouvement de simplification utilise un nombre polynomial de mouvements de Reidemeister.
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
49
4.4. Borner la taille de la région euclidienne Il reste à démontrer le théorème 4.5, mais la preuve est très technique et dépasse les ambitions de cet exposé. Nous nous contenterons d’en raconter certains points saillants et renvoyons à l’excellente exposition de Lackenby [18, sections 8 et 9] pour plus de détails. – Supposons que E contienne un point très éloigné de son bord. Alors, autour de ce point, il y a une large région euclidienne E. La taille de la triangulation de Dynnikov étant polynomiale, si large signifie plus grand que ce polynôme, alors E « revient sur elle-même », c’est-à-dire qu’elle contient des disques normaux parallèles. Lorsque un point revient sur lui-même, cela permet de définir une application de premier retour, envoyant un point sur le même point sur le premier disque parallèle. La stratégie est de montrer que lorsque la région euclidienne est large, les coordonnées normales d’un de ses sous-ensembles décrivent un tore, ce qui contredit l’hypothèse que la surface S est fondamentale (modulo la remarque 1.7). – Pour ce faire, Lackenby utilise des surfaces branchées, qui sont les 2-complexes obtenus en identifiant tous les disques normaux parallèles dans les divers simplexes. Cela permet de donner un sens géométrique au tore que l’on cherche : il s’agit de le trouver comme un sous-complexe de la surface branchée induite par S. – On montre d’abord que si E contient une large région sans bord, elle contient en fait une grande sous-région où tous les points reviennent sur eux-mêmes (et donc l’application de premier retour est définie). Cet argument utilise de manière essentielle le fait que S soit une surface normale fondamentale. – Enfin, on observe que l’application de premier retour est covariante par translation sur cette grande sous-région. Cela permet de trouver un segment qui revient sur lui-même, formant un cylindre, et même un cylindre où les deux bords sont identifiés par l’application de premier retour, ce qui donne un tore.
5. DE L’ENTRELACS SÉPARÉ AU NŒUD TRIVIAL Concluons cet exposé par quelques mots sur les changements à effectuer pour traiter le cas d’un nœud trivial L au lieu d’un entrelacs séparé. L’approche générale est identique, mais la surface caractéristique S devient un disque au lieu d’une sphère, et la présence de ce bord induit un certain nombre de difficultés techniques. Un problème essentiel est que les surfaces normales par rapport à la triangulation de Dynnikov sont par essence disjointes ou transverses à L, alors que la surface caractéristique est un disque qui a ce nœud pour bord. Pour concilier les deux, on modifie
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
50
A. de MESMAY
K K
Figure 10. Les tétraèdres sont tronqués dans un voisinage du nœud L.
donc la triangulation en découpant les tétraèdres de sorte à exclure un voisinage de L, voir la figure 10. Les tétraèdres deviennent alors des tétraèdres tronqués, et Lackenby travaille avec des surfaces normales dans ces tétraèdres modifiés. La théorie reste globalement la même, mais les constantes explosent (au lieu de 7, il y a maintenant 106 types de disques fondamentaux dans un tétraèdre tronqué). Le nœud L est isotope à une certaine courbe C de complexité polynomiale qui est sur le bord de cette triangulation tronquée et transverse à son 1-squelette : cette courbe sera le bord de la surface caractéristique S. Un problème est que les disques normaux ne sont maintenant plus des triangles ou des quadrilatères, et si on peut les réaliser de façon linéaire par morceaux, cette réalisation n’est pas simple. En particulier, on peut maintenant trouver les selles généralisées du paragraphe 3 à l’intérieur d’un disque normal lorsque celui-ci touche le bord. C’est la source de nombreuses complications, par exemple le lemme 4.2 n’est plus vrai et il peut y avoir des pôles sur S. Mais l’observation clé est que les pathologies n’ont lieu que sur ou près du bord, qui a une complexité polynomiale. Ainsi, les selles intérieures aux faces, tout comme les pôles et de nombreuses autres pathologies ne sont également qu’en nombre polynomial. Similairement, la région euclidienne de la section 4.3 devient trop pathologique près du bord et il convient de l’arrêter avant, mais par le même argument, elle reste suffisamment large. Son bord peut maintenant avoir dimension 1 et n’être plus une union disjointe de sommets, mais cela change peu les arguments qui la concernent, notamment pas la preuve du théorème 4.5. Ces bornes polynomiales permettent d’effectuer un calcul similaire à celui de la section 4.3 et de conclure que si S a une grande complexité, alors les sommets de degré 2 ou 3 (non pathologiques) occupent une fraction importante du nombre total de sommets. On peut alors les supprimer et recommencer un nombre polynomial de fois, jusqu’à ce que la complexité du disque soit polynomiale. Mais il est nécessaire de s’arrêter là : il est possible que tout ce qui reste soit pathologique. Pour finir, on observe que le disque PL-admissible de complexité polynomiale que l’on a atteint peut être modifié pour donner un disque admissible lisse au sens de Dynnikov (comme au paragraphe 3.1) de complexité polynomiale – à ceci près que dans la définition d’une surface caractéristique admissible, il faut maintenant aussi contrôler ce qu’il se passe sur le bord. En effet, il est nécessaire d’autoriser la surface
ASTÉRISQUE 407
(1121)
NŒUDS, MOUVEMENTS DE REIDEMEISTER ET ALGORITHMES
51
à avoir des selles sur le bord, ainsi qu’un sommet d’enroulement, qui est un point de ∂S ∩ Sϕ1 autour duquel le disque décrit un angle supérieur à 2π. La complexité du disque étant polynomiale, l’approche de la section 3 sera maintenant assez puissante pour montrer qu’il suffit d’un nombre additionnel polynomial de mouvements pour conclure. Mais les selles sur le bord et le sommet d’enroulement causent des complications et il est nécessaire d’utiliser non seulement les mouvements de simplification que nous avons introduits en section 3, mais aussi d’autres sur le bord. Chacun de ces mouvements réduisant la complexité du disque, il suffit ensuite d’en effectuer un nombre polynomial pour arriver, enfin, au nœud trivial.
RÉFÉRENCES [1] J. S. Birman & W. W. Menasco – Studying links via closed braids. I. A finiteness theorem, Pacific J. Math. 154 (1992), no 1, p. 17–36. [2] , Special positions for essential tori in link complements, Topology 33 (1994), no 3, p. 525–556. [3] M. Bousquet-Mélou – Counting planar maps, coloured or uncoloured, in Surveys in combinatorics 2011, London Math. Soc. Lecture Note Ser., vol. 392, Cambridge Univ. Press, 2011, p. 1–49. [4] B. A. Burton & M. Ozlen – A fast branching algorithm for unknot recognition with experimental polynomial-time behaviour, prépublication arXiv:1211.1079, à paraître dans Mathematical Programming. [5] P. R. Cromwell – Embedding knots and links in an open book. I. Basic properties, Topology Appl. 64 (1995), no 1, p. 37–58. [6] I. A. Dynnikov – Arc-presentations of links : monotonic simplification, Fund. Math. 190 (2006), p. 29–76. [7] D. Gabai – Foliations and the topology of 3-manifolds, Bull. Amer. Math. Soc. (N.S.) 8 (1983), no 1, p. 77–80. [8] T. Gowers – Are there any very hard unknots ?, https://mathoverflow.net/ questions/53471/are-there-any-very-hard-unknots, 2011. [9] W. Haken – Theorie der Normalflächen : Ein Isotopiekriterium für den Kreisknoten, Acta Mathematica 105 (1961), p. 245–375. [10] J. Hass & J. C. Lagarias – The number of Reidemeister moves needed for unknotting, J. Amer. Math. Soc. 14 (2001), no 2, p. 399–428. [11] J. Hass, J. C. Lagarias & N. Pippenger – The computational complexity of knot and link problems, J. ACM 46 (1999), no 2, p. 185–211. [12] J. Hass & T. Nowik – Unknot diagrams requiring a quadratic number of Reidemeister moves to untangle, Discrete Comput. Geom. 44 (2010), no 1, p. 91–95.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
52
A. de MESMAY
[13] J. Hass, J. Snoeyink & W. P. Thurston – The size of spanning disks for polygonal curves, Discrete Comput. Geom. 29 (2003), no 1, p. 1–17. [14] C. Hayashi – The number of Reidemeister moves for splitting a link, Math. Ann. 332 (2005), no 2, p. 239–252. [15] W. Jaco & J. L. Tollefson – Algorithms for the complete decomposition of a closed 3-manifold, Illinois J. Math. 39 (1995), no 3, p. 358–406. [16] L. H. Kauffman & S. Lambropoulou – Hard unknots and collapsing tangles, in Introductory Lectures on Knot Theory : Selected Lectures Presented at the Advanced School and Conference on Knot Theory and Its Applications to Physics and Biology (L. H. Kauffman, S. Lambropoulou, S. Jablan & J. H. Przytycki, dir.), Series on Knots and Everything, vol. 46, World Scientific Publishing Company, 2011, p. 187–247. [17] H. Kneser – Geschlossene Flächen in dreidimensionalen Mannigfaltigkeiten, Jahresbericht Math. Verein. 28 (1929), p. 248–260. [18] M. Lackenby – A polynomial upper bound on Reidemeister moves, Ann. of Math. 182 (2015), no 2, p. 491–564. [19]
, Elementary knot theory, in Lectures on Geometry, Oxford Scholarship Online, 2017, doi:10.1093/oso/9780198784913.003.0002.
[20]
, Some conditionally hard problems on links and 3-manifolds, Discrete Comput. Geom. 58 (2017), no 3, p. 580–595.
[21]
, The efficient certification of knottedness and Thurston norm, prépublication arXiv:1604.00290.
[22] S. Matveev – Algorithmic topology and classification of 3-manifolds, Algorithms and Computation in Mathematics, vol. 9, Springer, 2007. [23] J. A. Storer – On minimal-node-cost planar embeddings, Networks 14 (1984), no 2, p. 181–212. [24] W. P. Thurston – A norm for the homology of 3-manifolds, Mem. Amer. Math. Soc. 59 (1986), no 339, p. 99–130.
Arnaud de MESMAY CNRS, Gipsa-Lab 11 rue des Mathématiques Grenoble Campus, BP 46 F–38402 Saint Martin d’Hères Cedex E-mail : [email protected]
ASTÉRISQUE 407
Séminaire BOURBAKI 69e année, 2016–2017, no 1122, p. 53 à 90 doi:10.24033/ast.1060
Novembre 2016
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS [d’après Bo Berndtsson] ˘ par Mihai PAUN
1. INTRODUCTION Le but de ce texte est de présenter une partie des travaux récents de Bo Berndtsson [4], [5], [7] ainsi que certaines de leurs nombreuses conséquences obtenues en analyse et géométrie complexe. En guise d’introduction, nous allons évoquer un beau résultat de géométrie convexe qui a été une importante source d’inspiration pour l’article [4] et ceux qui ont suivi. Soit A ⊂ Rn+1 un ensemble convexe. On définit ses sections par rapport à la projection sur le 1er facteur : (1)
At
:= {x ∈ Rn : (t, x) ∈ A } .
Une des versions du théorème de Brunn-Minkowski (cf. e.g., [33]) s’énonce comme suit 1
Théorème 1.1. — La fonction t → (VolAt ) n+1 est concave. C’est un résultat fondamental en géométrie convexe ; une version « fonctionnelle » a été obtenue par Leindler-Prekopa, cf. e.g., [52]. Théorème 1.2 ([52]). — Soit ϕ : Rn+1 → R une fonction convexe. On définit la fonction ϕ e par la formule suivante Z (2) e−ϕe(t) := e−ϕ(t,x) dλ(x). Rn
Alors ϕ e est convexe. Compte tenu de l’importance de ce type de propriétés en géométrie convexe, il est naturel d’essayer d’en formuler et démontrer une version complexe. Cela veut dire qu’on remplace Rn par Cn et l’hypothèse ϕ convexe par ϕ plurisousharmonique (qu’on
© Astérisque 407, SMF 2019
54
M. PĂUN
va abréger en psh par la suite). Malheureusement, la fonction ϕ e qui en résulte – i.e., définie selon l’égalité (2) – peut ne pas être psh, comme le montre l’exemple suivant dû à C. Kiselman, cf. [43] Soit ϕ(w, z) := |z − w|2 − |z|2 ; c’est une fonction psh dans C2 . Un calcul sans difficulté montre qu’on a ϕ(z) e = −|z|2 + c, où c est une constante dont la valeur est sans importance ; on voit que ϕ e n’est pas psh. La généralisation naïve du théorème 1.2 n’est donc pas vraie. Afin d’obtenir la version juste, il faut changer un peu de point de vue, comme suit. La fonction ϕ e dans (2) s’écrit (3)
ϕ(t) e = log R
1 −ϕ(t,x) dλ(x) e At
eϕe(t) =
sup
et pour chaque t ∈ R on a (4)
|f (x)|2
f ∈ker(d),kf kt ≤1
R où kf k2t := Rn |f |2 e−ϕ(t,x) dλ(x). On a noté d l’opérateur de Poincaré. Les égalités (3) et (4) sont equivalentes simplement parce qu’une fonction se trouve dans le noyau de l’opérateur d si et seulement si elle est constante. L’analogue de l’opérateur d en analyse complexe est l’opérateur ∂ et son noyau se trouve être l’espace des fonctions holomorphes. Dans (4), on devrait plutôt considérer le sup pour toutes les fonctions holomorphes de norme au plus un. L’exemple suivant [47] montre qu’on est sur la bonne voie. Soit ρ une fonction sousharmonique, et soit D ⊂ C2 le domaine (de Hartogs) correspondant n o 2 −2ρ(t) (5) D := (t, z) ∈ C × C : |z| < e . La tranche Dt ⊂ C est le disque de rayon e−ρ(t) , et la fonction analogue de ϕ e s’écrit (6)
eϕe(t,z) =
sup
|f (z)|2 ,
∂f =0,kf kt ≤1
R où la norme est kf k2t := Dt |f (z)|2 dλ. Autrement dit, eϕe(t,z) est le noyau de Bergman du domaine Dt évalué en z. Il se trouve que le disque a suffisamment de symétries pour pouvoir calculer son noyau de Bergman explicitement. On a 1 (7) eϕe(t,z) = 2 π 1 − |z|2 e2ρ(t) et donc on en déduit que ϕ e est une fonction psh dans l’ensemble des variables (bien entendu le fait intéressant, c’est la positivité de la hessienne par rapport à t). Parmi les premiers résultats qui pointent dans cette direction, on a choisi celui de F. Maitani-H. Yamaguchi ; le contexte est le suivant. Soit D ⊂ B × C un domaine
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
55
pseudo-convexe, où B est la boule unité dans C. Pour chaque t ∈ B on définit le noyau de Bergman de la fibre p−1 (t), où p : D → B est la projection sur le 1er facteur : (8)
sup |f (ξ)|2
K(t, ξ) :=
f ∈Bt (1)
avec (9)
Z n Bt (1) := f ∈ O (Dt ) :
o |f |2 dλ ≤ 1 ,
Dt
:= p−1 (t).
Dt
Un premier résultat obtenu dans [47] est le suivant. Théorème 1.3 ([47]). — La fonction (t, ξ) → log K(t, ξ) est psh. La démonstration de ce résultat (cf. [47]) n’est pas excessivement difficile, mais elle repose sur des outils de la théorie du potentiel spécifiques à la dimension un (i.e., la dimension des fibres de p). En particulier, Maitani-Yamaguchi utilisent de manière essentielle le fait que le noyau de Bergman est la hessienne de la fonction de Robin et la formule de variation de Hadamard. Ces résultats n’ont pas d’analogue en plusieurs variables complexes. Heureusement, B. Berndtsson a obtenu (cf. [4]) une nouvelle preuve du théorème 1.3, ce qui lui a permis de généraliser ce résultat dans le cadre suivant. Soit D = U × Ω ⊂ Cm × Cn un domaine pseudoconvexe, et soit ϕ ∈ Psh(D) une fonction psh sur D qu’on suppose dans un premier temps de classe C ∞ au voisinage de D. Dans ce cas, on a Dt = Ω et on note Z 2 (10) At := f ∈ O (Ω) : |f |2 e−ϕ(t,·) dλ < ∞ Ω
le noyau de Bergman pondéré correspondant à (Ω, e−ϕ(t,·) ). Soit E → U le fibré de rang infini dont la fibre Et est l’espace de Bergman A2t . On munit Et du produit scalaire Z (11) hf, git := f ge−ϕ(t,·) dλ Ω
et donc E est un fibré trivial, muni d’une structure métrique qui varie par rapport à t. Le résultat de Berndtsson dans [4] est le suivant. Théorème 1.4 ([4]). — Le fibré hermitien (E , k · k) est positif au sens de Nakano. On remarque tout de suite que le théorème 1.4 est une généralisation de 1.3 : la positivité au sens de Nakano de E implique en particulier que la fonction (12)
t → log kψk2?t
est psh, pour toute section holomorphe ψ du fibré dual E ? définie localement au voisinage d’un point de U . Dans (12), on note k·k2? la norme induite sur E ? . Soit t0 ∈ B
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
56
M. PĂUN
un point arbitraire, et soit σ une section de la projection D → B. On définit la section locale ψ de E ? comme suit hψ, f i := f (σt ),
(13)
i.e., pour tout f ∈ Et c’est l’évaluation au point σt . La norme de l’application d’évaluation coïncide avec le noyau de Bergman, donc la fonction t → log K(σt )
(14)
est psh, ce qu’il fallait démontrer. Remarquons au passage que la fonction (12) est psh pour toute fonctionnelle holomorphe ξ ; cela va jouer un rôle important par la suite. Remarque 1.5. — Le cas où l’ensemble D n’est pas nécessairement un produit est une conséquence du théorème 1.4, en utilisant des fonctions poids adéquates, cf. [4], [10]. Remarque 1.6. — L’énoncé 1.4 peut être également interprété comme une version complexe du théorème de Leindler-Prékopa mentionné au début de l’introduction. En e effet, dans le contexte réel les espaces A2t s’identifient à R et donc la convexité de ϕ devient la positivité de la courbure au sens de Nakano. Considérons à présent une application surjective propre p : X → Y dont la dimension relative est n. Ici X et Y désignent des variétés complexes non singulières. On suppose que X admet une métrique kählérienne, et que p est une submersion. Soit également un fibré en droites (L, hL ) → X muni d’une métrique hL non singulière dont la forme de courbure est semi-positive. On défini le fibré canonique relatif associé à p comme suit KX/Y := KX − p? (KY );
(15)
c’est un objet central dans l’étude de la géométrie de p. Soit (16)
F
:= p? (KX/Y + L)
l’image directe du fibré canonique relatif tensorisé par L. Alors F est un fibré vectoriel holomorphe, qu’on peut munir de la métrique suivante Z (17) hu, viy := cn u ∧ ve−ϕL Xy 0
où u, v ∈ Fy = H (Xy , KXy + L) sont des (n, 0)-formes à valeurs dans L| , et où cn Xy est la constante unimodulaire habituelle. Dans ce contexte, Berndtsson a établi le résultat suivant. Théorème 1.7 ([4]). — Le fibré hermitien image directe (F , k · k) est positif au sens de Nakano.
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
57
On voit aisément la parenté entre les énoncés 1.4 et 1.7, respectivement. La condition de pseudoconvexité de D est remplacée par l’hypothèse « X est kählérienne », et la fonction psh ϕ devient la métrique hL . L’espace des fonctions holomorphes A2t correspond à l’espace des sections H 0 (Xy , KXy + L). On remarquera que, du coup, on n’a pas besoin de trouver un substitut pour la mesure de Lebesgue utilisée pour définir la norme dans (17). Le théorème 1.7 a engendré beaucoup de résultats dans des domaines divers de l’analyse et de la géométrie complexe. Nous allons en présenter ici un certain nombre ; grosso modo, on peut le classer en trois catégories comme suit. 1.1. Applications en analyse complexe Il s’agit des articles [9], [8]. Parmi les résultats qui se trouvent dans ces ouvrages, nous avons choisi de présenter et commenter dans ce texte les deux théorèmes suivants. Soit Ω ⊂ Cn un ouvert contenant l’origine, et soit ϕ ∈ Psh(Ω) une fonction psh. On considère l’ensemble (18)
Λ := {λ ∈ R+ : e−λϕ ∈ L1 (Ω, 0)};
autrement dit, Λ c’est l’ensemble des réels positifs λ tels que la fonction e−λϕ est localement intégrable au voisinage de l’origine. Le résultat suivant a été conjecturé par Demailly-Kollár dans [27] et démontré par Berndtsson dans [8]. Théorème 1.8 ([8]). — L’ensemble Λ ⊂ R+ est ouvert. Le cas de la dimension complexe deux de la conjecture de Demailly-Kollár a été établi auparavant par Favre-Jonsson, cf. [31], [30]. Peu après la publication de [7], Guan-Zhou ont obtenu une version beaucoup plus générale du théorème 1.8, cf. [37], [36]. Nous allons présenter l’argument de 1.8 qui a été « extrait » par Berndtsson de la preuve de Guan-Zhou, car c’est plus simple que la preuve originale et il est très élégant. Un autre résultat – obtenu en collaboration avec L. Lempert – où le théorème 1.7 intervient de manière essentielle est la version « optimale » du célèbre théorème d’extension de Ohsawa-Takegoshi, dont voici le cas particulier qu’on va traiter ici. Théorème 1.9 ([12], [36], [9]). — Soit p : X → Dr une submersion propre, où X est une variété kählérienne et Dr ⊂ C est le disque de rayon r. Soit L → X un fibré en droites, muni d’une métrique singulière hL dont le courant de courbure est positif, et dont la restriction à la fibre centrale X0 = p−1 (0) n’est pas identiquement +∞. R Soit u une section du fibré KX0 + L, telle que cn x0 u ∧ ue−ϕL < ∞. Alors il existe une section U de KX + L, telle que :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
58
M. PĂUN
(a) sur la fibre centrale on a U | = u ∧ dp ; X0 (b) on a l’estimée suivante (19)
1 πr2
Z
2 −ϕ U e L ≤
X
Z
|u|2 e−ϕL .
X0
Bien entendu, la nouveauté dans l’énoncé 1.9 est la constante πr1 2 qui mesure la norme de l’extension de u dans (19). Le cas d’une fibration triviale montre que cette constante est optimale. Il est vrai que dans la majorité des applications du théorème de Ohsawa-Takegoshi la valeur de cette constante n’est pas importante, mais nous allons évoquer plus loin quelques cas où cela est crucial. 1.2. Applications en géométrie algébrique Comme on l’a vu dans l’introduction, la positivité au sens de Nakano du fibré E implique la variation psh des noyaux de Bergman définis fibre à fibre. Dans le cadre des submersions propres p : X → Y , les espaces de fonctions holomorphes définies sur les tranches du domaine considéré sont remplacés par des sections du KXy + L| , et Xy
les noyaux de Bergman se recollent en une métrique sur le fibré KX /Y + L, qu’on va appeler par la suite métrique de Bergman. Le théorème 1.7 implique la positivité de la courbure de la métrique de Bergman ; dans l’article [10], ce résultat est généralisé dans plusieurs directions. Les motivations principales pour obtenir des énoncés plus complets proviennent de la géométrie algébrique. Pour commencer, les applications p : X → Y qu’on considère ne sont pas des submersions en général. Typiquement, on doit considérer des espaces fibrés i.e., des applications surjectives p entre des variétés projectives X et Y non singulières, dont la fibre générique est connexe. Ensuite, le fibré L est remplacé par un Q-diviseur effectif dont le faisceau multiplicateur est trivial. En somme, cela veut dire qu’on doit étudier plutôt l’image directe Fm
:= p? (mKX/Y + L),
où m est un entier positif et (L, hL ) est un fibré en droites. Dans ce contexte, le résultat principal dans [10] est le suivant. Théorème 1.10 ([10]). — Soit p : X → Y un espace algébrique fibré, et soit (L, hL ) un fibré en droites muni d’une métrique hL dont le courant de courbure est positif. Soit m ≥ 1 un entier. On suppose qu’il existe un point très générique y ∈ Y et une section non nulle du fibré mKXy + L tels que Z 1 (20) |u|2/m e− m ϕL < ∞. Xy (m)
Alors le fibré mKX/Y + L admet une métrique hX/Y telle que :
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
59
(m)
(a) le courant de courbure correspondant a hX/Y est positif ; (m)
(b) la métrique hX/Y est définie explicitement sur un ensemble X := p−1 (Y ), où Y ⊂ Y est tel que Y \ Y est fermé dans la topologie de Zariski. (1)
Si m = 1, alors hX/Y coïncide avec la métrique de Bergman au-dessus de l’en2
semble Y . Si m ≥ 2, alors c’est une version L m de cette construction, comme on le verra plus tard. Nous allons expliquer dans ce texte les points clefs de la démonstration de 1.10, ainsi qu’un certain nombre de résultats qui utilisent ce théorème. Pour l’instant, nous allons rappeler une conjecture importante en géométrie algébrique, qui représente une motivation très forte pour l’analyse de ces questions. Compte tenu des nombreux ouvrages qui lui sont consacrés (cf. [18], [32], [38], [41], [42], [45] [51], [59], [61], [60], ...), le problème suivant (formulé par S. Iitaka) occupe une place centrale en géométrie birationnelle. Conjecture 1.11. — Soit p : X → Y un espace fibré ; on a l’inégalité suivante (21)
κ(X) ≥ κ(Y ) + κ(F ),
où F est une fibre générique de p. Dans l’énoncé précédent, on note κ(X) la dimension de Kodaira de X. C’est un invariant fondamental associé à X qui mesure l’ordre de croissance asymptotique de la dimension de l’espace de sections de mKX lorsque m → ∞. Les sections holomorphes du fibré mKX s’appellent des formes pluricanoniques. La plupart des articles cités ci-dessus reposent sur l’analyse des propriétés de positivité du fibré canonique relatif de p, noté KX/Y . Ceci s’explique très facilement : on voudrait construire des sections pluricanoniques sur X via le produit tensoriel des images inverses de formes pluricanoniques sur la base avec les extensions des formes qu’on a sur la fibre générique de p. La positivité de KX/Y est nécessaire pour obtenir ces extensions. Les travaux de P. Griffiths [35], [34] se trouvent à la base des résultats obtenus dans ce domaine. Il montre en particulier dans [35] que l’image directe du fibré canonique relatif correspondant à une submersion est positive (au sens de Griffiths) lorsqu’il est muni de la métrique de Hodge. Pour ceci, il utilise de manière cruciale le fait que p? (KX/Y ) est un sous-fibré holomorphe d’un fibré plat, muni de la connexion de Gauss-Manin. Remarque 1.12. — Présenté ainsi, cet énoncé de positivité peut paraître suspect – car on apprend aux étudiants que la courbure décroît pour les sous-fibrés, et comme le fibré plat a une courbure nulle... Mais le point important, c’est que la forme hermitienne qui induit la métrique de Hodge n’est pas définie positive.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
60
M. PĂUN
Remarque 1.13. — Dans le cas où L est trivial, m = 1 et dim Y = 1, le théorème 1.10 est une conséquence d’un résultat dû à T. Fujita, cf. [32] (plus exactement, ce sont les arguments présentés dans [32] qui impliquent 1.10). Dans sa preuve, il utilise le théorème de positivité de Griffiths, combiné à une analyse du comportement de la métrique de Hodge (= métrique de Bergman dans notre terminologie) au voisinage des points singuliers de p (ceci utilise fortement le fait d’avoir une base Y de dimension un). Par contre, si L est arbitraire, alors l’image directe peut très bien ne plus être un sous-fibré d’un fibré plat et c’est le théorème 1.7 qui remplace le résultat de Griffiths. Parmi les résultats récents qui utilisent 1.10, on peut compter [17] où on obtient une confirmation de 1.11 dans le cas où Y est une variété abélienne. Il se trouve que ce sont les propriétés métriques des faisceaux p? (mKX/Y ) qui (pour une fois...) font la différence par rapport aux méthodes purement algébriques. Nous allons faire quelques commentaires sur la démonstration de [17] dans la section 4, en suivant l’approche simplifiée extrêmement élégante de [39]. 1.3. Unicité des métriques extrémales Soit (X, ω) une variété kählérienne compacte. Un problème fondamental en géométrie différentielle est de trouver une métrique « canonique » dans la classe de cohomologie de ω, e.g., qui reflète des propriétés des autres invariants (topologiques, analytiques, ...) de X. À ce jour, le meilleur exemple qu’on peut donner dans ce sens, c’est le théorème d’uniformisation pour les surfaces de Riemann. La notion de métrique extrémale a été introduite par E. Calabi dans les années 1980, dans le but de généraliser ce type de résultats pour les variétés kählériennes en dimension supérieure à un. Une classe importante de ce type d’objets est constituée par les métriques de Kähler-Einstein. Par définition, une métrique kählérienne g se trouve dans cette classe si on a (22)
Riccig = λg,
où λ est −1, 0 ou 1, et où Riccig désigne la courbure de Ricci de g. Une métrique kählérienne g est dite extrémale si le gradient ∇1,0 de sa courbure scalaire est un champ de vecteurs homolorphe sur X. Par exemple, une métrique kählérienne dont la courbure scalaire est constante est extrémale. Notons que cette condition s’exprime par une équation (très compliquée) d’ordre quatre sur le potentiel de g. Nous renvoyons a [58] pour une excellente présentation des résultats et conjectures autour de ce type de métriques. Nous allons mentionner maintenant quelques résultats en rapport avec la question de l’unicité de ces métriques, en suivant [7], [6].
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
61
Soit α ∈ H 1,1 (X, R) la classe de cohomologie de la métrique de référence ω. On note Pα l’espace des potentiels de métriques kählériennes dans la classe α, i.e., (23)
Pα
:= {φ ∈ C ∞ (X) : ω + ddc φ > 0},
i où l’opérateur ddc dans (23) vaut 2π ∂∂. Dans [46], T. Mabuchi a introduit une structure riemannienne sur Pα (qui devient ainsi une variété de dimension infinie), dont voici la version infinitésimale. Un vecteur tangent à Pα au point φ est simplement une fonction v : X → R de classe C ∞ et sa longueur est donnée par la formule Z (24) kvk2φ := |v|2 (ω + ddc φ)n . X
Les géodésiques pour la métrique de Mabuchi peuvent être décrites de la manière suivante (cf. [56], [22], [21]). Soit S := {z = a + ib ∈ C : 0 ≤ b ≤ 1} ; un chemin t → φt ∈ Pα paramétré par t ∈ [0, 1] définit une fonction (25)
Φ : S × X → R,
Φ(z, x) := φb (x).
Alors (φt ) est une géodésique entre ω0 := ω + ddc φ0 et ω1 := ω + ddc φ1 si (26)
(π ? ω + ddc Φ)n+1 = 0,
autrement dit, si l’équation de Monge-Ampère homogène (26) est satisfaite, avec ω0 et ω1 comme conditions au bord. Plusieurs exemples ([23]) montrent qu’en général on ne peut pas construire de géodésiques entre deux métriques kählériennes. Par contre, les travaux fondamentaux de X. Chen et Z. Blocki (cf. [19], [13]) montrent qu’il existe une fonction Φ de classe C 1,1 qui vérifie (26) au sens de Bedford-Taylor, et telle que Φ(t, ·) ∈ P α (donc ω+ddc Φ(t, ·) peut avoir des valeurs propres nulles). Dans les applications qu’on va discuter dans la suite, le manque de régularité n’est pas vraiment un problème ; par contre, ce qui pose de vraies difficultés, c’est le défaut de positivité stricte. Dans [7], Berndtsson montre l’énoncé suivant. Théorème 1.14 ([7]). — Soit X une variété de Fano. La fonctionnelle de Ding est convexe le long de l’unique géodésique entre deux métriques kählériennes dans la classe α = c1 (X). Correctement interprété, ce résultat est une conséquence immédiate du théorème 1.7 dans le cas d’une géodésique de classe C ∞ . Le point important dans [7], c’est de montrer que cela reste vrai pour les géodésiques au sens faible dont on dispose. Comme conséquence de la démonstration du 1.14, Berndtsson obtient également une condition suffisante pour que la fonctionnelle de Ding soit linéaire le long d’une géodésique faible. Ceci est important dans la nouvelle preuve du théorème suivant de Bando-Mabuchi.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
62
M. PĂUN
Théorème 1.15 ([1], [7]). — Soit X une variété de Fano, et soient ω0 , ω1 ∈ c1 (X) deux métriques de Kähler-Einstein. Alors il existe un automorphisme f ∈ Aut(X) tel que f ? ω1 = ω0 . Nous rappelons qu’il est facile d’établir l’unicité des métriques de Kähler-Einstein (22) si λ ∈ {−1, 0}. Par contre, la preuve originale de Bando-Mabuchi [1] dans le cas λ = 1 ci-dessus est d’une grande complexité. Qui plus est, certaines identités dans [1] semblent « miraculeuses » : on arrive à les comprendre techniquement, mais elles n’ont pas encore trouvé une explication intuitive (cf. [57] pour quelques commentaires en ce sens). Si la géodésique qui connecte les deux métriques ω0 , ω1 dans 1.15 est non singulière, alors ce théorème est une conséquence immédiate de l’annulation de la dérivée seconde de la fonctionnelle de Ding le long de cette géodésique. Le cas général est un peu plus compliqué techniquement – c’est basé sur un procédé de régularisation, combiné avec des estimées uniformes pour l’opérateur ∂, mais les idées importantes restent transparentes dans le texte. Les techniques de [7] ont donné de très belles applications dans [2], [3]. Les derniers résultats qu’on va mentionner ici sont le fruit de la collaboration de B. Berndtsson avec R. Berman. Le théorème suivant répond affirmativement à une conjecture de X. Chen. Théorème 1.16 ([6]). — La fonctionnelle de Mabuchi est convexe le long des géodésiques faibles entre deux métriques kählériennes. En combinant ce théorème avec certains résultats techniques de Calabi et de BandoMabuchi, cf. [1], le résultat suivant en découle. Théorème 1.17 ([6]). — Soient ω0 , ω1 deux métriques extrémales dans la classe α. Alors il existe f ∈ Aut(X) tel que f ? ω1 = ω0 .
2. LES RÉSULTATS PRINCIPAUX Dans cette partie, nous allons présenter les grandes lignes de la preuve des théorèmes 1.4 et 1.7, respectivement. Pour commencer, on rappelle quelques notions de géométrie différentielle, cf. [44].
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
63
2.1. Courbure des sous-fibrés et positivité Soit (E, hE ) un fibré hermitien holomorphe de rang r. Si p, q sont deux entiers ∞ positifs, on note Cp,q (X, E) l’espace des formes C ∞ de type (p, q) à valeurs dans E. 0 Soit DE = ∂ + DE la connexion de Chern associée à (E, hE ), où ∂ est la différentielle anti-holomorphe et (27)
0 ∞ DE : C ∞ (X, E) → C1,0 (X, E)
est la partie de type (1, 0) de DE . On note iΘ(E, hE ) le tenseur de courbure de Chern, ainsi défini ∞ (28) Θ(E, hE ) = DE ◦ DE ∈ C1,1 X, End(E) . Soient (t1 , . . . , tm ) des coordonnées locales définies sur un ouvert Ω ⊂ X ; le tenseur de courbure s’écrit X (29) iΘ(E, hE ) = i ΘE jk dtj ∧ dtk 1≤j,k≤n
où les ΘE jk désignent des endomorphismes de E |Ω . Il se trouve que iΘ(E, hE ) induit une forme hermitienne θE sur TX ⊗ E, comme P suit. Si u = j uj ∂t∂j est une section locale de ce fibré, alors on pose X (30) θE (u, u) := hΘE jk uj , uk i. j,k
On rappelle les deux notions suivantes. Définition 2.1. — On dit que (E, hE ) est positif au sens de Nakano si θE (u, u) ≥ 0 pour toute section u de TX ⊗ E. Définition 2.2. — On dit que (E, hE ) est positif au sens de Griffiths si θE (v ⊗ s, v ⊗ s) ≥ 0 pour toute section v de TX et pour toute section s de E. La propriété de positivité au sens de Nakano (et sa version stricte) est indispensable afin d’obtenir des théorèmes d’annulation pour certains groupes de cohomologie à valeurs dans des fibrés vectoriels. Par contre, la positivité plus faible au sens de Griffiths se comporte nettement mieux du point de vue fonctoriel, ce qui la rend très utile, e.g., en géométrie algébrique. Considérons à présent un morphisme injectif j : S → E. Alors hE induit une métrique notée hS sur S, et soit S ⊥ ⊂ E l’orthogonal de l’image j(S) ⊂ E par
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
64
M. PĂUN
rapport à la métrique hE . Soit u une section de S ; en l’identifiant avec son image dans E, on écrit DE (u) =: DS (u) + β(u),
(31)
où les deux termes dans le membre de droite de (31) sont les projections sur S et S ⊥ , respectivement. Des considérations faciles montrent que DS est la connexion de Chern ∞ X, Hom(S, S ⊥ ) . On déduit l’égalité suivante correspondant à (S, hS ) et que β ∈ C1,0 pour les formes de courbure (cf. notations précédentes) S hΘE jk uj , uk i = hΘjk uj , uk i + hβuj , βuk i P pour toute paire d’indices (j, k) ; ici u = l ul ∂t∂ l est une section locale TX ⊗ S.
(32)
Nous n’allons pas développer ce point de vue dans la suite, mais il se trouve que les considérations précédentes restent valables dans le cas d’un fibré E de rang infini. Dans ce cadre, on suppose que les fibres de E sont localement équivalentes à un produit Ω × H où Ω ⊂ X est un ensemble ouvert et H est un espace de Hilbert. La connexion de Chern est définie exactement comme dans le cas d’un fibré de rang fini, en imposant la condition de compatibilité avec le produit scalaire. Les coefficients de la forme de courbure ΘE jk deviennent des opérateurs sur E définis presque partout, cf. [4]. La formule (32) sera la même. 2.2. Preuve du théorème 1.4 Preuve (esquisse). — On suppose que ϕ est de classe C ∞ , et strictement psh au voisinage du domaine U × Ω ⊂ Cm × Cn . Soit E := U × H le fibré trivial dont la fibre est H := L2 (Ω), l’espace de Hilbert des fonctions L2 par rapport à la mesure de Lebesgue. On peut munir E d’une métrique hE Z (33) hf, git := f ge−ϕ(t,·) dλ. Ω
La connexion de Chern correspondante est X 0 (34) DE (u) = utj − ϕtj u dtj j
où dans (34) on note utj :=
∂u ∂tj .
Donc le tenseur de courbure sera l’opérateur suivant XZ hΘ(E, hE )u, uit = ϕjp uj up e−ϕ(t,·) dλ
(35)
j,p
où ϕjp :=
∂2ϕ . ∂tj ∂tp
(36)
ASTÉRISQUE 407
Ω
On a une inclusion de fibrés 0→E →E
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
65
et nous allons utiliser la formule de Griffiths (32) afin de calculer la courbure de E . La quantité qu’on doit évaluer est Z X
X
2 (37) ϕjp uj up e−ϕ(t,·) dλ − β(us ) t . Ω j,p
s
P Plus précisément, on doit montrer que (37) est positive si u = l ul ∂t∂ l est tel que les coefficients uj sont des fonctions holomorphes. La relation (34), combinée avec la définition de β, implique X X (38) β(us ) = π⊥ ϕj uj := ρ s
j
où π⊥ est la projection (fibre à fibre) sur l’espace orthogonal à E dans E par rapport à la métrique L2 . La remarque importante est que la restriction ρt de ρ sur la fibre Et est la solution de norme minimale de l’équation XX (39) ∂ρt = uj ϕjα dz α . α
j
Ceci est la conséquence du fait que ρt est orthogonale sur l’espace des fonctions holomorphes, cf. (38). Par ailleurs, le théorème de Hörmander [40] montre l’existence d’une solution w de (39) telle que Z Z X (40) |w|2 e−ϕ(t,·) dλ ≤ ϕαβ ηβ η α e−ϕ(t,·) dλ Ω
où ηα := (41)
P
j
Ω α,β
uj ϕjα . Comme ρt est la solution de norme minimale, on a Z X 2 kρt k ≤ ϕαβ ηβ η α e−ϕ(t,·) dλ. Ω α,β
La différence (37) est donc minorée par Z ϕjp − ϕαβ ϕjβ ϕαp uj up dλ (42) Ω
qui est positive, compte tenu du fait que ϕ est psh. Remarque 2.3. — Dans le contexte actuel, c’est l’espace E des fonctions L2 qui joue le rôle du fibré plat dans la preuve de Griffiths [35]. On peut pousser l’analogie un peu plus loin pour dire que le théorème de Hörmander se substitue ici à la théorie de Hodge.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
66
M. PĂUN
2.3. Preuve du théorème 1.7 Nous allons discuter ici un cas particulier du théorème 1.7, qui concerne les propriétés de la forme de courbure du fibré F := p? (KX /Y + L). On rappelle que p : X → Y est une submersion propre, et (L, hL ) est un fibré hermitien en droites, tel que ΘhL (L) ≥ 0. Pour commencer, on rappelle brièvement quelques résultats concernant la structure complexe et métrique de F . 2.3.1. Structure complexe de l’image directe. — Sous les hypothèses ci-dessus, le faisceau image directe F est un fibré vectoriel. Ceci est une conséquence d’un énoncé qu’on rappelle maintenant, cf. [50]. Soit y ∈ Y un point arbitraire. On note Xy = p−1 (y) la fibre de p au-dessus de y. Soit y ∈ Ω ⊂ Y un ouvert de coordonnées, et soit dt := dt1 ∧ · · · ∧ dtm la forme de degré maximale sur Ω corespondant aux coordonnées t1 , . . . , tm définies sur Ω. Théorème 2.4 ([50]). — Soit p : X → Y une submersion propre, dont l’espace total X est une variété kählérienne. Soit (L, hL ) → X un fibré hermitien en droites, tel que ΘhL (L) ≥ 0. Considérons une section holomorphe u du fibré KXy + L| . Alors Xy
il existe une section U du fibré KX /Y + L| −1 telle que sur la fibre Xy on ait p (Ω) U|
(43)
Xy
= u ∧ p? dt.
Ceci montre que F est un fibré vectoriel. Dans le cas où L est trivial, ce résultat est une conséquence de la théorie de Hodge. Nous rappelons maintenant la définition de la structure complexe de F . Soit v une section de F | , où Ω ⊂ Y est un ouvert de coordonnées. En suivant [49], [48], on Ω peut interpréter v comme une collection de (n, 0) formes holomorphes sur des ouverts de coordonnées de p−1 (Ω) modulo les sections locales du fibré Λn−1 TX? ∧ p? TY? . De façon alternative, on peut représenter v par une (n, 0) forme globale sur p−1 (Ω) dont la restriction aux fibres de p est holomorphe – c’est le point de vue préféré dans [4]. Dans la suite, nous allons noter v un tel représentant de v. Définition 2.5. — La section v de F | est holomorphe si ∂(v ∧ p? dt) = 0. Ω
La notion qu’on vient d’introduire est manifestement indépendante du représentant choisi. En conclusion, v est holomorphe si la section v ∧ p? dt du fibré KX + L| −1 p Ω est holomorphe au sens habituel. On peut alors écrire ∂v =
(44)
m X
η k ∧ dtk ,
k=1 k
où les η sont des formes du type (n − 1, 1) qui dépendent clairement de v, mais par contre leur restriction aux fibres de p dépend seulement de v.
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
67
2.3.2. Connexion de Chern. — Le fibré holomorphe F est muni d’une métrique naturelle hF , cf. (17), dont on rappelle ici l’expression. Soient u, v deux sections locales de F | . Leur produit scalaire en y ∈ Ω est Ω Z (45) hu, viy := cn u ∧ ve−ϕL , Xy
avec les conventions et abus de notations habituels. On s’intéresse par la suite à la connexion de Chern du fibré holomorphe hermitien F . Soit u une section de F , et soit u un représentant de u. En particulier u est une (n, 0) forme à valeurs dans L. Donc l’expression 0 DL (u)
(46)
0 est une (n + 1, 0)-forme à valeurs dans L. On note DL la composante (1, 0) de la −1 connexion de Chern de (L, hL ). Localement sur p (Ω) on peut donc écrire 0 DL (u) =
(47)
m X
µj ∧ dtj .
j=1
Pour chaque indice j, les restrictions aux fibres de p µj | des (n, 0)-formes à valeur Xy dans L dans (47) sont bien définies, mais elles dépendent du représentant u. De plus, il se peut très bien que ces restrictions ne soient pas holomorphes. Néanmoins, on a l’énoncé suivant. sur l’espace des Lemme 2.6 ([4]). — La projection orthogonale Π(µj | ) de µj | Xy Xy sections holomorphes de KXy + L| est indépendante du représentant u, et on a Xy X (48) DF0 (u)y = Π(µj | ) ⊗ dtj . Xy j
La preuve de ce lemme est facile, et nous n’allons pas détailler l’argument ici. Notons cependant que pour évaluer la quantité – assez incommode – d0 hu, vi, P ”j ∧ dt une forme C ∞ de type (m − 1, m) Berndtsson procède ainsi : soit ρ = j φj dt à support compact dans un ouvert Ω de Y . On doit calculer Z Z (49) − hu, viy dρ = −cn u ∧ ve−ϕL ∧ dρ Ω
p−1 (Ω)
et le lemme s’ensuit par une simple intégration par parties. Ce principe de calcul – au sens faible – sera également utilisé dans le paragraphe suivant. Il offre une alternative élégante à l’approche qui consiste à fixer une fibre de p et travailler par rapport à des coordonnées données par la famille de structures complexes intégrables induites par p, cf. [35].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
68
M. PĂUN
2.3.3. Calcul de la forme de courbure. — Nous allons indiquer la preuve du théorème seulement dans le cas où la base Y est de dimension un. Le cas d’une base de dimension arbitraire est un peu plus technique, mais les difficultés principales sont déjà visibles dans la situation que nous allons présenter par la suite. Soit u un représentant de la section holomorphe u de F . On peut écrire (50)
∂u = dt ∧ η,
0 DL u = dt ∧ µ
où η et µ sont des (n − 1, 1) et (n, 0) formes à valeur dans L respectivement. Leur restriction aux fibres de p dépend uniquement de u. La norme (51) kuk2 = p? cn u ∧ ue−ϕ est égale à l’image directe de la forme de type (n, n) ci-dessus. Compte tenu de cela, quelques calculs faciles – faits comme dans (49), au sens faible – montrent qu’on a la formule suivante Z Z p? ΘL ∧ u ∧ ue−ϕ 2 (52) ∆kuk = −cn + cn η ∧ ηe−ϕ + cn µ ∧ µe−ϕ , idt ∧ dt Xt Xt où ∆ est l’opérateur de Laplace dans C. Par ailleurs, on a (53)
∆kuk2 idt ∧ dt = −hΘhF (F )u, ui + hDF0 u, DF0 ui.
Fixons le point 0 ∈ Y ; les formules (52) et (53) donnent dans ce cas Z hΘhF (F )u, ui p? ΘL ∧ u ∧ ue−ϕ = cn − cn η ∧ ηe−ϕ + kDF0 uk2 − kµk20 . (54) idt ∧ dt idt ∧ dt Xt Dans le membre de droite de la formule précédente, il y a quelques termes qu’on doit analyser de plus près, notamment les trois derniers. (a) On a vu dans le paragraphe précédent que la dérivée de u en t = 0, i.e DF0 u coïncide avec la projection orthogonale de µ sur l’espace des sections holomorphes de KX0 + L. Alors la différence (55)
kDF0 uk20 − kµk20
sera nulle si on peut choisir le représentant u tel que µ soit holomorphe. (b) La forme η | est de type (n − 1, 1), donc si η est primitive par rapport à une X0 R métrique ω, alors le terme −cn Xt η ∧ ηe−ϕ dans (54) est semi-positif. Le lemme suivant montre que c’est en effet possible de choisir un représentant u qui convient. Lemme 2.7 ([4]). — Soit ω une métrique kählérienne sur X . On peut choisir un représentant u de la section u pour lequel les formes η et ν définies par (50) ont les propriétés suivantes.
ASTÉRISQUE 407
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
69
(i) La restriction η | est primitive par rapport à ω. X0 (ii) La restriction µ| de µ à X0 est une forme holomorphe. X0 Preuve (esquisse). — Soit u e un représentant arbitraire de u. On voudrait déterminer une forme v de type (n − 1, 0) telle que u := u e + dt ∧ v satisfait (i) et (ii). Si on note ηe et µ e les formes induites par u e (cf. (50)), alors v doit satisfaire les équations suivantes (56)
0 ∂ (e µ − DL v) = 0
ηe ∧ ω = ∂(v ∧ ω), ?
0 sur la fibre X0 . Comme DL v = ∂ (v∧ω), la seconde équation dans (56) est équivalente à la suivante
(57)
?
µ e⊥ = ∂ (v ∧ ω)
où µ e⊥ désigne la projection de µ e sur l’orthogonal de l’espace des formes holomorphes. Si on note α := v ∧ ω, alors le système (56) est équivalent à ∂α = ηe ∧ ω
(58) et (59)
?
∂ α=µ e⊥ .
L’égalité (50) et la définition de µ e⊥ montrent qu’on peut résoudre séparément les équations (58) et (59) ci-dessus. Soient α1 et α2 les solutions de (58) et (59) respectivement dont la norme est minimale. On voit aisément – grâce a la minimalité de la norme – que la somme α := α1 + α2 satisfait simultanément ces équations ; on renvoie à [4] pour plus de détails. En choisissant le représentant u comme dans le lemme 2.7, on obtient l’expression suivante pour la courbure de l’image directe Z hΘhF (F )u, ui p? ΘL ∧ u ∧ ue−ϕ (60) = cn + |∂v|2 e−ϕ . idt ∧ dt idt ∧ dt Xt 2.3.4. Le cas où L est ample. — Dans le cas où la courbure ΘhL (L) de L est définie positive sur les fibres de p, on peut raffiner un peu plus la formule (54). Nous allons présenter ici brièvement le résultat principal obtenu dans [5]. Si L est positif, on peut prendre ω := ΘhL (L). ∂ ∂t
par rapport à la métrique ω. C’est le champ de Soit V le relèvement canonique de vecteurs de type (1, 0) sur X qui s’écrit localement X ∂ ∂ (61) V= − ω γδ ωtδ ; ∂t ∂zγ γ,δ
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
70
M. PĂUN
∂ , ainsi que ω(V , ξ) = 0 pour tout vecteur ξ il est caractérisé par le fait que dp(V ) = ∂t tangent aux fibres de p. Soit u une section holomorphe de F , telle que DF0 u = 0 en t = 0. En utilisant le champ de vecteurs V , on peut construire un représentant u de u dont les propriétés sont absolument remarquables. On pose
u := iV · (dt ∧ u e ),
(62)
où iV désigne l’opération de contraction avec le vecteur V , et u e est un représentant arbitraire de la section u. On définit comme dans (54) les formes η et ν. Nous n’allons pas détailler la preuve des affirmations suivantes, car il s’agit de calculs qui ne présentent pas de difficultés particulières. (a) La restriction de η à la fibre X0 est primitive par rapport à ω. En particulier, on a ?η = −η, où ? est l’opérateur de Hodge sur X0 et donc 0? DL η =−?∂?η =0
sur X0 . (b) Si on écrit ω ∧ u = dt ∧ ψ, alors ψ | = 0. X0 0 (c) L’égalité ∂µ = DL η est satisfaite sur X0 .
(d) On a Z p? ΘL ∧ u ∧ ue−ϕ c(ω)|u|2 e−ϕ , cn |t=0 = idt ∧ dt X0 où la fonction c(ω) dans la formule précédente est définie comme suit ω n+1 . ω n ∧ idt ∧ dt En conclusion, la formule de courbure (54) devient Z hΘhF (F )u, ui (63) = c(ω)|u|2 e−ϕ + |η|20 − |µ|20 . idt ∧ dt X0 c(ω) :=
On va montrer maintenant que |η|20 − |µ|20 ≥ 0. L’argument est assez similaire à celui employé dans le cas des domaines dans Cn , dans le sens qu’on utilise l’équation verifiée par µ afin de mesurer sa norme. Toutefois, la technique utilisée est assez différente. Par le choix de u, i.e., DF0 u = 0 en t = 0, on déduit que µ est la solution de norme minimale de l’équation dans (c). Le théorème de Hörmander [40] montre qu’on a Z 0 (64) |µ|20 ≤ |DL η|2ω e−ϕ , X0
mais malheureusement, cette inégalité ne semble pas suffisamment fine pour conclure. Par contre, on a une formule exacte pour µ comme suit (65)
ASTÉRISQUE 407
?
0 µ = −∂ (00 )−1 DL η
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
71
et la formule de Bochner-Kodaira-Nakano (cf. [5] pour les calculs intermédiaires) montre qu’on a (66)
|η|20 − |µ|20 = h(Id + 0 )−1 η, ηi0 ≥ 0.
En conclusion, dans le cas où ω = ΘhL (L) est définie positive, on a l’égalité suivante Z hΘhF (F )u, ui = (67) c(ω)|u|2 e−ϕ + h(Id + 0 )−1 η, ηi0 . idt ∧ dt |t=0 X0 On renvoie à [62], [63] pour des résultats récents très intéressants dans le même cercle d’idées.
3. CONJECTURE DE L’OUVERTURE ET EXTENSION DES FONCTIONS HOLOMORPHES 3.1. Idéaux multiplicateurs Nous allons esquisser ici la preuve du théorème 1.8, en suivant [13]. Soit Ω ⊂ Cn un ensemble ouvert, et soit ϕ ∈ Psh(Ω) une fonction psh définie sur Ω. On suppose dans ce paragraphe que ϕ est négative. L’idéal multiplicateur de ϕ est défini comme suit (68)
I (ϕ)x
:= {f ∈ Ox (Ω) : |f |2 e−ϕ ∈ L1 (Ω, x)}.
Motivés en partie par des questions techniques, J.-P. Demailly et Th. Peternell ont introduit la version « régularisée » suivante de l’idéal multiplicateur I (ϕ) : on pose (69) I+ (ϕ) := lim I (1 + ε)ϕ . ε→0+
La famille d’idéaux I (1 + ε)ϕ est décroissante par rapport à ε, donc stationnaire pour 0 < ε 1 et alors la limite (69) est bien définie. La conjecture dite « d’ouverture » de Demailly-Kollár (= théorème 1.8) s’énonce comme suit : soit ϕ ∈ Psh(Ω) une fonction psh, telle que I (ϕ)0 = OCn ,0 . Alors on a I+ (ϕ)0 = OCn ,0 . Le cas où n = 1 de cette conjecture est une conséquence des propriétés élémentaires des fonctions sousharmoniques. Par contre, la preuve obtenue par Favre-Jonsson [31], [30] dans le cas n = 2 est radicalement plus compliquée techniquement. Cette conjecture a été résolue par Bo Berndtsson dans [8]. Le théorème 1.4 joue un rôle important dans sa démonstration. Cependant, très peu de temps après la parution de son article sur la Toile, Guan-Zhou ont obtenu dans [37], [36] la confirmation d’une version beaucoup plus générale de cette conjecture, qu’on énoncera un peu plus loin. La preuve de Guan-Zhou a été la source d’inspiration pour l’argument suivant (dû à
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
72
M. PĂUN
Berndtsson), qui montre la version initiale de openness conjecture. Compte tenu de l’élégance de cette preuve, on ne résiste pas à la tentation de la reproduire dans la suite. Démonstration du théorème 1.8. — Le point principal de la preuve est l’affirmation suivante. Lemme 3.1 ([13]). — Soit ψ une fonction négative et psh, définie dans la boule unité de Cn . On suppose que e−ψ n’est pas intégrable par rapport à la mesure de Lebesque au voisinage de l’origine. Alors on a Z Cn (70) e−ψ dλ ≥ 2 |a| (zn =a) où Cn est une constante numérique. Pour montrer ce lemme, on raisonne de la manière suivante. Pour chaque valeur a ∈ C telle que |a| < 1/2, le théorème d’Ohsawa-Takegoshi [50] montre l’existence d’une fonction fa ∈ O (∆) holomorphe sur la boule unité ∆ ⊂ Cn , telle que fa (z 0 , a) = 1 pour tout z 0 ∈ Cn−1 tel que (z 0 , a) ∈ ∆. De plus, la norme L2 de fa vérifie l’inégalité Z Z 0 (71) |fa |2 e−ψ dλn ≤ cn e−ψ(z ,a) dλn−1 , ∆
zn =a n
où dλn est la mesure de Lebesgue dans C . Dans (71), la constante cn est purement numérique. On utilise l’hypothèse concernant la non-intégrabilité de e−ϕ en zero : ceci implique fa (0) = 0. Le lemme de Schwarz – combiné avec l’inégalité de la moyenne – montre qu’on a Z 0 2 2 (72) |fa (0, zn )| ≤ C1 |zn | e−ψ(z ,a) dλn−1 zn =a
pour tout zn , en particulier le choix zn = a démontre (70). Soit ϕ une fonction psh négative dans la boule unité, telle que Z (73) e−ϕ dλn < ∞, ∆
et telle que Z
e−pϕ dλn = ∞,
(74) ∆
pour chaque p > 1. Le lemme 3.1 montre que Z (75) zn =a
ASTÉRISQUE 407
e−pϕ dλn−1 ≥
cn , |a|2
(1122)
POSITIVITÉ DES IMAGES DIRECTES ET APPLICATIONS
73
pour chaque p > 1. Par récurrence, on peut supposer que e−pϕ(·,a) est intégrable près de l’origine de Cn−1 , et le théorème de convergence dominée montre que (75) reste valable pour p = 1. On obtient une contradiction en intégrant par rapport à a. La version « forte » obtenue par Guan-Zhou est la suivante. Théorème 3.2 ([37]). — L’idéal régularisé I+ (ϕ) coïncide avec I (ϕ). La preuve présentée dans [37] est remarquablement simple, mais nous n’allons pas la reproduire ici ; le lecteur intéressé peut consulter [37]. Cette version forte de la conjecture d’ouverture a eu des applications importantes, notamment dans le travail de J.-P. Demailly [25]. 3.2. Une version optimale du théorème d’extension d’Ohsawa-Takegoshi Dans cette section, nous allons indiquer très brièvement les parties importantes de la preuve du théorème 1.9, énoncé dans l’introduction. Soit p : X → Dr une famille kählérienne au-dessus du disque Dr de rayon r dans C. On suppose que X0 = p−1 (0) est non singulière. Soit L → X un fibré en droites, muni d’une métrique hL éventuellement singulière telle que ΘhL (L) ≥ 0 et dont la restriction hL | est bien définie (i.e., n’est pas identiquement +∞). X0
Considérons une section holomorphe u du fibré KX0 + L, dont la norme L2 R |u|2 e−ϕL < ∞ est finie. D’après [50], il existe une section U de KX + L telle X0 que U | = u ∧ dp et telle que X0 Z Z 2 −ϕL (76) |U | e ≤ C(r) |u|2 e−ϕL , X
X0
où C(r) est une constante qui dépend du rayon r de la base de la famille p seulement. La question est de déterminer la valeur optimale de C(r). Ce problème a été résolu très récemment par Z. Błocki, cf. [12], et Guan-Zhou, cf. [36] qui obtiennent la constante C(r) = πr2 . L’exemple d’une famille produit X = Dr × X0 montre que cette valeur est optimale. Les arguments dans [12] et [36] représentent une amélioration technique impressionnante de la preuve d’Ohsawa-Takegoshi dans [50]. Dans l’esquisse de preuve cidessous, nous allons suivre l’approche de Berndtsson-Lempert, cf. [9], qui est basée sur le théorème 1.7. Ils démontrent le théorème 1.9 dans le cas particulier d’une métrique hL non singulière. Ceci implique l’énoncé général si X est une famille projective. Par contre, si X est une variété kählérienne et hL est singulière, les arguments de 1.9 ne sont pas applicables – au moins, on ne voit pas comment les utiliser.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
74
M. PĂUN
Preuve (esquisse). — Sauf mention explicite du contraire, on suppose dans la suite que la métrique hL est non singulière. Pour alléger les notations, on suppose aussi que r = 1. On considère l’espace des formes canoniques L2 sur X à valeur dans L Z (77) A2 (X) := U ∈ H 0 (X, KX + L) : kU k2 = |U |2 e−ϕL < ∞ X
et soit A20 (X) le sous-espace vectoriel U ∈ A2 (X) tel que U | = 0. Nous devons X0 évaluer la norme de l’extension « optimale » Umin de u, i.e., la quantité n o (78) kUmin k2 := inf kV k2 : V ∈ A2 (X), V | = u ∧ dp . X0
Pour ceci, Berndtsson et Lempert procèdent par dualité : on a |hξ, Umin i|2 , kξk2?
kUmin k2 = sup
(79)
ξ
où ξ ∈ A2 (X)? est une fonctionnelle linéaire (continue) sur A2 (X) telle que ξ| 2 = 0. La notation k · k? dans (79) désigne la norme duale sur l’espace A2 (X)? . A0 (X)
Soit σ une section C ∞ de KX + L. On peut lui associer une application linéaire ξσ comme suit Z (80) hξσ , V i := V ∧ σe−ϕL X0
et il se trouve que l’espace vectoriel de ces fonctionnelles est dense dans le dual du quotient A2 (X)/A20 (X). En particulier, on a l’égalité suivante kUmin k2 = sup
(81)
σ
On voit que hξσ , Umin i = déduit l’inegalité (82)
R X0
u ∧ σe
−ϕL
|hξσ , Umin i|2 . kξσ k2?
. Par Cauchy-Schwarz combiné avec (79), on
kUmin k2 /kuk20 ≤ sup σ
ke σ k20 , kξσ k2?
où σ e est la projection orthogonale de σ sur l’espace des sections holomorphes de KX0 + L. ke σ k2 C’est dans le but de trouver un majorant de supσ kξσ k02 dans (82) qu’on aura besoin du théorème 1.7. Soit H ⊂ C le demi-plan de Poincaré ( 3 ne sont pas rationnelles. Dans [42], C 3 B. Totaro démontre, en utilisant la méthode de J. Kollár et le théorème 5.1, que des hypersurfaces très générales de degré d > 2 n+2 ne sont pas stablement rationnelles. 3 Lorsque le degré est pair, le résultat vaut même pour des hypersurfaces lisses sur Q. Lorsque le degré est pair, la preuve repose sur l’utilisation du théorème 5.1 et une réduction en caractéristique 2. Plus précisément la fibre spéciale considérée est un revêtement double inséparable. Cela donne une résolution des singularités explicite dont les diviseurs exceptionnels sont des quadriques, ce qui permet de vérifier les hypothèses de la proposition 4.3 ; l’invariant stablement rationnel utilisé est le groupe des sections du faisceau Ωn−1 . En effet, B. Totaro démontre que, pour une belle variété V sur un corps K, si V admet une décomposition de Chow de la diagonale, les groupes H 0 (V, Ωi ) sont nuls pour i > 0. Pour traiter le cas du degré impair, B. Totaro utilise une déformation qui fait dégénérer une hypersurface de degré 2a + 1 en la réunion d’une hypersurface de degré 2a et d’un hyperplan. 6.5. Variétés de Fano de dimension 3 De nombreux travaux sont dédiés à la rationalité des volumes de Fano. Ainsi, dans le cas où l’indice vaut 1, la non-rationalité des volumes de Fano obtenus comme hypersurfaces dans un espace projectif pondéré résulte des travaux de V. A. Iskovskikh et Y. Manin [30], de A. Corti, A. V. Pukklikov et M. Reid [17] et de I. Cheltsov et J. Park [10] qui prouvent que les volumes considérés sont birationnellement rigides et donc non rationnels. Dans le cas lisse, B. Hassett et Y. Tschinkel démontrent dans [28], à l’aide des méthodes de décomposition de la diagonale, qu’un volume de Fano lisse qui n’est pas rationnel et n’est pas birationnellement isomorphe à un volume cubique n’est pas stablement birationnel. Reprenant la méthode d’inégale caractéristique de B. Totaro, T. Okada étudie dans [37] la rationalité des « orbivariétés » de Fano de dimension 3 obtenues comme hypersurfaces dans des espaces projectifs pondérés. Soient a0 , . . . , an des entiers strictement positifs. Rappelons qu’on définit l’espace projectif pondéré P(a0 , . . . , an ) comme le schéma projectif associé à l’anneau gradué C[X0 , . . . , Xn ], où la variable Xi a pour degré ai pour i ∈ {1, . . . , n}. La question de la stable rationalité restait en partie ouverte. T. Okada combine les différents résultats obtenus dans le théorème suivant :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
112
E. PEYRE
Théorème 6.1. — Soit V une hypersurface très générale de degré d dans l’espace projectif pondéré P(a0 , . . . , a4 ) avec 1 6 a0 6 a1 6 a2 6 a3 6 a4 . On suppose que V est une orbivariété de Fano, c’est-à-dire que le faisceau canonique est ample. Alors les assertions suivantes sont équivalentes : (i) L’inégalité d < 2a4 est vérifiée ou d = 2a4 = 2a3 ; (ii) L’hypersurface V est rationnelle. Si, en outre, V n’est pas un solide cubique, ces conditions sont équivalentes à l’assertion : (iii) L’hypersurface V est stablement rationnelle. Il résulte en particulier du théorème 6.1 que, parmi les vingt-sept familles d’hypersurfaces dans l’espace projectif pondéré de dimension 4 qui sont de Fano et d’indice > 3, vingt familles correspondent à des variétés rationnelles et un membre très général des sept autres n’est pas stablement rationnel.
7. RATIONALITÉ ET DÉFORMATION La question de la stabilité par déformation de la rationalité pour les variétés lisses sur C est très naturelle, et les experts étaient convaincus depuis longtemps qu’il devait exister des contre-exemples à cette stabilité. Pour une famille de variété Y → B sur un corps algébriquement clos, le lieu des points b de B en lesquels la fibre est rationnelle est connu pour être une réunion dénombrable de parties localement fermées de B (cf. [19]). L’exemple des surfaces cubiques déjà mentionné montre que la rationalité n’est pas stable par spécialisation lorsqu’on admet des singularités. En dimension 3, il découle des travaux de T. de Fernex et T. Fusi [19] et de C. Hacon et J. McKernan [23] que la rationalité est stable par spécialisation pour les variétés klt. En dimension supérieure, B. Totaro donne dans [43], des contre-exemples avec des singularités terminales en dimension > 5 et des singularités canoniques en dimension 4. Dans [26], B. Hassett, A. Pirutka et Y. Tschinkel considèrent des fibrés en quadriques au-dessus du plan projectif. Ils obtiennent des familles de telles variétés lisses de dimension 4 au-dessus d’une base connexe sur C dont les fibres très générales ne sont pas stablement rationnelles mais dont les fibres rationnelles sont denses pour la topologie complexe. Le lieu des fibres rationnelles pour cet exemple est donc en particulier ni ouvert ni fermé. Concrètement l’exemple est obtenu en considérant des hypersurfaces lisses V de P2C × P3C données par une équation bihomogène de degré (2, 2). Cela fournit via la première projection une variété fibrée en quadriques de dimension 2 au-dessus du
ASTÉRISQUE 407
(1123)
PROGRÈS EN IRRATIONALITÉ
113
plan projectif. Le lieu de dégénérescence de cette fibration π correspond au lieu en lequel la forme quadratique considérée est dégénérée. La fibre générique Q est une quadrique au-dessus de K = C(X, Y ) qui est rationnelle sur ce corps si et seulement si Q admet un point défini sur K, ce qui correspond à une section rationnelle de la fibration. Par un théorème de T. A. Springer, cela est équivalent à l’existence d’un point rationnel sur une extension L de K de degré impair. En considérant la variété des droites contenues dans les fibres de π, B. Hassett, A. Pirutka et Y. Tschinkel démontrent que cela est vérifié si V admet une classe de cohomologie entière dans H 2,2 (V, C) dont le degré d’intersection avec les fibres est impair. Ils démontrent alors que si B désigne l’espace de modules des hypersurfaces de P2 × P3 de bidegré (2, 2) alors le lieu des b pour lesquels l’hypersurface correspondante admet une classe de cohomologie convenable est dense pour la topologie réelle. Cet argument utilisant la théorie de Hodge est dû à C. Voisin. Pour obtenir que la fibre très générale n’est pas rétractilement rationnelle, il faut également disposer d’une fibre qui admet une désingularisation dont on sait qu’elle n’admet pas de décomposition de Chow de la diagonale. On considère pour cela le cas particulier déjà mentionné de l’équation yzs2 + xzt2 + xyu2 + F (x, y, z)v 2 = 0, où F (x, y, z) = x2 + y 2 + z 2 − 2(xy + xz + yz). La démonstration passe par un calcul explicite de la désingularisation ce qui fournit une preuve du fait que le morphisme de désingularisation est universellement CH0 -trivial au sens de la définition 4.1. Par contre, la variété obtenue par désingularisation admet un groupe de cohomologie non ramifiée de degré 2 qui est non trivial, résultat donné dans [38], ce qui permet d’appliquer la machinerie décrite auparavant, et une fibre très générale de la fibration n’est pas rétractilement rationnelle.
RÉFÉRENCES [1] M. Artin & D. Mumford – Some elementary examples of unirational varieties which are not rational, Proc. London Math. Soc. 25 (1972), p. 75–95. [2] A. Auel, J.-L. Colliot-Thélène & R. Parimala – Universal unramified cohomology of cubic fourfolds containing a plane, in Brauer groups and obstruction problems, Progr. Math., vol. 320, Birkhäuser, 2017, p. 29–55. [3] A. Beauville – A very general sextic double solid is not stably rational, Bull. Lond. Math. Soc. 48 (2016), no 2, p. 321–324.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
114
E. PEYRE
[4] A. Beauville, J.-L. Colliot-Thélène, J.-J. Sansuc & P. SwinnertonDyer – Variétés stablement rationnelles non rationnelles, Ann. of Math. 121 (1985), no 2, p. 283–318. [5] S. Bloch & V. Srinivas – Remarks on correspondences and algebraic cycles, Amer. J. Math. 105 (1983), no 5, p. 1235–1253. [6] F. A. Bogomolov – The Brauer group of quotient spaces of linear representations, Izv. Akad. Nauk SSSR Ser. Mat. 51 (1987), no 3, p. 485–516. [7] C. Böhning & H.-C. Graf von Bothmer – On stable rationality of some conic bundles and moduli spaces of Prym curves, Comment. Math. Helv. 93 (2018), no 1, p. 133–155. [8] N. Bourbaki – Algèbre. Chapitre 8, Springer, 2012. [9] G. Castelnuovo – Sulla razionalità delle involuzioni piane, Math. Ann. 44 (1894), no 1, p. 125–155. [10] I. Cheltsov & J. Park – Birationally rigid Fano threefold hypersurfaces, Mem. Amer. Math. Soc., vol. 246, 2017. [11] C. H. Clemens & P. A. Griffiths – The intermediate Jacobian of the cubic threefold, Ann. of Math. 95 (1972), p. 281–356. [12] J.-L. Colliot-Thélène – Birational invariants, purity and the Gersten conjecture, in K-theory and algebraic geometry : connections with quadratic forms and division algebras (Santa Barbara, CA, 1992), Proc. Sympos. Pure Math., vol. 58, Amer. Math. Soc., 1995, p. 1–64. [13] J.-L. Colliot-Thélène & M. Ojanguren – Variétés unirationnelles non rationnelles : au-delà de l’exemple d’Artin et Mumford, Invent. math. 97 (1989), no 1, p. 141–158. [14] J.-L. Colliot-Thélène & A. Pirutka – Cikliqeskie nakryti, kotorye ne vlc stabil~no racional~nymi, Izv. Ross. Akad. Nauk Ser. Mat. 80 (2016), no 4, p. 35–48. [15]
, Hypersurfaces quartiques de dimension 3 : non-rationalité stable, Ann. Sci. Éc. Norm. Supér. 49 (2016), no 2, p. 371–397.
[16] J.-L. Colliot-Thélène & J.-J. Sansuc – La R-équivalence sur les tores, Ann. Sci. École Norm. Sup. 10 (1977), no 2, p. 175–229. [17] A. Corti, A. Pukhlikov & M. Reid – Fano 3-fold hypersurfaces, in Explicit birational geometry of 3-folds, London Math. Soc. Lecture Note Ser., vol. 281, Cambridge Univ. Press, 2000, p. 175–258. [18] P. Deligne – Variétés unirationnelles non rationnelles [d’après M. Artin et D. Mumford], Séminaire Bourbaki (1971/72), exp. no 402, Lecture Notes in Math. 317 (1973), p. 45–57.
ASTÉRISQUE 407
(1123)
PROGRÈS EN IRRATIONALITÉ
115
[19] T. de Fernex & D. Fusi – Rationality in families of threefolds, Rend. Circ. Mat. Palermo 62 (2013), no 1, p. 127–135. [20] W. Fulton – Rational equivalence on singular varieties, Publ. Math. IHÉS (1975), no 45, p. 147–167. [21]
, Intersection theory, Ergebn. Math. Grenzg., vol. 2, Springer, 1984.
[22] O. Gabber, Q. Liu & D. Lorenzini – The index of an algebraic variety, Invent. math. 192 (2013), no 3, p. 567–626. [23] C. D. Hacon & J. Mckernan – On Shokurov’s rational connectedness conjecture, Duke Math. J. 138 (2007), no 1, p. 119–136. [24] J. Harris – Lectures on rationally connected varieties, EAGER Advanced School in Algebraic Geometry, Levico Terme, notes by J. Kock, http://mat.uab.cat/ ~kock/RLN/rcv.pdf, 2001. [25] B. Hassett, A. Kresch & Y. Tschinkel – Stable rationality and conic bundles, Math. Ann. 365 (2016), nos 3-4, p. 1201–1217. [26] B. Hassett, A. Pirutka & Y. Tschinkel – Stable rationality of quadric surface bundles over surfaces, prépublication arXiv:1603.09262. [27]
, A very general quartic double fourfold is not stably rational, prépublication arXiv:1605.03220.
[28] B. Hassett & Y. Tschinkel – On stable rationality of Fano threefolds and Del Pezzo fibrations, J. reine angew. Math. (2016), doi:10.1515/ crelle-2016-0058. [29] A. Hoshi & A. Yamasaki – Rationality problem for algebraic tori, Mem. Amer. Math. Soc., vol. 248, 2017. [30] V. A. Iskovskih & J. I. Manin – Three-dimensional quartics and counterexamples to the Lüroth problem, Mat. Sb. (N.S.) 86 (1971), p. 140–166. [31] N. A. Karpenko & A. S. Merkurjev – On standard norm varieties, Ann. Sci. Éc. Norm. Supér. 46 (2013), no 1, p. 175–214. [32] J. Kollár – Rational curves on algebraic varieties, Ergebn. Math. Grenzg., vol. 32, Springer, 1996. [33] J. Lüroth – Beweis eines Satzes über rationale Curven, Math. Ann. 9 (1875), no 2, p. 163–165. [34] A. Merkurjev – Unramified elements in cycle modules, J. Lond. Math. Soc. 78 (2008), no 1, p. 51–64. [35] L. Moret-Bailly – Variétés stablement rationnelles non rationnelles, Séminaire Bourbaki (1984/85), exp. no 643, Astérisque 643 (1986), p. 133–134. [36] T. Okada – Stable rationality of cyclic covers of projective spaces, prépublication arXiv:1604.08417.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
116
[37]
E. PEYRE
, Stable rationality of orbifold Fano threefold hypersurfaces, prépublication arXiv:1608.01186.
[38] A. Pirutka – Varieties that are not stably rational, zero-cycles and unramified cohomology, prépublication arXiv:1603.09261. [39] M. Rost – Chow groups with coefficients, Doc. Math. 1 (1996), p. 319–393. [40] Séminaire Palaiseau – Géométrie des surfaces K3 : modules et périodes, Astérisque, vol. 126, 1985. [41] J-P. Serre – Critère de rationalité pour les surfaces algébriques, in Séminaire N. Bourbaki, 9e année, exposé 146, édition hors série, vol. 4, Soc. math. France, 1995. [42] B. Totaro – Hypersurfaces that are not stably rational, J. Amer. Math. Soc. 29 (2016), no 3, p. 883–891. [43]
, Rationality does not specialise among terminal varieties, Math. Proc. Cambridge Philos. Soc. 161 (2016), no 1, p. 13–15.
[44] C. Vial – Algebraic cycles and fibrations, Doc. Math. 18 (2013), p. 1521–1553. [45] C. Voisin – Abel-Jacobi map, integral Hodge classes and decomposition of the diagonal, J. Algebraic Geom. 22 (2013), no 1, p. 141–174. [46]
, Unirational threefolds with no universal codimension 2 cycle, Invent. math. 201 (2015), no 1, p. 207–237.
[47]
, Stable birational invariants and the Lüroth problem, in Surveys in differential geometry 2016. Advances in geometry and mathematical physics, Surv. Differ. Geom., vol. 21, Int. Press, 2016, p. 313–342.
Emmanuel PEYRE Institut Fourier Université Grenoble Alpes et CNRS CS 40700 38058 Grenoble Cedex 09 France E-mail : [email protected] Web : http://www-fourier.ujf-grenoble.fr/~peyre
ASTÉRISQUE 407
Séminaire BOURBAKI 69e année, 2016–2017, no 1124, p. 117 à 134 doi:10.24033/ast.1062
Janvier 2017
L’INÉGALITÉ DE CORRÉLATION GAUSSIENNE [d’après Thomas Royen] par Franck BARTHE
INTRODUCTION Les mesures gaussiennes jouent un rôle « central » en théorie des probabilités. Leurs propriétés géométriques et analytiques ont été largement étudiées, et mises en application dans des domaines variés (théorie des processus, statistiques, géométrie des espaces de Banach, théorie des algorithmes, ...). De nombreuses techniques sont maintenant disponibles pour les établir (symétrisation d’Ehrhard, interpolation par le semigroupe d’Ornstein-Uhlenbeck, formules issues du calcul stochastique, transport optimal, entre autres), mais elles semblent plus efficaces pour les propriétés qui font intervenir tous les ensembles mesurables, comme l’isopérimétrie gaussienne. Elles n’ont pas permis, jusqu’à présent, d’établir la célèbre conjecture de corrélation gaussienne, qui fait intervenir des ensembles convexes symétriques. La conjecture est devenue un théorème en 2014, grâce au travail remarquable de Royen : Théorème 0.1 ([16]). — Soit n ≥ 1. Soit γ une mesure de probabilité gaussienne sur Rn , de moyenne 0. Pour tous les sous-ensembles A, B ⊂ Rn convexes et symétriques par rapport à l’origine, on a (1)
γ(A ∩ B) ≥ γ(A)γ(B).
Royen prouve en fait un résultat pour la famille plus vaste des lois gamma multivariées au sens de Krishnamoorthy et Parthasarathy. Même dans le cas particulier gaussien, sa démonstration utilise de manière astucieuse les propriétés de ces lois (et s’adresse à des lecteurs qui en sont spécialistes). Latała et Matlak [12] ont écrit une version auto-contenue et détaillée de l’argument de Royen dans le cas des mesures gaussiennes.
© Astérisque 407, SMF 2019
118
F. BARTHE
1. FORMULATIONS ÉQUIVALENTES ET BREF HISTORIQUE En jouant sur les transformations linéaires, on peut donner des formulations équivalentes de la corrélation gaussienne, formellement plus faibles, et ce de deux manières. Comme toute mesure gaussienne centrée sur Rn est image linéaire de la mesure gaussienne standard de dimension n, γn (dx) = e−|x|
2
/2
dx , (2π)n/2
le théorème 0.1 revient à γn (A ∩ B) ≥ γn (A)γn (B) pour tous les convexes symétriques de Rn . Cet énoncé a souvent été formulé en termes fonctionnels, afin d’introduire des techniques analytiques. Toute fonction mesurable f : Rn → R+ peut s’écrire sous la forme Z +∞ f (x) = 1At (x) dt, 0
où les At := {y ∈ R; f (y) ≥ t} sont les ensembles de niveaux de f . On dit que f est quasi-concave si ses ensembles de niveau sont tous convexes. On obtient la formulation suivante de la corrélation gaussienne : Théorème 1.1. — Soit n ≥ 1. Soient f, g : Rn → R+ des fonctions paires et quasiconcaves. Alors Z Z Z f g dγn ≥ f dγn g dγn . Dans une autre direction, on peut conserver une mesure gaussienne générale sur Rd et simplifier les ensembles convexes à traiter. Par approximation, il suffit de considérer des polytopes convexes symétriques, qui sont des intersections de bandes symétriques A=
n1 \ i=1
x ∈ Rd ; |hx, ui i| ≤ ti ,
B=
n \
x ∈ Rd ; |hx, ui i| ≤ ti ,
i=1+n1
pour n entier, des ti ≥ 0 et des vecteurs unitaires ui ∈ Rd . Si Y est un vecteur aléatoire sur Rd de loi gaussienne γ, l’inégalité γ(A ∩ B) ≥ γ(A)γ(B) revient à P ∀i, |hY, ui i| ≤ ti ≥ P ∀i ≤ n1 , |hY, ui i| ≤ ti P ∀i > n1 , |hY, ui i| ≤ ti , où l’on a sous-entendu la condition i ∈ {1, . . . , n}. Si ti 6= 0, on définit Xi = hY, ui i/ti . Si ti = 0, comme hY, ui i est une variables aléatoire gaussienne centrée, P |hY, ui i| = 0 peut seulement valoir 0 ou 1. Dans le premier cas l’inégalité de corrélation est évidente, dans le second on peut enlever la condition toujours vraie. On obtient ainsi un vecteur gaussien X. En récrivant l’inégalité précédente en fonction de X on arrive à une autre formulation équivalente du théorème 0.1 :
ASTÉRISQUE 407
(1124)
CORRÉLATION GAUSSIENNE
119
Théorème 1.2. — Soient n ≥ n1 ≥ 1 des entiers et X = (X1 , . . . , Xn ) un vecteur gaussien centré (i.e., d’espérance nulle) à valeurs dans Rn . Alors P max |Xi | ≤ 1 ≥ P max |Xi | ≤ 1 P max |Xi | ≤ 1 . 1≤i≤n
1≤i≤n1
n1 0 signifie que A est une matrice symétrique définie positive. On
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
120
F. BARTHE
√ note A ≥ 0 si elle est seulement (semi-définie) positive ; A désigne alors son unique racine carrée positive. Enfin la matrice identité de taille n est notée In . 2.2. Mesures gaussiennes Les mesures de probabilités gaussiennes sur R sont notées N (m, σ 2 ) avec m ∈ R et σ ∈ R+ . Lorsque σ > 0, ces mesures sont à densité N (m, σ
2
)(dt) = e−
(t−m)2 2σ 2
dt √ . σ 2π
De plus N (m, 0) est la masse de Dirac en m. Une mesure sur Rn est dite gaussienne si ses images par toutes les formes linéaires sont des mesures gaussiennes sur R. Elles sont caractérisées par leur espérance m ∈ Rn et leur matrice de covariance C ≥ 0, C ∈ Mn . On les note logiquement Nn (m, C). Si G1 , . . . , Gn sont des variables aléatoires réelles indépendantes et de loi N (0, 1), alors le vecteur G = (G1 , . . . , Gn ) suit la loi Nn (0, In ) que nous avons déjà notée γn . Pour m ∈ Rn et C ∈ Mn positive, √ le vecteur m + CG suit la loi Nn (m, C). Lorsque C > 0 cette loi est à densité par rapport à la mesure de Lebesgue :
dx − 1 x−m,C −1 (x−m) Nn (m, C)(dx) = e 2 · (2π)n/2 |C|1/2 L’inégalité de corrélation gaussienne fait intervenir des vecteurs centrés, i.e., m = 0. 2.3. Quelques transformées de Laplace utiles Dans sa preuve, Royen ne travaille avec les lois de probabilités que par l’intermédiaire de leur transformée de Laplace et tire habilement parti de leur forme simple. Comme l’énoncé que l’on cherche à prouver (le théorème 1.2) ne fait intervenir que les variables positives |Xi |, on va définir, pour une mesure µ sur Rn+ , sa transformée de Laplace par Z e−hλ,xi µ(dx),
Lµ (λ) = Rn +
λ ∈ Rn+ .
Ainsi elle prend toujours des valeurs finies pour les mesures de probabilité. On étendra la définition aux mesures signées. Si X est un vecteur à valeurs dans Rn+ , on définit sa transformée de Laplace comme celle de sa loi PX , ce qui revient à LX (λ) = Ee−hλ,Xi . Il est connu que dès que la transformée de Laplace d’une mesure (finie ou signée) est finie sur un ouvert, la donnée de ses valeurs sur l’ouvert caractérise la mesure. Commençons par calculer la transformée des « carrés » de vecteurs gaussiens centrés. Lemme 2.1. — Soit X un vecteur gaussien de loi Nn (0, C), et Z = Alors pour tout λ ∈ Rn+ , LZ (λ) = |In + ΛC|−1/2 ,
ASTÉRISQUE 407
2 X12 Xn 2 ,..., 2 .
(1124)
121
CORRÉLATION GAUSSIENNE
où Λ = diag(λ1 , . . . , λn ). Si C > 0, la loi de Z est à densité par rapport à la mesure de Lebesgue sur Rn+ . √ Preuve. — Soit G de loi Nn (0, In ). On utilise que X a même loi que C G X X2 √ 1 1 √ i E exp − λi = E exp − hΛX, Xi = E exp − Λ CG, CG 2 2 2 i≤n Z 1 1 √ √ dx = exp − CΛ Cx, x − hx, xi n/2 2 2 (2π) n R Z dx 1 = , exp − hM x, xi n/2 2 (2π) n R √ √ √ où M := In + CΛ C > 0. En effectuant le changement de variables y = M x, on obtient √ √ −1/2 √ −1 LZ (λ) = M = In + CΛ C = |In + ΛC|−1/2 , en utilisant en dernier lieu que pour des matrices carrées A, B de même taille, AB et BA ont même polynôme caractéristique. Si C > 0, la loi de X est à densité. On en déduit la densité de Z en découpant Rn en 2n orthants. Sur chacun d’eux, les coordonnées sont de signe constant, et le changement de variables x2i /2 = zi est bijectif. On obtient que PZ (dz) = 1]0,+∞[n (z) où ε ·
√
|C|−1/2 (4π)−n/2 Q √ zi i≤n
X
exp −hC −1 (ε ·
√
z), (ε ·
√
z)i dz,
ε∈{−1,1}n
√ z = (εi zi )ni=1 .
Nous aurons besoin d’identifier d’autres transformées de Laplace qui sont liées à la précédente. Lemme 2.2. — Soit k ∈ N∗ . Soit C ≥ 0 une matrice de taille n. Alors il existe une mesure de probabilité µ sur Rn+ telle que pour tout λ ∈ Rn+ , Lµ (λ) = |In + ΛC|−k/2 , où Λ = diag(λ1 , . . . , λn ). Si C > 0 alors µ est à densité sur Rn+ , µ(dz) = h(z)dz. De plus, lorsque k ≥ 3, on a pour tout ensemble S ⊂ [n] les propriétés suivantes ∂ |S| n h existe sur ]0, +∞[ et appartient à L1 (Rn+ ). ∂xS ∂ |S| h(x) = 0. 2. Si i ∈ [n] \ S, alors lim+ xi →0 ∂xS 1. La dérivée « diagonale »
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
122
F. BARTHE
3. Pour tout λ ∈ Rn+ , la transformée de Laplace de la dérivée diagonale vaut Y L ∂ |S| h (λ) = |In + ΛC|−k/2 λi . ∂xS
i∈S
Preuve (esquisse). — Lorsque k = 1 la loi du vecteur Z étudié dans le lemme précédent convient. Pour k ≥ 2, il suffit de considérer des copies indépendantes Z1 , . . . , Zk de Z. Par indépendance, pour λ ∈ Rn+ , LZ1 +···+Zk (λ) = E
k Y
e−hλ,Zi i =
i=1
k Y
LZi (λ) = |In + ΛC|−k/2 .
i=1
Rn+ .
Lorsque C > 0 la loi de Z est à densité sur La loi de Z1 +· · ·+Zk est donc encore à densité sur Rn+ , donnée par la puissance de convolution d’ordre k de la densité de PZ . Lorsque k ≥ 3, le point 3) revient à Z |S| Y Z P Pn λi xi ∂ − n i=1 h(x) dx = e λi e− i=1 λi xi h(x) dx. ∂xS Rn Rn + + i∈S
Ceci se démontre par intégrations par parties successives par rapport aux variables xi pour i ∈ S. L’absence de terme de bord dans l’intégration par parties provient du point 2) pour le bord en 0 et du point 1) pour le bord en +∞. En principe nous avons à ce stade assez d’information sur h pour montrer directement les points 1) et 2). Nous présenterons plus loin une preuve conceptuelle, qui requiert un cadre plus large. Terminons cependant en expliquant heuristiquement le rôle de la condition k ≥ 3 : en utilisant C ≥ εIn pour un ε > 0, on obtient n Y Y Y λj ≤ (1 + ελj )−k/2 λj . L ∂ |S| h (λ) = |In + ΛC|−k/2 ∂xS
j∈S
j=1
j∈S
Donc si i 6∈ S et k > 2, on obtient limλi →+∞ λi L ∂ |S| h (λ) = 0. En exploitant le principe ∂xS
« de la valeur initiale » (qui dit en dimension 1 que limp→+∞ pLf (p) = limt→0+ f (t)), on peut se convaincre du point 2).
3. DÉMONSTRATION DE L’INÉGALITÉ GAUSSIENNE 3.1. Interpolation Une approche classique de l’inégalité de corrélation consiste à interpoler entre les termes sur la formulation donnée dans le théorème 1.1 : on écrit Z Z Z f g dγn = Ef (X1 )g(Y1 ) et f dγn g dγn = Ef (X0 )g(Y0 ),
ASTÉRISQUE 407
(1124)
123
CORRÉLATION GAUSSIENNE
avec des vecteurs gaussiens de lois P(X1 ,Y1 ) = N2n
In
In
In
In
! ,
P(X0 ,Y0 ) = N2n
In
0
0
In
! .
On peut alors faire varier continûment les termes non diagonaux de la covariance entre ces deux cas extrêmes et étudier le sens de variation de l’espérance, ce qui revient à appliquer le semi-groupe d’Ornstein-Uhlenbeck à une des fonctions. Royen applique une approche par interpolation sur la formulation donnée dans le théorème 1.2. La principale nouveauté de sa démarche réside dans sa manière de contrôler le signe des termes qui apparaissent après dérivation. L’énoncé suivant dégage son argument d’interpolation : Proposition 3.1. — Soit C : [0, 1] → Mn une application de classe C 1 telle que ∀t, C(t) > 0. Pour chaque t, on considère un vecteur gaussien X(t) = (X1 (t), . . ., Xn (t)) de loi Nn 0, C(t) . Si pour tout S ⊂ [n] non vide, l’application t 7→ |C(t)S | est décroissante, alors P max |Xi (1)| ≤ 1 ≥ P max |Xi (0)| ≤ 1 . i≤n
i≤n
n Preuve. — Définissons Z(t) = Xi (t)2 /2 i=1 . Le lemme 2.1 nous renseigne sur ses propriétés. Notons f (t, ·) la densité de la loi de Z(t), et considérons le cube Q := [0, 1/2]n . Notre but est de montrer la croissance de la fonction ϕ définie sur [0, 1] par Z ϕ(t) := P max |Xi (t)| ≤ 1 = P Z(t) ∈ Q = f (t, x) dx, i≤n
Q
en montrant que sa dérivée est positive. On peut dériver sous le signe somme (la formule explicite de f (t, ·) et l’existence d’un ε > 0 tel que, pour tout t, εIn ≤ C(t) ≤ ε−1 In permettent de voir que g(x) := ∂ supt∈[0,1] | ∂t f (t, x)| est intégrable sur Rn+ , voir [12]) : Z ∂ ϕ0 (t) = f (t, x) dx. Q ∂t ∂ Pour identifier la fonction x 7→ ∂t f (t, x), Royen n’utilise pas la formule explicite directement ; il passe par les transformées de Laplace : pour λ ∈ Rn+ , Z Z ∂ ∂ −hλ,xi ∂ e f (t, x) dx = e−hλ,xi f (t, x) dx = Ee−hλ,Z(t)i n n ∂t ∂t ∂t R+ R+ ∂ = |In + ΛC(t)|−1/2 , ∂t
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
124
F. BARTHE
où Λ = diag(λ), d’après le lemme 2.1. En utilisant la multilinéarité du déterminant, on a X X Y (ΛC(t))S = 1 + C(t)S |In + ΛC(t)| = 1 + λi . ∅6=S⊂[n]
i∈S
∅6=S⊂[n]
Donc Z
e−hλ,xi
Rn +
∂ 1 f (t, x) dx = − |In + ΛC(t)|−3/2 ∂t 2
X ∅6=S⊂[n]
Y ∂ C(t)S λi . ∂t i∈S
Par le lemme 2.2 appliqué pour k = 3, il existe une densité de probabilité sur Rn+ , que nous notons ici ht , dont la transformée de Laplace vaut |In + ΛC(t)|−3/2 . Le point 3) du lemme 2.2 nous permet d’identifier l’expression précédente comme la transformée de Laplace de la fonction kt := −
1 2
X ∅6=S⊂[n]
∂ |S| ∂ C(t)S ht . ∂t ∂xS
∂ f (t, x) = kt (x) pour Par injectivité de la transformée de Laplace, on obtient que ∂t presque tout x ∈ Rn+ . Cette expression non triviale va permettre de montrer la positivité de Z Z X 1 ∂ ∂ |S| ∂ 0 C(t)S ϕ (t) = f (t, x) dx = − ht . 2 ∂t Q ∂xS Q ∂t ∅6=S⊂[n]
Par hypothèse les termes entre crochets sont positifs. Les intégrales sont aussi positives, en effet Z Z ∂ |S| ht = ht ◦ JS ≥ 0, [0,1/2]n ∂xS [0,1/2]S c où pour y = (yi )i∈S c , JS (y) est le vecteur de Rn donc la i-ème coordonnée vaut yi si i ∈ S c et 1/2 si i ∈ S. Ceci se voit facilement en intégrant d’abord sur les variables xi pour i ∈ S : si pour fixer les idées 1 ∈ S, en posant T := S \ {1}, Z [0,1/2]
∂ |S| ht (x) dx1 = ∂xS
Z [0,1/2]
∂ ∂ |T | ht (x1 , x2 , . . . , xn ) dx1 ∂x1 ∂xT
∂ |T | ∂ |T | = ht 1/2, x2 , . . . , xn − lim + ht (x1 , x2 , . . . , xn ) ∂xT x1 →0 ∂xT =
∂ |T | ht (1/2, x2 , . . . , xn ), ∂xT
en invoquant le point 2) du lemme 2.2.
ASTÉRISQUE 407
(1124)
125
CORRÉLATION GAUSSIENNE
3.2. Preuve du théorème 1.2 Soient n ≥ n1 ≥ 1 et X un vecteur gaussien centré sur Rn . Notons sa loi Nn (0, C). Tout d’abord, on remarque qu’il suffit de traiter le cas où la covariance C est définie positive. En effet, lorsque k tend vers l’infini, la loi Nn (0, C + k1 In ) converge étroitement vers Nn (0, C) ; de plus comme P(|Xi | = 1) = 0 le bord des ensembles convexes considérés n’est pas chargé par la mesure limite, donc la convergence étroite assure la convergence de leurs mesures. Notons N1 = [n1 ] = {1, . . . , n1 } et N2 = {1 + n1 , . . . , n}. Pour t ∈ [0, 1], soit X(t) un vecteur gaussien de loi Nn (0, C(t)) où ! CN1 tCN1 ,N2 C(t) := . tCN2 ,N1 CN2 On note que C(1) = C donc X(1) a même loi que X. De plus C(t) > 0 pour tout t ∈ [0, 1] et C(0) correspond à un vecteur dont les deux blocs sont indépendants, et ont chacun même loi que les blocs de X. Ainsi P max |Xi (0)| ≤ 1 = P max |Xi | ≤ 1 P max |Xi | ≤ 1 , 1≤i≤n
1≤n1
n1 0. C(t)S = tCS2 ,S1 CS2 Par le lemme 3.2 ci-dessous, son déterminant se calcule par blocs : −1/2 −1/2 |C(t)S | = |CS1 ||CS2 | I|S1 | − t2 CS1 CS1 ,S2 CS−1 C C . S ,S 2 1 S1 2 −1/2
−1/2
De plus, pour t = 1 le lemme nous assure que 0 ≤ CS1 CS1 ,S2 CS−1 CS2 ,S1 CS1 ≤ I|S1 | , 2 donc cette matrice (diagonalisable) a toutes ses valeurs propres dans [0, 1]. On les note λi , i = 1, . . . , |S1 |. Il s’ensuit que |S1 |
|C(t)S | = |CS1 ||CS2 |
Y
(1 − t2 λi )
i=1
est une fonction décroissante de t ∈ [0, 1]. Ceci termine la preuve de l’inégalité de corrélation gaussienne. Nous avons utilisé une version de la formule du déterminant de Schur pour les matrices définies positives :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
126
F. BARTHE
Lemme 3.2. — Soit n = n1 + n2 et A > 0!une matrice symétrique définie positive de A1,1 A1,2 taille n, écrite par blocs A = avec Ai,j ∈ Mni ,nj et A2,1 = A∗1,2 . Alors A2,1 A2,2 −1/2 −1/2 |A| = |A1,1 ||A2,2 | In1 − A1,1 A1,2 A−1 2,2 A2,1 A1,1 , −1/2
−1/2
et de plus 0 ≤ A1,1 A1,2 A−1 2,2 A2,1 A1,1
≤ I n1 .
Preuve. — L’hypothèse A > 0 implique A1,1 > 0 et A2,2 > 0. La décomposition ! ! ! ! 1/2 −1/2 −1/2 1/2 A1,1 A1,2 A1,1 0 In1 A1,1 A1,2 A2,2 A1,1 0 = 1/2 −1/2 −1/2 1/2 A2,1 A2,2 0 A2,2 A2,2 A2,1 A1,1 In2 0 A2,2 ! In1 B montre qu’il suffit d’établir le lemme pour des matrices A = positives. B ∗ I n2 Dans ce cas, la relation ! ! ! In1 −B In1 0 In1 − BB ∗ 0 A = 0 In2 −B ∗ In2 0 In2 montre que In1 − BB ∗ ≥ 0 et |A| = |In1 − BB ∗ |. 3.3. Quand les carrés font la différence n Le changement de variable Z(t) = Xi (t)2 /2 i=1 joue rôle crucial dans la preuve de la proposition 3.1. Examinons ce que l’on obtiendrait si l’on s’en passait, en travaillant directement avec X(t), de loi Nn 0, C(t) et de transformée de Laplace LX(t) (λ) = exp 21 hC(t)λ, λi . ∂ Notons g(t, ·) la densité de la loi de X(t). On identifie ∂t g(t, ·) par sa transformée de Laplace : pour λ ∈ Rn+ , Z Z ∂ ∂ ∂ e−hλ,xi g(t, x) dx = e−hλ,xi g(t, x) dx = Ee−hλ,X(t)i n n ∂t ∂t ∂t R+ R+ 1 ∂ 1 hC(t)λ,λi 1 e2 = hC 0 (t)λ, λi e 2 hC(t)λ,λi ∂t 2 1 1X 0 = C (t)i,j λi λj e 2 hC(t)λ,λi . 2 i,j
=
Par injectivité de la transformée de Laplace, on peut en déduire que ∂ 1X 0 ∂2 g(t, x) = C (t)i,j g(t, x). ∂t 2 i,j ∂xi ∂xj Qn En intégrant sur l’ensemble Q = i=1 ]−∞, bi ], on retrouve avec la même méthode le lemme de Slepian, qui est un outil classique pour l’étude des processus gaussiens :
ASTÉRISQUE 407
(1124)
CORRÉLATION GAUSSIENNE
127
Lemme 3.3 ([22]). — Soit C : [0, 1] → Mn une application de classe C 1 telle que ∀t, C(t) > 0. Pour chaque t, on considère un vecteur gaussien X(t) = (X1 (t), . . . , Xn (t)) de loi Nn 0, C(t) . Si pour tout i, l’application t 7→ C(t)i,i est constante, et pour tous i 6= j, t 7→ C(t)i,j est croissante alors pour tout b ∈ Rn , P ∀i ≤ n, Xi (0) ≤ bi ≤ P ∀i ≤ n, Xi (1) ≤ bi .
4. LES LOIS GAMMA MULTIVARIÉES Royen démontre l’inégalité de corrélation dans un cadre plus général que les mesures gaussiennes : celui des lois gamma multivariées. Nous présentons rapidement les bases de ce sujet, auquel Royen a largement contribué. Cette approche générale permet, même dans le cas gaussien, de démontrer de manière rapide les propriétés techniques qui ont été mentionnées à la fin du lemme 2.2. 4.1. Rappels sur les lois gamma univariées Pour α > 0, la loi gamma de paramètre α, notée γ(α), est la mesure de probabilité sur R+ donnée par dx , γ(α)(dx) := e−x xα−1 1x>0 Γ(α) où Γ est la fonction gamma d’Euler. Un calcul direct donne sa transformée de Laplace : Lγ(α) (s) = (1 + s)−α ,
s ∈ R+ .
La forme puissance de ces transformées montre que les lois gamma forment un semigroupe de convolution γ(α) ∗ γ(β) = γ(α + β). Ces lois sont parfois appelées lois gamma centrées. Pour comprendre ce terme il faut revenir en arrière : Si g1 , . . . , gk sont des variables aléatoires réelles indépendantes et de loi N (0, 1), alors 12 (g12 + · · · + gk2 ) suit une loi γ(k/2), appelée aussi loi du X 2 (k) (pour carrés de vecteur gaussien centré à k degrés de liberté). Notez que ce fait classique est redémontré dans les lemmes 2.1 et 2.2 pour une dimension n = 1. Si les gi suivent la loi gaussienne non centrée N (m, 1), alors un calcul direct donne la transformée de Laplace de Z = 21 (g12 + · · · + gk2 ) : LZ (s) = (1 + s)−k/2 e−
km2 s 2 1+s
s ∈ R+ .
,
Par extension, on peut dire qu’une loi µ sur R suit une loi gamma non centrée de paramètres α > 0 et y > 0, si pour tout s ≥ 0 (2)
s
Lµ (s) = (1 + s)−α e−y 1+s .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
128
F. BARTHE
Encore faut-il que de telles lois existent. On peut le montrer par la méthode de poissonisation : Soit (Xn )n∈N∗ une suite de variables aléatoires indépendantes et de même loi (disons sur R+ ), et N une variable indépendante des (Xn ) qui suit une loi de Poisson P (y), i.e., P(N = k) = e−y y k /(k!) pour k ∈ N. Alors la variable aléatoire P S := 1≤i≤N Xi (avec la convention qu’une somme vide est nulle) vérifie pour s ≥ 0 : X LS (s) = P(N = 0) + P(N = k)Ee−s(X1 +···+Xk ) k≥1
=
X k∈N
e−y
k
y LX1 (s)k = ey(LX1 (s)−1) . k!
Si l’on choisit les (Xn )n≥1 de loi γ(1) (loi exponentielle e−x 1x>0 dx), et X0 de loi γ(α) PN indépendante de N et des (Xn )n≥1 , alors la variable Z := X0 + S = i=0 Xi vérifie pour s ≥ 0 −1
LZ (s) = LX0 (s)ey(LX1 (s)−1) = (1 + s)−α ey((1+s)
−1)
s
= (1 + s)−α e−y 1+s .
Ceci montre l’existence des lois gamma décentrées. On peut en simplifier la présentation en notant que la loi conditionnelle de Z sachant N = k est celle de X0 + · · · + Xk , c’est-à-dire γ(α + k). Avec des notations très concises Z ∼ γ α + P (y) . Ceci permet de donner une description complètement explicite de sa loi : Définition 4.1. — Soient α > 0, x > 0 et y ≥ 0. On définit gα (x, y) :=
+∞ X
e−x
k=0
xα+k−1 −y y k e · Γ(α + k) k!
Alors la mesure de probabilité gα (x, y)1x>0 dx est la loi gamma décentrée de paramètres α et y. On la notera ici γ(α, y). On retiendra pour la suite que sa transformée de Laplace est donnée par (2), ainsi que les deux propriétés suivantes, qui sont faciles à vérifier sur la formule : ∂ gα = gα−1 − gα . (3) ∀x > 0, gα (x, y) ≤ 2xα−1 (1 + x) et, si α > 1, ∂x 4.2. Un détour par les matrices aléatoires Soit C ∈ Mn une matrice symétrique positive C ≥ 0 et α > 0. On dit qu’une matrice aléatoire M à valeurs dans les matrices symétriques positives de taille n suit la loi de Wishart Wn (α, C) si sa transformée de Laplace (matricielle) est donnée par la formule Ee−Tr(ΛM ) = |In + ΛC|−α , pour toute matrice Λ ≥ 0 dans Mn . Par un théorème de Gyndikin (voir e.g., [19]), ces lois existent pour α appartenant à 21 N∗ ∪ ] n−1 2 , +∞[. Le cas des indices demi-entiers est très classique : on considère
ASTÉRISQUE 407
(1124)
CORRÉLATION GAUSSIENNE
129
des vecteurs aléatoires Z1 , . . . , Zk indépendants et de même de loi Nn (0, C). Alors si l’on voit les vecteurs de Rn comme des matrices colonnes, k
M :=
1X Zi Zi∗ 2 i=1
est de loi Wn ( k2 , C). On le vérifie par un calcul analogue à ceux des lemmes 2.1 et 2.2. 4.3. Lois gamma multidimensionnelles Il existe plusieurs notions différentes de loi gamma multivariées, voir e.g., [9]. Celle de Krishnamoorthy et Parthasarathy [10] est basée sur une formule de transformée de Laplace qui étend naturellement celle du cas univarié. Définition 4.2. — Soit C ∈ Mn une matrice symétrique positive C ≥ 0 et α > 0. On dit qu’un vecteur aléatoire X à valeurs dans Rn+ suit une loi Γn (α, C) si sa transformée de Laplace vaut pour tout λ ∈ Rn+ , Ee−hλ,Xi = |In + ΛC|−α , où Λ = diag(λ1 , . . . , λn ). Encore une fois, l’existence de telles lois n’est pas assurée. Les lois Γn (α, C) existent pour tous C ≥ 0 lorsque α ∈ 12 N∗ ∪ ] n−2 2 , +∞[. Le cas des α demi-entiers est vérifié dans le lemme 2.2. Il est clair sur les définitions que si M est une matrice de Wishart Wn (α, C) alors le vecteur constitué par ses coefficients diagonaux suit la loi Γn (α, C). Ainsi le résultat d’existence de lois de Wishart donne l’existence des lois gamma multivariées lorsque 2α > n−1. Il reste donc à traiter le cas 2α ∈ ]n−2, n−1], pour lequel Royen a proposé dans des travaux antérieurs [15, 14] une représentation qui en plus de l’existence des lois, permet d’établir des propriétés analytiques. Nous allons présenter rapidement cette approche et ses conséquences pour les inégalités de corrélation. Remarque 4.3. — Il existe des conditions individuelles sur α et C, sans même supposer C ≥ 0 ; elles font intervenir des permanents de matrices associées. Les vecteurs aléatoires correspondants sont aussi appelés vecteurs permanentaux. Nous renvoyons entre autres à l’article [4] pour les références et les inégalités de corrélation positive qu’il contient. Le lemme suivant montre l’existence des lois Γn (α, C) lorsque C est singulière, en utilisant les lois de Wishart de taille n − 1 :
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
130
F. BARTHE
Lemme 4.4. — Soit C ∈ Mn une matrice positive non inversible. Il existe B ∈ Mn−1,n tel que C = B ∗ B. Pour i ∈ [n], soit bi ∈ Rn−1 le i-ème vecteur colonne de B. Soit S une matrice aléatoire de loi Wn−1 (α, In−1 ) ; elle existe lorsque i (n − 1) − 1 h 1 in − 2 h 1 α ∈ N∗ ∪ , +∞ = N∗ ∪ , +∞ . 2 2 2 2 n Alors le vecteur V = hbi , Sbi i i=1 est de loi Γn (α, C). Preuve. — La vérification est directe : soit λ ∈ Rn+ , alors n n X X hλ, V i = λi Tr(b∗i Sbi ) = Tr λi bi b∗i S = Tr(BΛB ∗ S), i=1
i=1
avec Λ = diag(λ). Donc, Ee−hλ,V i = Ee−Tr(BΛB
∗
S)
= |In−1 + BΛB ∗ |−α = |In + ΛB ∗ B|−α = |In + ΛC|−α ,
grâce au lien entre polynômes caractéristiques de AB et BA dans le cas rectangulaire.
Il reste ensuite à passer des matrices C positives singulières aux matrices définies positives. Royen y parvient en utilisant des mélanges de produits de lois gamma décentrées : Proposition 4.5. — Soit µ ∈ R∗+ et Y de loi Γn (α, C). On définit un vecteur aléatoire X par sa loi conditionnelle sachant Y : L (X|Y )
:= γ(α, Y1 /µ) ⊗ · · · ⊗ γ(α, Yn /µ).
Alors µX est de loi Γn (α, µIn + C). Preuve. — Soit λ ∈ Rn+ et Λ la matrice diagonale associée. En utilisant la définition, et la formule (2) de la transformée de Laplace des lois gamma décentrées, on obtient : Z n n Z Y Y Ee−hλ,µXi = E e−hµλ,xi γ(α, Yi /µ)(dxi ) = E e−µλi xi γ(α, Yi /µ)(dxi ) i=1
i=1
=E
n Y
−
(1 + µλi )−α e
Yi µλi µ 1+µλi
= |In + µΛ|−α Ee
−
λi i=1 1+µλi
Pn
Yi
i=1
= |In + µΛ|−α |In + (In + µΛ)−1 ΛC|−α = |In + Λ(µIn + C)|−α . Si α > (n − 2)/2 et C > 0, on peut choisir pour µ la plus petite valeur propre de C. Alors C = µIn + C˜ où C˜ est positive singulière. Le lemme 4.4, donne un vecteur de loi ˜ à partir duquel la proposition précédente permet de construire un vecteur Γn (α, C), distribué suivant Γn (α, C). Comme nous allons le voir, cette construction a l’avantage de révéler des propriétés de régularité de la loi Γn (α, C). À cette fin, on peut procéder
ASTÉRISQUE 407
(1124)
CORRÉLATION GAUSSIENNE
131
de même pour α ∈ N∗ /2, même si la construction des lois Γn (k/2, C) ne pose pas de problème. Partant de C > 0, il existe ε > 0 tel que C˜ := C − εIn > 0. Alors le ˜ à partir lemme 2.2 donne une construction élémentaire d’un vecteur de loi Γn (k/2, C), duquel la construction de la proposition 4.5 avec µ = ε fournit un vecteur Γn (k/2, C). Pour finir, voyons comment la construction de la proposition 4.5 permet de montrer des propriétés fines des densités des lois Γn (α, C) lorsque α > 1 et C > 0. Nous allons considérer une construction un peu plus générale : soit Z un vecteur aléatoire n à valeurs dans Rn+ et a ∈ ]0, +∞[ , on définit alors un vecteur X dans Rn+ par sa loi conditionnelle : L (X|Z) := γ(a1 , Z1 ) ⊗ · · · ⊗ γ(an , Zn ). Sa loi est à densité par rapport à la mesure de Lebesgue sur Rn+ , de densité ha (x) = E
n Y
gai (xi , Zi ),
x ∈ Rn+,∗ .
i=1
En utilisant les propriétés (3) des densités des lois gamma décentrées, on obtient tout d’abord que n Y ha (x) ≤ 2n xai i −1 (1 + xi ), x ∈ Rn+,∗ . i=1
En particulier si ai > 1, il vient limxi →0+ ha (x) = 0. ∂ D’autre part, en exploitant ∂x gα = gα−1 −gα qui est valable pour α > 1, on montre que ∂ si ai > 1, ∂x ha = ha−ei − ha , i où ei est le i-ème vecteur de la base canonique de Rn . Par récurrence, on obtient que si a = (α, . . . , α) avec α > 1, pour S ⊂ [n], P ∂ |S| |S\T | ha−Pi∈T ei . T ⊂S (−1) ∂xS ha = Cette fonction est intégrable sur Rn+ car chacune des fonctions hβ est une densité de P probabilité. De plus, si j 6∈ S alors pour tout T ⊂ S, (a − i∈T ei )j = α > 1 donc limxj →0
∂ |S| ∂xS ha (x)
= 0,
j 6∈ S.
Ceci permet de démontrer les points 1), 2) (et 3) qui s’en déduit) du lemme 2.2, pour les lois Γn (α, C) lorsque α > 1 et C > 0. L’argument que nous avons présenté dans ile cas gaussien se déroule sans encombre pour des lois Γn (α, C) avec h α ∈ 21 N∗ ∪
n−2 2 , +∞
(l’argument d’interpolation, après dérivation du déterminant,
fait apparaître une loi Γn (α + 1, C)). Ceci permet ià Royen hde montrer que si X = (X1 , . . . , Xn ) est de loi Γn (α, C) avec α ∈ 21 N∗ ∪ n−2 2 , +∞ , alors pour n1 ≤ n et tous ti ≥ 0, P ∀i ≤ n, Xi ≤ ti ≥ P ∀i ≤ n1 , Xi ≤ ti P ∀i > n1 , Xi ≤ ti .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
132
F. BARTHE
La corrélation gaussienne correspond à α = 1/2. Remerciements. — Les discussions instructives que j’ai eues avec Gérard Letac et avec Michel Ledoux m’ont grandement facilité la préparation de cet exposé. Dans le travail ultérieur [17], Royen a obtenu des résultats partiels pour d’autres valeurs possibles du couple (α, C). Par ailleurs, l’article récent [5] observe qu’en partant de l’inégalité de corrélation gaussienne, on peut obtenir un résultat analogue pour certains mélanges de lois gaussiennes. Ceci permet notamment de traiter les lois stables.
RÉFÉRENCES [1] C. Borell – A Gaussian correlation inequality for certain bodies in Rn , Math. Ann. 256 (1981), no 4, p. 569–573. [2] S. Das Gupta, M. L. Eaton, I. Olkin, M. Perlman, L. J. Savage & M. Sobel – Inequalitites on the probability content of convex regions for elliptically contoured distributions, in Proceedings of the Sixth Berkeley Symposium on Mathematical Statistics and Probability (Univ. California, Berkeley, Calif., 1970/1971), Vol. II : Probability theory, Univ. California Press, 1972, p. 241– 265. [3] C. W. Dunnett & M. Sobel – Approximations to the probability integral and certain percentage points of a multivariate analogue of Student’s t-distribution, Biometrika 42 (1955), p. 258–260. [4] N. Eisenbaum – Characterization of positively correlated squared Gaussian processes, Ann. Probab. 42 (2014), no 2, p. 559–575. [5] A. Eskenazis, P. Nayar & T. Tkocz – Gaussian mixtures : entropy and geometric inequalities, Ann. Probab. 46 (2018), no 5, p. 2908–2945. [6] G. Hargé – A particular case of correlation inequality for the Gaussian measure, Ann. Probab. 27 (1999), no 4, p. 1939–1951. [7]
, A convex/log-concave correlation inequality for Gaussian measure and an application to abstract Wiener spaces, Probab. Theory Related Fields 130 (2004), no 3, p. 415–440.
[8] C. G. Khatri – On certain inequalities for normal distributions and their applications to simultaneous confidence bounds, Ann. Math. Statist. 38 (1967), p. 1853–1867. [9] S. Kotz, N. Balakrishnan & N. L. Johnson – Continuous multivariate distributions. Vol. 1, second dir., Wiley Series in Probability and Statistics, WileyInterscience, 2000.
ASTÉRISQUE 407
(1124)
CORRÉLATION GAUSSIENNE
133
[10] A. S. Krishnamoorthy & M. Parthasarathy – A multi-variate gamma-type distribution, Ann. Math. Statistics 22 (1951), p. 549–557. [11] R. Latała – On some inequalities for Gaussian measures, in Proceedings of the International Congress of Mathematicians, Vol. II (Beijing, 2002), Higher Ed. Press, 2002, p. 813–822. [12] R. Latała & D. Matlak – Royen’s proof of the Gaussian correlation inequality, prépublication arXiv:1512.08776. [13] L. D. Pitt – A Gaussian correlation inequality for symmetric convex sets, Ann. Probability 5 (1977), no 3, p. 470–474. [14] T. Royen – On some central and non-central multivariate chi-square distributions, Statist. Sinica 5 (1995), no 1, p. 373–397. [15]
, Integral representations and approximations for multivariate gamma distributions, Ann. Inst. Statist. Math. 59 (2007), no 3, p. 499–513.
[16]
, A simple proof of the Gaussian correlation conjecture extended to some multivariate gamma distributions, Far East J. Theor. Stat. 48 (2014), no 2, p. 139–145.
[17]
, Some probability inequalities for multivariate gamma and normal distributions, Far East J. Theor. Stat. 51 (2015), nos 1-2, p. 17–36.
[18] G. Schechtman, T. Schlumprecht & J. Zinn – On the Gaussian measure of the intersection, Ann. Probab. 26 (1998), no 1, p. 346–357. [19] D. N. Shanbhag – The Davidson-Kendall problem and related results on the structure of the Wishart distribution, Austr. J. Statist 30A (1988), p. 272–280. [20] Q.-M. Shao – A Gaussian correlation inequality and its applications to the existence of small ball constant, Stochastic Process. Appl. 107 (2003), no 2, p. 269– 287. [21] Z. Šidák – Rectangular confidence regions for the means of multivariate normal distributions, J. Amer. Statist. Assoc. 62 (1967), p. 626–633. [22] D. Slepian – The one-sided barrier problem for Gaussian noise, Bell System Tech. J. 41 (1962), p. 463–501.
Franck BARTHE Université Paul Sabatier Institut de Mathématiques de Toulouse UMR CNRS 5219 118 route de Narbonne F–31062 Toulouse cedex 9 E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 69e année, 2016–2017, no 1125, p. 135 à 182 doi:10.24033/ast.1063
Janvier 2017
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL [d’après Babai et Luks, Weisfeiler–Leman, . . .] par Harald Andrés HELFGOTT
1. INTRODUCTION Soient x, y deux chaînes de caractères, à savoir, deux applications Ω → Σ, où Σ (l’alphabet) et Ω (le domaine) sont des ensembles finis. Tout groupe de permutations (1) G < Sym(Ω) agit sur l’ensemble ΣΩ des chaînes de domaine Ω sur un alphabet Σ. Pour nous, décrire un groupe G, ou être donné un groupe G, voudra toujours dire « donner, voire être donné, un ensemble de générateurs de G » ; décrire une classe Hπ voudra dire « donner un élément π de la classe et un ensemble de générateurs de H ». Le problème de l’isomorphisme de chaînes consiste à déterminer, étant donnés x, y et G, s’il y a au moins un élément π de G qui envoie x sur y, et, si de tels éléments (isomorphismes) existent, à les décrire. Il est clair que l’ensemble des isomorphismes IsoG (x, y) forme une classe AutG (x)π du groupe AutG (x) d’automorphismes de x dans G, c’est-à-dire du groupe consistant dans les éléments de G qui envoient x sur lui-même. Le défi consiste à donner un algorithme qui résolve le problème en temps polynomial en la taille n = |Ω| de Ω, voire en temps raisonnable. Par exemple, le temps employé pourrait être quasi-polynomial en n, ce qui veut dire exp O(log n)O(1) . Ici, comme toujours, O(f (n)) désigne une quantité bornée par C ·f (n), pour n assez grand et C > 0 une constante, et O indique que la constante C dépend de . Une grande partie de la motivation pour le problème de l’isomorphisme de chaînes vient du fait que le problème de l’isomorphisme de graphes se réduit à lui. Ce problème consiste à déterminer si deux graphes finis Γ1 et Γ2 sont isomorphes, et, s’ils le sont, à décrire la classe de leurs isomorphismes. (Un isomorphisme π : Γ1 → Γ2 est une bijection π de l’ensemble de sommets de Γ1 vers celui de Γ2 telle que π(Γ1 ) = Γ2 .) (1)
Pour nous, G < S (ou S > G) veut dire « G est un sous-groupe de S, pas forcement propre. »
© Astérisque 407, SMF 2019
136
H. A. HELFGOTT
Une solution permettrait, par exemple, de trouver une molécule dans une base de données. Le problème de l’isomorphisme de graphes se réduit en temps polynomial au problème de l’isomorphisme de chaînes, de la façon suivante. Supposons sans perte de généralité que Γ1 et Γ2 ont le même ensemble de sommets V . Alors, nous pouvons définir Ω comme l’ensemble des paires d’éléments de V (ordonnés ou non ordonnés, suivant que nos graphes sont orientés ou pas). La chaîne xi , i = 1, 2, est définie comme suit : pour la paire a = {v1 , v2 } (ou a = (v1 , v2 ), si nos graphes sont orientés), la valeur de xi (a) est 1 s’il y a une arête entre v1 et v2 en Γ1 , et 0 dans le cas contraire. Soit G l’image de l’homomorphisme ι : Sym(V ) → Sym(Ω) définie par σ ι ({v1 , v2 }) = {σ(v1 ), σ(v2 )}, où σ ι = ι(σ). Alors ι induit une bijection entre la classe des isomorphismes de Γ1 à Γ2 et la classe IsoG (x1 , x2 ). Théorème 1.1 (Babai). — Le problème de l’isomorphisme de chaînes Ω → Σ peut être résolu en temps quasi-polynomial en le nombre d’éléments du domaine Ω. En novembre 2015, Babai a annoncé une solution en temps quasipolynomial, avec un algorithme explicite. La préparation de cet exposé m’a conduit à trouver une erreur non triviale dans l’analyse du temps, mais Babai a réussi à le réparer en simplifiant l’algorithme. La preuve est maintenant correcte. Corollaire 1.2 (Babai). — Le problème de l’isomorphisme de graphes peut être résolu en temps quasi-polynomial en le nombre de sommets. Notre référence principale sera [3] ; nous nous servirons aussi de la version courte [2]. Nous essayerons d’examiner la preuve de la façon la plus détaillée possible dans un exposé de ce format, en partie pour aider à éliminer tout doute qui pourrait rester sur la forme actuelle du résultat. La meilleure borne générale connue antérieurement pour le temps requis par le √ problème de l’isomorphisme de graphes, due à Luks [5], était exp(O( n log n)), L’usage de la canonicité joue un rôle crucial dans la stratégie de Babai. Comme dans la théorie de catégories, voire dans l’usage courant, un choix est canonique s’il est fonctoriel. La situation typique pour nous sera la suivante : un groupe G < Sym(Ω) agit sur Ω, et donc sur ΣΩ ; il agit aussi sur un autre ensemble S, et donc aussi sur les applications S → C , où C est un ensemble fini. Une application S → C s’appelle un coloriage ; l’ensemble C s’appelle l’ensemble de couleurs. Un choix canonique (en relation à G) d’un coloriage de Ω pour chaque chaîne x ∈ ΣΩ est une application qui va de ΣΩ aux coloriages et qui commute avec l’action de G. En particulier, un choix canonique peut être un outil pour détecter des nonisomorphismes : si les coloriages C(x) et C(y) induits canoniquement par x et y ne
ASTÉRISQUE 407
(1125)
137
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
sont pas isomorphes l’un à l’autre – par exemple, s’ils ont un nombre différent d’éléments vermeils – alors x et y ne sont pas isomorphes l’un à l’autre. Même quand il y a des isomorphismes dans G qui envoient C(x) sur C(y), la classe IsoG (C(x), C(y)) de tels isomorphismes sert à délimiter la classe d’isomorphismes IsoG (x, y) de x à y, puisque cette dernière est forcément un sous-ensemble de IsoG (C(x), C(y)). La preuve assimile aussi plusieurs idées développées lors d’approches antérieures au problème. La première étape de la procédure consiste à essayer de suivre ce qui est en essence l’algorithme de Luks [15]. Si cet algorithme s’arrête, c’est parce qu’il s’est heurté contre un quotient H1 /H2 isomorphe à Alt(Γ), où H2 / H1 < G et Γ est plutôt grand. Notre tâche majeure consiste à étudier ce qui se passe à ce moment-là. La stratégie principale sera de chercher à colorier Γ d’une façon qui dépend canoniquement de x. Cela limitera les automorphismes et isomorphismes possibles à considérer. Par exemple, si la moitié de Γ est coloriée en rouge et l’autre en noir, le groupe d’automorphismes possibles se réduit à Sym(|Γ|/2) × Sym(|Γ|/2). Un coloriage similaire induit par y limite les isomorphismes aux applications qui alignent les deux coloriages. Nous trouverons toujours des coloriages qui nous aident, sauf quand certaines structures ont une très grande symétrie, laquelle, en revanche, permettra une descente à Ω considérablement plus petit. Cette double récursion – réduction du groupe H1 /H2 ou descente à des chaînes considérablement plus courtes – résoudra le problème.
2. FONDEMENTS ET TRAVAUX PRÉCÉDENTS En suivant l’usage courant pour les groupes de permutations, nous écrirons rg pour l’élément g(r) auquel g ∈ Sym(Ω) envoie r ∈ Ω. Étant donnés une chaîne :Ω→Σ x
et un élément g ∈ Sym(Ω), nous définissons xg : Ω → Σ par xg (r) = x rg
−1
.
k
Par contre, nous écrivons Ω pour l’ensemble des ~x = (x1 , . . . , xk ) avec l’action à gauche donnée par (φ(~x))r = ~xφ(r) . L’idée est que ceci est défini non pas seulement pour φ une permutation, mais pour toute application φ : {1, . . . , k} → {1, . . . , k}, même non injective. Nous appelons les éléments de Ωk tuples plutôt que chaînes. 2.1. Algorithmes de base 2.1.1. Schreier-Sims. — Plusieurs algorithmes essentiels se basent sur une idée de Schreier [20]. Il a remarqué que, pour tout sous-groupe H d’un groupe G et tout sousensemble A ⊂ G qui engendre G et contient des représentants de toutes les classes de H dans G, A0 = AAA−1 ∩ H = σ1 σ2 σ3−1 : σi ∈ A ∩ H est un ensemble de générateurs de H.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
138
H. A. HELFGOTT
L’étape suivante est celle de Sims [21], [22], qui a montré l’utilité de travailler avec un groupe de permutations G < Sym(Ω), Ω = {x1 , . . . , xn }, en termes d’une chaîne de stabilisateurs G = G0 > G1 > G2 > · · · > Gn−1 = {e}, où Gk = G(x1 ,x2 ,...,xk ) = {g ∈ G : ∀1 ≤ i ≤ k xgi = xi } (stabilisateur de points). L’algorithme de Schreier-Sims (Algorithme 1 ; description basée sur [15, §1.2]) S construit des ensembles Ci de représentants de Gi /Gi+1 tels que i≤j H > H1 > H2 > · · · à la place de G = G0 > G1 > G2 > · · · . Ici, comme toujours, « décrire » veut dire « trouver un ensemble de générateurs », et un groupe nous est « donné » si un tel ensemble nous est donné. L’algorithme de Schreier-Sims décrit le stabilisateur de points G(x1 ,...,xk ) pour x1 , . . . , xk ∈ Ω arbitraires. Par contre, nous ne pouvons pas demander allègrement un ensemble de générateurs d’un stabilisateur d’ensemble G{x1 ,...,xk } = {g ∈ G : {xg1 , . . . , xgk } = {x1 , . . . , xk }} pour G, xi arbitraires : faire ceci serait équivalent à résoudre le problème de l’isomorphisme lui-même.
(2)
Nous supposons que l’ensemble de générateurs initial, spécifiant le groupe G du problème, est de taille O(nC ), C une constante. Le temps pris par la première utilisation de l’algorithme est donc O nmax(5,3+C) .
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
139
Algorithme 1 Schreier-Sims : construction d’ensembles Ci 1: fonction SchreierSims(A, ~ x) . A engendre G < Sym({x1 , . . . , xn }) S assure i≤j 1 ;
Pour être précis : O |Ω|O(1) + |A||Ω| , où A est la taille de l’ensemble de générateurs de G qui nous est donné. Nous omettrons toute mention de cette taille par la suite, puisque, comme nous l’avons déjà dit, nous pouvons la garder toujours sous contrôle.
(3)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
140
H. A. HELFGOTT
autrement, elle s’appelle imprimitive. Un système de blocs est minimal (4) si l’action de G sur lui est primitive. Voyons comment déterminer si l’action de G est primitive, et, s’il ne l’est pas, comment trouver un système de blocs de taille > 1. En itérant la procédure, nous obtiendrons un système de blocs minimal en temps polynomial. (Nous suivons [15], qui cite [21].) Pour a, b ∈ Ω distincts, soit Γ le graphe avec Ω comme son ensemble de sommets et l’orbite {{a, b}g : g ∈ G} comme son ensemble d’arêtes. La composante connexe qui contient a et b est le bloc le plus petit qui contient a et b. (Si Γ est connexe, alors le « bloc » est Ω.) L’action de G est imprimitive ssi Γ est non connexe pour un a arbitraire et au moins un b ; dans ce cas-là, nous obtenons un bloc qui contient a et b, et donc tout un système de blocs de taille > 1. Un dernier mot : si G < Sym(Ω), nous disons que G est transitif, voire primitif, si son action sur Ω l’est. 2.2. Luks : le cas de groupes avec facteurs d’ordre borné Luks a montré comment résoudre le problème de l’isomorphisme de graphes en temps polynomial dans le cas spécial de graphes de degré borné. (Le degré, ou valence, d’un sommet dans un graphe non orienté est le nombre d’arêtes qui le contiennent.) Il réduit ceci au problème de décrire le groupe d’automorphismes de chaînes dans le cas d’un groupe G tel que tout facteur de composition de G – c’est-à-dire, tout quotient dans une suite principale (Jordan-Hölder) de G – est borné. Le processus de réduction, élégant et loin d’être trivial, ne nous concerne pas ici. Voyons plutôt comment Luks résout ce cas du problème de l’isomorphisme de chaînes. Nous suivrons la notation de [3], même si les idées viennent de [15]. Définition 2.2. — Soient K ⊂ Sym(Ω) et ∆ ⊂ Ω (la « fenêtre »). L’ensemble d’isomorphismes partiels Iso∆ K est τ Iso∆ K (x, y) = {τ ∈ K : x(x) = y(x ) ∀x ∈ ∆}. ∆ L’ensemble d’automorphismes partiels Aut∆ K (x) est égal à IsoK (x, x).
Iso∆ K est donc l’ensemble de toutes les permutations g ∈ K qui envoient x sur y – au moins à en juger par ce qui peut se voir par la fenêtre ∆. Nous travaillerons en général avec K de la forme Hπ, où H laisse ∆ invariante (en tant qu’ensemble). Il est clair que, pour K, K1 , K2 ⊂ Sym(Ω) et σ ∈ Sym(Ω), ∆ σ −1 (1) Iso∆ (x, y) = Iso x, y σ, Kσ K (4)
Pour paraphraser [15, §1.1] : il faut avouer qu’un tel système pourrait s’appeler plutôt maximal. La taille des blocs est maximale, leur nombre est minimal.
ASTÉRISQUE 407
(1125)
(2)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
141
∆ ∆ Iso∆ K1 ∪K2 (x, y) = IsoK1 (x, y) ∪ IsoK2 (x, y).
Il est aussi clair que, si G est un sous-groupe de Sym(Ω) et ∆ est invariant sous G, alors AutG (x) est un sous-groupe de G, et, pour tout σ ∈ Sym(Ω), IsoGσ (x, y) est soit vide, soit une classe à droite de la forme AutG (x)τ , τ ∈ Sym(Ω). Soient ∆1 , ∆2 ⊂ Ω, 0 1 ∆1 invariant sous G. Pour G0 = AutG (x) et σ, τ tels que Iso∆ Gσ (x, y) = G τ , ∆2 ∆2 τ −1 1 ∪∆2 (3) Iso∆ (x, y) = Iso (x, y) = Iso x, y τ, 0 0 Gσ Gτ G où la deuxième équation est une application de (1). Babai appelle (3) la règle de la chaîne. L’énoncé suivant n’utilise pas la classification de groupes finis simples. Théorème 2.3 ([4] (5)). — Soit G < Sym(Ω) un groupe primitif. Soit n = |Ω|. Si tout facteur de composition de G est d’ordre ≤ k, alors |G| ≤ nOk (1) . Ici, comme d’habitude, Ok (1) désigne une quantité qui dépend seulement de k. Théorème 2.4 (Luks [15]). — Soient Ω un ensemble fini et x, y : Ω → Σ deux chaînes. Soit donné un groupe G < Sym(Ω) tel que tout facteur de composition de G est d’ordre ≤ k. Il est possible de déterminer IsoG (x, y) en temps polynomial en n = |Ω|. Preuve. — Cas 1 : G non transitif. Soit ∆1 ( Ω, ∆1 6= ∅, ∆1 stable sous l’action 1 de G. Définissons ∆2 = Ω \ ∆1 . Alors, par (3), il suffit de calculer Iso∆ G (x, y) (égal ∆2 0 0 0 τ −1 à une classe que nous notons G τ ) et IsoG0 (x, y ) pour y = y . Or, pour dé-
1 terminer Iso∆ G (x, y), nous déterminons, de façon récursive, IsoG x|∆1 , y|∆1 , puis, par Schreier-Sims, le stabilisateur de points G(∆1 ) . De la même manière, détermi0 0 τ −1 2 ner Iso∆ se réduit à déterminer le groupe d’isomorphismes G0 (x, y ) pour y = y 0 (dans un groupe G ) entre deux chaînes de longueur |∆2 |. Comme |∆1 | + |∆2 | = n et Schreier-Sims prend du temps O(n5 ), tout va bien. (La comptabilité est laissée au lecteur.)
Cas 2 : G transitif. Soit N le stabilisateur d’un système de blocs minimal pour G ; donc, G/N est primitif. Par le théorème 2.3, |G/N | ≤ mOk (1) , où m est le nombre de S blocs. Or, pour σ1 , . . . , σ` (` = |G/N |) tels que G = 1≤i≤` N σi , [ [ −1 (4) IsoG (x, y) = IsoSi N σi (x, y) = IsoN σi (x, y) = IsoN (x, yσi )σi 1≤i≤`
1≤i≤`
(5)
À vrai dire, [4, Thm 1.1] est plus général que ceci ; par exemple, des facteurs abéliens arbitraires (non bornés) sont admis. Cela donne une généralisation du théorème 2.4.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
142
H. A. HELFGOTT
par (1) et (2). Comme les orbites de N sont contenues dans les blocs, qui sont de −1 taille n/m, déterminer IsoN (x, yi ) (yi = yσi ) se réduit – par la règle (3) – à déterminer les groupes d’isomorphismes de m paires de chaînes de longueur n/m. Nous avons donc réduit le problème à la solution de ` · m = mOk (1) problèmes pour des chaînes de longueur n/m. Le pas final consiste à faire l’union de classes en (4). Nous avons une description de chaque IsoN (x, yi ), soit comme l’ensemble vide, soit comme une classe à droite Hτi du groupe H = AutN (x), dont nous avons trouvé une description, c’est-à-dire un ensemble de générateurs A. Alors [ [ IsoG (x, y) = IsoN (x, yi )σi = Hτi σi 1≤i≤`
1≤i≤`
−1
= A ∪ τi σi (τ1 σ1 )
: 1 ≤ i ≤ ` τ1 σ1 .
Nous aurions pu éviter quelques appels à Schreier-Sims en travaillant toujours avec des isomorphismes partiels, mais cela a peu d’importance qualitative. 2.3. Relations, partitions, configurations Soit C (« couleurs ») un ensemble fini que nous pouvons supposer ordonné (disons, de rouge à violet). Une relation k-aire sur un ensemble fini Γ est un sous-ensemble R ⊂ Γk . Une structure (relationnelle) k-aire est une paire X = (Γ, (Ri )i∈C ), où, pour chaque i ∈ C , Ri est une relation k-aire sur Γ. Si les Ri sont tous non vides et partitionnent Γk , nous disons que X est une structure de partition k-aire. Dans ce cas-là, nous pouvons décrire X par une fonction c : Γk → C qui assigne à chaque ~x ∈ Γk l’indice i de la relation Ri à laquelle il appartient. Nous disons que c(~x) est la couleur de ~x.
Un isomorphisme entre deux structures k-aires X = (Γ, (Ri )i∈C ) et X0 = (Γ0 , (Ri0 )i∈C ) est une bijection Γ → Γ0 qui envoie Ri à Ri0 pour chaque i. Il est possible de construire un foncteur F1 qui envoie chaque structure k-aire X sur Γ à une structure de partition k-aire F1 (X) sur Γ ; qui plus est, Iso(X, Y) = Iso(F1 (X), F1 (Y)). La procédure est plutôt triviale ; nous la détaillons (Algorithme 2) pour montrer ce qu’indexer veut dire. Cela nous permet de ne pas utiliser plus de min |Γ|k , 2|C | couleurs, où n = |Ω|, tout en gardant leur signification en termes des couleurs originales C . Le temps pris pour calculer F1 (X) est O(|C ||Γ|O(k) ). Nous ne nous occupons pas des détails d’implémentation de la collection de tuples I , mais il peut s’agir tout simplement d’une liste ordonnée lexicographiquement ; dans ce cas, |Γ|O(k) est |Γ|2k . (Dans la réalité, I serait implémentée avec du hachage, ce qui n’est que l’art de bien organiser une bibliothèque.)
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
143
Algorithme 2 Raffinement d’une structure de relation. Indexeur. 1: fonction F1 (Γ,k,C ,(Ri )i∈C ) 2: I ←∅ 3: pour ~x ∈ Γk 4: a ← {i ∈ C : ~x ∈ Ri } 5: c(~x) ← Indexeur(I , a) 6: 7:
retourner (I , c) . retourne c : Γk → C 0 0 . C est l’ensemble d’indices de I ; I explique C 0 en termes de C
fonction Indexeur(I ,a) si a n’est pas dans I alors 10: ajouter a à I 8:
. I est une collection modifiable
9:
11:
retourner indice de a dans I
Un élément ~x ∈ Γk définit une relation d’équivalence ρ(~x) sur {1, . . . , k} : i ∼ j ssi xi = xj . Le monoïde M(S) (S un ensemble) consiste en les applications S → S, avec la composition comme opération. Définition 2.5. — Une structure de partition k-aire X = (Γ, c) est dite configuration k-aire si (a) Pour tous ~x, ~y ∈ Γk , si c(~x) = c(~y ), alors ρ(~x) = ρ(~y ). (b) Il y a un homomorphisme de monoïdes η : M({1, . . . , k}) → M(C ) tel que, pour tout τ ∈ M({1, . . . , k}), c (τ (~x)) = τ η (c(~x)) pour tout ~x ∈ Γk . Alors, par exemple, pour k = 2, (a) veut dire que la couleur de ~x = (x1 , x2 ) « sait » si x1 = x2 ou pas, dans le sens où, si nous connaissons c(~x), alors nous savons si x1 = x2 ou pas. De la même façon, (b) nous indique que la couleur de ~x connaît les couleurs de (x2 , x1 ), (x1 , x1 ) et (x2 , x2 ). Nous pouvons définir un foncteur F2 qui envoie chaque structure de partition k-aire X sur Γ à une configuration k-aire ; comme pour F1 , le fait que F2 (X) est un raffinement de X implique que Iso(X, Y) = Iso(F2 (X), F2 (Y)). La procédure pour calculer F2 est très similaire à celle pour calculer F1 (Algorithme 2). Au lieu d’assigner à ~x la couleur {i ∈ C : ~x ∈ Ri }, nous lui assignons la couleur ρ(~x), (c(φ(~x)))φ∈M({1,...,k}) . Il est aisé de voir que F2 (X) est le raffinement le plus grossier d’une structure de partition X qui est une configuration, de la même manière que F1 (X) est le raffinement le plus grossier d’une structure X qui est une structure de partition. Définition 2.6. — Soit X = (Γ, c), c : Γk → C , une structure de partition k-aire. Pour 1 ≤ l ≤ k, nous définissons c(l) : Γl → C comme suit : c(l) (~x) = c(x1 , x2 , . . . , xl , xl , · · · xl ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
144
H. A. HELFGOTT
La structure de partition l-aire X(l) = Γ, c(l) est dite le (l-)squelette de X. La chaîne vide sera viride. Exercice 2.7. — Tout squelette d’une configuration est une configuration. Ici le fait que l’axiome (b) dans la définition de configuration soit valable même pour η non injectif est crucial. Pour X = (Γ, c) une structure de partition et Γ0 ⊂ Γ, la sous-structure induite X[Γ0 ] est la structure (Γ0 , c| 0 ) définie par la restriction de c à Γ0 . Il est clair que, si X est Γ une configuration, alors X[Γ0 ] l’est aussi. Il ne faut pas confondre une structure de partition (partition structure) avec ce que nous appellerons un découpage (colored partition). Un découpage d’un ensemble Γ est un coloriage de Γ supplémenté d’une partition de chaque classe de couleur. (Une classe de couleur est l’ensemble de sommets d’une couleur donnée.) Un découpage est dit admissible si chaque ensemble B dans chaque partition est de taille ≥ 2. Pour α < 1, un α-découpage est un découpage admissible tel que |B| ≤ α|Γ| pour chaque B. Un découpage est une structure plus fine que le coloriage qu’il raffine, mais moins fine que la structure que nous obtiendrions si nous donnions à chaque élément de chaque partition une couleur différente. Un automorphisme ou isomorphisme d’un découpage doit préserver les couleurs de celui-ci, mais pourrait permuter les ensembles de la même taille qui appartiennent à la partition d’une couleur. Comme les ensembles de taille différente ne peuvent, évidemment, être permutés, il est clair que nous pouvons supposer sans perte de généralité que toute couleur est partitionnée en ensembles de la même taille. Nous ajoutons ceci à la définition de α-découpage à partir de maintenant. 2.4. Configurations cohérentes k-aires Pour ~x ∈ Γk , z ∈ Γ et 1 ≤ i ≤ k, nous définissons ~xi (z) ∈ Γk comme suit : ~xi (z) = (x1 , x2 , . . . , xi−1 , z, xi+1 , . . . , xk ). Définition 2.8. — Une configuration cohérente k-aire X = (Γ, c) est une configuration k-aire ayant la propriété suivante : il y a une fonction γ : C k × C → Z≥0 telle que, pour ~k ∈ C k et j ∈ C arbitraires et tout ~x ∈ Γk tel que c(~x) = j, |{z ∈ Γ : c(~xi (z)) = ki ∀1 ≤ i ≤ k}| = γ(~k, j). Les valeurs γ(~k, j) sont appelées nombres d’intersection de X. Une configuration cohérente est dite classique si k = 2.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
145
Remarque 2.9. — Les configurations cohérentes classiques ont été introduites par Higman [13]. Les premiers exemples étaient du type schurien : une configuration est schurienne si elle est la partition de Γ2 dans ses orbites (« orbitales ») sous l’action d’un groupe G < Sym(Γ). Définition 2.10. — Si une configuration cohérente classique n’a que deux couleurs, une pour {(x, x) : x ∈ Γ} et l’autre pour son complément, la configuration est dite une clique, ou triviale. Exercice 2.11. — Tout squelette d’une configuration cohérente est cohérent. Encore une fois, l’axiome (b) des configurations joue un rôle clé. Exercice 2.12. — Soient X = (Γ, c) une configuration cohérente et Γ0 ⊂ Γ une classe de couleurs en relation au coloriage induit par c sur Γ. Alors la sous-structure induite X[Γ0 ] est une configuration cohérente. Ici, c’est un cas spécial de (b) qu’il faut utiliser : la couleur c(x1 , . . . , xn ) « connaît » les couleurs c(x1 ), . . . , c(xn ), puisque c(xi ) = c(xi , . . . , xi ). Soient 0 ≤ l < k et ~x ∈ Γl . Nous colorions Γk−l comme suit : pour ~y ∈ Γk−l , c~x (~y ) = c(~x~y ). En résulte une structure de partition (k − l)-aire X~x = (Γ, c~x ). Exercice 2.13. — Soit X = (Γ, c) une structure de partition ; soit ~x ∈ Γl , 0 ≤ l < k. Alors (a) c~x est un raffinement du coloriage du squelette X(k−l) . (b) Si X est cohérente, X~x l’est aussi. Il est clair que, de plus, X~x est canonique en relation à ~x, ce qui veut dire que X → X~x commute avec l’action sur Γ du stabilisateur dans Sym(Γ) des points x1 , . . . , xl . Définition 2.14. — Une configuration cohérente (Γ, c) est dite homogène si la couleur c(x, x, . . . , x) de tout sommet x ∈ Γ est la même. Une configuration cohérente classique est dite primitive si elle est homogène et les graphes Gr = {(x, y) : x, y ∈ Γ, c(x, y) = r} (pour toute couleur r telle que c(x, y) = r pour au moins une paire (x, y) avec x 6= y) sont tous connexes. Elle est dite uniprimitive si elle est primitive et non triviale.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
146
H. A. HELFGOTT
Nous n’avons pas besoin de préciser si ces graphes son connexes dans le sens propre (à savoir, il y a un chemin de tout sommet à tout autre, respectant l’orientation) ou dans le sens faible (sans compter l’orientation) : le fait que (Γ, c) soit cohérente, classique et homogène implique que d+ r (x) = |{y ∈ Γ : (x, y) ∈ Gr }| est indépendant de x (pourquoi ?), ce qui implique que toute composante faiblement connexe de Gr est connexe (exercice). Exercice 2.15. — Soit X = (Γ, c) une configuration cohérente classique uniprimitive. Il n’y a aucun ensemble B ⊂ Γ, |B| > |Γ|/2, tel que la restriction de X à B soit une clique. Solution. — Si les arêtes de la grande clique sont sensées être blanches, soit noir une autre couleur d’arêtes de X, et soit G = Gnoir . Or, pour un graphe orienté birégulier (6) G non vide avec Γ comme ensemble de sommets, il est impossible qu’il y ait un ensemble B ⊂ Γ, |B| > |Γ|/2, tel que la réduction du graphe à B soit vide (pourquoi ?). Exercice 2.16. — Soit (Γ, c) une configuration cohérente classique homogène. (a) Soit r0 , . . . , rk une séquence de couleurs. Alors, si x0 , xk ∈ Γ sont tels que c (x0 , xk ) = r0 , le nombre de x1 , . . . , xk−1 ∈ Γ tels que c (xi−1 , xi ) = ri pour tout 1 ≤ i ≤ k dépend seulement de r0 , . . . , rk . (b) Pour toute couleur r, toute composante connexe de Gr est de la même taille. Solution (esquisse). — En (a), le cas k = 2 vaut par la définition de « cohérent » ; prouvez les cas k > 2 par induction. Pour prouver (b), utilisez (a). 2.5. Le raffinement canonique k-aire à la façon de Weisfeiler-Leman Définissons un foncteur F3 qui envoie une configuration X = (Γ, c) à une configuration cohérente F3 (X) = (Γ, c0 ). Comme F3 (X) sera un raffinement de X, nous aurons Iso(X, Y) = Iso(F3 (X), F3 (Y)). L’algorithme 3, qui calcule F3 , est basé sur une idée de Weisfeiler et Leman (7) [23]. Il s’agit d’itérer une procédure de raffinement. Si, dans une itération, aucun raffinement ne se produit – c’est-à-dire, si les classes d’équivalence du nouveau coloriage Ci sont les mêmes que celles de l’ancien coloriage Ci−1 – alors, (a) aucun raffinement ne se produira dans le futur, (b) le coloriage Ci−1 est déjà cohérent. Si le coloriage C = C0 a r couleurs différentes du début, il est clair qu’il ne peut être raffiné que |Γ|k − r fois. Alors, |Γ|k − r itérations sont suffisantes pour produire (6)
Voir la définition du §2.6. Aussi appelé Lehman, mais [3] indique que le deuxième auteur préférait Leman. Deux transformations naturelles L → L, L → L peuvent ne pas être l’inverse l’une de l’autre.
(7)
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
147
une configuration cohérente. En particulier, si l’indexation est faite en temps logarithmique, et que le vecteur dans le pas 6 de l’algorithme 3 est représenté comme un vecteur creux (puisque son nombre d’entrées non nulles est au plus |Γ|), le temps pris par l’algorithme est O(k 2 |Γ|2k+1 log |Γ|). (En outre, [3, §2.8.3] affirme une borne plus forte.) Les algorithmes de type Weisfeiler-Leman étaient autrefois regardés comme une approche plausible au problème de l’isomorphisme de graphes. Depuis [8], [10], il est clair qu’il ne se suffisent pas à eux-mêmes. Ils sont quand même un outil précieux. La version k-aire ici est due à Babai-Mathon [1] et Immerman-Lander [14]. Algorithme 3 Weisfeiler-Leman pour les configurations k-aires. 1: fonction WeisfeilerLeman(Γ, k, c : Γk → C ) 2: C0 ← C ; c0 ← c ; i0 ← |Γk | − |c(Γk )| 3: pour i = 1 jusqu’à i0 4: Ii ← ∅ k 5: pour ~x ∈ Γ 6: ν ← ci−1 (~x), z ∈ Γ : ci−1 (~xj (z)) = rj ∀ 1 ≤ j ≤ k ~r∈C k i−1
7: 8: 9:
ci (~x) = Indexeur (Ii , ν) . Indexeur est comme dans l’algorithme 2 Ci ← indices de Ii retourner cn−i0 : Γk → Cn−i0 , (Ii )1≤i≤n−i0
. (Ii ) donne du sens à Cn−r
2.6. Graphes, hypergraphes et designs en blocs Nous savons déjà qu’un graphe est une paire (V, A), où V est un ensemble (« sommets ») et A est une collection de paires d’éléments de V (voire de sous-ensembles de V avec deux éléments, si le graphe est non orienté). Un graphe non orienté est dit régulier si le degré de tout sommet est le même ; un graphe orienté est dit birégulier si le degré sortant d+ (v) = |{w ∈ V : (v, w) ∈ A}| et le degré entrant d− (v) = |{w ∈ V : (w, v) ∈ A}| sont indépendants de v. (Pour V fini, ils sont forcément la même constante.) Un graphe biparti est un triplet (V1 , V2 ; A) avec A ⊂ V1 × V2 . Un graphe biparti est semirégulier si le degré (8) d+ (v1 ) est indépendant de v1 ∈ V1 , et le degré d− (v2 ) est indépendant de v2 ∈ V2 . Exercice 2.17. — Soit X = (Γ, c) une configuration cohérente classique. (8) Nous omettons les mots « entrant » et « sortant », puisqu’il est évident qu’il s’agit du degré entrant dans le cas de v2 et du degré sortant dans le cas de v1 .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
148
H. A. HELFGOTT
(a) Soient C1 , C2 deux classes de couleur, et soit vert une couleur d’arêtes en C1 × C2 . Alors, le graphe biparti (C1 , C2 ; Gvert ) est semirégulier. (b) Soit y ∈ Γ, et Li (y) = {x ∈ Γ : c(x, y) = i}. Soient lin, bis et terre trois couleurs d’arêtes. Alors, pour L1 = Llin (y) et L2 = Lbis (y), le graphe biparti (L1 , L2 ; Rterre ∩ (L1 × L2 )) est semirégulier. Exercice 2.18. — Soit X une configuration cohérente classique. Soient C1 , C2 deux classes de couleur. Soient vert une couleur d’arêtes en C1 × C2 et rouge une couleur d’arêtes en C2 × C2 . Soient B1 , . . . , Bm les composantes connexes de Grouge en C2 . Définissons le graphe biparti Y = (C1 , {1, . . . , m}; D) comme suit : (x, i) ∈ D ssi (x, y) ∈ Gvert pour au moins un y ∈ Bi . Alors Y est semirégulier. Solution. — Notez que, pour y ∈ Bi et x ∈ C1 , (x, i) ∈ D si et seulement si il existe y0 , y1 , . . . , yk = y tels que (x, y0 ) est vert et (yj , yj+1 ) est rouge pour tout 0 ≤ j < k. Concluez par les exercices 2.16a et 2.17a que tous les sommets en {1, . . . , m} ont le même degré en Y . De façon analogue, montrez que, pour x ∈ C1 et y ∈ Bi tels que (x, y) est vert, le nombre de z ∈ Bi tels que (x, z) est vert ne dépend pas de x, y ou i. Notons ce nombre q. Alors, le degré de tout x ∈ C1 est le nombre d’arêtes vertes (x, y) en X, divisé par q. Par (a), il ne dépend donc pas de v. Un graphe biparti est complet (en tant que graphe biparti) si A = V1 × V2 . Un graphe biparti qui n’est ni vide ni complet est appelé non trivial. Un hypergraphe H = (V, A ) consiste en un ensemble V (« sommets ») et une collection A de sous-ensembles de V (« arêtes »), peut-être avec des sous-ensembles répétés. Un hypergraphe est dit u-uniforme si |A| = u pour tout A ∈ A . Il est dit régulier de degré r si tout v ∈ V appartient à exactement r ensembles A dans A . L’hypergraphe u-uniforme complet sur V est (V, {A ⊂ V : |A| = u}), où chaque ensemble A est compté une fois. Un coloriage des arêtes de l’hypergraphe complet est une application de {A ⊂ V : |A| = u} à un ensemble fini C . Un block design équilibré (BDE) de paramètres (v, u, λ) est un hypergraphe avec |V | = v sommets, u-uniforme et régulier de degré r ≥ 1, tel que toute paire {v1 , v2 } de sommets distincts est contenue dans exactement λ ≥ 1 arêtes (« blocks »). Un block design dégénéré a la même définition, mais avec λ = 0, et la condition additionnelle d’être un hypergraphe régulier. (La régularité peut être déduite de la définition si λ ≥ 1.) Un block design est incomplet si u < v. Notons b le nombre |A | d’arêtes d’un BDE.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
149
Proposition 2.19 (Inégalité de Fisher (9) [11]). — Pour tout block design équilibré incomplet, b ≥ v. Il est aisé de voir que cette inégalité est vraie même pour les designs dégénérés. Les blocks designs admettent une généralisation. Un design t-(v, u, λ) est un hypergraphe (V, A ) u-uniforme avec v = |V | sommets tel que tout T ⊂ V de taille t est contenu dans exactement λ arêtes. Ici t ≥ 2 et λ ≥ 1. Nous écrivons toujours b = |A |. Proposition 2.20 ([19]). — Pour tout design t-(v, u, λ) et tout s ≤ min(t/2, v − u), nous avons b ≥ vs . 2.7. Schémas de Johnson Un schéma d’association est une configuration cohérente classique (Γ, c : Γ2 → C ) telle que c(x, y) = c(y, x) ∀x, y ∈ Γ. (Il s’agit donc d’un sens du mot schéma qui n’a rien à voir avec les schémas de la géométrie algébrique.) Soient s ≥ 2 et r ≥ 2s + 1. Un schéma de Johnson J (r, s) = (Γ, c) est donné par Γ = Ss (Λ) = {S ⊂ Λ : |S| = s},
c(S1 , S2 ) = |S1 \ (S1 ∩ S2 )|,
où Λ est un ensemble à r éléments. La relation Ri est bien sûr l’ensemble Ri = {(S1 , S2 ) : c(S1 , S2 ) = i}. Notons que nous avons défini implicitement un foncteur de la catégorie d’ensembles Λ avec |Λ| = r à la catégorie de schémas de Johnson. Ceci est un foncteur plein ; autrement dit, les seuls automorphismes de J (r, s) sont ceux qui sont induits par Sym(Λ). 2.8. Identification de groupes et de schémas Il est une chose de démontrer que deux groupes G, H sont isomorphes, et une autre de construire un isomorphisme φ de façon explicite entre eux. Cette dernière tâche implique, au moins, de donner les images φ(g1 ), . . . , φ(gr ) de générateurs g1 , . . . , gr de G. Voyons un cas particulier qui nous sera crucial. Nous aurons un groupe de permutation G < Sym(Γ), et nous saurons qu’il est isomorphe au groupe abstrait Altm . Comment construire un isomorphisme ? Si m n’est pas trop petit en relation à n = |Γ|, il est connu que G doit être isomorphe à un groupe de permutation de la forme Alt(k) que le groupe Altm m , qui n’est autre m agissant sur l’ensemble Sk (Λ0 ) = {S ⊂ Λ0 : |S| = k} à k éléments, où Λ0 est un (9)
Si, R. A. Fisher, le statisticien. Ici design vient d’experimental design.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
150
H. A. HELFGOTT
ensemble à m éléments. (10) En d’autres termes, il existe une bijection ι0 : Γ → Sk (Λ0 ) et un isomorphisme φ0 : G → Alt(Λ0 ) tels que ι0 (ω g ) = ι0 (ω)φ0 (g) . Le problème consiste à construire ι : Γ → Sk (Λ) et φ : G → Alt(Λ), calculables en temps polynomial, avec ces mêmes propriétés. Nous suivons [6]. Soient Υ ⊂ Γ × Γ l’orbitale la plus petite de G (hors la diagonale {{ω, ω} : ω ∈ Γ}) ; soit ∆ ⊂ Γ × Γ l’orbitale la plus grande. Nous supposerons que m > (k + 1)2 − 2, ce qui revient à dire que n n’est pas trop grand en relation à m. (11) Alors, φ(Υ) = R1 = {(S1 , S2 ) ∈ Sk (Λ0 ) : |S1 ∩ S2 | = k − 1},
(5)
φ(∆) = Rk = {(S1 , S2 ) ∈ Sk (Λ0 ) : S1 ∩ S2 = ∅}.
Définissons, pour (x, y) ∈ Υ, B(x, y) = {z ∈ Γ : (x, z) ∈ / ∆, (y, z) ∈ ∆}. Ceci est l’ensemble de tous les z tels que ι0 (z) intersecte ι0 (x) mais pas ι0 (y). Soit [ C(x, y) = Γ \ {r : (z, r) ∈ ∆}. z∈B(x,y)
Alors ι0 (C(x, y)) = {S ∈ Sk (Λ0 ) : S ∩ S 0 6= ∅ ∀S 0 ∈ Sk (Λ0 ) t.q. S 0 ∩ ι0 (x) 6= ∅, S 0 ∩ ι0 (y) = ∅} = {S ∈ Sk (Λ0 ) : i ∈ S}, où i est l’élément de ι0 (x) qui n’est pas dans ι0 (y). Soit Λ la collection {C(x, y) : (x, y) ∈ Υ}, sans multiplicités. Nous pouvons calculer et comparer C(x, y) pour (x, y) donné, et calculer et indexer Λ, tout en temps polynomial. Nous calculons, aussi en temps polynomial, l’action de G sur Λ induite par l’action de G sur Υ. Ceci définit φ : G → Alt(Λ). Il y a une bijection naturelle j : Λ → Λ0 qui commute avec l’action de G : elle envoie C(x, y) à i, où i est l’élément de Λ0 tel que ι0 (C(x, y)) = {S ∈ Sk (Λ0 ) : i ∈ S}. (10)
(k)
Babai nomme les groupes Altm groupes de Johnson, par analogie avec les schémas de Johnson. (k) Puisque Altm n’est qu’un déguisement de Altm , ne faudrait-il pas appeler ce dernier groupe de Ramerrez ? (11) Si m ≤ (k + 1)2 − 2, alors n est si grand que m! = nO(log n) . En ce cas, nous pouvons enlever le groupe G (c’est-à-dire, dans l’application qui nous intéressera, un quotient G/N ) de façon brutale, comme dans le cas 2 de la preuve du théorème 2.4 (Luks). Nous pourrions aussi nous passer de la supposition m > (k +1)2 −2 au coût de quelques complications en ce qui suit. En particulier, φ(∆) ne serait pas Rk comme dans (5), sinon un autre Rj .
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
151
Il est clair que, pour ω ∈ Γ, ω ∈ C(x, y) ssi j(C(x, y)) ∈ ι0 (ω). Ainsi, nous obtenons la bijection ι : Γ → Sk (Λ), donnée par ι(ω) = {γ ∈ Λ : ω ∈ γ}. Celle-ci satisfait ι (ω g ) = ι(ω)φ(g) . Les applications φ, ι sont donc celles que nous désirions ; nous avons construit un isomorphisme explicite entre G et Alt(Λ). Notons que cette même procédure nous permet de construire un isomorphisme explicite entre, d’un côté, un schéma d’association (§2.7) qu’on sait être isomorphe à un schéma de Johnson J (m, k), et, de l’autre côté, ce même schéma.
3. LA PROCÉDURE PRINCIPALE 3.1. Premiers pas : récursion à la façon de Luks G transitif ?
non
récursion n0 < n
non
récursion n0 ≤ n/2
oui
G/N ∼ Altm ?
oui
m petit ?
oui
Les premiers pas de la procédure sont ceux de la preuve du théorème 2.4 (Luks). En particulier, si G < Sym(Ω) n’est pas transitif, nous procédons exactement comme dans le cas non transitif de la preuve du théorème 2.4. Bien qu’il soit possible que n = |Ω| ne décroisse que très légèrement, la récursion marche, puisque son coût est aussi très léger dans ce cas : nous n’avons qu’à subdiviser le problème selon les orbites de G. Supposons que G soit transitif. Nous savons que nous pouvons trouver rapidement un système de blocs minimal R = {Bi : 1 ≤ i ≤ r}, Bi ⊂ Ω (§2.1.2). Par SchreierSims, nous trouvons aussi, en temps polynomial, le sous-groupe N / G des éléments g ∈ G tels que Big = Bi pour tout i. Le groupe H = G/N agit sur R. Au lieu du théorème 2.3 [4], nous utiliserons une conséquence de la Classification des Groupes Finis Simples (CGFS). Elle a été dérivée pour la première fois par Cameron, puis raffinée par Maróti.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
152
H. A. HELFGOTT
input : G < Sym(Ω) x, y : Ω → Σ
réduction de G/N à Altm0 m0 ≤ |m|/2
G transitif ?
aligner
non
récursion n0 < n
oui
coupe coupe ou Johnson ?
output : IsoG (x, y)
Fonction Isomorphisme-de-Chaînes
J
réduction de G/N à Altm0 √ m0 m
G/N ∼ Altm ?
non
récursion n0 ≤ n/2
oui : G/N ∼ Alt(Γ) coupe
oui blocs ∼
Γ k
une couleur domine ?
oui
k = 1?
certificats locaux
symétrie > 1/2 ? non
ASTÉRISQUE 407
cas trivial
non
rels.
plénitude > 1/2 ?
oui
non
Lemme des designs
non
oui
m petit ?
non
G primitif ?
coupe ou relations ?
non
Weisfeiler - Leman k-aire oui
x, y → relations k-aires sur Γ
oui
pullback
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
153
Théorème 3.1 ([9], [16]). — Soit H < Sym(R) un groupe primitif, où |R| = r est plus grand qu’une constante absolue. Alors, soit (12) (a) |H| < r1+log2 r , soit (b) il y a un M / H tel que R se subdivise (13) en un système de m k blocs sur lequel M agit comme un groupe Alt(k) m , m ≥ 5. En plus, [H : M ] ≤ r. La borne [H : M ] ≤ r se déduit de m > 2, |H| ≥ r1+log2 r , |H| ≤ m!s s!, ms ≤ r et [H : M ] ≤ 2s s!, où s ≥ 1 est un paramètre dans Cameron-Maróti. Il est possible [6] de trouver en temps polynomial le sous-groupe normal M et les blocs de l’action de M . Nous avons déjà vu au §2.8 comment identifier explicitement l’action de M avec celle de Alt(k) m . Par ailleurs, l’algorithme de Schreier-Sims nous permet de calculer |H| en temps polynomial, et donc nous dit aussi si nous sommes dans le cas (a). Si c’est le cas, nous procédons comme dans le cas transitif de la preuve du théorème 2.4. Nous réduisons ainsi le problème à r2+log2 r instances du problème pour des chaînes de longueur ≤ n/r. Si nous sommes dans le cas (b) nous commençons toujours par réduire le problème à [H : M ] instances du problème avec M à la place de H : par l’équation (2) et comme dans l’équation (4), [ −1 IsoH (x, y) = IsoM x, yσ σ, σ∈S
où S est un système de représentants des classes de M dans H. Si m ≤ C log n, où C est une constante, |M | =
m! < mm ≤ mC log n ≤ (m0 )C log n , 2
où m0 = m k . Donc, ici comme dans le cas (a), nous nous permettons de procéder comme dans le cas transitif de la preuve du théorème 2.4. Nous obtenons une réduction à ≤ r · (m0 )C log n = (m0 )O(log n) instances du problème pour des chaînes de longueur n/m0 . Ceci est tout à fait consistant avec l’objectif d’avoir une solution en temps quasi-polynomial en n (ou même en temps nO(log n) ). Il reste à savoir que faire si nous sommes dans le cas suivant : il y a un isomorphisme φ : G/N → Alt(Γ), |Γ| > C log n, C une constante. (Ici nous avons déjà (i) remplacé G par la préimage de M dans la réduction G → G/N , et, après cela, (ii) remplacé N par le stabilisateur des blocs dans la partie (b) du théorème 3.1.) Ce cas nous occupera pour le reste de l’article. (12)
Pour nous, log2 désigne le logarithme en base 2, et non pas le logarithme itéré log log. L’énoncé dans [9], [16] est plus fort : il décrit toute l’action de H sur R. À vrai dire, le groupe M s (k) est isomorphe, en tant que groupe de permutation, à (Altm )s , s ≥ 1. Nous avons r = m . k
(13)
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
154
H. A. HELFGOTT
Babai indique comment enlever la dépendance de CGFS à cette étape. Soient G et N comme avant, avec G transitif. Alors G/N est un groupe primitif agissant sur l’ensemble de blocs R. Si un groupe de permutations sur un ensemble R est tel que son action sur l’ensemble des paires d’éléments distincts de R est transitive, le groupe est dit doublement transitif. Or, un résultat de Pyber qui ne dépend pas de CGFS [17] nous dit qu’un tel 2 groupe est soit Alt(R), soit Sym(R), soit d’ordre ≤ |R|O(log |R|) . Si G/N est Alt(R) ou Sym(R), nous sommes dans le cas que nous discuterons d’ici jusqu’à la fin. Si G/N est doublement transitif, mais n’est égal ni à Alt(R) ni à Sym(R), nous pouvons procéder comme dans le cas transitif de la preuve du 2 théorème 2.4, puisque |G/N | ≤ rO(log r) , r = |R| ≤ n. (Babai propose aussi un traitement alternatif, même plus efficace et élémentaire.) Supposons donc que G/N n’est pas doublement transitif. Alors la configuration cohérente schurienne (§2.4) qu’elle induit n’est pas une clique. En conséquence, nous pouvons donner cette configuration à la procédure Coupe-ou-Johnson (§5.2), et reprendre le fil de l’argument à ce point-là.
4. LA STRUCTURE DE L’ACTION DE Alt 4.1. Stabilisateurs, orbites et quotients alternants Nous aurons besoin de plusieurs résultats sur les épimorphismes G → Altk . Ils joueront un rôle crucial dans la méthode des certificats locaux (§6.1). Dans la version originale [3], ils ont aussi été utilisés dans le rôle joué par [6] dans cet exposé. Lemme 4.1. — Soit G < Sym(Ω) primitif. Soit φ : G → Altk un épimorphisme avec k > max(8, 2 + log2 |Ω|). Alors φ est un isomorphisme. Prouver ce lemme est à peu près un exercice en théorie des groupes finis ; il faut utiliser [7, Prop. 1.22] pour le cas de socle abélien et la conjecture de Schreier pour le cas de socle non abélien. La conjecture de Schreier est un théorème, mais un théorème dont la preuve dépend, à son tour, de CGFS. Par contre, Pyber [18] a donné une preuve du lemme 4.1 qui n’utilise pas CGFS, avec une condition plus stricte : k > max(C, (log |Ω|)5 ), C constante. La dépendance de CGFS a donc été complètement enlevée de la preuve du théorème principal. Définition 4.2. — Soit G < Sym(Ω). Soit φ : G → Symk un homomorphisme dont l’image contient Altk . Alors x ∈ Ω est dit atteint si φ(Gx ) ne contient pas Altk . Lemme 4.3. — Soit G < Sym(Ω). Soit φ : G → Altk un épimorphisme avec k > max(8, 2 + log2 n0 ), où n0 est la taille de la plus grande orbite de G.
ASTÉRISQUE 407
(1125)
155
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
(a) Si G est transitif, tout x ∈ Ω est atteint. (b) Au moins un x ∈ Ω est atteint. Preuve (esquisse). — (a) Ceci découle immédiatement du lemme 4.1 si G est primitif, ou si K < ker(φ) pour K le stabilisateur d’un système de blocs minimal. Il reste le cas de φ : K → Altk surjectif. En général : Lemme. — Pour Ki arbitraires, K < K1 × · · · × Ks et un épimorphisme φ : K → S, ψ S simple, il doit y avoir un i tel que φ se factorise comme suit : K → Ki → S, ψ un épimorphisme. En utilisant ce lemme pour les restrictions Ki de K aux orbites de K, nous passons à une orbite Ki , et procédons par induction. (b) Soient Ω1 , . . . , Ωm les orbites de G, et soit Gi = G| la restriction de G à Ωi . Ωi
ψ
Par le lemme en (a), il doit y avoir un i tel que φ se factorise en G → Gi → Altk , ψ un épimorphisme. Alors, par (a), (Gx )ψ = ((Gi )x )ψ 6= Altk pour tout x ∈ Ωi . La proposition suivante jouera un rôle crucial au §6. Proposition 4.4. — Soient G < Sym(Ω) transitif et φ : G → Altk un épimorphisme. Soit U ⊂ Ω l’ensemble des éléments non atteints. (a) Supposons que k ≥ max(8, 2 + log2 n0 ), où n0 est la taille de la plus grande orbite de G. Alors (G(U ) )φ = Altk . (b) Supposons que k ≥ 5. Si ∆ est une orbite de G qui contient des éléments atteints, alors chaque orbite de ker(φ) contenue dans ∆ est de longueur ≤ |∆|/k. Rappelons que G(U ) = {g ∈ G : xg = x ∀x ∈ U } (stabilisateur de points). Preuve. — (a) Il est facile de voir que G fixe U en tant qu’ensemble. Alors, G(U ) / G, et donc (G(U ) )φ / Gφ . Or, Gφ = Altk . Supposons que (G(U ) )φ = {e}. Alors φ se factorise comme suit : ψ G → G → Altk , puisque G(U ) est le noyau de G → G. Ici ψ est un épimorphisme, et donc, par le lemme 4.3 (b), il existe un x ∈ U tel que ((G)x )ψ 6= Altk . Or ((G)x )ψ = (Gx )φ = Altk , parce que x est dans U , c’est-à-dire non atteint. Contradiction. (b) Comme ∆ contient des éléments atteints et est une orbite de G, tout élément de ∆ est atteint. Soit N = ker(φ), x ∈ ∆. La longueur de l’orbite xN est N x = [N : Nx ] = [N : (N ∩ Gx )] = [N Gx : Gx ] = [G : Gx ] [G : N Gx ] |∆| |∆| = φ = . [G : (Gx )φ ] [Altk : (Gx )φ ]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
156
H. A. HELFGOTT
Or, tout sous-groupe propre de Altk est d’indice ≥ k. Donc xN ≤ |∆|/k. 4.2. Le cas de grande symétrie G primitif ?
oui
k = 1?
oui
cas trivial
non
symétrie > 1/2 ?
oui
pullback
Considérons le cas de G primitif. Nous pouvons supposer que G est isomorphe en tant que groupe de permutation à Alt(k) m , puisque nous avons déjà éliminé les autres cas au §3 (peut-être en passant à un groupe non primitif M ; le cas non primitif sera traité au §6). Comme nous l’avons vu au §2.8, nous pouvons construire une bijection ι entre Ω et l’ensemble Sk (Γ) des sous-ensembles avec k éléments d’un ensemble Γ. Cette bijection induit un isomorphisme φ : G → Alt(Γ). Si k = 1, alors Ω est en bijection avec Γ, et G ∼ Altn = Altm . Nous sommes donc dans le cas trivial : le groupe AutG (x) consiste en les éléments de Altn qui permutent les lettres de x qui sont égales, et IsoG (x, y) est non vide ssi x et y ont exactement le même nombre de lettres de a’s, b’s, etc. – où, si aucune lettre n’est répétée ni en x ni en y, nous ajoutons la condition que la permutation de {1, . . . , n} qui induit x 7→ y soit dans Altn . Alors, soit G primitif, k > 1. Deux éléments γ1 , γ2 ∈ Γ sont des jumeaux par rapport à un objet si la transposition (γ1 γ2 ) le laisse invariant. Il est clair que les jumeaux forment des classes d’équivalence, et que, pour toute telle classe d’équivalence C, tout Sym(C) laisse l’objet invariant. Notre objet sera la chaîne x (ou y) : γ1 , γ2 sont des jumeaux par −1 rapport à x si, pour tout i ∈ Ω, x(i) = x(τ φ (i)), où τ = (γ1 γ2 ). Nous pouvons donc déterminer facilement (et en temps polynomial) les classes d’équivalence en Γ (dites classes de jumeaux), et vérifier s’il y a une classe d’équivalence C de taille > |Γ|/2. Examinons cette possibilité puisque nous devrons l’exclure après. La classe C de taille > |Γ|/2 est évidemment unique et donc canonique. Si x a une telle classe et y ne l’a pas, ou si les deux ont de telles classes, mais de tailles différentes, alors x et y ne sont pas isomorphes. Si x, y ont des classes de jumeaux Cx , Cy de la même taille > |Γ|/2, nous choisissons 0 σ σ ∈ Alt(Γ) tel que Cx = (Cy ) . (Nous supposons m > 1.) En remplaçant y par yσ ,
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
157
où σ 0 = φ−1 σ −1 , nous réduisons notre problème au cas Cx = Cy . (Voilà l’exemple le plus simple de ce que Babai appelle aligner ; nous avons aligné Cx et Cy .) Alors, soit C = Cx = Cy . La partition {C, Γ \ C} de Γ induit une partition {Ωj }0≤j≤k de Ω : ω ∈ Ωj ssi ψ(ω) contient k − j éléments de C et j éléments de Γ \ C. Il est aisé de montrer que αk−j (1 − α)j kj < 1/2 pour α ∈ (1/2, 1], 1 ≤ j ≤ k ; donc, |Ωj | < n/2 pour 1 ≤ j ≤ k. Nous avons réduit notre problème à celui de déterminer IsoH (x, y), où H = φ−1 (Alt(Γ)C ). Ici le besoin de prendre un stabilisateur d’ensemble (à savoir, Alt(Γ)C ) ne pose aucun souci : nous engendrons H en prenant des préimages φ−1 (h1 ), . . . , φ−1 (h5 ) de deux générateurs h1 , h2 de Alt(C) < Alt(Γ), deux générateurs h3 , h4 de Alt(Γ\C) < Alt(Γ) et un élément h5 ∈ Alt(Γ) de la forme (γ1 γ2 )(γ3 γ4 ), où γ1 , γ2 ∈ C, γ3 , γ4 ∈ Γ \ C. (Si |Γ| < 8, le nombre de générateurs est moindre, et la discussion se simplifie.) Notre problème se réduit à celui de déterminer IsoH 0 (x, y0 ) pour y0 = y et y0 = yh5 , où H 0 = φ−1 (Alt(C) × Alt(Γ \ C)) = φ−1 (hh1 , . . . , h4 i). Comme C est une classe de jumeaux pour x, tout élément de φ−1 (Alt(C)) laisse x invariant. Si x| 6= y| , alors IsoH 0 (x, y) = ∅. Ω0 Ω0 Soit alors x| = y| . Nous avons réduit notre problème à celui de déterminer Ω0 Ω0 IsoH 0 | (x| 0 , y| 0 ), où Ω0 = Ω \ Ω0 . Rappelons que H 0 | 0 agit sur Ω0 avec des orbites Ω0
Ω
Ω
Ω
de longueur |Ωi | < n/2. Nous procédons donc comme dans le cas non transitif de la méthode de Luks (preuve du Thm. 2.4).
5. DES CHAÎNES AUX SCHÉMAS DE JOHNSON x, y → relations k-aires sur Γ
Weisfeiler - Leman k-aire
Lemme des designs
une couleur domine ?
oui
coupe ou Johnson ?
non
récursion n0 ≤ n/2
Discutons maintenant le cas de G primitif et, plus précisément, G isomorphe à Alt(k) m , k ≥ 2. Maintenant nous pouvons supposer que nos chaînes x, y n’ont pas de classes de jumeaux de taille > m/2. Les outils principaux que nous développerons (lemme des designs, coupe-ou-Johnson) nous seront utiles, voire essentiels, aussi dans le cas de G imprimitif.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
158
H. A. HELFGOTT
Nous avons une bijection entre les éléments de Ω et {S ⊂ Γ : |S| = k}. Pour x : Ω → Σ donné, nous avons donc une structure relationnelle X = (Γ, (Ri )i∈Σ ) k-aire sur Γ : (x1 , . . . , xk ) ∈ Ri si x1 , . . . , xk sont tous différents et x(ω) = i, où ω est l’élément de Ω qui correspond à {x1 , . . . , xk }. Nous appliquons à X le foncteur F1 (§2.3), qui fait d’elle une structure de partition, puis le foncteur F2 (encore §2.3), qui nous donne une configuration k-aire, et, finalement, le foncteur F3 défini par Weisfeiler-Leman k-aire (§2.5). Nous obtenons ainsi un raffinement F3 (F2 (F1 (X))) = (Γ, cx : Γk → C ) qui est une configuration cohérente k-aire. Comme F1 , F2 , F3 sont des foncteurs, l’assignation de cx à x est canonique. Elle nous sera donc utile : si cx et cy ne sont pas isomorphes sous l’action de Alt(Γ), alors x et y ne sont pas isomorphes sous l’action de Alt(k) m non plus. Nous obtiendrons une configuration cohérente classique de façon canonique à partir de cx (lemme des designs). Soit cette nouvelle configuration sera non triviale, soit nous obtiendrons un coloriage canonique sans couleur dominante, ce qui nous permettra immédiatement de réduire le problème à un certain nombre de problèmes pour des chaînes plus courtes, comme dans l’algorithme de Luks. (La nouvelle configuration et le nouveau coloriage seront canoniques par rapport à un sous-groupe de Alt(k) m d’indice lui-même.) petit, sinon par rapport à Alt(k) m Supposons, alors, que nous disposons d’une configuration cohérente classique non triviale assignée de façon canonique à x. La procédure Coupe-ou-Johnson nous donnera l’un ou l’autre de ces deux résultats : soit un découpage canonique de Γ, soit un schéma de Johnson plongé de façon canonique dans Γ. (De nouveau, « canonique » ici veut dire « canonique par rapport à un sous-groupe d’indice petit ».) Dans un cas comme dans l’autre, avoir une telle structure canonique limite fortement l’ensemble d’isomorphismes et automorphismes possibles. Nous pourrons réduire G à un sous√ groupe ∼ Altm0 , avec m0 ≤ m/2, dans le cas du découpage, ou m0 m, dans le cas de Johnson. Déjà m0 ≤ m/2 est suffisante pour une récursion réussie. 5.1. Lemme des designs Étant donnés une configuration X = (Γ, c : Γk → C ) et un paramètre 1/2 ≤ α < 1, une couleur i est dite α-dominante si c(γ, . . . , γ) = i pour ≥ α|Γ| valeurs de γ ∈ Γ. La classe de couleurs {γ ∈ Γ : c(γ, . . . , γ) = i} est, elle aussi, dite dominante. Par contre, si, pour toute couleur i, la classe {γ ∈ Γ : c(γ, . . . , γ) = i} est de taille < α|Γ|, le coloriage est dit un α-coloriage. Comme avant, deux éléments γ1 , γ2 ∈ Γ sont des jumeaux par rapport à une structure X (ici, une configuration cohérente sur Γ) si (γ1 γ2 ) ∈ Aut(X).
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
159
Proposition 5.1 (Lemme des designs). — Soit X = (Γ, c : Γk → C ) une configuration cohérente k-aire, où 2 ≤ k ≤ |Γ|/2. Soit 1/2 ≤ α < 1. Supposons qu’il n’y a aucune classe de jumeaux dans Γ avec > α|Γ| éléments. Alors, au moins une des options suivantes est vraie : (1)
(a) il existe x1 , . . . , x` ∈ Γ, 0 ≤ ` < k, tels que X~x n’a pas de couleur α-dominante ; (1) (b) il existe x1 , . . . , x` ∈ Γ, 0 ≤ ` < k−1, tels que X~x a une couleur α-dominante C (2) et (X~x ) [C] n’est pas une clique. La notation a été définie dans les sections 2.3 – 2.4 . En particulier, le 1-sque(1) lette X~x est tout simplement un coloriage de Γ. Lemme 5.2 (Lemme de la grande clique). — Soit X = (Γ, c) une configuration cohérente classique. Soit C ⊂ Γ une classe de couleurs avec |C| ≥ |Γ|/2. Si X[C] est une clique, alors C est une classe de jumeaux. Preuve. — Supposons que C n’est pas une classe de jumeaux. Il y a donc un x ∈ Γ et une couleur (disons, azur) telle que c(x, y) est égale à cette couleur pour au moins un y ∈ C mais pas pour tous. Comme X[C] est une clique, x ∈ / C. Appelons la couleur de C carmin, et celle de x, bronze. Soit B ⊂ Γ l’ensemble des éléments de couleur bronze. Il s’agit de construire un block design équilibré (§2.6) qui contredise l’inégalité de Fisher (Prop. 2.19). Définissons Ab = {y ∈ Γ : c(b, y) = azur} pour b ∈ B. Comme x ∈ B et c(x, y) = azur pour au moins un y ∈ C, et c(x, y) connaît la couleur de y, tous les éléments de Ab sont carmin. Par la cohérence de X et la définition des nombres d’intersection (Def. 2.8), |Ab | = γ(azur−1 , azur, bronze), et donc |Ab | ne dépend pas de b. Comme nous l’avons dit au début, 1 ≤ |Ax | < |C| ; donc, 1 ≤ |Ab | < |C| pour tout b ∈ B. Montrez de façon similaire que, pour v ∈ C, la taille de {b ∈ B : v ∈ Ab } = {b ∈ B : c(b, v) = azur} ne dépend pas de b. Comme X[C] est une clique, c(v, v 0 ) est de la même couleur pour tous v, v 0 ∈ C, v 6= v 0 ; appelons cette couleur doré. Montrez que |{b ∈ B : v, v 0 ∈ Ab }| = γ(azur, azur−1 , doré). Alors (C, {Ab }b∈B ) est un block design équilibré incomplet. En conséquence, par l’inégalité de Fisher, |B| ≥ |C|. Or, nous savons que |C| > |Γ|/2, B, C ⊂ Γ et B ∩ C = ∅. Contradiction.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
160
H. A. HELFGOTT
Preuve du lemme des designs (Prop. 5.1). — Supposons que pour chaque ~x ∈ Γ` , 0 ≤ ` < k, C~x a une couleur α-dominante C(~x), et, en plus, si ` < k − 1, (X~x )(2) [C(~x)] est une clique. Nous arriverons à une contradiction. Soit C = C(vide). Comme |C| > α|Γ|, C est trop grande pour être un ensemble de jumeaux. Donc il existe u, v ∈ C, u 6= v, tels que τ = (uv) ∈ / Aut(X). Soit ~y de longueur minimale r entre les chaînes satisfaisant c(~y τ ) 6= c(~y ). Par cette minimalité et les règles dans la définition 2.5, y1 , . . . , yr sont tous distincts. En les permutant, nous pouvons assurer que u, v ∈ / {y1 , y2 , . . . , yr−2 }, et, sans perte de généralité, que soit (i) yr−1 6= u, v, yr = u, soit (ii) yr−1 = u, yr = v. Dans le cas (i), nous choisissons ~x = y1 , . . . , yr−1 , ` = r − 1, et voyons que c~x (u) 6= c~x (v) ; dans le cas (ii), nous choisissons ~x = y1 , . . . , yr−2 , ` = r −2, et obtenons c~x (u, v) 6= c~x (v, u). Nous aurons donc une contradiction avec notre supposition une fois que nous aurons prouvé que u, v ∈ C(~x). Le fait que u, v ∈ C(~x) s’ensuivra immédiatement de l’égalité C(~x) = C \ {x1 , . . . , x` } ; cette égalité, à son tour, se déduit par itération du fait que, pour ~y de longueur ≤ k −2 et ~x = ~y z, z ∈ Ω, (6)
C(~x) = C(~y ) \ {z}. (2)
Pourquoi (6) est-il vrai ? Nous sommes en train de supposer que X~y [C(~y )] est une clique, et que |C(~y )| > α|Γ| ≥ |Γ|/2. Donc, par le lemme de la grande clique, tous (2) les éléments de C(~y ) sont des jumeaux en X~y . En particulier, pour u ∈ C(~y ) \ {z}, c~x (u) = c~y (zu) ne dépend pas de u. Puisque le coloriage de sommets en C~x est un raffinement de celui en C~y (par la deuxième règle de la définition 2.5), il s’ensuit que, soit C(~x) = C(~y )\{z}, soit C(~x) ⊂ Γ\C(~y ), soit C(~x) = {z}. Comme |C(~x)|, |C(~y )| > α|Γ| ≥ |Γ|/2, les deux dernières possibilités sont exclues. Nous appliquons le lemme des designs (avec α = 1/2) à la configuration cohérente k-aire X0 = F3 (F2 (F1 (X))), où X est donnée par x de la façon décrite au début de la section. Nous parcourons tous les tuples possibles ~x = (x1 , . . . , x` ) ∈ Γ` , 0 ≤ ` < k, jusqu’à trouver un tuple pour lequel la première ou la deuxième conclusion du lemme des designs est vraie. (1) Si la première conclusion est vraie, nous définissons cX = X~x et sautons à la section 5.3.1. Si la deuxième conclusion est vraie, nous passons au §5.2, ayant défini (2) (1) X00 = X~x [C], où C est la couleur α-dominante de X~x . 5.2. Coupe ou Johnson Nous avons une configuration classique cohérente homogène non triviale X00 = (Γ, c). (Nous rappelons que ceci est un coloriage c du graphe complet sur Γ tel que (a) les sommets ont leur couleur propre (« couleur diagonale »), (b) les arêtes (x, y), x 6= y, ne sont pas toutes de la même couleur, (c) la couleur c(x, y) de l’arête (x, y) détermine c(y, x), et (d) l’axiome de cohérence (2.8) se vérifie.) Nous voudrions
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
161
trouver des structures qui dépendent canoniquement de X00 et qui contraignent son groupe d’automorphismes. Il est raisonnable de s’attendre à ce que de telles structures existent : par le théorème 3.1, si le groupe d’automorphismes est transitif, soit il est imprimitif (et donc il laisse une partition invariante), soit il est près d’être Alt(k) m , k ≥ 2, (qui laisse invariant un schéma de Johnson), soit il est petit (et donc le stabilisateur de quelques points aura des orbites petites, et ainsi nous donnera un coloriage sans couleur dominante). Le défi est de trouver de telles structures, et de le faire canoniquement. Si X00 n’est pas primitif (Déf. 2.14), la tâche est plutôt facile : soit r la couleur non diagonale la plus rouge telle que le graphe Gr = {(x, y) : x, y ∈ Γ, c(x, y) = r} n’est pas connexe ; par l’exercice 2.16, ceci donne une partition de Γ dans des ensembles de la même taille ≤ |Γ|/2. Théorème 5.3 (Coupe ou Johnson). — Soit X = (Γ, c) une configuration classique cohérente uniprimitive. Soit 2/3 ≤ α < 1. En temps |Γ|O(1) , nous pouvons trouver – soit un α-découpage de Γ, – soit un schéma de Johnson plongé sur Γ0 ⊂ Γ, |Γ0 | ≥ α|Γ|, et un sous-groupe H < Sym(Γ) avec [Sym(Γ) : H] = |Γ|O(log |Γ|) tel que le découpage, voire le schéma, est canonique en relation à H. Le groupe H sera défini comme un stabilisateur de points en Γ. La valeur 2/3 dans l’énoncé est assez arbitraire ; toute valeur > 1/2 serait valable. Une valeur proche de 1/2 affecterait les constantes implicites. Preuve. — Choisissons un x ∈ Γ arbitraire. Donnons à chaque y ∈ Γ la couleur de c(x, y). Ce coloriage est canonique en relation à Gx . S’il n’y a aucune classe de couleur C de taille > α|Γ|, la partition triviale (non-partition) de chaque classe nous donne un α-découpage de Γ, et nous avons fini. Supposons, par contre, qu’il y ait une classe de couleur – disons, Clin – de taille > α|Γ|. Comme αn > n/2, la relation Rlin de cette couleur est non orientée (c(y, z) = lin ssi c(z, y) = lin). Le complément de Rlin (ou de toute autre relation) est de diamètre 2 (exercice). Soient x, z ∈ Γ tels que c(x, z) = lin, et soit y ∈ Γ tel que c(x, y), c(z, y) 6= lin. Appelons c(x, y) bis et c(z, y) terre. Considérons le graphe biparti (V1 , V2 ; A) avec sommets V1 = Clin , V2 = Cbis et arêtes Rterre ∩(V1 ×V2 ). Le graphe est non vide par définition et semirégulier par l’exercice 2.17b. Par homogénéité et cohérence, le nombre de y tels que c(y, w) est d’une couleur donnée c0 est indépendant de w. Donc, il est toujours ≤ (1 − α)n < n/2 pour c0 6= lin. Appliquant ceci à c0 = terre et V2 , nous voyons que le degré
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
162
H. A. HELFGOTT
|{v1 ∈ V1 : (v1 , v2 ) ∈ A}| est < n/2, et donc, comme |V1 | > n/2, le graphe n’est pas complet. Nous appliquons donc la proposition 5.7 à (V1 , V2 ; A) avec β = α|Γ|/|V1 |. Notons que |V2 | ≤ β|V1 |. Nous travaillerons donc avec un graphe biparti (V1 , V2 ; A). La stratégie sera d’essayer, soit de rendre V2 plus petit (par au moins un facteur constant), soit de trouver des structures en lui. Soit ces structures nous permettront de réduire V2 quand même, soit elles nous aideront à découper V1 , ou à trouver un schéma de Johnson assez grand sur V1 . Tout d’abord, nous devrons borner la symétrie en V1 , c’est-à-dire réduire, voire éliminer les jumeaux. Il y a deux raisons à ceci. – Même si nous découvrions une structure assez riche en V2 , cela impliquerait peu ou rien sur V1 si beaucoup d’éléments de V1 se connectent à V2 de la même façon. – Si V2 est petit, nous colorierons chaque sommet de V1 par son ensemble de voisins en V2 . Ceci nous donnera un coloriage canonique en relation à G(V2 ) . Or, dans ce coloriage, deux sommets en V1 auront la même couleur ssi ils sont des jumeaux ; donc, si aucune classe de jumeaux en V1 n’a > α|V1 | éléments, nous aurons un α-coloriage. Exercice 5.4. — Soit (V1 , V2 ; A) un graphe biparti semirégulier et non trivial. Alors, aucune classe de jumeaux en V1 n’a plus de |V1 |/2 éléments. Solution. — Nous assurons que |A| ≤ |V1 ||V2 |/2 en prenant le complément s’il est nécessaire. Soient d2 le degré des sommets en V2 et S une classe de jumeaux en V1 . Montrez que d2 ≥ |S|, et donc |A| ≥ |S||V2 |. Exercice 5.5. — Soit (V1 , V2 ; A) un graphe biparti sans jumeaux en V1 . Soient V2 = C1 ∪ C2 , C1 ∩ C2 = ∅. Montrez que, pour au moins un i = 1, 2, il n’y a aucune classe de ≥ |V1 |/2 + 1 jumeaux en V1 dans le graphe (V1 , Ci ; A ∩ (V1 × Ci )). Exercice 5.6. — Soit X = (Γ, c) une configuration cohérente. Soient C1 , C2 deux classes de couleurs en Γ. Soit brun une couleur d’arêtes en C1 × C2 . Alors, pour x, y ∈ C1 , la couleur c(x, y) détermine si x et y sont des jumeaux dans le graphe biparti (C1 , C2 ; Gbrun ). Proposition 5.7 (Coupe ou Johnson biparti, ou « Una partita a poker ») Soit X = (V1 , V2 ; A) un graphe biparti avec |V2 | < β|V1 |, où 2/3 ≤ β < 1, et tel qu’aucune classe de jumeaux en V1 n’ait plus de 2|V1 |/3 éléments. Alors, nous pouvons trouver, en temps |V1 |O(1) , – soit un β-découpage de V1 ,
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
163
– soit un schéma de Johnson plongé sur V0 ⊂ V1 , |V0 | ≥ β|V1 |, et un sous-groupe H < G, G = Sym(V1 ) × Sym(V2 ), avec [G : H] = |V1 |O(log |V1 |) tel que le découpage, voire le schéma, est canonique en relation à H. La condition sur les classes de jumeaux ici était remplie (même avec 1/2 à la place de 2/3) à la fin de la preuve du Thm. 5.3, grâce à l’exercice 5.4. En ce qui concerne le temps de la procédure, nous expliciterons quelques détails qui pourraient ne pas être évidents. Ce qui sera le détail le plus délicat est l’indice [G : H]. Le groupe H sera défini comme un stabilisateur de points ; nous devons bien contrôler le nombre de points que nous stabilisons. Esquissons la stratégie générale de la preuve. Ce que nous voulons est une réduction à la proposition 5.8, « coupe-ou-Johnson cohérent ». Nous pouvons produire une configuration cohérente classique sur V1 ∪ V2 à partir du graphe X, tout simplement en utilisant Weisfeiler-Leman. Ce qui demande de la ruse est de garantir que la restriction X[C2 ] à la classe de couleurs dominante (s’il y en a une) soit non triviale. Pour obtenir une configuration non triviale sur C2 , nous noterons que le graphe X induit lui-même une relation d-aire sur C2 , où d est au plus le degré de la majorité d’éléments de V1 (si une telle chose existe ; sinon, les degrés nous donnent une partition de V1 ). Si la relation est triviale, dans le sens de contenir tous les d-tuples d’éléments distincts dans C2 , nous obtenons un schéma de Johnson. Si elle est non triviale mais contient beaucoup de jumeaux, elle nous donne une manière de descendre à un C2 plus petit. S’il n’y a pas beaucoup de jumeaux, nous utilisons le lemme des designs (supplémenté par un lemme standard sur les designs) pour obtenir une configuration cohérente classique non triviale sur C2 , ce qui était à trouver. Preuve. — Si |V1 | ≤ c, où c est une constante, nous colorions chaque v ∈ V1 par lui-même. Ce coloriage est canonique en relation à H = {e} ; autrement dit, il n’est pas canonique du tout. Peu importe : trivialement, |G| ≤ (c!)2 ≤ |V1 |O(log |V1 |) . Nous pouvons donc supposer que |V1 | > c. Si |V2 | ≤ (6 log |V1 |)3/2 (disons), alors, par la discussion ci-dessus, nous obtenons un (2/3)-coloriage de V1 (et donc : un (2/3)-découpage de V1 ). Ce coloriage est canonique en relation à un H d’indice 3
3
|V2 |! ≤ |V2 ||V2 | ≤ (6 log |V1 |) 2 (6 log |V1 |) 2 |V1 |log |V1 | . Nous pouvons donc supposer que |V2 | > (6 log |V1 |)3/2 . Notre première tâche est d’éliminer les jumeaux. Nous divisons V1 dans ses classes de jumeaux et colorions chaque v ∈ V1 par son nombre de jumeaux et par son degré dans le graphe (V1 , V2 ; A). Nous obtenons un β-découpage de V1 , sauf s’il y a un
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
164
H. A. HELFGOTT
entier d1 tel que l’ensemble V10 des sommets v sans jumeaux et de degré d1 est de taille |V10 | > β|V1 |. Supposons dorénavant que cela est le cas. Comme |V10 | > |V2 | et qu’il n’y a pas de jumeaux en V10 , nous voyons que 1 < d1 < |V2 | − 1 ; nous pouvons supposer que d1 ≤ |V2 |/2 en remplaçant A par son complément, si nécessaire. Soit H = (V2 , A ) l’hypergraphe dont les arêtes sont les voisinages en (V1 , V2 ; A) des sommets dans V10 . (Elles sont toutes contenues en V2 .) L’hypergraphe est d1 -uniforme. Comme il n’y a pas de jumeaux dans V10 , il n’y a pas d’arêtes identiques. Si H est l’hypergraphe complet d1 -uniforme, alors V10 peut être identifié avec le schéma de Johnson Sd1 (V2 ). (Scoppia in un pianto angoscioso e abbraccia la testa di Johnson.) Supposons alors que H n’est pas complet. Nous voudrions avoir un coloriage canonique sur V2d pour un d l, l = (log |V10 |)/ log |V2 |, tel que les éléments de V2 ne soient pas tous jumeaux. Si d1 ≤ 6dle, nous définissons d = d1 et colorions {(v1 , . . . , vd ) ∈ V2d : {v1 , . . . , vd } ∈ H } en écarlate, et tout le reste en gris. Supposons, par contre, que d1 > 6dle. Soit d = 6dle. Nous colorions ~v = (v1 , . . . , vd ) en gris si les vi ne sont pas tous distincts ; dans le cas contraire, nous donnons à ~v la couleur (7)
|{H ∈ H : {v1 , . . . , vd } ⊂ H}|.
Cette opération de coloriage peut être faite en temps de l’ordre de log |V 0 | 6 log |V1 | d1 d 2 |V1 | · ≤ |V1 | · |V2 | = |V1 | · |V2 | = |V1 | · |V10 |O(1) = |V1 |O(1) . d Si les tuples avec v1 , . . . , vd distincts avaient tous la même couleur λ, nous aurions un design d − (|V2 |, d1 , λ) avec |V10 | arêtes. Donc, par la proposition 2.20, |V10 | ≥ |Vs2 | pour s = 3dle. Comme |V2 | ≥ (6 log |V10 |)3/2 et |V10 | peut être supposé plus grand qu’une constante, s s 3l log |V10 | |V2 | |V2 | |V2 | > > |V2 |1/3 = |V2 | log |V2 | = |V10 |, ≥ s 6l s ce qui donne une contradiction. Donc, pour d1 arbitraire, les tuples avec v1 , . . . , vd distincts n’ont pas tous la même couleur ; en d’autres termes, les éléments de V2 ne sont pas tous jumeaux en relation à notre nouvelle structure d-aire. S’il y a une classe S de jumeaux de taille > |V2 |/2, alors, par l’exercice 5.5, au moins un des deux graphes (V10 , S; A ∩ (V10 × S)), (V10 , V2 \ S; A ∩ (V10 × (V2 \ S))) n’a aucune classe de > |V10 |/2 + 1 jumeaux dans V1 . Comme 2|V10 |/3 ≥ |V10 |/2 + 1 pour |V1 | ≥ 8, nous appliquons la proposition 5.7 ellemême à un de ces deux graphes (disons, celui sur V10 × S si les deux sont valables), et terminons. (Peut-être que la taille de V2 est descendue seulement à |V2 | − 1, mais tous nos choix ont été canoniques – des non-choix, si l’on veut – donc gratuits.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
165
Nous n’avons perdu que du temps ; pour être précis, |V1 |O(1) de temps, ce qui est acceptable.) Alors, nous avons un coloriage de V2d en relation auquel il n’y a aucune classe de jumeaux en V2 de taille > |V2 |/2. Nous appliquons les foncteurs F1 , F2 , F3 (WeisfeilerLeman) à ce coloriage. Puis nous utilisons le lemme des designs (prop. 5.1) avec α = 2/3. Nous trouvons les éléments x1 , . . . , x` ∈ V2 (` = d − 1 ou ` = d − 2) dans l’énoncé de la proposition 5.1 par force brute, en temps proportionnel à |V2 |d = |V1 |O(1) . Nous les fixons, et nous imposons que H fixe x1 , . . . , x` , ce qui a un coût de |V1 |O(1) , dans le sens où [G : Gx1 ,...,x` ] ≤ |V2 |d = |V1 |O(1) . Si nous sommes dans le premier cas du lemme de designs (pas de couleur dominante), nous cueillons les classes de couleur, en commençant par la plus rouge (interprétez la quantité en (7) comme une longueur d’onde), jusqu’à avoir une union des classes S ⊂ V2 avec |V2 |/3 < |S| ≤ 2|V2 |/3. (Ceci marche s’il n’y a aucune classe de taille > |V2 |/3 ; si de telles classes existent, nous définissons S comme la classe la plus grande de ce type.) Nous appliquons l’exercice 5.5, et obtenons un graphe (V10 , V20 , A ∩ (V10 × V20 )) remplissant les conditions de notre proposition 5.7 avec V20 = S ou V20 = V2 \ S, et donc |V20 | ≤ α|V2 |. Donc, nous appliquons la proposition 5.7 à ce graphe ; la récursion marche. (Il est important ici que |V20 | ≤ α|V2 |, puisque nous avons déjà encouru un coût considérable (|V1 |O(1) ) dans l’indice.) Restons donc dans le deuxième cas du lemme des designs : nous avons un coloriage de V2 avec une classe de couleurs C ⊂ V2 telle que |C| ≥ 2|V2 |/3, et une configuration cohérente homogène classique Y non triviale sur C. Nous définissons un graphe avec des sommets V10 ∪ V2 , où V10 est de couleur nacrée et V2 vient d’être colorié par le lemme des designs ; les arêtes seront non pas seulement celles en A ∩ (V10 × V2 ) (coloriées en noir) mais aussi les arêtes entre les éléments de V2 , dans les couleurs données par Y. Nous appliquons les raffinements F1 , F2 et F3 (Weisfeiler-Leman) à ce graphe, et obtenons une configuration cohérente X. La configuration X[V2 ] est un raffinement de Y. Si elle n’a pas de couleur α-dominante, nous réduisons notre problème à celui pour (V10 , V20 , A∩(V10 ∩V20 )), |V20 | ≤ α|V2 |, comme avant ; nous pouvons appliquer la proposition 5.7 à un tel graphe sans changer β parce que 2 |V20 | ≤ |V2 | ≤ β|V2 | < β|V10 |. 3 La récursion marche ici aussi parce que |V20 | ≤ 2|V2 |/3 : il est important que V20 soit plus petit que V2 par un facteur constant, puisque le coût entraîné jusqu’à maintenant dans l’index [G : H] est déjà considérable (|V1 |O(1) ). Supposons donc qu’il existe une classe de couleurs (2/3)-dominantes C2 dans X[V2 ]. Elle doit être un sous-ensemble de C car 2/3 + 2/3 > 1. La restriction de X[C2 ] n’est
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
166
H. A. HELFGOTT
pas une clique : si elle l’était, la restriction de Y à C2 l’aurait été aussi, et cela est impossible par l’exercice 2.15. Nous pouvons supposer qu’il existe une classe de couleurs C1 ⊂ V10 en X1 qui satisfait |C1 | > β|V1 | ; sinon, nous avons un β-coloriage de V1 , et pouvons finir. Le fait que |C1 | > β|V1 | implique que |C1 | > |V2 | ≥ |C2 |. Nous pouvons supposer aussi que les arêtes de X en C1 × C2 ne sont pas toutes de la même couleur. Si elles l’étaient, il y aurait une classe de ≥ |C1 | > β|V1 | > |V1 |/2 + 1 jumeaux en V1 dans le graphe (V1 , C2 ; A ∩ (V1 × C2 )), dont X[V1 × C2 ] est un raffinement. Dans ce cas, par l’exercice 5.5, nous aurions une réduction à (V1 , V2 \ C2 ; A ∩ (V1 × (V2 \ C2 ))), et nous pourrions finir en utilisant la proposition 5.7 de façon récursive. Ainsi, nous avons tout réduit à la proposition 5.8 : nous l’appliquons à X[C1 ∪ C2 ]. Nous obtenons, soit un (1/2)-découpage de C1 , soit un graphe biparti (W1 , W2 ; A0 ), W1 ⊂ C1 , W2 ⊂ C2 , avec |W1 | ≥ |C1 |/2, |W2 | ≤ |C2 |/2 ≤ |V2 |/2, tel qu’aucune classe de jumeaux en W1 n’a plus que |W1 |/2 éléments. Nous pouvons supposer que |W1 | > β|V1 |, parce que, dans le cas contraire, nous avons obtenu un β-découpage de W1 . Alors, |W2 | < |W1 |/2. Nous pouvons, alors, faire de la récursion : nous appliquons la proposition 5.7 avec (W1 , W2 ; A0 ) à la place de (V1 , V2 ; A). La récursion se finit au maximum après O(log |V2 |) pas puisque |W2 | ≤ |V2 |/2. Si la taille de W1 (ou de V1 ) décroît en dessous de β|V1 | (pour la valeur originale de |V1 |), alors nous avons obtenu un β-découpage de V1 . Comme nous l’avons vu, coupe ou Johnson biparti utilise coupe ou Johnson cohérent. À son tour, coupe ou Johnson cohérent se réduira à coupe ou Johnson biparti pour un graphe biparti (V1 , V2 ; A) avec V2 de taille au plus une moitié de la taille du V2 original. Proposition 5.8 (Coupe ou Johnson cohérent). — Soit X = (C1 ∪ C2 ; c) une configuration cohérente avec des classes de couleurs de sommets C1 , C2 , où |C1 | > |C2 |. ne sont une fonction constante. ni c| Supposons que ni c| C1 ×C2
C2 ×C2
Alors, nous pouvons trouver, en temps |C1 |O(1) , soit – un (1/2)-découpage de C1 , ou – un graphe biparti (V1 , V2 ; A), Vi ⊂ Ci , |V1 | ≥ |C1 |/2, |V2 | ≤ |C2 |/2, tel que toute classe de jumeaux en V1 contient au plus |V1 |/2 éléments, et un élément y ∈ C2 , tel que le découpage, voire le graphe biparti, est canonique en relation à Gy , où G = Sym(C1 ) × Sym(C2 ). Il va de soi que dire que c| est constant équivaut à dire que X[C2 ] est une C2 ×C2 clique.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
167
Preuve. — Si la restriction X[C1 ] était une clique, alors, par cohérence, pour toute couleur en C1 × C2 – pourpre, disons – les voisinages dans (C1 , V2 ; Gpourpre ) des sommets en C2 nous donneraient un block design équilibré (et peut-être dégénéré) sur C1 . Le design est incomplet parce que c n’est pas monochrome sur C1 × C2 . L’inégalité de Fisher nous donne que |C2 | ≥ |C1 |, en contradiction avec nos suppositions. Donc, X1 [C1 ] n’est pas une clique. Si X[C1 ] n’est pas primitive, la plus rouge de ses relations non connexes nous donne un (1/2)-découpage canonique de V1 , par l’exercice 2.16. Nous pouvons donc supposer que X[C1 ] est primitif. Nous avons deux cas à considérer : X[C2 ] primitive et X[C2 ] imprimitive. Supposons d’abord que X[C2 ] est imprimitive. La relation non connexe la plus rouge dans X[C2 ] nous donne une partition de C2 dans des ensembles B1 , . . . , Bm , m ≥ 2, tous de la même taille ≥ 2. Nous avons donc trouvé une structure en C2 , et nous l’utiliserons, soit pour découper C1 , soit pour réduire |C2 | par un facteur constant. Le premier pas consiste à montrer qu’il n’y a pas de jumeaux dans C1 . Comme notre configuration est cohérente, la couleur d’une arête en C1 sait si ses sommets sont des jumeaux en relation à C2 (Ex. 5.6) ; donc, s’il y avait des jumeaux dans C1 en relation à C2 , nous aurions, soit qu’une des couleurs d’arêtes en C1 donne une relation non connexe – ce qui contredit le fait que X[C1 ] est uniprimitive – soit que tous les éléments de C1 sont des jumeaux en relation en C2 . Dans ce dernier cas, serait monochrome, ce qui n’est pas le cas. En conclusion, par l’exercice 5.4, c| C1 ×C2 il n’y a pas de jumeaux dans C1 en relation à C2 . Notre intention est d’appliquer l’exercice 2.18 pour obtenir un graphe biparti contracté C1 × {1, 2, . . . , m} avec m ≤ |C2 |/2. Nous devons seulement faire attention à ce que ce graphe ne soit pas trivial. Soit dk le degré de tout w ∈ C2 dans le graphe biparti (C1 , C2 ; Gk ) pour une couleur k donnée, où Gk consiste en les arêtes de couleur k. (Par l’ex. 2.17a, le degré dk ne dépend pas de w.) Si dk ≤ |C1 |/2 pour tout k, nous fixons un w ∈ C2 (non canonique) et obtenons un (1/2)-coloriage de C1 en assignant la couleur c(x, w) au sommet x ∈ C1 . Supposons donc qu’il y a une couleur – que nous appellerons violet – telle que dviolet > |C1 |/2. S’il y a un 1 ≤ i ≤ m tel qu’il n’y a aucune classe de plus que |C1 |/2 jumeaux dans C1 en relation à Bi , nous fixons un élément y ∈ Bi d’un tel i (non canoniquement), fixant ainsi cet i. De cette façon, nous obtenons une réduction au graphe biparti (C1 , Bi ; Gviolet ∩ (C1 × Bi )). Supposons que cela n’est pas le cas. Donc, pour chaque i, il existe une classe Ti ⊂ C1 de jumeaux en relation à Bi telle que |Ti | > |C1 |/2. Pour chaque w ∈ Bi , les arêtes de w à tout v ∈ Ti sont de la même couleur ; alors, elles doivent être violettes. Soit vert une couleur d’arêtes en C1 × C2 qui ne soit pas violet. Alors, le graphe X = (C1 , {1, . . . , m}; D) dans l’exercice 2.18 n’est pas vide ; comme (v, i) est violet
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
168
H. A. HELFGOTT
pour tout v ∈ Ti , X n’est pas complet non plus. Comme X est birégulier, il n’y a aucune classe de jumeaux en C1 en relation à {1, . . . , m} avec > |C1 |/2 éléments (ex. 5.4). Nous avons donc tout réduit à un graphe biparti X du type que nous désirions. Considérons maintenant le cas de X[C2 ] primitive (14). Fixons un y ∈ C2 arbitraire (non canoniquement). Nous pouvons supposer qu’il y a une couleur – disons, violet – telle que dviolet > |C1 |/2, puisque, sinon, les couleurs des arêtes qui connectent les éléments de C1 avec y nous donneraient un (1/2)-coloriage de C1 . Écrivons V1 = Lviolet (y) = {x ∈ C1 : c(x, y) = violet}. Donc |V1 | > |C1 |/2. Soit bleu une couleur d’arêtes en X[C2 ] telle que le degré de Gbleu est (positif et) < |C2 |/2 ; une telle couleur existe parce que X[C2 ] n’est pas une clique. (S’il y a plusieurs couleurs comme cela, nous choisissons la plus bleue d’entre elles.) Alors, V2 = Lbleu (y) ⊂ C2 satisfait 1 ≤ |V2 | < |C2 |/2. Le graphe biparti (V1 , V2 ; Gviolet ∩ (W × U )) est semirégulier par l’exercice 2.17b. Il est non vide parce que, pour tout u ∈ V2 , |Lviolet (u)| > |C1 |/2, et donc Lviolet (u) ∩ V1 6= ∅. S’il était complet, nous aurions V1 ⊂ Lviolet (u) pour tout u ∈ V2 ; comme |V1 | = |Lviolet (y)| = |Lviolet (u)|, ceci impliquerait que V1 = Lviolet (u). Or, cela voudrait dire que y et u sont des jumeaux dans le graphe (C1 , C2 ; Gviolet ). Par le même argument qu’avant (basé sur l’exercice 5.6), la primitivité de X[C2 ] et le ne soit pas monochrome impliquent qu’il n’y a pas de jumeaux fait que c| C1 ×C2 dans C2 en relation au graphe (C1 , C2 ; Gviolet ). Donc, (V1 , V2 ; Gviolet ∩ (V1 × V2 )) n’est pas complet. Par l’exercice 5.4, nous obtenons qu’aucune classe de jumeaux dans (V1 , V2 ; Gviolet ∩ (V1 × V2 )) n’a plus de |V2 |/2 éléments. Nous avons donc terminé. 5.3. Récursion et réduction une couleur domine ?
non récursion n0 ≤ n/2
(14)
réduction de G/N à Altm0 m0 ≤ |m|/2
aligner
G transitif ?, etc.
réduction de G/N à Altm0 √ m0 m
Le problème dans la preuve originale de Babai était à ce point précis. Ce qui suit est un argument alternatif proposé par lui (col rumore sordo di un galoppo) lorsque cet article était en train d’être édité. Il est plus concis et élégant que l’argument d’origine, en plus d’être correct. Avant, la preuve faisait deux fois (ou plus) recours à la proposition elle-même, ce qui faisait croître l’indice [G : H] de façon catastrophique.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
169
5.3.1. Le cas sans couleurs dominantes. — Nous sommes dans le cas dans lequel un coloriage cX : Γ → C n’a pas de couleur dominante. Ici cX est l’image d’une structure X sous un foncteur F qui commute avec l’action de H(x1 ,...,x` ) , où H = Alt(Γ), xi ∈ Γ. Le fait que cX n’a pas de couleur dominante nous servira pour trouver ou écarter ses isomorphismes possibles en H~x = H(x1 ,...,x` ) . Pour trouver ou écarter des isomorphismes en tout H = Alt(Γ), nous n’avons qu’à travailler avec un ensemble de représentants {σ1 , . . . , σs }, s ≤ |Γ|` = m` , des classes de H~x dans H, et à faire l’union −1 de IsoH~x (cX , cYi ) pour Yi = Yσi : [ (8) IsoH (X, Y) = IsoH~x (X, Yi ) σi , IsoH~x (X, Yi ) ⊂ IsoH~x (cX , cYi ). 1≤i≤s
Ceci est similaire à l’équation (4), en §2.2. Le coût de la procédure est multiplié par s ≤ m` . Si le coloriage cX n’est pas une permutation (en H~x ) du coloriage cYi , alors IsoH~x (cX , cYi ) = ∅. Supposons, par contre, qu’il y a au moins un τi ∈ H~x tel que cX = cτYi i . (Nous disons que τi aligne cX et cYi .) Il est trivial de trouver τi . Or IsoH~x (X, Yi ) = IsoH~x (X, Yτi i ) τi−1 ⊂ AutH~x (cX )τi−1 . Comme cX n’a pas de couleur dominante, ceci est assez contraignant, ce que nous voulions. Appliquons cette procédure générale au cas de G primitif que nous sommes en train de discuter. Il y a une bijection ι : Ω → {S ⊂ Γ : |S| = k} ; donc, cX induit un P coloriage c0 : Ω → {(ki )i∈C : ki ≥ 0, i ki = k}. Nous sommes dans une situation similaire à celle de la fin du §4.2, mais en mieux : il est facile de montrer que, comme aucune classe de couleur de cX possède plus de α|Γ| éléments, aucune classe de couleur de c0 possède plus de α|Ω| éléments. Nous procédons alors comme dans le cas intransitif de la preuve de Luks (Thm. 2.4), ce qui réduit le problème à ≤ n problèmes d’isomorphisme de chaînes pour des chaînes de longueur ≤ αn et de longueur totale ≤ n. Le dernier pas (lifting, « relèvement ») consiste à trouver des éléments de G qui induisent τi . Étant donnée une bijection ι, ceci est trivial. 5.3.2. Le cas du découpage. — Considérons maintenant un α-découpage (fin de §2.3) d’un ensemble de sommets Γ. Ce découpage sera donné canoniquement, à savoir, en tant que l’image d’une structure X sous un foncteur, tout comme le coloriage au §5.3.1. Nous pouvons supposer que le découpage a une classe de couleurs C dominante (|C| > α|Γ|, α > 1/2), puisque, dans le cas contraire, nous pouvons passer au §5.3.1. Nous voulons savoir quels éléments de Alt(Γ) respectent le α-découpage ; ceci nous aidera à contraindre les isomorphismes de X, tout comme en (8). Par la définition de α-découpage, C est partitionné en ` ≥ 2 ensembles de la même taille ≥ 2. Les
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
170
H. A. HELFGOTT
seules permutations en Altm0 , m0 = |C|, qui sont permises sont celles qui respectent la partition. Le groupe qui respecte la partition est isomorphe à Altm0 /` . Nous avons donc réduit notre problème à un problème avec m0 = m0 /` ≤ m/2. Après avoir résolu ce problème, nous travaillons – comme dans le §5.3.1 – sur les autres classes de couleurs. Étant donnés deux α-découpages, nous vérifions si les partitions des deux découpages ont le même nombre d’ensembles de la même taille pour chaque couleur, puis nous alignons les deux découpages, et procédons exactement comme pour le problème de l’automorphisme. 5.3.3. Le cas du schéma de Johnson. — Soit donné un schéma de Johnson sur un ensemble de sommets Γ, ou plutôt deux schémas de Johnson J (mi , ki ), 2 ≤ ki ≤ mi /2, sur des ensembles de sommets Γ1 , Γ2 de la même taille. Nous avons vu au §2.8 comment identifier Γi (là, Ω) explicitement avec les ensembles de taille ki d’un ensemble Λi (là, Γ) de taille mi . Si k1 6= k2 et m1 6= m2 , nos structures ne sont pas isomorphes. Si k1 = k2 et m1 = m2 , nous établissons une bijection entre Λ1 et Λ2 et alignons les deux structures. Nous avons réduit notre problème à un problème √ avec m0 m à la place de m. La situation nous est donc même plus favorable que dans le cas du découpage. À nouveau, nous laissons la comptabilité au lecteur. Une petite confession : le cas de G primitif, que nous venons de finir de traiter, pourrait être traité exactement comme le cas de G imprimitif, que nous examinerons maintenant. La motivation du traitement séparé pour G primitif est pédagogique. Aucune peine n’est perdue, puisque toutes les techniques que nous avons étudiées nous seront essentielles dans le cas imprimitif.
6. LE CAS IMPRIMITIF Nous avons une application surjective explicite φ : G → Alt(Γ), où G < Sym(Ω) est un groupe de permutation, |Γ| = m, |Ω| = n. Nous pouvons supposer que |Γ| ≥ C log n, C arbitraire. L’application φ se factorise comme suit G → G/N → Alt(Γ), où N est le stabilisateur d’un système de blocs, et G/N → Alt(Γ) est un isomorphisme. Nous devons déterminer IsoG (x, y), où x, y sont des chaînes. Nous avons déjà résolu le cas N = {e}.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
171
Nous attaquerons le problème de façon locale : pour T ⊂ Γ, nous arriverons à obtenir un certificat, soit du fait que φ(AutGT (x))| contient Alt(T ) (« certificat de T
plénitude »), soit du contraire. (Ici GT désigne le groupe {g ∈ G : T φ(g) = T }.) Nous calculerons tous ces certificats pour T d’une taille k modérée. Si le nombre de certificats de plénitude est très grand, nous aurons prouvé que φ(AutG (x)) contient un grand groupe alternant ; ce qui restera à faire sera une version de la procédure du § 4.2 (« pull-back »). Dans le cas contraire, les certificats formeront une structure k-aire dont la symétrie est bornée. Nous pourrons donc appliquer le lemme des designs, suivi de coupe-ouJohnson, comme avant. Il y a aussi quelques autres cas particuliers, mais ils nous amènent à des α-découpages, α < 1, ce qui est aussi bien. 6.1. Les certificats locaux 6.1.1. Certificats d’automorphismes. — Un certificat local (15) pour T ⊂ Γ est – soit un triplet (« pas plein », W, M (T )), où W ⊂ Ω, M (T ) < Sym(T ), M (T ) 6= Alt(T ) (donc « pas plein ») et φ AutW GT (x) |T < M (T ), – soit une paire (« plein », K(T )), où K(T ) < AutGT (x), et φ(K(T ))| = Alt(T ). T
Le certificat local dépend de x de façon canonique. Il est clair qu’un certificat plein, voire pas plein, garantit que φ(AutGT (x))| est Alt(T ), voire ne l’est pas. T Si T est donné en tant que tuple ordonné, son certificat dépend de l’ordre de T seulement dans le sens de ne pas en dépendre : le même groupe {(23), e} < Sym({1, 2, 3}) (disons) a une apparence différente si nous le regardons du point de vue de l’ordre (1, 2, 3) ou de l’ordre (2, 1, 3). Nous construisons le certificat par une procédure itérative. Au début de chaque pas, W ⊂ Ω et A(W ) est le groupe AutW GT (x) ; la fenêtre W sera invariante sous A(W ). Au tout début de la procédure, W = ∅ et A(W ) = GT . (Nous pouvons calculer GT comme dans l’exercice 2.1c en temps |Ω|O(k) , où k = |T |.) À chaque pas, nous ajoutons à W tous les éléments atteints par A(W ) (voir §4.1), puis nous mettons A(W ) à jour, selon le nouveau W . Nous nous arrêtons si φ(A(W ))| 6= Alt(T ) (non-plénitude) ou T si W ne croît plus, ce qui veut dire qu’aucun élément de Ω\W n’est atteint par A(W ). Il est clair qu’il y aura ≤ |Ω| itérations. À la fin, dans le cas de non-plénitude, nous retournons (« pas plein », W, φ(A(W ))) ; dans le cas de plénitude, nous retour nons « plein », A(W )(Ω\W ) . Il est clair que le stabilisateur des points A(W )(Ω\W ) est contenu non pas seulement dans AutW (x), puisqu’il GT (x), mais aussi dans Aut GT fixe tous les points de Ω \ W . Nous savons que φ A(W )(Ω\W ) = Alt(T ) par la proposition 4.4a, sous la condition que |T | ≥ max(8, 2 + log2 |Ω|). (15)
Ou « local-global », dans la nomenclature de Babai. « Global » fait référence à AutGT (x) < Sym(Ω).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
172
H. A. HELFGOTT
Vérifier si φ(A(W ))| = Alt(T ) est facile : nous n’avons qu’à vérifier, en utilisant T Schreier-Sims, si deux générateurs arbitraires de Alt(T ) sont en φ(A(W ))| . De la T même façon, il est simple de déterminer quels éléments sont atteints par A(W ) : nous calculons A(W )x pour chaque x ∈ Ω (par Schreier-Sims) et, toujours par SchreierSims, vérifions si φ(A(W )x )| = Alt(T ). Ceci prend du temps polynomial en |Ω|. T
Il reste à voir comment mettre à jour A(W ), étant donné A (W − ), où nous écrivons W − pour l’ancienne valeur de W . Tout élément de A(W ) est dans A(W − ), et donc A (W ) = AutW A(W − ) (x). Comme dans l’équation (4), [ [ σ −1 , (9) AutW AutW IsoW N σ (x) = N x, x A(W − ) (x) = σ
σ
où N est le noyau de φ| et σ parcourt des représentants des k!/2 classes A(W − ) de N en A(W ). Nous pouvons trouver rapidement un σ ∈ A(W − ) ∩ φ−1 ({τ }) pour tout τ ∈ Sym(Γ), par Schreier-Sims. La proposition 4.4b nous donne que toute orbite de N contenue en W (l’ensemble d’éléments atteints par A(W − )) est de longueur ≤ |W |/k ≤ |Ω|/k. Par conséquence, par la règle (3), mettre A(W ) à jour se réduit à |Ω|·(k!/2) problèmes de détermination de Iso pour des chaînes de longueur ≤ |Ω|/k. Comme le nombre d’itérations est ≤ |Ω|, la procédure fait appel à Isomorphismede-Chaînes ≤ |Ω|2 · (k!/2) fois pour des chaînes de longueur ≤ |Ω|/k. Ceci – comme la routine qui prenait |Ω|O(k) de temps – est acceptable pour k (log |Ω|)κ . Nous choisirons κ = 1. 6.1.2. Comparaisons de certificats. — Une légère modification de la procédure cidessus nous permet d’élucider la relation entre deux certificats locaux pour deux chaînes. Soient x, x0 : Ω → Σ, T, T 0 ⊂ Γ, |T | = |T 0 | = k. Pour S ⊃ T , soit xS la chaîne ( x(i) si i ∈ S, S x (i) = glauque si i ∈ /S où glauque ∈ / Σ. Nous voulons calculer (10)
0 IsoGT ·τ(T ,T 0 ) xW , xW ,
où GT ·τ(T,T 0 ) est la classe des éléments de G qui envoient l’ensemble T à T 0 , et W 0 est la valeur de W retournée quand la donnée est T 0 à la place de T . Pour déterminer (10), nous suivons la procédure (§ 6.1.1), modifiée de la façon suivante : nous mettrons à jour, dans chaque itération, non pas seulement A(W ), 0 mais aussi la classe A(W )τ d’isomorphismes en GT · τ(T,T 0 ) de xW à (x0 )W . Voilà
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
173
comment le faire, de façon analogue à (9) : [ −1 [ 0 0 σ W 0 W W 0 W (11) IsoN σ x , (x ) = IsoN x , (x ) , σ
σ
où N est le noyau de φ| et σ parcourt des représentants des k!/2 classes de N A(W − ) − − contenues en A(W )τ . Comme W est stabilisé par A(W − ) (et donc par N ), le fait que σ envoie W sur W 0 ou non dépend seulement de la classe de N à laquelle σ appartient. (La classe Iso dans la dernière expression de (11) est vide si W σ 6= W 0 .) Comme avant, toute orbite de N contenue en W est de longueur ≤ |W |/k, et le problème se réduit à |Ω| · (k!/2) appels par itération à Isomorphisme-de-Chaînes pour des chaînes de longueur ≤ |W |/k ≤ |Ω|/k. Par ailleurs, si T et T 0 nous sont données comme tuples ordonnés (T ), (T 0 ), il est facile de déterminer W0 (12) I(x, x0 , T, T 0 ) = IsoG(T ) ·τ((T ),(T 0 )) xW , (x0 ) , où G(T ) · τ((T ),(T 0 )) est la classe des éléments de G qui envoient le tuple ordonné (T ) à (T 0 ). En effet, nous n’avons qu’à déterminer (10), puis utiliser Schreier-Sims pour déceler les éléments de (10) qui envoient (T ) à (T 0 ) dans le bon ordre. 6.2. L’agrégation des certificats
coupe
coupe
certificats locaux
plénitude > 1/2 ?
réduction de G/N à Altm0 m0 ≤ |m|/2
coupe ou relations ?
relations
WeisfeilerLeman, lemme des designs, etc.
Johnson
réduction de G/N à Altm0 √ m0 m
oui pas de couleur dominante pullback
récursion n0 ≤ 3n/4
En suivant la procédure du §6.1.1 pour une chaîne x, nous trouvons des certificats locaux pour chaque T ⊂ Γ de taille k, où k est une constante ∼ C log |Ω| (C > 1/ log 2) et k < |Γ|/10. Soit F < AutG (x) le groupe engendré par les certificats pleins K(T ). Soit S ⊂ Γ le support de φ(F ), c’est-à-dire l’ensemble des éléments de Γ qui ne sont pas fixés par tout élément de φ(F ). Notre objectif est de déterminer les isomorphismes IsoG (x, x0 ) de x à une autre chaîne x0 . Puisque les certificats sont canoniques, l’assignation de F et S à une chaîne
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
174
H. A. HELFGOTT
l’est aussi. Donc, si nous arrivons à deux cas différents ci-dessous en suivant la procédure pour x et pour x0 , les deux chaînes ne sont pas isomorphes. Cas 1 : |S| ≥ |Γ|/2, mais aucune orbite de φ(F ) n’est de longueur > |Γ|/2. Alors, nous colorions chaque élément de Γ par la longueur de l’orbite qui le contient. Ceci est un coloriage canonique. Soit aucune classe de couleurs n’est de taille > |Γ|/2, soit une classe de couleurs de taille > |Γ|/2 est découpée en ≥ 2 ensembles de la même taille ≥ 2. Dans un cas comme dans l’autre, nous passons à une réduction/récursion. Cas 2 : |S| ≥ |Γ|/2 et une orbite Φ de φ(F ) est de longueur > |Γ|/2. Cas 2a : Alt(Φ) < φ(F )| . Nous sommes dans le cas de grande symétrie. Nous Φ procédons comme au §4.2, jusqu’au point où nous devons déterminer IsoH (x, y) (où y σ0 est (x0 ) , σ 0 ∈ G, et H = φ−1 (Alt(Γ)Φ )). Définissons K = φ−1 Alt(Γ)(Φ) , et soient σ1 , σ2 ∈ G des préimages (arbitraires) sous φ de deux générateurs de Alt(Φ) < Alt(G), trouvées par Schreier-Sims. Nous savons que les classes AutKσi (x), i = 1, 2, sont non vides, puisque Alt(Φ) < φ(F )| . Comme K n’a pas d’orbites de longueur > |Ω|/2, Φ nous pouvons déterminer ces deux classes par des appels à Isomorphisme-deChaînes pour des chaînes de longueur ≤ |Ω|/2 et longueur totale ≤ 2|Ω|. Elles engendrent AutH (x). Encore par le fait que Alt(Φ) < φ(F )| , la classe IsoH (x, y) sera non vide ssi Φ IsoK (x, y) est non vide. Nous pouvons déterminer cette dernière classe par des appels à Isomorphisme-de-Chaînes comme ci-dessus, puisque K n’a pas d’orbites de longueur > |Ω|/2. Si elle est non vide, nous obtenons la réponse IsoH (x, y) = AutH (x) IsoK (x, y). Cas 2b : Alt(Φ) ≮ φ(F )| . Soit d ≥ 1 l’entier maximal avec la propriété que φ(F )| Φ Φ est d-transitif, c’est-à-dire, φ(F )| agit transitivement sur l’ensemble des d-tuples Φ d’éléments distincts de Φ. Par CGFS, d ≤ 5 ; si nous ne voulons pas utiliser CGFS, nous avons la borne classique d log |Γ|. Choisissons x1 , . . . , xd−1 ∈ Φ arbitrairement. Le reste de notre traitement de ce cas sera donc seulement canonique en relation à φ(g)
G(x1 ,...,xd−1 ) = {g ∈ G : xi
= xi ∀1 ≤ i ≤ d − 1},
ce qui, comme nous le savons, n’est pas un problème ; voir le début du §5.3.1. La restriction du groupe φ(F )(x1 ,...,xd−1 ) à Φ0 = Φ \ {x1 , . . . , xd−1 } est transitive sur Φ0 , mais elle n’est pas doublement transitive. Donc, la configuration cohérente schurienne qui lui correspond n’est pas une clique. Nous donnons cette configuration à coupe-ou-Johnson (§5.2), tout comme à la fin du §5.2. Pour comparer les configurations qui correspondent à deux chaînes x, x0 , nous alignons leurs classes Φ d’abord. (Si elles ne sont pas de la même taille, ou si une
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
175
chaîne nous donne le cas 2a et l’autre pas, les chaînes ne sont pas isomorphes.) Les isomorphismes sont donc contenus dans le stabilisateur H < G de l’ensemble Φ (facile à déterminer, comme vers la fin du §4.2, puisque φ est surjective). Nous pouvons remplacer φ par l’application g 7→ φ(g)| de H à Alt(Φ). Puis nous construisons les Φ configurations comme ci-dessus, et comparons ce que coupe-ou-Johnson nous donne. Tout à la fin, nous nous occupons du complément de C. Il s’agit, comme d’habitude, d’appels à Isomorphisme-de-Chaînes pour des chaînes de longueur ≤ |Ω|/2 et longueur totale < |Ω|. Cas 3 : |S| < |Γ|/2. Nous commençons en alignant les supports S pour les chaînes x, x0 , et en remplaçant φ par g 7→ φ(g)| , tout comme dans le cas 2(b). Γ\S
Nous allons définir une relation k-aire avec très peu de jumeaux, pour la donner après au lemme des designs. Regardons la catégorie de toutes les chaînes Ω → Σ, où Ω et Σ sont fixes, une action de G sur Ω est donnée, et φ : G → Alt(Γ) est aussi donnée. Nous la regardons depuis longtemps, puisque nous devons comparer les couleurs sur des configurations induites par des chaînes différentes pour décider si ces dernières sont isomorphes. Cette fois-ci, nous définirons des couleurs par des classes d’équivalence : deux paires (x, (T )), (x0 , (T 0 )) (T, T 0 ⊂ Γ \ S, |T | = |T 0 | = k) sont équivalentes si l’ensemble des isomorphismes en (12) est non vide. Nous colorions (T ) – dans le coloriage de (Γ \ S)k correspondant à x – par la classe d’équivalence de (x, (T )). Ici, (T ) est un k-tuple ordonné sans répétitions ; si (T ) a des répétitions, elle est coloriée en gris. Pour x donné, aucune classe de jumeaux en Γ ne peut avoir ≥ k éléments : s’il existait un tel ensemble avec ≥ k éléments, il contiendrait un ensemble T avec k éléments, et tous les ordres (T ) de T auraient la même couleur. Ceci voudrait dire que l’ensemble des isomorphismes en (12) serait non vide pour n’importe quels ordres (T ), (T 0 ) de T . En conséquence, AutGT (xW ) contiendrait des éléments donnant toutes les permutations possibles de T . Ceci nous donnerait une contradiction, puisque T , étant contenu en Γ \ S, n’est pas plein. Alors, pourvu que k ≤ |Γ|/4, nous avons un coloriage de (Γ \ S)k sans aucune classe de jumeaux avec ≥ |Γ \ S| éléments. Nous pourrons donc appliquer le lemme des designs, après une application de raffinements habituels F2 , F3 (Weisfeiler-Leman). Mais – pouvons-nous calculer ces coloriages ? Les classes d’équivalence sont énormes. Par contre, il n’y a aucun besoin de les calculer. Tout ce dont nous aurons besoin, pour comparer des structures qui viennent de chaînes x, y, sera d’être capables de comparer deux tuples (T ) (sur la configuration donnée par x ou y) et (T 0 ) (sur la configuration donnée par x0 = x ou x0 = y) et dire si elles sont de la même couleur. En d’autres termes, nous devrons calculer – au tout début de la procédure, pour toute paire ((T ), (T 0 )), |T | = |T 0 | = k, et pour les paires de chaînes
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
176
H. A. HELFGOTT
(x, x), (x, y), (y, y) – l’ensemble d’isomorphismes en (12), ce que nous savons déjà faire. Les couleurs sont donc, dans la pratique, des entrées dans un index, que nous enrichissons et auquel nous faisons référence durant nos procédures. Nous invoquons donc le lemme des designs, suivi par coupe-ou-Johnson, et le reste de la procédure. — Fine dell’opera — Le lecteur peut vérifier que les informations précisées jusqu’à ici (temps pris par des procédures, type de récursion) sont assez pour donner une borne du type exp(O(log |Ω|)c ) pour le temps de l’algorithme qui résout le problème de l’isomorphisme de chaînes. Ceci donne une borne exp(O(log n)c ) pour le problème de l’isomorphisme de graphes avec n sommets. Avec un peu plus de travail, il devient clair que, dans un cas comme dans l’autre, c = 3. Nous donnons les détails dans l’appendice. L’exposant c = 3 est plus petit que celui d’origine ; il est devenu possible grâce à quelques améliorations et simplifications que j’ai été capable d’apporter. Remerciements. — Je remercie vivement L. Babai, J. Bajpai, L. Bartholdi, D. Dona, E. Kowalski, W. Kantor, G. Puccini, L. Pyber, A. Rimbaud et C. Roney-Dougal pour des corrections et suggestions. En particulier, L. Babai a répondu à beaucoup de mes questions, et m’a aussi fourni des versions corrigées ou améliorées de plusieurs sections de [3]. En particulier, les § 2.3–2.4 et §5.1 sont basés sur ces nouvelles versions. Je voudrais aussi remercier V. Ladret et V. Le Dret pour un grand nombre de corrections d’ordre typographique et linguistique. L’auteur est supporté par l’ERC Consolidator grant 648329 (GRANT) et par les fonds de sa chaire Humboldt.
APPENDICE ANALYSE DU TEMPS D’EXÉCUTION A.1. Quelques précisions sur la procédure principale À tout moment donné, nous travaillons avec un groupe transitif G < Sym(Ω) qui S agit sur un système de blocs B = {Bi }, Ω = i Bi , Bi disjoints ; nous notons N le noyau de l’action sur B. À vrai dire, nous aurons toute une tour de systèmes de blocs B1 , B2 , . . . , Bk , où Bi est un raffinement de Bi+1 ; B signifiera Bk , le système le moins fin. Au début, il n’y a qu’un système, B1 , dont les blocs Bi sont tous de taille 1, et dont le noyau N est trivial. Nous voudrions que l’action de G sur B soit primitive. Donc, si elle ne l’est pas, nous ajoutons à la tour un système minimal Bk+1 tel que Bk soit un raffinement de Bk+1 . Nous redéfinissons B = Bk+1 ; N sera le noyau du nouveau B.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
177
Si G/N est petit (≤ bO(log b) , où b = |B| ; cas (a) du théorème 3.1 (Cameron)), nous réduisons notre problème à plusieurs instances du problème avec N à la place de G. Chacune de ces instances se décompose en plusieurs instances – une pour chaque orbite de N . Chaque orbite Ω0 de N est contenue dans un bloc de B. Les intersections de Ω0 avec les blocs de B1 , B2 , · · · nous donnent une tour de systèmes de blocs pour N | 0 . Ω Si nous sommes dans le cas (b) du Théorème 3.1, nous passons à ≤ b instances du problème avec M / G (où [G : M ] ≤ b) à la place de G. Nous passons à un nouveau système (16) B 0 de m0 = m k ≤ b blocs, et l’ajoutons à la tour comme son nouveau dernier niveau. Nous notons N 0 le noyau de l’action de M sur B 0 . Alors, 0 0 M/N 0 = Alt(k) m . Nous remplaçons G par M et redéfinissons B = B , N = N . Donc, nous avons un isomorphisme de G/N à Altm . Nous sommes dans le cas principal que Babai attaque. Ses méthodes amènent à une réduction de Altm , soit à un groupe intransitif sans grandes orbites, soit à un produit Alts1 o Alts2 , s1 , s2 > 1, √ s1 s2 ≤ m, soit à un groupe Altm0 , m0 m. (Nous simplifions quelque peu. Nous pourrions avoir, disons, un produit Alts1 o Alts2 , agissant sur une orbite de grande taille s1 s2 ≤ m, et d’autres groupes sur des petites orbites, ou plusieurs produits agissant sur des petites orbites.) Dans le cas intransitif sans grandes orbites, nous procédons comme dans la preuve de Luks. (La procédure aura été plus coûteuse que dans Luks, mais grâce au manque de grandes orbites, le gain dans la récursion est aussi plus grand.) Dans le cas de Altm0 , √ m0 m, nous itérons la procédure. Dans le cas de Alts1 o Alts2 – qui correspond à un découpage dans des ensembles de taille r de la même couleur – nous avons une action primitive de Alts sur un système de s blocs de taille r. Nous passons, alors, à cette action et à ces blocs, sans oublier les blocs B 0 , auxquels nous retournons plus tard, après avoir fini de travailler sur Alts . Il est clair que ce type de procédure réduit complètement Altk en un nombre d’itérations qui n’est pas supérieur à log2 m. A.2. Récursion et temps Examinons le temps total d’exécution de l’algorithme qui trouve les isomorphismes entre deux chaînes. Les pas individuels sont peu onéreux ; aucun ne précise plus de nO(log n) de temps. Notre attention doit se porter avant tout sur la récursion. Dans la procédure générale, une récursion est toujours d’une descente, soit vers des chaînes plus courtes, soit vers un groupe plus petit, ou au moins coupé dans des tranches plus fines par une tour de systèmes de blocs ayant plus de niveaux. Dans le premier type de descente, le groupe reste le même ou, plutôt, est remplacé par une (16) Ce système peut être égal à B seulement si M = G ; voir la deuxième note de pied de page dans l’énoncé du théorème 3.1. Dans ce cas-là, le passage de G à M est, bien sûr, gratuit.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
178
H. A. HELFGOTT
restriction de lui-même. Dans le deuxième cas, la longueur des chaînes reste la même. (Nous pouvons aussi avoir un mélange des deux cas – tant mieux : le groupe devient plus petit et les chaînes se raccourcissent aussi.) La descente la moins coûteuse, et moins avantageuse, est celle du cas intransitif de la procédure de Luks. Il pourrait arriver que G ait deux orbites sur Ω (|Ω| = n), une de longueur n − 1 et une de longueur 1. Ceci serait même compatible avec une borne polynomiale sur le temps, pourvu que le temps pris avant la descente soit lui-même polynomial : nc+1 ≥ (n − 1)c+1 + 1c+1 + nc pour c ≥ 0. D’autres types de descente sont plus coûteux, mais aussi plus avantageux : nous descendons à des chaînes de longueur ≤ n/2 (ou ≤ 2n/3), ou de Altm à Alts1 o Alts2 , s1 s2 ≤ m, s1 , s2 ≤ m/2, par exemple. Il est clair qu’il est impossible de descendre plus qu’un nombre logarithmique de fois de cette façon. Il est crucial de ne pas oublier qu’un coût (considérable) peut être caché dans une perte de canonicité. Si nos choix ne sont canoniques qu’en relation à un sous-groupe H de notre groupe G, le coût de leur application sera multiplié par [G : H]. (Voir §5.3.1.) Considérons, alors, le coût de chaque procédure. Le cas intransitif de Luks est, comme nous l’avons déjà vu, compatible même avec une borne polynomiale. Concentrons-nous alors sur le cas où G agit de façon primitive sur un système de blocs ; soit N le noyau. Si nous sommes dans le cas (a) du Théorème 3.1, ou dans le cas (b), mais avec m ≤ C log n, nous faisons appel à (m0 )O(log n) instances de la procédure principale pour des chaînes de longueur n/m0 (où m0 ≥ m). Ceci est consistant avec une borne totale du type exp(O((log n)c )), c ≥ 2. Nous pouvons, donc, nous concentrer sur le cas où il existe un isomorphisme φ : G/N → Alt(Γ), |Γ| = m > C log n. (La procédure du §2.8 rend cet isomorphisme explicite.) Le premier pas à considérer est la création de certificats locaux, avec, comme objectif, la création d’une relation k-aire sur Γ. (Si G est primitif, créer une telle relation est trivial ; voir le début du §5.) Il y a nk certificats locaux, où k = 2 log n (disons) ; nous devons les calculer et aussi comparer toute paire de certificats. Déjà le premier pas du calcul d’un certificat, à savoir le calcul de GT , prend un temps nO(k) (plus précisément, O((n/k)O(k) )). D’autres calculs prennent moins de temps. L’usage de la récursion, par contre, est relativement lourd : nous faisons appel à la procédure principale ≤ n2 · k! fois pour des chaînes de longueur ≤ n/k. Ceci se passe pour chaque ensemble T de taille k, c’est-à-dire ≤ nk /k! fois. La procédure pour comparer des paires de certificats est analogue. Nous faisons donc appel à la procédure principale O(n2k+1 ) fois pour des chaînes de longueur ≤ n/k. Dans chacun de ces appels, notre tour de stabilisateurs est héritée :
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
179
notre groupe est un groupe transitif, égal à la restriction de N − à une de ses orbites, où N − (noté N au §6) est un sous-groupe d’un sous-groupe A(W − ) de G. Pour deux systèmes de blocs consécutifs Bi , Bi+1 , notons ri le nombre de blocs de Bi dans chaque bloc de Bi+1 . Il est clair que ce nombre n’augmente pas quand nous passons à la restriction d’un sous-groupe de G (par exemple, N − ) à une de ses orbites. Examinons maintenant l’agrégation des certificats locaux (§ 6.2). Il y a trois cas. Dans le premier, le temps de calcul additionnel est à peu près trivial, et nous obtenons une réduction, soit à un groupe intransitif sans grandes orbites, soit à un produit Alts1 o Alts2 sur une grande orbite et éventuellement d’autres groupes sur des orbites plus petites. Ici, déjà, l’analyse devient délicate. Nous devons prendre en considération non seulement la taille du domaine mais aussi le groupe qui agit sur lui. Plus précisément, nous devons borner le nombre de fois que notre tour B1 , B2 , . . . , Bk pourrait être raffiné ou raccourci encore. Ceci sera mesuré par X ρ= (2blog2 ri c − 1), 1≤i≤k−1
où nous supposons que nous avons enlevé des systèmes répétés de la tour (donc ri > 1). Notons F (n, r) le temps d’exécution de la procédure principale pour des chaînes de longueur n et pour une tour de systèmes de blocs pour G telle que le paramètre ρ est ≤ r. Une réduction de G/N fait décroître r par au moins 1 ; un coloriage sans aucune grande classe de couleurs assure une descente vers des chaînes de longueur ≤ n/2. Nous devrons aussi inclure un facteur de log n2k , prenant en considération le temps requis pour accéder à nos comparaisons de paires de certificats locaux (17). Donc, dans le cas que nous examinons, F (n, r) est borné par X nO(k) + n2k+1 F (n/k, r) + F (n1 , r − 1) + F (ni , r) · O(k log n), i≥2
où
P
ni = n et ni ≤ n/2 pour i ≥ 2, ou ! nO(k) +
n2k+1 F (n/k, r) +
X
F (ni , r)
· O(k log n),
i
P où ni = n et ni ≤ n/2 pour i ≥ 1. Puisque k log n, ceci est consisc tant avec F (n, r) = exp (O (r + log n) ) pour c ≥ 3, ou même avec F (n, r) = exp (O ((log n)c1 + (log r)c2 )) pour c1 ≥ 3 et c2 ≥ 1, par exemple. (17)
Faire ce type de comparaisons à l’avance nous aide, mais ne pas les faire à l’avance ne changerait pas l’ordre du temps utilisé, asymptotiquement.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
180
H. A. HELFGOTT
Le cas 2a a un coût très similaire, à un facteur constant près. Le cas 2b et 3 sont différents. Dans les deux cas, nous arrivons à construire une relation d-aire, avec d ≤ 5, dans le cas 2b, et d = k log n dans le cas 3. Puis, nous appelons Weisfeiler-Leman, suivi du lemme des designs pour des configurations d-aires, et, finalement, coupe-ouJohnson. Weisfeiler-Leman prend un temps |Γ|O(d) = mO(d) . Le lemme des designs garantit l’existence d’un tuple (x1 , . . . , x` ) ∈ Γ, ` ≤ d − 1, avec certaines propriétés. Nous cherchons un tel tuple par force brute, ce qui prend un temps O(md ). Ce qui est plus important est que ce choix n’est pas canonique. Donc, le temps d’exécution de tout ce qui reste est multiplié par md = mO(log n) . Coupe-ou-Johnson prend un temps O(md ). Ici, à nouveau, nous faisons des choix qui ne sont pas complètement canoniques ; ils imposent un facteur de mO(log m) sur tout ce qui suit. Le résultat de coupe-ou-Johnson est soit un β-découpage, ce qui implique une réduction à un produit du type Alts1 o Alts2 et/ou à des chaînes plus √ courtes, soit un schéma de Johnson, ce qui implique une réduction à Altm0 , m0 m. Donc, soit (13) X F (n, r) ≤ nO(k) +O kn2k+2 F (n/k, r) +mO(log n) 1 + F (n1 , r − 1) + F (ni , r) , i≥2
où
P
ni = n, et ni ≤ n/2 pour i ≥ 2, ou !
(14)
F (n, r) ≤ nO(k) + O kn2k+2 F (n/k, r) + mO(log n)
1+
X
F (ni , r) ,
i
où
P
ni = n et ni ≤ n/2 pour i ≥ 1.
Ici m ≤ n. (Nous pourrions travailler avec une borne moins grossière, mais cela nous servirait peu.) Donc, les inégalités (13) et (14) sont consistantes avec c F (n, r) = exp (O (r + log n) ) pour c ≥ 3. Comme r ≤ 2 log2 n, nous concluons que le temps total d’exécution de la procédure pour déterminer les isomorphismes entre deux chaînes de longueur n est 3
F (n, r) ≤ eO(log n) .
RÉFÉRENCES [1] L. Babai – Lectures on graph isomorphism, University of Toronto, Dept. of Computer Science, notes polycopiées, 1979.
ASTÉRISQUE 407
(1125)
ISOMORPHISMES DE GRAPHES EN TEMPS QUASI-POLYNOMIAL
181
[2]
, Graph isomorphism in quasipolynomial time [extended abstract], in STOC’16—Proceedings of the 48th Annual ACM SIGACT Symposium on Theory of Computing, ACM, 2016, p. 684–697.
[3]
, Graph isomorphism arXiv:1512.03547.
in
quasipolynomial
time,
prépublication
[4] L. Babai, P. J. Cameron & P. P. Pálfy – On the orders of primitive groups with restricted nonabelian composition factors, J. Algebra 79 (1982), no 1, p. 161– 168. [5] L. Babai, W. M. Kantor & E. M. Luks – Computational complexity and the classification of finite simple groups, in Proc. 24th IEEE FOCS, 1983, p. 162–171. [6] L. Babai, E. M. Luks & A. Seress – Permutation groups in NC, in Proc. 19th ACM STOC, 1987, p. 409–420. [7] L. Babai, P. P. Pálfy & J. Saxl – On the number of p-regular elements in finite simple groups, LMS J. Comput. Math. 12 (2009), p. 82–119. [8] J.-Y. Cai, M. Fürer & N. Immerman – An optimal lower bound on the number of variables for graph identification, Combinatorica 12 (1992), no 4, p. 389– 410. [9] P. J. Cameron – Finite permutation groups and finite simple groups, Bull. London Math. Soc. 13 (1981), no 1, p. 1–22. [10] S. Evdokimov & I. Ponomarenko – On highly closed cellular algebras and highly closed isomorphisms, Electron. J. Combin. 6 (1999), Research Paper 18, 31. [11] R. A. Fisher – An examination of the different possible solutions of a problem in incomplete blocks, Ann. Eugenics 10 (1940), p. 52–75. [12] M. Furst, J. Hopcroft & E. Luks – Polynomial-time algorithms for permutation groups, in 21st Annual Symposium on Foundations of Computer Science (Syracuse, N.Y., 1980), IEEE, 1980, p. 36–41. [13] D. G. Higman – Finite permutation groups of rank 3, Math. Z. 86 (1964), p. 145–156. [14] N. Immerman & E. Lander – Describing graphs : a first-order approach to graph canonization, in Complexity theory retrospective, Springer, 1990, p. 59–81. [15] E. M. Luks – Isomorphism of graphs of bounded valence can be tested in polynomial time, J. Comput. System Sci. 25 (1982), no 1, p. 42–65. [16] A. Maróti – On the orders of primitive groups, J. Algebra 258 (2002), no 2, p. 631–640. [17] L. Pyber – On the orders of doubly transitive permutation groups, elementary estimates, J. Combin. Theory Ser. A 62 (1993), no 2, p. 361–366.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
182
[18]
H. A. HELFGOTT
, A CGFS-free analysis of Babai’s quasipolynomial GI algorithm, prépublication arXiv:1605.08266.
[19] D. K. Ray-Chaudhuri & R. M. Wilson – On t-designs, Osaka J. Math. 12 (1975), no 3, p. 737–744. [20] O. Schreier – Die Untergruppen der freien Gruppen, Abh. Math. Sem. Univ. Hamburg 5 (1927), no 1, p. 161–183. [21] C. C. Sims – Graphs and finite permutation groups, Math. Z. 95 (1967), p. 76–86. [22]
, Computational methods for permutation groups, in Computational Problems in Abstract Algebra, Pergamon, 1970, p. 169–184.
[23] B. Y. Weisfeiler & A. A. Leman – Privedenie grafa k kanoniqeskomu vidu i voznikaxa pri tom algebra, Nauqno-Tehniqeska Informaci 9 (1968), p. 12–16.
Harald Andrés HELFGOTT Universität Göttingen Mathematisches Institut Bunsenstrasse 3-5 D-37073 Göttingen Allemagne E-mail : [email protected]
ASTÉRISQUE 407
Séminaire BOURBAKI 69e année, 2016–2017, no 1126, p. 183 à 212 doi:10.24033/ast.1064
Janvier 2017
DERIVED GROTHENDIECK-TEICHMÜLLER GROUP AND GRAPH COMPLEXES [after T. Willwacher] by Maxim KONTSEVICH
INTRODUCTION The goal of my talk is to explain the result of Thomas Willwacher (see [11]) which relates two universal groups of symmetries introduced in early 90s. The first symmetry was defined by V. Drinfeld (called Grothendieck-Teichmüller group, or GT in short) as the group of automorphisms of the pro-nilpotent completion of the tower of braid groups (or, more precisely, braid groupoids). An element of the Lie algebra of the graded version GRT of GT is a Lie polynomial in two variables satisfying a complicated set of constraints. Group GT is closely related to the motivic Galois group of Z, and it also appears in a great variety of purely algebraic questions. It acts on various formality morphisms, associators, etc. Multiple-zeta values correspond to functions on a torsor over the GT. The second group (or more precisely, a differential graded Lie algebra) was defined under the name of “graph complex” in my work on universal symmetries of topological field theories of Chern-Simons type. A cohomology class in graph complex is represented by a finite linear combination of isomorphism classes of finite graphs endowed with an additional data called orientation. There are two graph complexes (even and odd) which differs by the notion of an orientation, depending on the parity of the dimension of the space-time manifold. Graph complexes acts as outer derivations (in the derived sense) of Lie superalgebras of functions on even/odd symplectic supermanifolds, and on rational homotopy types of spaces of embeddings of higher-dimensional spheres. The relation between GRT and the even graph complex was expected for a long time, as both symmetries act e.g., on the formality morphism in deformation quantization, see e.g., [9]. Still, it was not clear how to relate these two theories based on quite different combinatorial structures. In his breakthrough work T. Willwacher found a
© Astérisque 407, SMF 2019
184
M. KONTSEVICH
way to connect them using a generalization of some construction of mine which appeared in the proof of formality of little disks operads. This is a very powerful result, implying non-trivial vanishing results in certain range of parameters (cohomological degree and the weight) on both sides of the story. I will be concentrated in my talk on the calculational aspects, and not on various situations where GRT or graph complex act. The original proof from [11] is very involved, and contains several dozens of spectral sequences. I will explain the key argument of a streamlined shorter proof extracted from [5]. The first section serves as a short introduction to the basic notions of theory of operads, and of deformation theory. In the second Section I will explain why the derived symmetry group of Gerstenhaber operad could be considered as a derived version of Drinfeld’s group GRT. (Even) graph complexes and their relatives appear in the third section. The forth section contains the proof of the most essential part of Willwacher’s theorem, and some remarks and open questions. Finally, I finish the introduction with an example of universal symmetry, which appeared first with wrong coefficients in [9], and was recently corrected in [1]. Example: ζ(3) flow on Poisson structures The simplest non-trivial element of the Lie algebra of GRT (dual to ζ(3) = 1 n≥1 n3 ) is represented in the graph complex by the complete graph K4 on 4 vertices:
P
It produces an evolution equation (see Section 3.3) on the space of bivector fields P ∂ ∂ N α = ij αij ∂x , given by i ∧ ∂xi in an open domain U in the coordinate space R
d i1 i2 X α = ∂j1 j2 j3 αi1 i2 ∂j5 αj1 j4 ∂j6 αj2 j5 ∂j4 αj3 j6 + 6 ∂j1 j2 αi1 j3 ∂j4 j5 αj1 i2 ∂j6 αj2 j4 ∂j3 αj5 j6 dt j •
where t is the time variable, αij = −αji are C ∞ functions in U ×Rtime (components of tensor α depending on t); the summation is over 6 indices 1 ≤ j1 , j2 , j3 , j4 , j5 , j6 ≤ N . V2 The solution of this equation with any initial data α| ∈ Γ(U , TRN ) exists t=0 and unique as a formal power series in t (or as an analytic germ if the initial data α| is real-analytic). We claim that this equation has the following properties: t=0 P 1. if α| is a Poisson structure (i.e., the bracket {f, g}α := i1 i2 αi1 i2 ∂i1 f ∂i2 g t=0 satisfies Jacobi identity), then this property holds for all t, understood in the sense of formal series in t (i.e., we get a Poisson bracket on U with coefficients in R[[t]]),
ASTÉRISQUE 407
(1126)
GROUP GRT AND GRAPH COMPLEXES
185
2. Let α(t), β(t) be two Poisson structures depending on time t and obeying the above evolution equation. If at t = 0 bivector field α is obtained from β by a change of coordinates, then the same holds for any t, again understood in the sense of formal power series in t. The conclusion is that we obtain a (formal) flow on isomorphism classes of germs of Poisson structures. Up to now, in all known examples this flow on isomorphism classes is constant. Nevertheless, one can show that it is impossible to prove the triviality of the flow using only the universal tensor calculus involving Taylor coefficients of α.
1. TOOLKIT: OPERADS, ALGEBRAS, DEFORMATIONS 1.1. Operads and algebras Let k be a field of characteristic zero, denote by Vectk the tensor category of vector spaces over k. Any collection P = (P (n))n≥0 of k-linear representations of symmetric groups (Sn )n≥0 defines a polynomial endofunctor ΦP of the category Vectk via M ⊗n ΦP (V ) := P (n) ⊗ V ∀ V ∈ Ob (Vectk ). Sn n≥0
Obviously, polynomial endofunctors are closed under composition, hence form a monoidal category. Definition 1.1. — An operad P over k is a monoid in the monoidal category of polynomial endofunctors. An algebra over an operad is an algebra over the corresponding monad in Vectk . Unwinding the definition, one sees immediately that the structure of an operad on a collection (P (n))n≥0 of Sn -modules is uniquely determined by the identity element idP ∈ P (1) ⇐⇒ a morphism 1Vectk → P (1) and composition morphisms P (k) ⊗ (P (n1 ) ⊗ P (nk ))
→ P (n1 + · · · + nk )
satisfying certain compatibility constraints. Similarly, the structure of a P -algebra on vector space V ∈ Ob(Vectk ) is determined by the collection of Sn -equivariant maps P (n) ⊗ V
⊗n
→ V.
For any operad P and any integer n ≥ 0 the underlying vector space of Sn -representation P (n) coincides with the space of all natural transformations A⊗n → A defined universally for all P -algebras A. For any vector space V the free P -algebra generated by V coincides as a vector space with ΦP (V ). Basic examples of operads:
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
186
M. KONTSEVICH
– operads Comm, Assoc, Lie, Poisson describing respectively (non)-unital commutative associative, just associative, Lie or Poisson algebras, – for any unital associative algebra A define an operad PA by PA (1) := A, PA (n) := 0 for any n 6= 0; the category of PA -algebras coincides with the category of left A-modules, – for any vector space V define operad EndV by declaring EndV (n) := Hom(V ⊗n , V ) for any n ≥ 0; for any operad P a structure of a P -algebra on V is the same as a morphism of operads P → EndV . If P is one of classical operads Comm, Assoc, Lie, Poisson then we have P (0) = 0 (because we encode non-unital algebras), P (1) = k = 1Vectk and all operations are generated by binary ones (i.e., by P (2)) subject to appropriate bilinear relations. One has for any n ≥ 1 the following formula for the dimension: dim Comm(n) = 1, dim Assoc(n) = dim Poisson(n) = n!, dim Lie(n) = (n − 1)! Spaces P (n) for P = Comm, Assoc or Lie are spanned by operations if P = Comm, a1 a2 . . . an a1 ⊗ · · · ⊗ an 7→
aσ(1) aσ(2) . . . aσ(n) , σ ∈ Sn [a σ(1) , [aσ(2) , [. . . , [aσ(n−1) , an ] . . . ], σ ∈ Sn−1
if P = Assoc, if P = Lie.
Also, one has the following equivalence of polynomial endofunctors: ΦPoisson ' ΦComm ◦ ΦLie ' ΦAssoc . The first equivalence means that universal expression in Poisson algebras are products of universal Lie expressions. The second equivalence follows from the fact that the free unital associative algebra generated by a vector space V is the same as the universal enveloping algebra for the free Lie algebra g = ΦLie (V ) generated by V , and hence is naturally isomorphic (as a vector space) to the symmetric algebra generated by g, via Poincaré-Birkhoff-Witt isomorphism U g ' Sym g = 1Vectk ⊕ ΦComm (V ). Remark 1.2 (Colored operads). — There is a natural generalization of the language of operads and algebras to the case when algebraic structures under consideration consist not of one, but several distinct vector spaces. One can say that these spaces are “colored” by a set of colors. For example, there is a colored operad with two colors Algebra, M odule such that algebras over this colored operad are the same as pairs (A, M ) where A is an associative algebra over k and M is a left A-module. If I denotes the set of colors, then the components of an I-colored operad P are vector spaces P (i1 , . . . , in ; j), n ≥ 0, i1 , . . . , in , j ∈ I, encoding operations Vi1 ⊗. . . Vin → Vj , where (Vi )i∈I are colored components of an algebra over colored operad P . In this way the category of (one-colored) operads can be realized itself as the category of algebras over certain colored operad, whose set of colors is N = {0, 1, 2, . . .}.
ASTÉRISQUE 407
(1126)
GROUP GRT AND GRAPH COMPLEXES
187
The space of color n ∈ N is the n-th component P (n) of a (1-colored) operad P . More conveniently, using representation theory of symmetric groups in zero characteristic, one can make an alternative description with the set of colors corresponding to finite partitions. We will use later the latter description, for which the category of colored vector spaces is canonically equivalent to the category of collections P = (P (n))n≥0 of k-linear representations of symmetric groups (Sn )n≥0 (or, in other words, to the category of polynomial endofunctors of Vectk ). The one-colored operads will be algebras of certain partitions-colored operad Oper. If P = (P (n))n≥0 is a collection of (Sn )-representations, then the free operad ΦOper (P ) generated by P is given by the direct sum over certain types of trees of tensor products of components of P , factorized by the automorphism group of the tree. Instead of giving a formal description I will show a typical example from which the general structure should be clear. Consider the following tree: output
3 1
2
4
5
The corresponding term in the formula is ΦOper (P )(5) = · · · ⊕ P (0)⊗4 ⊗ P (2) ⊗ P (3) ⊗ P (6) S3 ⊕ · · · . 1.2. Operads in other symmetric monoidal categories Unwinding the definition of a (colored) operad (and an algebra over an operad) one can easily see that it makes sense in arbitrary symmetric monoidal category instead of Vectk . For us there will be important three such categories: – Top: topological spaces (with the tensor product given by the usual product), – VectZk : Z-graded vector spaces, – Compk : Z-graded complexes of vector spaces (with the differential of degree +1). In the last two cases the commutativity morphisms E • ⊗ F • → F • ⊗ E • are, as usual, twisted by the Koszul rule of signs. For any topological operad P = (P (n))n≥0 the collection of chain complexes (Chains• (P (n), k))n≥0 is a dg operad (i.e., an operad in Compk ) concentrated in degrees ≤ 0, and its (co)homology is an operad in VectZk . Also, one can associate with a dg operad another Z-graded operad just by forgetting the differential. Similarly, any Z-graded operad gives tautologically a dg operad with
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
188
M. KONTSEVICH
zero differential. In what follows the name “operad” without any adjective will mean tacitly a dg operad. For any operad P , denote by sP a new operad given by (1)
sP (n) := k[+1] ⊗ P (n) ⊗ k[−1]⊗n ' P (n)[1 − n]
where k[i] = k[1]⊗i is the one-dimensional space concentrated in degree (−i), so that for any P -algebra A the graded space A[1] = A ⊗ k[1] is a sP algebra. Remark 1.3 (Basic example). — Fix an integer d ≥ 1. A disk D = D(~c, r) ⊂ Rd is parametrized by its center ~c ∈ Rd and radius r > 0. We define topological operad Discd (little d-disks operad ) by declaring n o G Discd (n) := (~c1 , r1 ), . . . , (~cn , rn ) D(~ci , ri ) ⊂ D(~0, 1) , ∀n ≥ 1 i
and the composition given by inserting configurations of disks applying appropriate elements of the group Rd o R× >0 (parallel translations and dilations). In the case d = 1, space Discd (n) is the disjoint union of n! contractible spaces, and H• (Disc1 , k) = H0 (Disc1 , k) = Assoc. The homology operad H• (Disc2 , k) is a shifted version of operad Poisson, and is called the operad Ger of Gerstenhaber algebras. By definition, a Ger algebra is a commutative associative algebra A in VectZk , endowed with a bracket { , } : A⊗A → A of degree −1, satisfying two properties: – for every a ∈ Ai , i ∈ Z, the bracket {a, ?} : A → A is a derivation of A in the graded sense, – bracket { , } induces a Lie bracket on the graded space A[1]. Vi • i Polyvector fields Tpoly (X), Tpoly (X) := Γ(X, TX ) on any manifold X (C ∞ , analytic, affine algebraic, . . . ) form a Ger algebra, with the usual cup-product and the Schouten-Nijenhuis bracket. Similarly to the operad Poisson, one has dim Ger(n) = n! ∀n > 0 and the space Ger(n) of n-linear Ger expressions consists of products of shifted Lie expressions: ΦGer ' ΦComm ◦ Φs−1 Lie . Operad Ger will be the main object of interest in this text. Homology operad H• (P , k) of any topological operad P carries an additional structure: every component of this Z-graded operad is a cocommutative coassociative counital coalgebra (the same is true in the homotopy sense for the operad of chains). This implies that tensor product of any finite collection of H• (P , k)-algebras is endowed with a natural structure of an H• (P , k)-algebra (hence such algebras form a symmetric monoidal category). A usual name for such graded (or more generally, dg)
ASTÉRISQUE 407
(1126)
GROUP GRT AND GRAPH COMPLEXES
189
operads is cocommutative Hopf operads. One considers cocommutative Hopf operads as algebraic analogs of topological operads. 1.3. Resolutions Definition 1.4. — For a dg operad P , an algebra V over P is called quasi-free if it is free as an algebra over P with the forgotten differential, and one can choose a space of free generators G endowed with a complete increasing filtration [ G= G≤n , 0 = G≤0 ⊂ G≤1 ⊂ · · · n≥0
such that for any n ≥ 1 the subspace dG≤n ⊂ V belongs to the subalgebra generated by G≤(n−1) . A resolution of an algebra U is a quasi-free algebra U 0 and a morphism U 0 → U inducing a quasi-isomorphism of underlying complexes. It is easy to show using an inductive procedure that any algebra U admits a resolution. Moreover, any two resolutions are quasi-isomorphic over U . One can define homotopy category of P algebras (ignoring set theory problems) as the localization of the category of P -algebras by quasi-isomorphisms. Quasi-free algebras serve as convenient cofibrant models for which sets of morphisms up to homotopy (or even better, appropriate Kan simplicial sets of morphisms) can be defined directly avoiding set-theoretic difficulties and/or the use of universes. In Section 1.8 we will provide the reader with the resolutions of classical operads, and of algebras over these operads. In particular, operad Lie has a standard resolution by dg operad denoted Lie∞ whose free generators are totally antisymmetric operations mn , n ≥ 2 of degree 2 − n. 1.4. Deformation theory via Lie∞ -language A general principle of derived algebra says that with any object defined using dg language one can associate a canonical (up to quasi-isomorphism) deformation complex which carries a structure of sLie∞ -algebra (i.e., a Lie∞ algebra shifted by [1]). Definition 1.5. — A structure of sLie∞ -algebra on a complex T = T • ∈ Compk is a coderivation d of degree +1 of graded cocommutative coassociative coalgebra Sym+ (T ) := T ⊕ Sym2 (T ) ⊕ Sym3 (T ) ⊕ · · · endowed with the shuffle coproduct, such that d2 = 0 and d induces the original differential on T ⊂ Sym+ (T ).
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
190
M. KONTSEVICH
Passing to the dual space to Sym(T ) := k ⊕ Sym+ (T ) we obtain the algebra of formal power series at 0 ∈ T , i.e., the algebra of functions on an infinite-dimensional formal Z-graded supermanifold. Definition 1.5 says geometrically that the odd vector field ξ corresponding to d has degree +1, vanishes at the base point 0 and satisfies [ξ, ξ] = 0. An important tool is the homotopy transfer: for any two complexes T, T 0 , two morphisms α : T → T 0 , β : T 0 → T and two homotopies H : T → T, H 0 : T 0 → T 0 of degree −1 such that dT H + HdT = idT − β ◦ α, dT 0 H 0 + H 0 dT 0 = idT 0 − α ◦ β, one can transfer by certain explicit formula an sLie∞ -structure from T to T 0 . Moreover, these two structures are equivalent in the derived sense. The trouble with the homotopy transfer is that it gives usually very complicated formulas which is hard to untangle. Below we will describe some explicit models of deformation complexes. 1.5. Deformation complex of a morphism of algebras Let A → B be a morphism of algebras over a (dg-)operad P . Let us choose any resolution A0 → B where as Z-graded algebra A0 = ΦP (G) for some filtered space G ∈ VectZk , as in the Definition 1.4. Then the model for Def (A → B) is graded space Y Hom(G, B) := HomVectZk (G, B) ∈ VectZk , Homi (G, B) := Hom(Gj , B i+j ). j +
The coderivation on Sym (T ), T := Hom(G, B) is defined as follows. The composition morphism A0 → A → B defines a map of Z-graded spaces φ : G → B. The formal Z-graded supermanifold parametrizing morphisms of algebras A0 → B formally close to the initial morphism, is the same as the formal neighborhood of φ ∈ T because A0 is free and any morphism from A0 is uniquely determined by its restriction to generators. Derivations dA0 , dB of algebras A0 , B define an odd vector field ξ on the formal neighborhood of φ vanishing at φ and satisfying [ξ, ξ] = 0. Finally, we identify the formal neighborhood of φ ∈ T 0 ⊂ T with the formal neighborhood of 0 ∈ T by the shift. 1.6. Analogy with spaces of maps Let (X, x) and (Y, y) be two pointed topological spaces. We assume that X is a finite CW-complex and Y is k-connected for some k ≥ dim X. Then the space of maps M := Maps (X, x), (Y, y) is connected and has canonical base point m ∈ M given by the constant map X → {y} ∈ Y . We claim that in such a situation we have morally a “convergent spectral sequence” (2)
L RHom H• (X, x; Z), π• (Y, y) ' H • (X, x; Z) ⊗Z π• (Y, y) =⇒ π• (M, m).
ASTÉRISQUE 407
(1126)
GROUP GRT AND GRAPH COMPLEXES
191
Strictly speaking, this statement does not make much sense as homotopy groups do not form an object of the derived category D(Z−mod) of abelian groups (and for k = 0 the group π1 (Y, y) is not always abelian). Here is the heuristic argument: “Proof ”. — Induction by cells: in the initial case X = {x}, one has M = {m} and H• (X, x; Z) = 0 = π• (M, m). If X 0 = X ∪f Di is obtained from X by gluing a cell of dimension i ≤ k for some map f : S i−1 = ∂Di → Y , then the mapping space M 0 := Maps (X 0 , x), (Y, y) is fibered over M with fiber Maps (Di , ∂Di ), (Y, y) = Ωi (Y, y). The exact sequence of homotopy groups for fibrations provides the induction step. D. Quillen discovered an equivalence between the homotopy category of pointed simply connected Q-local spaces (i.e., all reduced homology groups with Z-coefficients are Q-modules), and the homotopy category of dg Lie algebras over Q concentrated in negative degrees. If (X, x) is such a space, then π• (X, x)[−1] is equal to the cohomology of the underlying complex of the corresponding Lie algebra. Cells of a finite CW complex X give generators of the Lie algebra for the rational completion of X. If X is a finite CW complex but Y is not dim(X)-connected, in the above inductive procedure one should truncate non-topological components whose cohomological dimension is strictly positive (and governed by deformation theory). We will see later that sometimes it is possible to overcome the dimension constraint working in derived algebra instead of topology.
1.7. Deformation complex of an algebra For a P -algebra A, in order to describe (a model of) deformation complex of A it is sufficient to find a resolution A0 → A where A0 = ΦP (G) as a graded space. We define a model of Def(A) as g[1], g := DerVectZk (A0 ) ' Hom(G, A0 ). Here g is the dg Lie algebra of derivations of A0 . It carries a canonical Lie∞ structure with m1 , m2 given by the differential and the bracket in g, and with m≥3 = 0. Using homotopy transfer one can transfer sLie∞ -structure on Hom(G, A0 )[1] to one on Hom(G, A)[1]. The latter space is obtained by shift from the model for the deformation complex of the identity morphism idA : A → A as was described above. One can show that the differentials in Hom(G, A)[1] coming from two deformation problems, coincide (up to shift). The structure of higher brackets on Hom(G, A)[1] is more obscure.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
192
M. KONTSEVICH
1.8. Resolutions of classical operads and canonical resolution of algebras It is known that all classical operads admit nice explicit resolutions: Comm ' Oper (k[−1] ⊗ sLie(n)∗ )n≥2 , Assoc ' Oper (k[−1] ⊗ sAssoc(n)∗ )n≥2 , Lie ' Oper (k[−1] ⊗ sComm(n)∗ )n≥2 , Poisson ' Oper (k[−1] ⊗ sPoisson(n)∗ )n≥2 , Ger ' Oper (k[−1] ⊗ s2 Ger(n)∗ )n≥2 , where free operads on the r.h.s. are endowed with appropriate differentials. For example, vector space Lie(n) for n ≥ 2 is equal to the top degree cohomology of the complex spanned by trees with n + 1 labeled leaves (inputs from 1 to n, and an output) and ≥ 1 inner vertices of valency ≥ 3. Here is the resolution of 2-dimensional space Lie(3): output
output
−→ 1
2
3
3 1
output
⊕
2
⊕
2 1
output
3
1 2
3
Similarly, the Koszul duality pattern from above extends to certain construction of canonical resolutions of algebras over classical operads. For example, any dg Lie algebra g has a canonical resolution ΦLie (G) (with an appropriate differential), whose space of generators is ! 2 M ^ ∗ ⊗n Sn (3) G := sComm(n) ⊗ g =g⊕ g [1] ⊕ · · · . n≥1
Similar formulas work for Comm, Assoc, Poisson. For a Ger-algebra A the space of S n L generators of the Koszul resolution is n≥1 s2 Ger(n)∗ ⊗ A⊗n . For convenience we show table of dimensions of graded components of operad Ger: −6
−5
−4
−3
−2
−1
0
1
1
2
2
3
1
3
11
6
1
4
(4) 6
ASTÉRISQUE 407
(1126)
GROUP GRT AND GRAPH COMPLEXES
193
and of generators of its resolution: −6
−5
−4
−3
−2
(5) 1
6
1
3
11
6
−1
0
1
1
2
2 3 4
Here the horizontal coordinate: . . . , −2, −1, 0 denotes Z-grading (cohomological degree), and the vertical one: 2, 3, 4 . . . denotes the arity of operations (number n for P (n)).
2. DERIVED GROTHENDIECK-TEICHMÜLLER GROUP 2.1. Deformation complex of operad Ger From now on we will assume that the ground field k = Q. General consideration from Section 1.7 and the standard resolution from Section 1.8 gives a model for the deformation complex of operad Ger Y S Def (Ger) ' (Ger(n) ⊗ Ger(n)) n [4 − 2n], certain sLie∞ -structure . n≥2
Looking at (4) we see immediately that the above complex is concentrated in degrees ≥ −2. It is hard to write higher compositions, as it is based on the homotopy transfer technique. Nevertheless, one can write explicitly a formula for the differential. It coincides (up to shift) with the differential on Y id S Def (Ger → Ger) ' (Ger(n) ⊗ Ger(n)) n [3 − 2n], another sLie∞ -structure . n≥2
The latter is in fact a sLie algebra, and can be described explicitly as follows: interpret graded vector space (notice that we add below a summand corresponding to n = 1) M S (Ger(n) ⊗ Ger(n)) n [2 − 2n] n≥1
as the space of universal polynomial vector fields on the shifted tensor product A⊗B[2] of two arbitrary Ger algebras A, B. Namely, any element X S φ= uα ⊗ vα ∈ (Ger(n) ⊗ Ger(n)) n [2 − 2n] α
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
194
M. KONTSEVICH
P gives a vector field whose velocity ψ˙ at point ψ = i ai ⊗ bi is X X ψ˙ = ±uα (ai1 ⊗ · · · ⊗ ain ) ⊗ vα (bi1 ⊗ · · · ⊗ bin ), α i1 ,...,in
where the signs are determined by the Koszul rule. The space of such vector fields is closed under the Lie bracket, and we get a graded Lie algebra. The differential is given by the commutant [Q, ?] with the vector field Q of degree +1, [Q, Q] = 0 given by 1 Q: ψ˙ = {ψ, ψ}. 2 Here we use the fact that the tensor product of Ger algebras is again a Ger algebra, and any Ger algebra carries after shift a structure of a Lie algebra via the canonical morphism of operads s−1 Lie → Ger. The differential (but not sLie∞ structure) on our model of Def(Ger) is obtained by taking the natural complement to 1-dimensional space Ger(1) ⊗ Ger(1) (corresponding . to the Euler vector field ψ= ψ), and replacing the direct sum by the direct product. 2.2. Cocommutative Hopf version Operad Ger is defined as the homology of a topological operad Disc2 , hence it is a cocommutative Hopf operad. One can develop a general deformation theory of such operads. The answer for Ger is the following (see [11]): Y (6) Def(Ger as a cocommutative Hopf operad) = (Ger(n) ⊗ tn )Sn [5 − 2n], n≥2
where tn is a Drinfeld-Kohno Lie algebra, a version of pro-nilpotent completion of the pure braid group Braidn , the fundamental group of Disc2 (n) ' Conf n (C) := {(z1 , . . . , zn ) ∈ Cn |zi 6= zj for i 6= j} ' K(Braidn , 1). Recall that tn has the following presentation: Generators: tij = tji , 1 ≤ i, j ≤ n, i 6= j, Relations: [tij , tjk ] = [tjk , tki ] = [tki , tij ], [tij , tkl ] = 0 if all i, j, k, l are distinct. As a side remark, here we have again an example of Koszul duality: tn has a resolution by the free Z-graded Lie algebra generated by H0 (parallel translations and dilations) for any n ≥ 2 acts freely on the n-th configuration space Conf n (Rd ) := (Rd )n − Diagonals . (d)
We denote by Cn
the quotient space.
Definition 2.2. — For any n ≥ 2 define topological space F Md (n) as the compact2 (d) ification of the image of Cn by the inclusion map to (S d−1 )n(n−1) × [0, +∞]n(n−1) given by ! ~xi − ~xj |~xi − ~xj | (~x1 , . . . , ~xn ) 7→ . , |~xi − ~xj | i6=j |~xi − ~xk | i6=j,k It is known that F Md (n) is a smooth compact manifold with corners, of dimension (d) nd − (d + 1), with the interior equal to Cn . Strata of F Md (n) are parametrized by trees with the set of leaves labeled by {1, . . . , n} ∪ {output}, and every stratum is (d) canonically isomorphic to the product of Cnv where numbers (nv + 1) are valencies of inner vertices of the tree. Hence we get a structure of an operad (for n = 1 we set F Md (1) := {point}), and set-theoretically it looks as a free operad generated by the (d) collection of sets (Cn )n≥2 endowed with Sn -actions. Remark 2.3. — Poincaré duality explains naturally Koszul resolutions for operads Assoc = H• (Disc1 ) and Ger = H• (Disc2 ). Namely, the natural stratification on F Md (n), n ≥ 2, gives a spectral sequence converging to H• (F Md (n)) whose first page is M M ∗ H• (σ, ∂σ; Q) = (H• (σ; Q)) [dim σ]. strata σ
strata σ
This spectral sequence degenerates at the first page and gives the resolution. In the case d = 1 the space F Md (n), n ≥ 2 is the disjoint union of n! copies of the n-th Stasheff polytope. In general, generators of the Koszul resolution of the op(d) erad H• (Discd ) is the collection of Sn -modules H•BM (Cn )) for all n ≥ 2, where
ASTÉRISQUE 407
(1126)
197
GROUP GRT AND GRAPH COMPLEXES
H•BM denotes Borel-Moore homology (i.e., reduced homology of the one-point compactification). Let us return to the “topological interpretation” of complex (7). Let us consider the space of automorphisms of the operad F M2 . We can build it inductively, considering at n-th step automorphisms defined only on components F M2 (< n) and preserving partially defined compositions. Making the induction step we should consider automorphisms of F M2 (n) which are Sn -equivariant and equal to the identity map on the boundary ∂F M2 (n). Therefore, we obtain a spectral sequence with terms Sn π• Selfmaps (F M2 (n), rel ∂F M2 (n)) . For the latter we will use the spectral sequence as in (2) starting with (9) Sn S (H • (F M2 (n), ∂F M2 (n)) ⊗ π0 quand K = 0 et N < ∞ ; v(x) = e−Kx /2 quand N = ∞. (Quand N ∈ N, on peut voir X K,N comme la projection d’une sphère sur l’un de ses axes ; en particulier, le profil isopérimétrique de X K,N est le même que celui de S K,N .) Milman [70] effectue une discussion plus détaillée incluant non seulement l’inégalité de courbure-dimension, mais aussi une borne sur le diamètre. Remarque 1.6. — Dans le droit fil des remarques 1.4 et 1.5, l’inégalité de LévyGromov peut se généraliser à toute variété riemannienne vérifiant le critère de courbure-dimension CD(K, N ) avec K > 0, y compris pour N = ∞ [14, 70] ; et l’on peut aussi traiter K ≤ 0 si l’on impose une borne sur le diamètre [17, 70]. Remarque 1.7. — On peut mettre en regard le principe de comparaison de LévyGromov (en courbure minorée) avec la conjecture de Cartan-Hadamard (en courbure majorée). Cette dernière postule que le profil isopérimétrique non normalisé des variétés simplement connexes de dimension n et de courbures sectionnelles négatives (resp. ≤ κ < 0) est minoré par celui de l’espace euclidien En (resp. de l’espace hyperbolique de dimension n et courbure κ). Je ne dirai rien de plus sur cette conjecture, si ce n’est qu’une étude récente l’aborde par le transport optimal [62]. Preuve du théorème 1.1. — Soit A un sous-ensemble mesurable de M , et soit α = ν[A]. Si α ∈ {0, 1} on a σ + [B] = 0, et la conclusion est évidente ; on supposera donc 0 < α < 1. La théorie géométrique de la mesure assure que, parmi tous les ensembles mesurables A0 tels que ν[A0 ] = α, il en existe au moins un, disons A0 , qui minimise ν + [∂A] ; de plus les théorèmes de régularité d’Almgren [2] assurent que A0 est lisse en dehors d’un ensemble singulier (∂A0 )s ⊂ ∂A0 , négligeable (vide si n ≤ 7, de dimension au plus n − 8 si n ≥ 8). En outre, (a) la courbure moyenne de A0 , mesurée le long de la partie régulière de ∂A0 , est constante ; (b) l’ensemble singulier (∂A0 )s peut être caractérisé comme l’ensemble des points de ∂A0 en lesquels le cône (positif) tangent à A0 n’est pas inclus dans un demi-espace ; (c) ν + [∂A0 ] = ν + [∂(M \A0 )], et la mesure ν + induite sur ∂A0 par A0 ou par M \A0 est la même ; (d) ν + [(∂A0 )s ] = 0. Avant de commenter ces propriétés, notons w la fonction normale intérieure à A0 : elle est définie globalement sur ∂A0 en dehors de l’ensemble singulier (∂A0 )s . On rappelle que la courbure moyenne η quantifie la variation de la surface visà-vis de petites déformations. Plus précisément, soit A un sous-ensemble mesurable d’une variété M de dimension n ; comme la notion est locale, on supposera même que M = En . Soit x0 un point régulier de ∂A, O un voisinage de x où ∂A s’écrit
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
219
comme un graphe, f une fonction lisse définie sur ∂A, alors dans O on pourra écrire, pour ε > 0 assez petit, Z + + vol ∂(A + εf w) = vol [∂A] − (n − 1) ε f (x) η(x) ν + (dx) + o(ε). ∂A
On généralise ainsi la notion de courbure extrinsèque introduite par S. Germain pour une surface plongée dans E3 , à savoir la moyenne des deux courbures principales. On rappelle également la notion de cône tangent ; là aussi, on se contente de la définir pour un sous-ensemble de l’espace euclidien. Soient donc A ⊂ En , x ∈ ∂A ; on appelle direction tangente à A, issue de x, un vecteur unitaire v qui est limite d’une suite (yk − x)/|yk − x| avec yk ∈ A, yk 6= x, yk → x. Le cône tangent à A en x est alors l’ensemble des demi-droites issues de x et dirigées par une de ces directions tangentes. En un point régulier, le cône tangent est un demi-espace ; pour une singularité « sortante », il pourra être strictement inclus dans un demi-espace (penser au coin d’un cube). En revanche, un cône à deux nappes n’est inclus dans aucun demi-espace, et on peut dire qu’il est « de part et d’autre de la singularité ». Le résultat d’Almgren dit qu’un ensemble minimisant est situé de part et d’autre de n’importe lequel de ses points singuliers ; cela nous rappelle que l’archétype d’une telle singularité est le cône minimal x21 + · · · + x24 = x25 + · · · + x28 (équation de ∂A0 ) en dimension 8. On reprend maintenant le fil de la preuve. L’idée est de définir une fibration de A0 par des géodésiques issues de points réguliers de ∂A0 : à chaque x ∈ A0 on ferait correspondre sa projection sur ∂A0 . Cependant il pourrait se faire, a priori, que l’ensemble singulier de ∂A0 corresponde à un ensemble de mesure positive dans A0 ... Le lemme suivant, basé sur la caractérisation (b) ci-dessus, écarte cette possibilité. Lemme 1.8. — Pour presque tout x ∈ M , la distance entre x et ∂A0 est atteinte en un unique point régulier y ∈ ∂A0 , que l’on appellera projection géodésique de x sur ∂A0 . La géodésique joignant y à x est orthogonale à ∂A0 . Donc, pour presque tout x ∈ M on trouve une unique projection géodésique y sur ∂A0 , et c’est un point régulier. Si x ∈ A0 on a x = expy (Lw(y)), si x ∈ M \ A0 on a x = expy (−Lw(y)), avec dans les deux cas L = d(x, y). Pour tout y point régulier de ∂A0 , définissons maintenant les temps de coupure t± C (y) comme ceux où la géodésique issue de y avec vitesse ±w(y) cesse d’être minimisante : n t± (y) = sup T > 0; pour tout t ∈ [0, T [, C o expy (±tw(y)) admet y pour projection géodésique .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
220
C. VILLANI
+ L’application F : (t, z) 7−→ expz (tw(z)) est bien définie et lisse dans {]t− C (z), tC (z)[, z} pour z ∈ ∂A0 au voisinage de chaque point régulier y ; on l’appellera application exponentielle issue orthonormalement de ∂A0 . Elle atteint tout A0 et tout M \ A0 à un ensemble négligeable près. D’où les formules Z Z t+ C (y) + (8) ν[A0 ] = J (y, t) dt ν (dy), ∂A0
Z
0
Z
t− C (y)
ν[M \ A0 ] =
J (y, −t) dt ν ∂A0
+
(dy),
0
où les intégrales sur ∂A0 sont restreintes aux points réguliers, et J (y, t) est le déterminant jacobien de l’application F (t, ·) en y. (C’est un résultat classique que J (y, t) + reste strictement positif pour t ∈] − t− C (y), tC (y)[.) Pour estimer le déterminant jacobien, on peut appliquer le principe de comparaison de Heintze-Karcher [54], qui en fait était déjà connu de Lévy dans ce cas particulier : Lemme 1.9. — Dans une variété M de dimension n, vérifiant Ric ≥ Kg, K > 0, soit H une hypersurface orientée de courbure moyenne constante égale à η. Alors, pour t ≥ 0, le déterminant jacobien de l’application exponentielle issue orthonormalement de H vérifie J (x, t)
≤ Jη (t),
où Jη (t) est le déterminant jacobien de l’application exponentielle sur la sphère S K,n , issue orthonormalement de ∂Bη , et Bη est la boule de courbure moyenne η dans la sphère de référence S K,n . Cette inégalité a lieu pour tout t inférieur ou égal au rayon de Bη . Définissons maintenant R(A0 ) = sup d(x, ∂A0 ) = sup t+ C (y); x∈A0
y∈∂A0
− on a une formule similaire pour R(M \ A0 ) en changeant simplement t+ C en tC . Par ailleurs, R(Bη ) coïncide avec le rayon de Bη au sens usuel, et S \ Bη n’est autre que B−η . Tout pris en compte,
R(A0 ) ≤ R(Bη ),
R(M \ A0 ) ≤ R(B−η ).
Combinant cela avec le lemme 1.9, on conclut que Z R(Bη ) σ[Bη ] + + ν[A0 ] ≤ ν [∂A0 ] Jη (t) dt = ν [∂A0 ] , σ + [∂Bη ] 0 Z R(B−η ) σ[B−η ] + + ν[M \ A0 ] ≤ ν [∂A0 ] J−η (t) dt = ν [∂A0 ] . σ + [∂B−η ] 0
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
221
(On a utilisé ν + [∂(M \ A0 )] = ν + [∂A0 ].) Donc σ + [∂B−η ] σ + [∂Bη ] , ν[M \ A0 ] ν + [∂A0 ] ≥ max ν[A0 ] σ[Bη ] σ[B−η ] IS (v) IS (1 − v) = max α , (1 − α) , v 1−v où v = σ[Bη ] et IS est la fonction σ[Bη ] 7−→ σ + [∂Bη ]. (Il résultera de la preuve que IS est bien le profil isopérimétrique de S.) Lemme 1.10. — Si S = S K,N est la sphère de référence de paramètres K et N , alors la fonction IS vérifie l’inégalité différentielle 00
(9)
IS IS
+
(IS0 )2 + K = 0. N −1
En particulier, IS est concave. (C’est un cas très particulier d’un théorème bien plus délicat, selon lequel le profil isopérimétrique normalisé d’une variété compacte de courbure positive est concave.) Comme par ailleurs IS (0) = IS (1) = 0, et I (1 − v) = I (v), on conclut que pour tout v ∈ [0, 1], IS (1 − v) IS (v) , (1 − α) ≥ IS (α). max α v 1−v (Écrire v comme combinaison convexe, soit de 0 et α si v < α, soit de α et 1 si v > α.) Enfin on achève la preuve du théorème 1.1 en se rappelant que, par construction, ν + [∂A] ≥ ν + [∂A0 ].
Bη −w w A0
Figure 1. Principe de la preuve de Lévy-Gromov : A0 est un minimiseur pour l’isopérimétrie dans M ; w est la normale le long de ∂A0 ; on recouvre M par des courbes issues du bord de A0 avec vitesse ±w. Dans la sphère de référence, Bη est une boule de même courbure moyenne que A0 ; et l’on recouvre la sphère par des courbes issues de ∂Bη .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
222
C. VILLANI
Remarque 1.11. — Comme on l’a vu, la preuve repose de façon importante sur les résultats de régularité subtils dus à Almgren. En fait, Lévy considérait le problème variationnel inf{ν[Aε ]; ν[A] = α} ; mais l’existence d’un ensemble minimisant suffisamment régulier n’est alors pas garantie, alors que pour la minimisation de la surface on a accès à de bons théorèmes de régularité. (Gromov crédite Allard pour avoir fourni les références pertinentes dans ce domaine.) Cependant, le profil isopérimétrique est une notion qui ne demande pas ou presque pas de régularité [55], et qui est même stable pour des topologies n’exigeant aucune régularité, comme la topologie de Gromov-Hausdorff mesurée. (Plus précisément [43], si Mk → M dans cette topologie, et que pour tout k on a IMk ≥ f , où f est une fonction croissante continue sur [0, 1/2], alors IM ≥ f .) On est donc en droit de souhaiter une preuve qui s’applique dans un cadre bien plus général. Un autre point saillant de la preuve est que l’on ne travaille pas directement sur l’ensemble A, mais sur un ensemble extrémal A0 ; même si cela est bien sûr légitime, il serait intéressant, par exemple pour mieux comprendre les termes d’erreur, de pouvoir manipuler A directement. Dans la suite de l’exposé nous verrons comment remplir ces deux objectifs. Pour finir, on présente brièvement les preuves des lemmes auxiliaires utilisés dans la démonstration du théorème 1.1. Le premier relève de l’analyse non lisse, le second de la géométrie riemannienne, et le dernier d’un calcul « explicite » dans l’espace modèle. Preuve du lemme 1.8. — Le début du raisonnement est classique. Soit x ∈ M , soit y ∈ ∂A0 tel que d(x, ∂A0 ) = d(x, y), et soit γ une géodésique de vitesse constante unitaire, de longueur L = d(x, y), joignant y = γ(0) à x = γ(L). La définition de la distance à ∂A0 et la classique formule de variation des distances montrent que pour x0 ' x,
d(x0 , ∂A0 ) ≤ d(x0 , y) ≤ d(x, y) + γ(L), ˙ x0 − x + o(d(x, x0 )), où le produit scalaire est fourni par gx , et j’ai noté abusivement x0 − x le vecteur z de norme minimale tel que expx z = x0 (dans une carte, z est bien égal à x0 − x, à des corrections d’ordre supérieur près). Le vecteur γ(L) ˙ est donc un sur-gradient de la fonction f : x 7−→ d(x, ∂A0 ). Cependant, f est lipschitzienne (et même semi-concave), donc différentiable en dehors d’un ensemble négligeable N . Pour tout x ∈ M \ N , la fonction f admet un unique sur-gradient en x (c’est le gradient) ; cela détermine uniquement γ(L) ˙ et donc γ. La sphère géodésique S centrée en γ(L/2), de rayon L/2, intersecte donc ∂A0 seulement en y ; il s’ensuit que le cône tangent à A0 en y est inclus dans le demiespace tangent extérieurement à S . (Noter que y n’est pas situé dans le lieu de coupure
ASTÉRISQUE 407
(1127)
223
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
de γ(L/2), car sinon γ(L/2) serait situé dans le lieu de coupure de y.) Comme A0 est un ensemble minimisant, on conclut de la propriété (b) que y est un point régulier. ∂A0
y
γ
x γ(L) ˙
Figure 2. Preuve de ce que presque toute projection y sur ∂A0 est un point régulier : la sphère géodésique de diamètre γ([0, L]) est tangente à ∂A0 .
Preuve du lemme 1.9 (esquisse). — Soit γ(t, x) l’application géodésique orthonormale issue de H. On peut écrire γ(t, x) = expx (−t∇x d(x, ∂H)), où d est la distance signée à H (bien définie par l’orientation). La différentielle de γ(t, x) dans la variable x s’identifie à une matrice (n − 1) × (n − 1) de champs de Jacobi (ou variations de géodésiques), notée J(t) et vérifiant l’équation différentielle de Jacobi ; c’est le même calcul que pour le déterminant jacobien d’une application de la forme expx (t∇ψ(x)), sauf que l’on ne considère que des variations tangentes à H, donc orthogonales à la direction du mouvement géodésique. Le déterminant de J(t), que je noterai J ⊥ (c’est le J⊥ de [90, chapitre 14]), n’est autre que le déterminant jacobien de l’application exponentielle issue orthonormalement de H, et mesure la distortion « transversale au mouvement ». On prouve, au moyen de l’équation de Jacobi, 1 1 K d2 ⊥ n−1 ⊥ n−1 J + J ≤ 0, (10) 2 dt n−1 avec égalité pour la sphère S K,n . Par ailleurs, la courbure moyenne s’exprime (à un facteur de normalisation près) comme la dérivée initiale de ce déterminant jacobien : d 1 ⊥ ⊥ (11) J (x, 0) = 1; η=− J (x, t). n − 1 dt t=0
Pour conclure, il suffit de noter que l’inégalité différentielle f¨ + Λf ≤ 0 vérifie un principe de comparaison : f¨ + Λf ≤ g¨ + Λg,
f (0) = g(0),
f˙(0) = g(0) ˙
=⇒ f (t) ≤ g(t) 1
tant que g(t) reste positif. On peut donc comparer les quantités (J ⊥ ) n−1 sur H et sur ∂Bη , jusqu’à l’annulation de Jη . Sur ∂Bη , le temps de coupure coïncide avec le
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
224
C. VILLANI
premier temps où le déterminant jacobien s’annule, et c’est aussi le rayon de Bη . Ceci achève la preuve. p Preuve du lemme 1.10. — On note I = IS . Soient R = (π/2) (N − 1)/K et p RR f (x) = cosN −1 ( K/(N − 1) x)/Z, où Z = Z(K, N ) est choisi de sorte que −R f = 1. Rx On pose F (x) = −R f (s) ds : c’est le volume normalisé d’une calotte sphérique de rayon x + R dans S K,N , et la définition de I implique I (F (x)) = f (x). En dép p rivant on obtient I 0 (F (x)) = f 0 (x)/f (x) = − K(N − 1) tan( K/(N − 1) x), p et en dérivant à nouveau, I 00 (F (x))f (x) = −K[1 + tan2 ( K/(N − 1) x)] = −K[1 + I 0 (F (x))2 /(K(N − 1))], ce qui établit l’équation souhaitée. On note que la même inégalité différentielle est vérifiée dans l’espace modèle X K,N de la remarque 1.5.
2. THÉORIE SYNTHÉTIQUE DE LA COURBURE DE RICCI À partir du milieu des années 2000, plusieurs théories se sont développées pour capturer les propriétés fondamentales de la courbure de Ricci dans un cadre non lisse. Au lieu d’utiliser des exponentielles riemanniennes de champs de vecteurs, ces méthodes reposaient sur le transport optimal entre mesures : une méthode « non lisse » pour engendrer des familles de géodésiques. On peut distinguer deux approches principales, étroitement liées : (a) l’étude de l’évolution de la concentration le long du transport optimal, prenant la distance et le volume comme éléments de base ; (b) l’étude du taux de contraction du flot de la chaleur en distance de transport optimal, prenant la distance et l’équation de diffusion comme éléments de base. Dans un cadre lisse, l’article de Sturm et Von Renesse [84] présentait de nombreux critères relevant des catégories (a) ou (b). Par la suite c’est l’approche (a) qui a été la plus étudiée et je m’y limiterai ici ; je noterai seulement que pour les espaces métriques « riemanniens » l’équivalence entre les deux approches a été soigneusement établie [19]. Dans cette section, je vais résumer à grands traits une décennie de recherche en la matière, renvoyant à l’article de synthèse [91] pour un survol historique un peu plus large. Par simplicité, et parce que ce cadre suffira pour l’inégalité de Lévy-Gromov, je me limiterai, sauf mention expresse, à des espaces métriques compacts ; cependant la théorie peut se développer dans les espaces métriques localement compacts et σ-compacts [3, 66, 90].
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
225
2.1. Principe et heuristique Commençons par quelques définitions. Un espace géodésique (X , d) est un espace métrique dans lequel deux points quelconques sont reliés par au moins une géodésique, c’est-à-dire une courbe lipschitzienne γ : [0, 1] → (X , d) dont la longueur L(γ) coïncide avec la distance d(γ(0), γ(1)). On rappelle que Z 1 d γ(t), γ(t + ε) L(γ) = |γ(t)| ˙ dt, |γ(t)| ˙ := lim sup . ε ε↓0 0 On parle d’espace géodésique mesuré quand on adjoint à un espace géodésique (X , d) une mesure de Borel finie sur les compacts. Un cas particulier est celui d’une variété riemannienne complète que l’on munit de sa distance géodésique et de son volume riemannien. Soit (X , d, ν) un espace géodésique mesuré ; on note P (X ) l’espace des mesures de probabilité boréliennes sur (X , d), et P ac (X ) le sous-espace fait des mesures absolument continues par rapport à ν. On introduit alors sur P (X ) : – une notion de concentration relative à ν : l’information de Boltzmann-Shannon, Z dµ Hν (µ) = ρ log ρ dν, ρ= dν (on posera Hν (µ) = +∞ si µ n’est pas absolument continue) ; – une notion de distance entre mesures : 1/p ZZ p (12) Wp (µ0 , µ1 ) = inf d(x0 , x1 ) π(dx0 dx1 ) , π∈Π(µ0 ,µ1 )
où Π(µ0 , µ1 ) est l’espace des π ∈ P (X × X ) dont les marginales (projections) sont µ0 et µ1 , et p ∈ [1, ∞[ est un paramètre. Aussi bien pour la théorie que pour les applications, ce sont les cas p = 1 et p = 2 qui ont, de très loin, retenu le plus d’attention. On notera Pp (X ) = (P (X ), Wp ) ; si (X , d) est un espace géodésique il en va de même de Pp (X ) [90, chapitre 7]. Le problème de minimisation qui apparaît dans (12) est appelé problème de MongeKantorovich, ou problème de transport optimal ; on le notera (MKp ). Pour le cas p = 1 il remonte à Monge [73]. Dans l’interprétation habituelle, il s’agit de transporter une distribution de masse µ0 pour la faire coïncider avec une distribution prescrite µ1 , et d’effectuer ce réarrangement au moindre coût total, sachant que le transport d’une unité de masse de x0 vers x1 coûte d(x0 , x1 )p . C’est à partir d’une note de Brenier [20] que le transport optimal s’est développé spectaculairement en un sujet particulièrement multiforme de l’analyse, en lien avec le calcul des variations, la géométrie, les probabilités, les systèmes dynamiques, et les équations aux dérivées partielles [85, 90].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
226
C. VILLANI
On peut voir le transport optimal sous l’angle de l’appariement (trouver π, la distribution jointe des couples (x0 , x1 )), ou sous l’angle de l’interpolation (trouver le chemin (µt )0≤t≤1 dans P (X ) qui permettra à la mesure µ0 de se réarranger progressivement, sous l’action du transport optimal, en la mesure µ1 ). Ce sont deux faces du même problème [90, chapitre 7] : pour passer de (µt ) à π, ou vice-versa, on cherche un transport dynamique, c’est-à-dire une mesure Π ∈ P (C([0, 1], X )), concentrée sur des courbes géodésiques, telle que (et )# Π = µt , (e0 , e1 )# Π = π ; ici et est la fonction évaluation au temps t, et (γ) = γ(t). Si π est optimal au sens de (12) et que Π est porté par des courbes géodésiques, on parlera de transport optimal dynamique au sens (MKp ). L’interpolation (µt )0≤t≤1 est alors une géodésique dans Pp (X ). Nous pouvons maintenant introduire la notion de « courbure positive » dans les espaces métriques mesurés. La définition suivante est un cas particulier archétypal des notions plus générales à venir : Définition 2.1 (critère CD(0, ∞) métrique-mesuré). — On dit qu’un espace géodésique mesuré (X , d, ν) vérifie CD(0, ∞) si pour tous µ0 , µ1 ∈ P (X ) il existe une géodésique (µt )0≤t≤1 dans P2 (X ) telle que (13)
∀t ∈ [0, 1]
Hν (µt ) ≤ (1 − t)Hν (µ0 ) + tHν (µ1 ).
– Si cette inégalité a lieu pour toute géodésique (µt )0≤t≤1 , on dit que (X , d, ν) est fortement CD(0, ∞) ; Hν (µt ) est alors une fonction convexe de t. – Si pour tout x∗ cette inégalité a lieu dès que µ0 , µ1 ont leur support dans un voisinage de x∗ assez petit, alors on dit que (X , d, ν) est localement CD(0, ∞), ce que l’on note CDloc (0, ∞). Remarque 2.2. — Le choix p = 2 ci-dessus (dans la définition de Pp ) est réminiscent de la nature quadratique de la géométrie riemannienne. Remarque 2.3. — Cette définition utilise l’information de Boltzmann pour mesurer la dispersion de la masse : si les géodésiques se rapprochent, la concentration augmente et Hν aussi. En courbure positive, les géodésiques ont tendance à diverger avant de reconverger, ce que capture la définition au travers de l’inégalité de convexité pour Hν . Remarque 2.4. — Si (X , d, ν) est une variété riemannienne munie de sa distance géodésique et d’une mesure ν(dx) = e−V (x) vol (dx), alors la définition 2.1 est équivalente au critère classique Ric + ∇2 V ≥ 0 [90, chapitre 17]. Remarque 2.5. — La définition 2.1 est « synthétique » en ce qu’elle ne nécessite pas le calcul de la courbure, ne demande pas de régularité, et n’utilise aucune structure audelà de celles de distance géodésique et de mesure. Elle est stable par convergence de Gromov-Hausdorff mesurée [90, chapitre 29], une topologie très flexible sur les espaces
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
227
µt µ1
µ0
Figure 3. Transport (MK2 ) en courbure positive : la mesure µt , qui interpole entre µ0 et µ1 , est plus « étalée » au sens de l’information de Boltzmann.
métriques mesurés qui prend seulement en compte la convergence des distances et des mesures [52, chapitre 3 12 ] [90, chapitre 27]. En fait, la définition 2.1 est essentiellement la seule approche « intrinsèque » connue pour rendre compatibles la courbure de Ricci et la topologie de Gromov-Hausdorff mesurée. 2.2. définitions générales Pour généraliser la définition 2.1, deux possibilités majeures se sont dégagées : (a) conserver la fonction H et modifier l’inégalité de convexité [36] ; pour cela, on remplace l’interpolation linéaire Ψt (h0 , h1 ) = (1 − t)h0 + th1 par l’interpolation non linéaire (14)
ΨK,N (h0 , h1 , σ) = h(t), t
˙2 ¨ − h = Kσ, h N
h(0) = h0 , h(1) = h1 .
(Le paramètre σ sera égal au carré de la vitesse de la géodésique dans P2 , c’est-à-dire au carré de la distance W2 entre µ0 et µ1 .) (b) conserver l’inégalité de convexité et changer la fonction H [88] ; pour cela on inclura dans la fonctionnelle une notion de dimension, à travers le choix de la non-linéarité, et une notion de courbure, par l’usage de « coefficients de distortion » βt (x, y) ≥ 0 qui comparent l’évolution du volume infinitésimal, au cours du trajet de x à y, à celle qui a lieu dans l’espace euclidien. Si U est une fonction convexe vérifiant
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
228
C. VILLANI
U (0) = 0, π ∈ P (X × X ) et µ ∈ P (X ), on définit donc (15) Z ρ(x) β Uπ,ν (µ) = U β(x, y) π(dy|x) ν(dx) + U 0 (∞) µs [X ], β(x, y)
µ = ρ ν + µs ,
où µs est la partie singulière de µ par rapport à ν. Pour U , le choix qui s’impose, en fonction de la dimension N , est UN (r) = N r(1 − r−1/N ) (noter que UN (r) → r log r quand N → ∞). Le rôle particulier des fonctions UN remonte à la thèse de McCann [69] : il y était démontré qu’elles correspondent à la non-linéarité limite compatible avec une évolution convexe le long du transport optimal dans EN . Pour ce qui est des coefficients β, on a deux choix naturels : – soit les coefficients de distortion de l’espace de référence : par exemple, pour K > 0 et N < ∞, ce sera r N −1 sin(tα) K K,N (16) βt (x, y) = d(x, y); , α= t sin α N −1 – soit les coefficients de distortion estimés à partir de l’inégalité (6) : r N ∗ K,N sin(tα) K (17) β t (x, y) = , α= d(x, y). t sin α N ∗
Les coefficients β sont sous-optimaux, mais ont le bon goût d’être associés à l’équation différentielle linéaire (7). Plus précisément, dire que (7) est vérifié le long d’une géodésique γ de vitesse constante est équivalent à dire que pour toute sousgéodésique γ e (c’est-à-dire la reparamétrisation par [0, 1] de la restriction de γ à un intervalle [t0 , t1 ] ⊂ [0, 1]), quitte à reparamétrer également J |[t0 ,t1 ] par [0, 1] on a ∀t ∈ [0, 1],
1
J (t) N
N1 N1 K,N K,N ∗ ∗ γ0 , γ e1 ) J (0) γ0 , γ e1 ) J (1) ≥ (1 − t) β 1−t (e + t β t (e .
(Voir [90, théorème 14.28] pour une preuve dans un contexte lisse ; le cas général peut se traiter par régularisation.) Dans la définition suivante on notera π ˇ = S# π, avec S(x, y) = (y, x) (échange des variables) ; et on se limitera au cas délicat N < ∞. Définition 2.6. — Soient N ∈ [1, ∞[ et K ∈ R. On dit qu’un espace géodésique mesuré compact (X , d, ν) vérifie la propriété CD(K, N ) (resp. CD∗ (K, N ), CDe (K, N )) si pour tous µ0 , µ1 ∈ P (X ) il existe une géodésique (µt )0≤t≤1 dans P2 (X ), et un transport optimal π associé, tels que pour tout t ∈ [0, 1], β K,N
β K,N
1−t t – pour CD(K, N ) : UN (µt ) ≤ (1 − t) UN,ˇ π ,ν (µ0 ) + t UN,π,ν (µ1 ) ; ∗ K,N
β
∗ K,N
β
1−t t – pour CD∗ (K, N ) : UN (µt ) ≤ (1 − t) UN,ˇ π ,ν (µ0 ) + t UN,π,ν (µ1 ) ;
– pour CDe (K, N ) : Hν (µt ) ≤ ΨK,N Hν (µ0 ), Hν (µ1 ); W2 (µ0 , µ1 )2 . t
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
229
Si l’inégalité a lieu pour toute géodésique (µt ), on dit que l’espace vérifie la propriété CD(K, N ) (resp. CD∗ (K, N ), CDe (K, N )) forte. En particulier, la propriété CDe (K, N ) forte implique que h(t) := Hν (µt ) vérifie l’inégalité différentielle ˙ 2 ¨ − (h) ≥ K|µ˙ t |2 = K W2 (µ0 , µ1 )2 . h(t) N On introduit les versions locales CDloc de ces inégalités comme dans la définition 2.1. Proposition 2.7 (Compatibilité avec le cadre lisse, [12, 35, 36, 66, 88, 90]) Les trois notions CD(K, N ), CD∗ (K, N ) et CDe (K, N ) coïncident avec la propriété classique CD(K, N ) si (X , d, ν) est une variété riemannienne compacte munie d’une mesure de référence lisse. En outre, elles sont toutes trois stables par convergence de Gromov-Hausdorff mesurée. Remarque 2.8. — On voit bien sur la formulation CDe (K, N ) que le transport optimal fournit un moyen d’écrire, en termes métriques et sous une forme intégrée, l’inégalité fondamentale (6) qui sous-tend, implicitement ou explicitement, toute la théorie de la courbure de Ricci. Remarque 2.9. — À ce niveau de généralité les trois définitions sont acceptables, et ont leurs avantages et leurs inconvénients. La propriété CD(K, N ) implique ∗ K,N
CD∗ (K, N ) ; mais l’usage des coefficients sous-optimaux β reste légitime, comme le prouve la proposition 2.7. En fait, il y a pour les variétés riemanniennes une frappante propriété d’auto-amélioration des coefficients de distortion : en dimension N , ∗ K,N
si les coefficients de distortion sont minorés par β minorés par β K,N .
, alors ils sont automatiquement
Remarque 2.10. — On peut espérer que les trois propriétés sont équivalentes sous des hypothèses minimales de régularité, telles que le non-branchement des géodésiques ; des résultats partiels en la matière ont déjà été obtenus [35, 36] et le résultat complet vient tout juste d’être annoncé par Cavalletti & Milman [25], sans toutefois que la preuve ait pu encore être validée. Pour conclure cette section, notons que nombre de propriétés découlant classiquement des bornes de courbure-dimension s’adaptent au cadre de la définition 2.6 : inégalités de Bishop-Gromov, Brunn-Minkowski, Sobolev, Sobolev logarithmique, Poincaré L2 , Talagrand, etc. [66, 88, 90]. Cela tient à ce que toutes ces propriétés peuvent se reformuler, directement ou indirectement, en termes de transport optimal.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
230
C. VILLANI
2.3. Compatibilité avec la théorie de Cartan-Alexandrov-Toponogov La théorie de Cartan-Alexandrov-Toponogov (CAT) est utilisée au moins depuis les années 80 pour encoder des bornes sectionnelles supérieures ou inférieures, à partir de relations géométriques faisant intervenir des distances ou des angles. Par exemple, on dira qu’un espace est de courbure positive au sens CAT si, étant donné un triangle géodésique ABC, la longueur de la médiane issue de A est au moins égale à la longueur de la médiane issue de A0 dans un triangle isométrique A0 B0 C0 tracé dans le plan. Un critère équivalent consiste à imposer que la somme des angles d’un triangle géodésique soit toujours supérieure ou égale à π. Par comparaison avec des sphères ou des espaces hyperboliques, on peut définir des notions de courbure minorée par κ ou majorée par κ, pour tout κ ∈ R ; il existe une vaste littérature sur ce sujet qui est très bien présenté par Burago, Burago & Ivanov [21]. On note que les propriétés des espaces à courbure minorée (souvent appelés espaces d’Alexandrov) sont très différentes des propriétés des espaces à courbure majorée. Dans un cadre lisse, la notion de courbure minorée au sens CAT est identique à celle de courbure sectionnelle minorée ; et comme la courbure de Ricci est une somme de courbures sectionnelles, les espaces d’Alexandrov de dimension finie vérifient automatiquement, quand ils sont lisses, des critères de courbure-dimension. Il était donc souhaitable que la théorie synthétique de la courbure-dimension inclue les espaces d’Alexandrov. C’est ce qu’a démontré Petrunin : Théorème 2.11 ([80]). — Si (X , d) est un espace d’Alexandrov compact à courbure minorée par κ ∈ R et à dimension de Hausdorff égale à n, alors (X , d, H n ) est un espace fortement CDe ((n − 1)κ, n), où H n est la mesure de Hausdorff. En fait l’énoncé ci-dessus est démontré dans [80] seulement dans le cas où κ = 0, mais la preuve s’adapte aux autres situations ; en outre Zhang-Zhu [92, appendice A] proposent une démonstration complète d’un énoncé plus précis.
2.4. Compatibilité avec l’analyse des espaces métriques Une autre tradition d’analyse non lisse a été développée dans le cadre des espaces métriques mesurés, en particulier par les écoles nordique et italienne [11]. Elle utilise deux inégalités fondamentales : – l’inégalité de doublement de la mesure : il existe C > 0 tel que pour tout x ∈ X et pour tout r > 0, ν[B2r (x)] ≤ C ν[Br (x)];
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
231
– l’inégalité de Poincaré L1 locale : il existe C > 0 tel que pour tout x > 0 et tout r > 0, pour toute fonction f ∈ L1 (X , d, ν), Z Z C (18) − |f − hf ix,r | dν ≤ − |∇f | dν. r Br (x)
B2r (x)
R R Ici huix,r = −Br (x) u = ν[Br (x)]−1 Br (x) u dν et |∇f | = lim supy→x |f (y) − f (x)|/d(x, y). (Dans le jargon du domaine, l’inégalité (18) est l’inégalité de Poincaré (1,1) faible.) Ici encore, la compatibilité est garantie : Théorème 2.12. — Soit (X , d, ν) un espace géodésique mesuré compact vérifiant la propriété CD(K, N ) (ou CD∗ (K, N ), ou CDe (K, N )) avec K ∈ R et N < ∞ ; alors il vérifie aussi les inégalités de doublement et de Poincaré L1 locale. La partie délicate dans cette preuve est l’inégalité de Poincaré, due à Rajala [81]. 2.5. Semigroupe de la chaleur La courbure de Ricci est fondamentalement associée aux équations de diffusion ; par exemple, ce sont les bornes de type CD(K, N ) qui permettent des estimations ponctuelles du noyau de la chaleur sur une variété riemannienne (inégalités de LiYau) ou garantissent l’existence d’un semigroupe conservatif de la chaleur dans une variété non bornée. Cette propriété reste vraie dans les espaces métriques : Théorème 2.13 (diffusion dans les espaces métriques, [5, 45, 47]) Soit (X , d, ν) un espace géodésique mesuré compact vérifiant CD(K, N ) avec K ∈ R et N ∈ [1, ∞]. Alors il existe un unique semigroupe de la chaleur sur P (X ), défini de façon équivalente – en termes de mesures, comme flot gradient en métrique W2 de l’information Hν ; – ou en termes de densités, comme flot gradient dans la norme L2 (ν) de la foncR tionnelle de Cheeger Ch∗ (f ) = 12 |∇f |2 dν. En outre, ce semigroupe est stable par convergence de Gromov-Hausdorff mesurée. Remarque 2.14. — Dans l’énoncé ci-dessus, la fonctionnelle de Cheeger doit être définie avec de grandes précautions, selon la construction mise au point par Cheeger [29] et Shanmugalingam [87]. On renvoie à [5] pour la mise en œuvre dans ce contexte. Remarque 2.15. — L’idée originale du théorème 2.13 remonte à l’article de JordanKinderlehrer-Otto [56] qui a eu une influence considérable [90, 91]. La première étude systématique de la construction des flots gradients abstraits dans l’espace des mesures remonte à Ambrosio-Gigli-Savaré [4], tandis que la première adaptation de cette théorie au contexte des espaces métriques est due à Gigli-Kuwada-Ohta [46].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
232
C. VILLANI
Remarque 2.16. — À ce niveau de généralité, et même si X est une variété lisse (non riemannienne), le semigroupe de la chaleur peut être non linéaire. 2.6. Non-branchement et localité Le succès de la propriété de courbure de Ricci minorée tient en partie à la possibilité de passer d’inégalités locales à des inégalités globales. (Il en va de même pour les minorations ou majorations des courbures sectionnelles, mais pas pour les majorations de la courbure de Ricci.) Dans un cadre métrique, ce passage du local au global ne va pas de soi sans hypothèses supplémentaires. Les hypothèses de non-branchement sont les plus économiques que l’on ait trouvé : en interdisant les bifurcations, elles permettent de mettre en correspondance les points intermédiaires avec les géodésiques qui les atteignent. Définition 2.17 (non-branchement). — Soit (X , d) un espace géodésique. – Soit Γ une famille de géodésiques [0, 1] → X ; on dit que Γ est non branchant s’il vérifie la propriété suivante : pour tous γ, γ e dans Γ, si γ et γ e coïncident sur un intervalle non trivial [s0 , s1 ], alors γ e = γ. – On dit que (X , d) est non branchant si l’ensemble Γ(X ) de toutes les géodésiques [0, 1] → X est non branchant. – On dit que (X , d) est essentiellement non branchant si pour toutes mesures µ0 , µ1 ∈ P ac (X , ν), tout Π ∈ P (Γ(X )), transport optimal dynamique au sens (MK2 ) joignant µ0 et µ1 , est concentré sur un ensemble non branchant de géodésiques. Il résulte des travaux de divers auteurs [36, 81, 83, 88, 90] : Théorème 2.18. — (i) Un espace géodésique mesuré compact (X , d, ν) vérifie la propriété CD(K, N ) forte si et seulement si il est essentiellement non branchant et CD(K, N ) (de même avec les propriétés CD∗ (K, N ) et CDe (K, N )) ; (ii) Pour un espace essentiellement non branchant, les trois propriétés suivantes sont équivalentes : CDe (K, N ), CD∗ (K, N ), et CDloc (K, N ) ; en outre, ces propriétés sont équivalentes à l’une quelconque des inégalités différentielles suivantes sur la densité d’une interpolation géodésique absolument continue dans P2 (X ) : avec la notation ρt = dµt /dν, µt = (et )# Π, pour Π-presque tout γ, d2 1 K |γ˙t |2 1 (19) + ≤ 0, dt2 ρt (γt )1/N N ρt (γt )1/N ˙2 ¨ ≥ ` (t) + K |γ˙ t |2 . `(t) = log ρt (γt ) =⇒ `(t) N ∗ (iii) Dans un espace CD (K, N ) essentiellement non branchant, pour ν ⊗ ν-presque toute paire (x, y), il existe une unique géodésique joignant x à y. (20)
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
233
Remarque 2.19. — La propriété (ii) montre que les propriétés CD∗ et CDe se globalisent sous une hypothèse de non-branchement essentiel : il est équivalent de les imposer localement ou globalement. En revanche, sans hypothèse de non-branchement, cette propriété de globalisation peut être en défaut [82]. Remarque 2.20. — Les inégalités (19) et (20) peuvent être comprises au sens des distributions (les dérivées d’ordre 1 sont continues), ou bien exprimées par comparaison avec des solutions explicites (cf. [90, théorème 14.11]). Remarque 2.21. — Cette propriété entraîne deux questions naturelles : (a) la version locale CDloc (K, N ) de CD(K, N ) se globalise-t-elle sous une hypothèse de nonbranchement ? (b) peut-on trouver des critères stables par topologie de GromovHausdorff qui garantissent la propriété de non-branchement essentielle (dont on sait qu’elle n’est pas stable) ? Pour le (a), une réponse positive vient d’être annoncée par Cavalletti-Milman, dans un mémoire long et dense [25] ; pour le (b), le principal critère est celui que l’on verra maintenant. 2.7. Propriété riemannienne La théorie de la courbure-dimension dans les espaces géodésiques mesurés est suffisamment large pour englober trois grandes catégories de géométries non euclidiennes non lisses : les espaces d’Alexandrov [21, 22], les limites de variétés riemanniennes [31] et les espaces de Finsler [74, 76]. Elle couvre aussi de nombreux exemples construits par produit tordu [59]. Cette généralité peut être vue comme un avantage, car elle propose une unification d’estimations variées, ou comme un inconvénient, car elle rend plus difficiles les théorèmes de rigidité ou de structure. À cet égard, l’observation suivante apparaissait à la fois simple et dérangeante [90, Conclusion] : tout espace normé (RN , k · k), muni de la mesure de Lebesgue λN , est CD(0, N ). En corollaire, on n’a pas en général de théorème de décomposition en courbure positive (splitting theorem) : ce théorème, d’usage crucial dans la construction d’espaces tangents en géométrie non lisse, énonce qu’un espace X vérifiant CD(0, N ) et contenant une ligne géodésique infinie (minimisante pour tous temps) se factorise en un produit riemannien R × X 0 , avec X 0 vérifiant CD(0, N − 1). Les travaux de Gigli [45], adaptant en dimension finie les notions introduites par Ambrosio-Gigli-Savaré [6], ont permis de répondre à cette question : ils ont identifié, au sein des espaces métriques CD(K, N ), une sous-classe qui (a) vérifie le théorème de décomposition, (b) vérifie aussi la propriété de non-branchement essentiel, (c) est toujours stable par topologie de Gromov-Hausdorff. Faut-il se placer ou pas dans cette sous-classe, cela dépend du problème considéré.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
234
C. VILLANI
Définition 2.22 (Propriété CD(K, N ) riemannienne, [6, 45]) Un espace géodésique mesuré (X , d, ν) de classe CD(K, N ) (resp. CD∗ (K, N ), CDe (K, N )) est dit RCD(K, N ) (resp. RCD∗ (K, N ), RCDe (K, N )) si la fonctionnelle de Cheeger dans X est quadratique, ou de façon équivalente si le semigroupe de la chaleur est linéaire. Remarque 2.23. — Une formulation équivalente consiste à dire que l’espace de Sobolev W 1,2 (X , d, ν) (fonctions dans L2 (ν) de « gradient » dans L2 (ν)) est un espace de Hilbert. R Remarque 2.24. — La nature quadratique de la fonctionnelle Ch∗ (f ) = 21 |∇f |2 dν est bien sûr une formulation faible, intégrée, de la propriété riemannienne selon laquelle la métrique définit une forme quadratique sur les champs de vecteurs tangents. Cette définition peut donc sembler très naturelle, mais il ne faut pas s’y méprendre : seule, elle serait de peu d’intérêt car elle est instable pour la topologie de GromovHausdorff. C’est seulement combinée au critère CD(K, N ) qu’elle devient stable. Voici une analogie commode : la convergence ponctuelle des fonctions continues n’implique pas la convergence des gradients, sauf si l’on se restreint par exemple à la classe des fonctions convexes. En combinant la définition 2.22, le théorème 2.13, les résultats de non-branchement essentiel de [83], et l’étude de l’inégalité de Bochner non lisse [6, 7, 9, 10, 36, 46], on obtient le Théorème 2.25 ([6, 42, 66, 83, 88]). — (i) Les propriétés RCD(K, N ), RCD∗ (K, N ) et RCDe (K, N ) sont stables par convergence de Gromov-Hausdorff mesurée ; (ii) La propriété RCD∗ (K, N ) est équivalente à une inégalité de Bochner ; si elle est vraie localement, elle reste vraie globalement ; (iii) Ces propriétés impliquent la propriété de non-branchement essentiel ; (iv) Les conditions RCD∗ (K, N ), RCDe (K, N ) et RCDloc (K, N ) sont équivalentes. Si les résultats de [25] sont confirmés, les trois conditions RCD∗ , RCDe et RCD sont finalement équivalentes. Quoi qu’il en soit, je parlerai dans la suite de la classe RCD∗ (K, N ) ; comme on l’a déjà dit, elle contient toutes les limites de suites de variétés riemanniennes vérifiant une condition de courbure-dimension uniforme. Les espaces RCD∗ (K, N ) vérifient nombre de propriétés. Tout d’abord, on peut démontrer dans ce contexte trois grands théorèmes de rigidité en courbure positive : – théorème de décomposition [45, 41] : en présence d’une géodésique infinie, un espace de courbure positive s’écrit comme le produit métrique de R par un autre espace ;
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
235
– théorème de diamètre maximal [60] : en courbure strictement positive, si le diamètre de l’espace est égal au diamètre maximal autorisé par Bonnet-Myers, alors l’espace est une suspension sphérique ; – théorème du cône volumique [34] : si autour d’un point donné le volume des boules augmente aussi vite que ce qui est autorisé par le théorème de Bishop-Gromov, alors l’espace est un cône métrique. Tous ces théorèmes avaient d’abord été établis par Cheeger-Colding [30] dans le cadre a priori plus restreint des limites de variétés riemanniennes. Les espaces RCD∗ (K, N ) vérifient en outre : – la propriété de cône [60] : X est RCD∗ (N − 1, N ) si et seulement si le cône métrique sur X est RCD∗ (0, N + 1) (penser à la sphère SN dont le cône est l’espace euclidien EN +1 ) ; – la possibilité de définir un opérateur laplacien et un calcul différentiel d’ordre 2 [44], de manipuler l’inégalité de Bochner [36] et de mettre en œuvre un calcul de Bakry-Émery [9, 86] ; – l’existence d’une notion d’exponentielle [49] ; – des estimations ponctuelles du semi-groupe de la chaleur, à la Li-Yau [39] ; – des théorèmes de rectifiabilité, incluant l’existence de cartes où la mesure est absolument continue par rapport à la mesure de Lebesgue [58, 71, 48] ; – des théorèmes topologiques concernant la structure du revêtement universel et du groupe fondamental [72].
3. LE DILEMME DE LA DIMENSION EN TROP Une difficulté imprègne la théorie de la courbure-dimension en dimension N < ∞ : la courbure ne se ressent que dans les directions transversales au déplacement géodésique, soit N − 1 directions au lieu de N ; mais cela est invisible sur les inégalités jacobiennes naturelles comme (6) ou de façon équivalente sur la formule de Bochner (5). Pour établir des résultats optimaux, il faut trouver un moyen de « retrancher » cette dimension en trop, ce qui requiert une gymnastique bien connue des experts. À titre d’exemple, considérons l’estimation de diamètre en courbure positive : si K > 0, l’inégalité (6), appliquée à une géodésique unitaire (|γ| ˙ = 1), permet de p majorer par π N/K la longueur de l’intervalle d’existence de ` : on en déduit r N diam(X ) ≤ π . K
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
236
C. VILLANI
Mais la borne optimale (théorème de Bonnet-Myers) est en fait r N −1 diam(X ) ≤ π ...! K Pour l’obtenir, on peut évaluer la contribution « transversale » du déterminant jacobien, en extrayant la sous-matrice jacobienne (N − 1) × (N − 1) qui correspond aux directions orthogonales à la vitesse (calcul bien connu rappelé dans [90, chapitre 14]) : en notant J ⊥ le déterminant de cette sous-matrice, et `⊥ = − log J ⊥ , on trouve (toujours pour une géodésique unitaire) (21)
(`˙⊥ )2 `¨⊥ ≥ + K, N −1
et la borne optimale s’ensuit. Dans la preuve de la section 1, ce passage aux constantes optimales s’est fait à travers la preuve du lemme 1.9 : si l’on a pu obtenir l’inégalité (10), avec le paramètre n − 1 plutôt que n, c’est parce que l’on s’est intéressé au déterminant jacobien d’une application définie sur une hypersurface (minimale) transverse au déplacement. Ce besoin de regagner la direction du déplacement se retrouve dans tous les problèmes de constantes optimales en dimension finie. En particulier, les constantes optimales demandent le gain d’un facteur (N − 1)/N dans des inégalités fonctionnelles telles que Poincaré L2 , Sobolev L2 , Sobolev logarithmique, Talagrand, etc. Pour l’inégalité Poincaré L2 optimale (théorème de Lichnérowicz), ce gain était mené à bien dans un cadre non lisse par [65], mais les autres inégalités restaient inaccessibles. Pour contourner ce problème, on pourrait être tenté d’exploiter au maximum la définition CD(K, N ) basée sur les coefficients optimaux βtK,N ; par exemple, cette définition implique facilement la borne optimale de Bonnet-Myers. Mais les difficultés sont majeures, car la propriété CD(K, N ) se prête très mal aux raisonnements locaux, et dès que l’on passe à la version différentielle des inégalités portant sur l’interpolation (MK2 ), on se heurte au même problème qu’auparavant. La solution de ce dilemme fera intervenir la structure géométrique du transport optimal ; la prochaine section y sera consacrée.
4. GÉOMÉTRIE DU TRANSPORT OPTIMAL 4.1. Généralités Soit (X , d) un espace métrique compact. Pour p ∈ [1, ∞[ on considère le problème variationnel de Monge-Kantorovich Z (22) (MKp ) inf d(x0 , x1 )p π(dx0 dx1 ) =: Cp (µ0 , µ1 ). π∈Π(µ0 ,µ1 )
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
237
On note c = dp le coût de transport. L’objet de cette section est la structure des minimiseurs, en particulier pour p = 1 et p = 2. Les trois notions essentielles sont la dualité de Kantorovich, les fonctions c-convexes et les ensembles c-cycliquement monotones [90, chapitre 5]. Théorème 4.1 (dualité de Kantorovich). — Avec les notations précédentes, (i) Le problème de minimisation de Monge-Kantorovich équivaut à un problème dual de maximisation : Z Z ψ c dµ1 − ψ dµ0 ; ψ c-convexe , Cp (µ0 , µ1 ) = sup où la paire (ψ, ψ c ) de fonctions X → R dans le membre de droite vérifie i h ∀y ∈ X , ψ c (y) = inf ψ(x) + d(x, y)p ; x∈X
∀x ∈ X ,
h i ψ(x) = sup ψ c (y) − d(x, y)p y∈X
(la première condition est la définition de la c-transformée, la seconde est la propriété caractérisant les fonctions c-convexes). Pour le problème original comme pour son dual, l’optimum est atteint. (ii) Si ψ est optimal dans le problème dual de maximisation, alors π est optimal dans le problème de minimisation si et seulement si il est supporté par le c-sousdifférentiel ∂c ψ de ψ, ∂c ψ = (x, y) ∈ X × X ; ψ c (y) − ψ(x) = d(x, y)p . (iii) π est optimal dans le problème de minimisation si et seulement si son support S est c-cycliquement monotone : X X ∀N ∈ N, ∀(x1 , y1 ), (x2 , y2 ), . . . , (xN , yN ) ∈ S, d(xi , yi )p ≤ d(xi , yi+1 )p , i
i
avec la convention yN +1 = y1 . Remarque 4.2. — Le lien entre les propriétés (ii) et (iii) se fait par le théorème de Rockafellar-Rüschendorf : un ensemble est c-cycliquement monotone si et seulement si il est inclus dans le c-sous-différentiel d’une fonction c-convexe. Pour les preuves, on pourra se reporter à [90, chapitre 5]. Jusqu’ici, aucune hypothèse géométrique n’est nécessaire ; mais des conditions de courbure et de nonbranchement permettront d’en dire plus sur la structure du transport. On note qu’il n’y a pas de cercle vicieux : pour développer la théorie de la courbure-dimension il suffit d’avoir des informations générales sur le transport optimal, et ce n’est qu’ensuite que l’on déduit de la courbure-dimension des informations plus précises sur le transport.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
238
C. VILLANI
4.2. Le cas p = 2 La structure du transport optimal avec coût quadratique a été explorée dans les années 80 par Brenier, Rachev, Rüschendorf dans En , avant d’être adaptée au cadre riemannien par McCann [69]. Le résultat principal énonce que si µ0 est absolument continue (ou plus généralement ne charge pas les ensembles de dimension n − 1) alors le transport optimal est concentré sur le graphe d’une application de transport T (de sorte que T# µ0 = µ1 ), caractérisée par l’identité T = exp(∇ψ), où ψ est c-convexe. Ce théorème et ses variantes sont discutés dans [90, chapitres 9-10]. Il est apparu bien plus récemment que ces résultats peuvent largement se généraliser dans les espaces CD∗ (K, N ) essentiellement non branchants [40, 49, 83]. Théorème 4.3 (Gigli, Rajala, Sturm). — Soit (X , d, ν) un espace CD∗ (K, N ) compact essentiellement non branchant ; soient µ0 ∈ P ac (X ) et µ1 ∈ P (X ). Soit en outre ψ une application optimale dans le problème dual de maximisation. Alors il existe un unique transport optimal au sens de (MK2 ) ; il est concentré sur le graphe d’une application T , caractérisée par la condition T (x) ∈ ∂c ψ(x),
pour µ0 -presque tout x ∈ X .
Remarque 4.4. — Même si l’hypothèse de non-branchement essentiel concerne des mesures µ0 et µ1 qui sont toutes deux absolument continues, le théorème 4.3 nécessite seulement l’absolue continuité de µ0 . Preuve du théorème 4.3 (esquisse grossière). — Pour prouver l’unicité, il suffit de démontrer que π est concentrée sur un graphe ; en effet, cela acquis, si l’on a deux minimiseurs π1 et π2 , l’un concentré sur le graphe de T1 et l’autre sur le graphe de T2 , on pourra construire un autre minimiseur, π = (π1 + π2 )/2, qui ne sera pas porté par un graphe mais par une application multivaluée. La question cruciale est donc de prouver que presque tout point x0 est transporté vers un unique point x1 = T (x0 ) ; par le théorème 4.1 cette image est nécessairement dans ∂c ψ(x0 ). L’estimation clé est la suivante : si ρ est une densité de probabilité, alors R 1−1/N − ρ dν ≥ −ν[{ρ > 0}]1/N (appliquer l’inégalité de Jensen à la mesure de probabilité ν restreinte à S = {ρ > 0}, à la fonction intégrable ρ et à la fonction convexe −r1−1/N ). En combinant cela à la définition 2.6, on montre que le long d’une interpolation (ρt ν) dans P2 (X ), si ρ0 est proportionnelle à une fonction indicatrice, alors ν {ρ0 > 0} ≤ lim inf ν {ρt > 0} . t↓0
Dans une situation typique de transport π multivalué, on trouvera un ensemble B de mesure strictement positive tel que pour chaque x ∈ B, il existera y 1 et y 2 distincts tels que (x, y 1 ) et (x, y 2 ) appartiennent au support de π. On peut ainsi définir des
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
239
sous-transports, disons π 1 et π 2 , étrangers au sens de la théorie de la mesure, tels que (π 1 +π 2 )/2 ≤ π, et tous deux ont pour première marginale la restriction de ν à B. Les interpolations correspondantes sont deux chemins (ρ1t ν)0≤t≤1 et (ρ2t ν)0≤t≤1 tels que ρ10 = ρ20 est la fonction indicatrice de B. Pour t > 0 petit, les ensembles {ρ1t > 0} et {ρ2t > 0} sont proches de B, et leur mesure n’est pas moindre, ou à peine ; il s’ensuit que ces deux ensembles s’intersectent sur une partie de mesure positive. On construit alors un nouveau plan de transport en échangeant les géodésiques de π 1 et celles de π 2 en un temps t où elles se rencontrent. On vérifie que le nouveau transport est toujours optimal, ce qui impose qu’il est porté par des géodésiques ; autrement dit, si l’on suit une géodésique du premier plan de transport, jusqu’au temps t, et que l’on bifurque ensuite en suivant une géodésique du second plan de transport, on a toujours une géodésique... On en déduit finalement que (π 1 + π 2 )/2, et donc π, est porté de manière significative par des géodésiques branchantes, ce qui contredit l’hypothèse de non-branchement essentiel. La mise au point de cette preuve heuristique s’avère élémentaire mais fastidieuse, utilisant tous les outils de la théorie de la mesure abstraite (régularité, sélection mesurable, désintégration de la mesure...). 4.3. Le cas p = 1 Le cas p = 1 revêt une structure particulière, qui se manifeste déjà dans la caractérisation simple de la c-convexité quand c(x, y) = d(x, y) : Proposition 4.5. — Si (X , d) est un espace métrique, alors les fonctions d-convexes sont les fonctions 1-lipschitziennes, et elles vérifient ϕd = ϕ. La géométrie du transport optimal est également très spéciale pour p = 1. Monge lui-même, travaillant dans l’espace euclidien, avait noté une propriété fondamentale associée à ce coût de transport [73] : les lignes de transport ne peuvent se croiser en leur intérieur. En effet, si π est un optimum dans (MK1 ), et (x1 , y1 ), (x2 , y2 ) appartiennent au support de π, alors |x1 − y1 | + |x2 − y2 | ≤ |x1 − y2 | + |x2 − y1 | ; mais supposant que les segments [x1 , y1 ] et [x2 , y2 ] se croisent en un point intérieur X, on aurait |x1 −y2 |+|x2 −y1 | ≤ |x1 −X|+|X −y2 |+|x2 −X|+|X −y1 | = |x1 −y1 |+|x2 −y2 | ; cela impose égalité dans toutes les inégalités, et il s’ensuit facilement que x1 , x2 , y1 , y2 sont alignés. La description des minimiseurs de (MK1 ) dans Rn a fait l’objet de nombreux travaux à partir de la fin des années 90 ; on trouvera un survol, ainsi que des résultats s’appliquant à toute norme de Rn , dans [28]. À partir des années 2000, des résultats de structure étaient obtenus sur des variétés riemanniennes [37], puis sur des espaces géodésiques [18] ; enfin Cavalletti [23] obtenait récemment des résultats précis pour
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
240
C. VILLANI
x1 y2 X x2 y1 Figure 4. Comme l’a noté Monge, les rayons de transport (MK1 ) dans l’espace euclidien ne peuvent se croiser – sinon on trouverait un transport plus efficace.
des espaces satisfaisant des conditions de courbure-dimension et de non-branchement. Avant de les énoncer, je vais en expliquer informellement les éléments principaux. On commence par résoudre le problème dual, ce qui fournit une fonction optimale ϕ ; par le théorème 4.1 ses variations contraignent la géométrie d’un transport optimal. On définit ensuite R comme l’ensemble de toutes les paires de points que les valeurs de ϕ autorisent à être mis en relation par transport optimal. C’est un ensemble assez grand, qui contient en particulier la diagonale {(x, x)} (correspondant à l’option de ne pas bouger de la position x). Puis on introduit TE , l’ensemble de tous les points x qui apparaissent dans R en association avec au moins un y 6= x ; c’est-à-dire ceux qui ont la possibilité d’effectuer un déplacement strict. Sur TE , la relation R, bien que symétrique, n’est pas une relation d’équivalence : chaque fois que l’on a (x, y) ∈ R et (x, z) ∈ R, avec (y, z) ∈ / R, cela correspond à l’existence d’un branchement au sein de TE , c’est-à-dire au croisement de deux géodésiques (soit en un point extrémal, soit en un point intérieur). On peut cependant éliminer tous ces branchements en retirant de TE un ensemble de mesure nulle bien choisi ; l’ensemble T ainsi obtenu est partitionné par des courbes géodésiques, et les rayons de transport qui passent par T ne peuvent se rencontrer qu’en leurs extrémités. Le théorème qui suit formalise tout cela rigoureusement. Théorème 4.6 (Cavalletti). — Soit (X , d, ν) un espace géodésique compact mesuré, vérifiant CD∗ (K, N ), N < ∞, essentiellement non branchant. Soient µ0 ∈ P ac (X ) et µ1 ∈ P (X ). Soit en outre ϕ solution du problème de maximisation duale de Kantorovich (MK1 ). Alors (i) ϕ est 1-lipschitzien, et tout transport optimal est concentré sur l’ensemble d-convexe Γ := (x, y) ∈ X × X ; ϕ(y) − ϕ(x) = d(x, y) . (ii) À partir de Γ, on définit : – R, l’ensemble des rayons de transport, comme l’ensemble de tous les couples de la forme (x, y) ou (y, x), pour (x, y) ∈ Γ ;
ASTÉRISQUE 407
(1127)
241
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
– TE , l’ensemble de transport avec extrémités, comme l’ensemble de tous les x ∈ X tels que (x, y) ∈ R pour un y 6= x ; TE est une union d’images de géodésiques ; – E, l’ensemble des extrémités, comme l’ensemble de tous les x ∈ TE tels que ∀y 6= x, (y, x) ∈ / Γ (extrémités initiales) ou ∀y 6= x, (x, y) ∈ / Γ (extrémités finales) ; On peut alors définir un ensemble mesurable T ⊂ TE , dit ensemble de transport sans branchement, tel que ν[TE \ T ] = 0, avec la propriété suivante : pour tout x ∈ T , soit l’ensemble R(x) ⊂ X des y tels que (x, y) ∈ R ; c’est une géodésique, dite ligne de transport passant par x ; et pour tous x, y, on a soit R(x) = R(y), soit R(x) ∩ R(y) ⊂ E. (iii) Il existe un transport optimal porté par le graphe d’une application mesurable T , et tel que T (x) ∈ R(x) pour µ0 -presque tout x ∈ X ; en outre ϕ est une application linéairement croissante le long de la géodésique R(x). T
µ1
µ0
E
R(x)
R(x0 )
A− ∩ E
E A+
Figure 5. Transport (MK1 ) : Quitte à éliminer des ensembles négligeables, les rayons R partitionnent l’ensemble de transport T . On a représenté ici quelques exemples de rayons R(x), de points extrémaux (E) et de points de branchement (A+ branchement vers le futur, A− vers le passé).
Remarque 4.7. — Le point (ii) est en fait un résultat général sur la structure des ensembles d-cycliquement monotones dans (X , d, ν). Ce point, comme l’ensemble du théorème, est démontré dans [23], à un détail près : l’ensemble T qui y est construit
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
242
C. VILLANI
autorise R(x)∩R(y) à comprendre des points de branchement intérieurs. La construction plus précise de [25] écarte cette dernière possibilité. Remarque 4.8. — Il y a, en fonction de l’exposant p, une différence considérable dans la géométrie des ensembles c-convexes : un ensemble d2 -convexe est plus ou moins un graphe, tandis qu’un ensemble d-convexe se présente plutôt comme une fibration. En conséquence, une différence majeure entre le cas p = 2 et le cas p = 1 est que dans ce dernier, la solution ϕ du problème dual ne détermine pas le transport optimal, mais seulement sa direction (en d’autres termes, les rayons). Une même fonction optimale ϕ peut donc être associée à différents plans de transport, selon les choix de µ0 et µ1 . Cette « dégénérescence » est une difficulté pour la théorie ; d’un autre côté, elle est exploitée adroitement dans [23, 26] par la construction de « mesures auxiliaires » pour lesquelles le transport optimal reste associé à ϕ. Pour exploiter les hypothèses du théorème 4.6, on se heurte tout de suite à une difficulté : la propriété de courbure-dimension et celle de non-branchement essentiel font référence au transport (MK2 ), donc aux ensembles d2 -cycliquement monotones, alors que l’ensemble Γ est d-cycliquement monotone. Le passage d’une notion à l’autre se fait à l’aide du lemme suivant, aussi simple que crucial : Lemme 4.9. — Si Γ est inclus dans le d-sous-différentiel d’une fonction 1-lipschitzienne ϕ et tel que (23) ∀(x, y), (x0 , y 0 ) ∈ Γ, ϕ(y) − ϕ(y 0 ) ϕ(x) − ϕ(x0 ) ≥ 0, alors Γ est d2 -cycliquement monotone. Ce lemme permettra en diverses occasions d’identifier, dans un transport optimal pour (MK1 ), un sous-transport optimal pour (MK2 ). Preuve. — L’hypothèse (23) exprime la d2 -monotonie cyclique de l’ensemble {(ϕ(x), ϕ(y)), (x, y) ∈ Γ} ⊂ R2 : en effet, pour tout N ∈ N et tous (x1 , y1 ), . . . , (xN , yN ) dans Γ, X X 2 X 2 ϕ(yi+1 ) − ϕ(xi ) − ϕ(yi ) − ϕ(xi ) = 2 ϕ(xi ) ϕ(yi ) − ϕ(yi+1 ) i
i
i
=
X
ϕ(xi ) − ϕ(xi+1 ) ϕ(yi ) − ϕ(yi+1 ) ≥ 0.
i
En conséquence, avec les mêmes notations, et en utilisant la propriété de d-sousdifférentiel, X X 2 X 2 X ϕ(yi ) − ϕ(xi ) ≤ ϕ(yi+1 ) − ϕ(xi ) ≤ d(xi , yi+1 )2 , d(xi , yi )2 = i
i
i 2
ce qui est la propriété de d -monotonie cyclique.
ASTÉRISQUE 407
i
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
243
Le théorème 4.6 repose encore sur tout l’arsenal de la théorie de la mesure. La stratégie globale est de décomposer le transport selon des rayons essentiellement disjoints, se ramenant ainsi à un problème en dimension 1 le long de chacun de ces rayons. En effet, la solution du transport optimal en dimension 1 est bien connue : Lemme 4.10. — Soient µ0 et µ1 deux mesures de probabilité sur R ; on suppose que µ0 n’a pas d’atome. Alors l’application croissante T : R → R définie par n o T (x) = inf z; µ0 [{t ≤ x}] < µ1 [{s ≤ z}] réalise un transport optimal de µ0 vers µ1 , au sens de Monge, c’est-à-dire que R T# µ0 = µ1 et d(x, T (x)) µ0 (dx) = C1 (µ0 , µ1 ). Cette approche par décomposition avait été initiée par Sudakov [89], qui n’avait cependant pas pu mener le raisonnement à bien du fait de la subtilité de l’opération de désintégration. Preuve du théorème 4.6 (esquisse grossière). — Le point (i) est obtenu simplement en combinant le théorème 4.1 et la proposition 4.5. La clé est maintenant l’étude de l’ensemble Γ. Dans cette esquisse on raisonne informellement, étant entendu qu’une démonstration rigoureuse demande du soin dans le maniement de la sélection mesurable et de la désintégration. Soit (x, y) ∈ Γ, et γ : [t0 , t1 ] → X une géodésique joignant x à y, alors pour tout t ∈ [t0 , t1 ] on a (x, γ(t)), (γ(t), y) ∈ Γ ; en effet d(x, y) = ϕ(y) − ϕ(x) ≤ |ϕ(y) − ϕ(γ(t))| + |ϕ(γ(t)) − ϕ(x)| ≤ d(γ(t), y) + d(x, γ(t)) = d(x, y), ce qui impose l’égalité partout, et donc, par exemple, ϕ(γ(t)) − ϕ(x) = d(x, γ(t)). Donc R est fait d’une union de géodésiques ; en retirant la diagonale, on élimine les géodésiques de longueur nulle, et TE est ainsi une union de géodésiques de longueur non nulle. On vérifie par ailleurs la mesurabilité de R, TE et E. Soit maintenant A+ l’ensemble des points de TE qui mènent à un branchement vers le futur (les x tels que (x, z) ∈ Γ et (x, w) ∈ Γ avec z, x, w distincts) ; et similairement A− l’ensemble de ceux qui mènent à un branchement vers le passé. Le problème est de montrer que ν[A± ] = 0. Raisonnons par l’absurde : si ν[A+ ] > 0, on peut sélectionner un sous-ensemble B de A+ de mesure positive, tel que de chaque x ∈ B sont issues deux géodésiques distinctes, disons γ 1,x et γ 2,x , qui interviennent dans TE . Quitte à restreindre encore, et à interrompre ces géodésiques à un instant adéquat (après branchement), on peut supposer que leurs points extrémaux, disons θ1 (x) et θ2 (x), sont situés dans une ligne de niveau commune de ϕ. Notons C 1 = θ1 (B), C 2 = θ2 (B) : on a donc
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
244
C. VILLANI
par construction un transport branché issu de B et aboutissant en C 1 ∪ C 2 . Soient alors µ00 = νB la mesure de probabilité portée par B, de densité uniforme 1/ν[B] ; 1 0 2 0 et µ01 = (1/2)(θ# µ0 + θ# µ0 ). On a ainsi construit un transport branché de la mesure absolument continue µ00 vers la mesure (peut-être singulière) µ01 ; et toujours par construction, ce transport est associé à un ensemble d-monotone Γ0 ⊂ Γ, inclus dans le sous-différentiel de ϕ. Or ϕ est constante sur le support de µ01 , le critère du lemme 4.9 est donc évidemment satisfait (ϕ(y 0 ) − ϕ(y) = 0 dans l’énoncé) ; il s’ensuit que le transport est optimal au sens (MK2 ). Mais cela vient contredire le théorème 4.3. On en déduit que ν[A+ ] = 0, et de même ν[A− ] = 0 ; on définit alors T en retirant A± de TE . Une fois éliminés les points de branchement, on montre facilement (en utilisant encore une fois T ⊂ ∂d ϕ) que R définit une relation d’équivalence sur T , et que chaque classe d’équivalence [x] constitue l’image d’une géodésique, éventuellement définie sur un intervalle ouvert ou semi-ouvert. Quitte à ajouter un ou deux points extrémaux, on obtient ainsi le rayon R(x) ; cela achève la preuve de (ii). On choisit ensuite une section mesurable S de la relation d’équivalence R sur T , de sorte que T est l’union des [x], x ∈ S ; on paramètre la géodésique R(x) de façon unitaire, dans le sens croissant de ϕ, en choisissant x comme origine : ainsi elle est définie sur un intervalle [a(x), b(x)] contenant 0. Soit g(x, t) l’application ainsi définie : à x ∈ S et t ∈ [a(x), b(x)] elle associe le point de R(x) dont la distance signée par rapport à x est égale à t. Puis on désintègre ν, restreinte à T , par rapport à la relation d’équivalence R, en identifiant à S l’espace quotient : Z νbT = νx q(dx), S
où q est la mesure (PS )# ν sur S (avec PS l’application de « projection » qui à y associe la première composante de g −1 (y)) et νx la mesure conditionnelle, concentrée sur le rayon R(x). L’étape clé maintenant consiste à prouver que (pour presque tout x) νx est absolument continue par rapport à g(x, ·)# L 1 , la mesure 1-dimensionnelle portée par R(x). Cette estimation traduit l’idée que la famille des rayons ne varie pas de façon trop « sauvage », et n’a rien d’une formalité : on sait en effet construire « à la Besicovitch » une famille de segments disjoints dans R3 pour lesquels les milieux forment un ensemble M de mesure strictement positive ; dans ce cas, si ν est la mesure de Lebesgue portée par M , ses mesures conditionnelles par rapport à la famille de segments sont toutes singulières. Pour prouver l’absolue continuité, on raisonne encore par l’absurde : si elle était en défaut, on trouverait un compact C ⊂ T tel que (24)
ASTÉRISQUE 407
ν[C] > 0,
(q ⊗ L 1 )(g −1 (C)) = 0.
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
245
(Dans l’exemple précédent, C pourrait être l’ensemble des milieux.) Quitte à restreindre, on peut aussi imposer que chaque rayon issu de C traverse une certaine courbe de niveau {ϕ = δ} dans le sens des temps croissants, et que ϕ < δ 0 < δ sur C. Soit y ∈ C : on lui associe une interpolation ξt (y) qui progresse à vitesse constante le long de R(y), telle que ξ0 (y) = y et ξ1 (y) ∈ {ϕ = δ} : en d’autres termes, ϕ(ξt (y)) est une interpolation linéaire entre ϕ(y) et δ. La fonction ξt définit ainsi une interpolation entre l’ensemble C et un sous-ensemble de {ϕ = δ}, portée par un ensemble de rayons. Comme ce transport aboutit dans {ϕ = δ}, le lemme 4.9 s’applique à nouveau pour fournir un transport optimal (MK2 ), et l’on peut utiliser la condition CD(K, N ), R 1−1/N encore une fois via ρt dν ≥ ν[ρt > 0]1/N , pour obtenir une borne inférieure sur ν[Ct ], faisant intervenir K et N , de la forme ν[Ct ] ≥ c(K, N, r) (1 − t)N ν[C]. Ici r > 0 est une borne sur les distances en jeu, qui sont supposées suffisamment petites, quitte à localiser, et c(K, N, r) > 0 ; ainsi Z 1/2 (25) ν[Ct ] dt > 0. 0
Mais cela est aussi, par réécriture et Fubini, h i −1 (26) ((g# ν) ⊗ L 1 ) (x, τ, t) ∈ S × R × [0, 1/2]; (x, τ ) ∈ g −1 (Ct ) Z h i −1 1 = L t ∈ [0, 1/2]; (x, τ ) ∈ g −1 (Ct ) (g# ν)(dx dτ ). S ×R
−1
Si (x, τ ) ∈ g (Ct ), cela veut dire que g(x, τ ) ∈ Ct , et par la construction de Ct on a ϕ(g(x, τ )) = (1 − t)ϕ(g(x, τ 0 )) + tδ, où g(x, τ 0 ) ∈ C. En revenant aux définitions de g et de l’interpolation θt , et en se souvenant que ϕ(g(y, t)) varie comme t, on trouve ϕ(x) + τ = (1 − t) ϕ(y) + τ 0 + t ϕ(y) + (δ − ϕ(y)) , où g(x, τ 0 ) ∈ C. De l’équation précédente on tire τ 0 en fonction de τ, t, δ et y, et on obtient finalement τ − t(δ − ϕ(y)) g(x, τ ) ∈ Ct ⇐⇒ g x, ∈ C. 1−t Pour chaque (x, τ ) dans g −1 (Ct ), on a ϕ(x) + τ < δ 0 < δ, et donc la fonction t 7−→ s = (τ − t(δ − ϕ(y)))/(1 − t) est uniformément bilipschitzienne pour t ∈ [0, 1/2], de sorte que dt/ds est uniformément majoré par J > 0. Ainsi h h i i 1 L t ∈ [0, 1/2]; (x, τ ) ∈ g −1 (Ct ) ≤ J L 1 s ∈ R; (x, s) ∈ g −1 (C) et l’intégrale de (26) est majorée par Z h i −1 1 J L s ∈ R; (x, s) ∈ g −1 (C) (g# ν)(dy dτ ). S ×R
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
246
C. VILLANI
−1 L’intégrande maintenant ne dépend plus de τ ; mais la première marginale de g# ν est −1 (P1 ◦ g )# ν, où P1 est la première projection ; c’est-à-dire (PS )#ν = q. Finalement l’intégrale est majorée par Z h i 1 J L s ∈ R; (x, s) ∈ g −1 (C) q(dx) = J (q ⊗ L 1 )(g −1 (C)) = 0 S
par (24). Ceci contredit l’inégalité (25), et achève la preuve de la continuité de la désintégration. Passons enfin à la construction du transport optimal. L’idée est de tout désintégrer selon les lignes du transport ; mais comme µ1 est peut-être singulière, nous allons devoir emprunter un bref détour. Soit π un transport optimal quelconque ; on sait que le support de π est inclus dans Γ. On partitionne (T × X) ∩ Γ selon la classe de la première composante : cela revient à écrire cet ensemble comme union disjointe des [R(x) ∩ T × X] ∩ Γ. On désintègre alors π par rapport à cette relation d’équivalence : cela revient à écrire π R comme une intégrale S πy Q(dy), où chaque πy ∈ P (R(y) × R(y)). On note µ0,y et µ1,y les marginales de πy : ce sont des mesures sur R(y), et µ0,y est absolument continue par rapport à g(y, ·)# L 1 . Maintenant, pour chaque y, on construit aisément par application du lemme 4.10 un transport optimal Ty , croissant le long de R(y), tel que (Ty )# µ0,y = µ1,y . Bien R sûr, πy est optimal aussi (par d-monotonie cyclique), donc d(x0 , x1 ) πy (dx0 dx1 ) = R d(x, Ty (x)) µ0,y (dx) ; en intégrant les deux membres par rapport à Q on obtient R R d(x0 , x1 ) π(dx0 dx1 ) = d(x, T (x)) µ0 (dx), où T (x) = Ty (x) si x ∈ R(y). On conclut que T est une application de transport optimal.
5. LOCALISATION EN AIGUILLES En géométrie des convexes, la technique de localisation a été mise au point par Kannan, Lovász et Simonovits [57]. Elle est basée sur la décomposition de la mesure le long de segments disjoints, ou « aiguilles » ; on peut faire remonter l’idée à Payne-Weinberger [79] et Gromov-Milman [53]. Par exemple, la motivation de PayneWeinberger était d’obtenir des inégalités de Poincaré optimales pour des fonctions de moyenne nulle dans un ouvert Ω convexe de En : en découpant de façon répétée Ω selon des hyperplans, tout en préservant la condition de moyenne nulle dans chaque sous-domaine, on se ramène à prouver l’inégalité souhaitée sur des domaines de plus en plus petits, et finalement (à la limite) sur des droites. Dans un travail récent, Klartag [61] montrait comment construire une telle décomposition en aiguilles dans un contexte riemannien, au moyen du problème de Monge-Kantorovich (MK1 ), les aiguilles étant alors les rayons de transport optimal ;
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
247
il en déduisait une nouvelle preuve de l’inégalité classique de Lévy-Gromov. CavallettiMondino [26] adaptaient ensuite l’idée de Klartag à des espaces métriques, se débarrassant de toute hypothèse de régularité. Par la même occasion, ils obtenaient l’amélioration des inégalités de courbure-dimension le long des aiguilles. Ces contributions sont rassemblées dans le résultat suivant : Théorème 5.1 (Décomposition en aiguilles sous hypothèse de courbure-dimension, [26]) Soit (X , d, ν) un espace géodésique mesuré compact, essentiellement non branchant, vérifiant la condition CD∗ (K, N ) pour K ∈ R et 1 < N < ∞. Soit f ∈ L1 (X ) tel R que X f dν = 0. Alors on peut décomposer X en deux ensembles disjoints T et Z, et on peut décomposer T en une partition (Xγ )γ∈Q , où chaque Xγ est la trajectoire d’une géodésique unitaire γ définie sur un intervalle Iγ de R, et les γ sont indexés par un espace polonais Q. En outre on peut définir une mesure q sur Q, et une famille de mesures (νγ )γ∈Q sur X , de sorte que (i) Pour tout ensemble mesurable B ⊂ T , on a Z ν[B] = νγ [B] q(dγ) Q
et chaque νγ (mesure conditionnelle à γ) est portée par Xγ . (ii) Soit uγ la densité de νγ par rapport à γ# L 1 , la mesure 1-dimensionnelle portée par Xγ : alors hγ = uγ ◦ γ vérifie, au sens des distributions sur Iγ , l’inégalité différentielle de courbure-dimension (27)
1 1 d2 K hγN −1 + hγN −1 ≤ 0. 2 dt N −1
(iii) Enfin, Z q(dγ)-presque sûrement, f dνγ = 0, ν(dz)-presque partout, z ∈ Z =⇒ f (z) = 0. Remarque 5.2. — On pourra retenir la décomposition de la mesure sous la forme Z νbT = (hγ ◦ γ −1 ) H 1 bXγ q(dγ), Q
où H 1 est la mesure de Hausdorff 1-dimensionnelle. Remarque 5.3. — On peut inclure le cas N = 1 dans le théorème 5.1 en imposant que hγ reste constant le long de γ.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
248
C. VILLANI
Remarque 5.4. — En pratique, f dans le théorème 5.1 dépend de la propriété géométrique que l’on souhaite établir ; l’énoncé (iii) permet de ramener l’étude globale (dans (X , d, ν)) à l’étude « locale » sur un espace 1-dimensionnel (Xγ , d, νγ ) (ou de façon équivalente sur l’intervalle mesuré (Iγ , | · |, hγ L 1 )) ; l’énoncé (ii) assure que cet espace vérifie l’inégalité (optimale) de courbure-dimension CD∗ (K, N ). R R Preuve du théorème 5.1 (esquisse). — Par hypothèse f dν = 0, soit f+ dν = R f− dν, où f± sont les parties positive et négative de f . Si cette masse commune m est nulle, il n’y a rien à prouver. Si m > 0, on pose µ0 = m−1 f− ν, µ1 = m−1 f+ ν, et on peut considérer le problème de transport (MK1 ) entre µ0 et µ1 dans (X , d, ν). Le théorème 4.6 fournit un transport optimal π, une fonction 1-lipschitzienne ϕ, R optimale dans le problème dual (qui ici est simplement max{ ϕ f dν; kϕkLip ≤ 1}) ; et π est supporté dans le d-sous-différentiel de ϕ. Ce théorème fournit aussi un ensemble de transport T , partitionné par les rayons R(x) (T ∩ R(x) est une trajectoire géodésique éventuellement privée d’une ou de ses deux extrémités). En outre µ0 et µ1 sont étrangères, donc concentrées sur T (aucune masse ne peut « rester en place » durant le transport) ; il s’ensuit que f± valent 0, presque partout sur Z = X \ T . Comme dans la preuve du théorème 4.6, on désintègre ensuite la mesure ν par rapport à la relation d’équivalence R ; cela engendre une mesure quotient notée q, et des mesures conditionnelles νγ . Il sera commode d’introduire une section S de cette relation d’équivalence R, contenant un élément de chaque Xγ , choisi mesurablement ; on pourra ainsi, selon les cas, considérer l’espace quotient Q comme l’ensemble des géodésiques γ associées aux Xγ , ou comme l’ensemble S . En désintégrant un transport optimal dynamique Π par rapport à (Xγ )# q, on obtient, pour q(dγ)-presque tout γ, un transport entre deux mesures µ0,γ et µ1,γ , portées par Xγ , qui ne sont autres que m−1 f− νγ et m−1 f+ νγ . En particulier, R R f− dνγ = f+ dνγ . À ce stade, tout est démontré, sauf la partie (ii), un énoncé qu’il faut établir pour presque toute géodésique γ ∈ Q, ou de façon équivalente pour presque tout x ∈ S . Sans perte de généralité, on peut supposer que S est inclus dans une famille dénombrable d’ensembles de niveau de ϕ ; on peut alors recouvrir T , identifié à un sous‹ × [a, b], où ensemble de S × R, par une famille dénombrable d’ensembles de la forme S ‹ ϕ(S ) = c et a < c < b. On va travailler sur l’un de ces ensembles fixés, et démontrer ‹, donc par l’inégalité souhaitée sur ]a, b[. On note g(y, τ ) = γ(s + τ ), où γ(s) = y ∈ S hypothèse ϕ(γ(s)) = c, et ϕ(g(y, τ )) = ϕ(γ(s)) + τ = c + τ . Soient A0 , A1 , L0 , L1 > 0 tels que a < A0 < A0 + L0 < c < A1 < A1 + L1 < b. (On se réserve bien sûr le droit d’imposer des conditions supplémentaires par la suite.) On
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
249
définit deux nouvelles mesures de probabilité µ e0 , µ f1 par µ ei =
1[Ai ,Ai +Li ] (τ ) 1Se(y) L 1 ⊗ q (dτ dy). Li
En d’autres termes, sur chaque rayon, µ ei est la mesure uniforme U [Ai , Ai + Li ] portée par le segment [Ai , Ai + Li ]. Le transport optimal croissant entre U [A0 , A0 + L0 ] et U [A1 , A1 + L1 ] est l’application affine croissante qui envoie [A0 , A0 + L0 ] sur [A1 , A1 + L1 ], autrement dit L1 L1 θ : τ 7−→ τ + A1 − A0 . L0 L0 ‹, on définit un En introduisant ce transport sur chaque géodésique γ passant par S transport Te entre µ e0 et µ e1 , qui dans les variables (y, τ ) se lit simplement τ 7−→ θ(τ ). En particulier (en notant ϕ(y, τ ) = ϕ(g(y, τ ))), L1 L1 e ϕ(T (y, τ )) = c + ϕ(y, τ ) − c + A1 − A0 L0 L0 est une fonction affine croissante de ϕ(y, τ ), dont les paramètres sont déterminés uniquement par c, A0 , A1 , L0 , L1 . On en déduit que {(x, Te(x))}, sous-ensemble de Γ, vérifie les conditions du lemme 4.9 et que c’est donc le transport optimal pour (MK2 ). L’interpolation au sens W2 entre µ e0 et µ e1 consiste simplement à interpoler linéairement le paramètre τ sur chaque γ, soit µ et =
1[At ,At +Lt ] (τ ) 1e (y) (q ⊗ L 1 )(dy dτ ), S Lt
où At = (1−t) A0 +t A1 , Lt = (1−t) L0 +t L1 . On peut donc appliquer à ρet = de µt /dν l’inégalité (19) ou (20) pour 0 ≤ t ≤ 1. Le transport optimal est concentré sur des géodésiques γet de la forme (y, (1 − t)τ0 + tτ1 ), où τ1 = θ(τ0 ), de sorte que |(e γt )· | = τ1 − τ0 . Par construction et par définition de la densité hγ , 1[At ,At +Lt ] (τ ) ρet (y, τ ) = . Lt hγ (τ ) L’inégalité (20) s’écrit donc ici (en évaluant en τ (t) = (1 − t)τ0 + tτ1 ) " # 2 1[At ,At +Lt ] (1 − t)τ0 + tτ1 (w(t)) ˙ 2 . (28) w(t) ¨ − ≥ K (τ1 − τ0 ) , w(t) = log N Lt hγ (1 − t)τ0 + tτ1 Dans (28) on a le choix des paramètres τi , Ai , Li . On choisit τi = Ai , et on fait tendre les Li vers 0 de sorte que (L1 − L0 )/L0 −→ α > 0 (α fixé, arbitraire). En notant `γ (t) = − log hγ ((1 − t)A0 + tA1 ), on trouve w = `γ − log Lt ,
L1 − L0 w˙ = `˙γ − , Lt
(L1 − L0 )2 w ¨ = `¨γ + , L2t
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
250
C. VILLANI
où toutes ces expressions sont évaluées en (1 − t)A0 + tA1 . En reportant dans (28) et en évaluant en τ0 = A0 , on trouve (`˙γ − α)2 ≥ K. N Il reste à optimiser par rapport à α : on trouve que le meilleur choix est obtenu pour α = `˙γ /(N − 1), et transforme (29) en (`¨γ + α2 ) −
(29)
(`˙γ )2 ≥K `¨γ − N −1
(30)
... ce qui est exactement le but recherché (ii) ! Ici on a établi l’inégalité au point A0 , mais on ferait de même pour l’obtenir en A1 , et finalement en n’importe quel point de l’intervalle ]a, b[. On constate en particulier que c’est la liberté de choisir le rapport entre L0 et L1 qui a permis de gagner une dimension. Pour conclure, on note que même si la fonction `γ , évaluée le long de la géodésique, n’est pas deux fois différentiable, elle est semi-convexe, ce qui permet de justifier le calcul. Remarque 5.5. — Au lieu de raisonner sur l’inégalité différentielle comme cidessus, on peut, à l’instar de [26], utiliser les formulations intégrales de CD(K, N ) et CD∗ (K, N ). Il est commode alors de passer par la formulation CDloc (K, N ), et le gain d’une dimension se ramène à l’identité ( #) " N1 N1 1 1 1 1 K,N 2L 2L0 1 h0N + h1N max β (γ0 , γ1 ) N L0 ,L1 2 1/2 L0 + L1 L0 + L1 =
NN−1 1 N1−1 1 ∗ K,N −1 N −1 (γ0 , γ1 ) h0 β . + h1 2 1/2
Ayant appliqué cela aux hi = 1/ρ(ti ), on peut utiliser la propriété de localisation ∗
associée aux coefficients β pour globaliser cette inégalité.
6. PREUVE SYNTHÉTIQUE DE L’INÉGALITÉ DE LÉVY-GROMOV Après les préparatifs des sections précédentes, nous n’aurons aucune difficulté à démontrer le résultat principal de cet exposé. On rappelle que IX est le profil isopérimétrique normalisé associé à l’espace X (muni d’une métrique et d’une mesure de référence), comme dans (2). On notera IK,N le profil isopérimétrique de référence, p défini comme la fonction isopérimétrique normalisée de S K,N = SN ( (N − 1)/K) si N est entier, ou plus généralement, pour toutes valeurs de N > 1, comme la fonction isopérimétrique de l’espace X K,N défini dans la remarque 1.5.
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
251
Théorème 6.1 (principe de comparaison de Lévy-Gromov dans les espaces métriques mesurés, [26]) Soit (X , d, ν) un espace géodésique mesuré compact, essentiellement non branchant, vérifiant CD∗ (K, N ) pour K > 0 et 1 < N < ∞. Alors IX ≥ IK,N . Corollaire 6.2. — L’inégalité isopérimétrique de Lévy-Gromov de dimension N et constante K est vérifiée par les trois classes d’espaces suivantes : – les limites de Gromov-Hausdorff mesurées de variétés riemanniennes de dimension au plus N et courbure de Ricci minorée par K ; – les espaces d’Alexandrov de courbures minorées par K/(N − 1) et de dimension au plus N ; – les espaces finslériens vérifiant CD∗ (K, N ) au sens de [74]. Remarque 6.3. — C’est par cohérence avec le reste de l’exposé que l’on impose la compacité dans le théorème 6.1 ; en fait elle découle automatiquement de CD∗ (K, N ), comme dans [66]. Remarque 6.4. — Dans un espace de Finsler lisse de dimension n, équipé de normes k · kx , la condition CD∗ (K, N ) signifie essentiellement que n ≤ N et Ric g ≥ K g, où la métrique g est définie par gx (v) = (1/2)d2v kvk2x . Une partie importante de la théorie classique de la courbure-dimension peut s’adapter aux espaces finslériens [76]. Pour la décomposition en aiguilles dans ce cadre, et les inégalités isopérimétriques optimales, on pourra consulter [75]. Preuve du théorème 6.1. — On souhaite établir l’inégalité IX (α) ≥ IK,N (α) pour tout α ∈ [0, 1] ; il suffit de le faire pour 0 < α < 1. Sans perte de généralité, on peut supposer que ν[X ] = 1. Soit donc α fixé dans ]0, 1[, et soit A une partie mesurable de X telle que ν[A] = α. R On pose f (x) = 1A (x) − α, de sorte que f dν = 0, et f ne s’annule jamais. Par le théorème 5.1, on peut décomposer X en une union disjointe, et ν en une famille de mesures conditionnelles : Z [ X = Xγ ∪ Z, ν= νγ q(dγ), Q
γ∈Q
de sorte que (a) ν[Z] = 0 ; (b) chaque espace (Xγ , d, νγ ) vérifie CD∗ (K, N ) ; et R (c) f dνγ = 0 pour (presque) tout γ. Sachant que νγ est concentrée sur Xγ , cette dernière propriété s’écrit νγ [A ∩ Xγ ] = α.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
252
C. VILLANI
On va ainsi se ramener à un problème isopérimétrique, avec le même volume α, sur chaque aiguille géodésique (Xγ , d, νγ ) : cela fonctionnera grâce à la remarque évidente Aε ∩ Xγ = x ∈ Xγ ; ∃y ∈ A; d(x, y) ≤ ε ⊃ x ∈ Xγ ; ∃y ∈ A ∩ Xγ ; d(x, y) ≤ ε = (A ∩ Xγ )ε , où, dans la dernière expression, l’élargissement est pris dans l’aiguille (Xγ , d). Supposons un instant le théorème démontré dans chaque (Xγ , d, νγ ) : alors, avec la notation (3) (dans l’espace de référence X K,N ), νγ [(A ∩ Xγ )ε ] ≥ ΦK,N (α; ε). D’où ν[Aε ] =
Z
νγ [Aε ∩ Xγ ] q(dγ)
Q
Z ≥
νγ [(A ∩ Xγ )ε ] q(dγ)
Q
Z ≥
ΦK,N (α; ε) q(dγ) = ΦK,N (α; ε). Q
Il ne reste donc qu’à démontrer le théorème pour chaque espace monodimensionnel (Xγ , d, νγ ) ; pour cela il suffit de le faire pour un sous-espace mesuré de R de la forme (I, | · |, h) : un intervalle I = [a, b] de R, muni de la distance canonique, et d’une densité h (pour la mesure de Lebesgue) telle que 1 K d2 N1−1 h h N −1 ≤ 0. + (31) 2 dt N −1 Si h est lisse, la preuve du théorème dans ce cadre se fait par des arguments classiques [70, théorème 1.2, corollaire 3.2]. Sinon, on peut régulariser h par convolution, tout en préservant l’inégalité (31) : pour cela on introduira une approximation (φδ ) de l’identité au sens de la convolution, c’est-à-dire φδ (x) = δ −1 φ(x/δ), où φ : R → R est lisse, à support dans [−1, 1], strictement positive dans ]−1, 1[, et d’intégrale 1 ; 1 on posera alors hδ = (h N −1 ∗ φδ )N −1 . La densité hδ est lisse, et par les propriétés habituelles de la convolution, elle vérifie (31) dans l’intervalle Iδ = ]a + δ, b − δ[. On a donc le résultat dans (Iδ , hδ ), et la conclusion pour (I, h) s’ensuit par passage à la limite selon un schéma classique [70, théorème 6]. Remarque 6.5. — La preuve s’adapte sans la moindre difficulté pour tenir compte de la contrainte de diamètre : si dans l’énoncé on sait en outre que diam(X ) ≤ D, alors on prouve que IX ≥ IK,N,D , la fonction isopérimétrique de la famille d’espaces modèles définie par Milman [70] sous contraintes de courbure-dimension et de diamètre. Pour incorporer cette extension il suffit de remarquer que diam(Xγ ) ≤ diam(X ).
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
253
Aε
Xγ A Xγ 0
Figure 6. Réduction par les aiguilles Xγ à des problèmes isopérimétriques monodimensionnels ; sur chaque aiguille, l’élargissement de A reste contenu dans Aε .
Remarque 6.6. — La décomposition en aiguilles est ici basée sur un transport optimal entre la mesure uniforme portée par A, et celle qui est portée par X \ A. En cela la démonstration s’inscrit dans la lignée de deux arguments « bien connus » : – la méthode de Marton [68, 78] pour établir des inégalités de concentration, basée sur le transport optimal entre les mesures uniformes portées par A et X \ Aε ; – la méthode de Rajala [81] pour établir des inégalités de Poincaré locales, basée sur un transport optimal entre {u < M } et {u > M }, où M est une médiane de u (en supposant ici {u = M } pour simplifier l’écriture). Une surprise de taille, cependant, est la constatation que le transport en jeu est un transport (MK1 ), alors que dans presque toutes les études précédentes de la courburedimension, c’était le transport (MK2 ) qui était à l’honneur. Cela a amené Cavalletti & Milman [25] à suggérer une nouvelle notion de courbure-dimension basée sur le transport (MK1 ).
7. CAS D’OPTIMALITÉ Les techniques de transport optimal, plutôt constructives, se prêtent si bien à l’étude de la rigidité des inégalités isopérimétriques, que c’est avec elles qu’ont été obtenus les résultats les plus fins pour la rigidité de l’inégalité isopérimétrique dans Rn (non nécessairement euclidien), voir [38]. Pour discuter des cas d’optimalité associés au théorème 6.1, on considérera l’hypothèse plus forte de condition de courbure-dimension « riemannienne » c’est-à-dire
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
254
C. VILLANI
RCD∗ (K, N ) ; on rappelle que cela implique automatiquement la propriété de nonbranchement essentiel. Pour éviter des situations dégénérées, on supposera N ≥ 2 ; et quitte à modifier la distance par un facteur constant, on supposera K = N − 1. On rappelle quelques notions de géométrie métrique. Soient (S, dS , νS ) et (F, dF , νF ) deux espaces métriques mesurés : on pense à S (le « support ») comme à la base d’une fibration dont les fibres sont des répliques homothétiques de F . On travaillera sur le produit S × F , et on se donnera une fonction f : S → R+ . Sur les chemins γ : [0, 1] → S × F on définit la fonctionnelle de longueur Z 1 1/2 ˙ 2 (t) |α| ˙ 2 (t) + (f ◦ α)2 |β| Lf (γ) = dt 0
˙ le déplacement dans la fibre, dont le poids est (|α| ˙ est le déplacement dans S, |β| modulé en fonction de la valeur dans S). De Lf on tire une distance df par la formule habituelle df ((p, x), (q, y)) = inf Lf (γ); γ(0) = (p, x), γ(1) = (q, y) . Enfin on définit le produit tordu (warped product) de S par F , avec torsion f et exposant N , par N S ×N f F = S × F/df , df , f νS ⊗ νF . Les exemples les plus célèbres sont – le cône Cone(F ) construit sur un espace F , défini seulement quand diam(F ) ≤ π ; c’est le produit tordu obtenu en choisissant S = R+ et f (t) = t. Dans ce cas on peut explicitement calculer la distance : p d((s, x), (t, y)) = s2 + t2 − 2 s t cos(d(x, y)) (bien noter que la distance restreinte à S est la distance usuelle sur R+ , mais la distance restreinte à une fibre n’est pas la distance intrinsèque de la fibre, car cette dernière n’est pas géodésique dans le cône) ; – la suspension sphérique construite sur F , obtenue par S = [0, π] et f (t) = sin t. Ces espaces sont connus pour intervenir dans les cas d’optimalité du théorème de Lévy-Gromov classique. L’étude d’optimalité dans le théorème 6.1 se fait sans douleur grâce à la nature assez constructive de la démonstration, et à l’aide de deux résultats auxiliaires : – la monotonie stricte du profil isopérimétrique par rapport au diamètre : si, comme dans la remarque 6.5, on note IN −1,N,D la fonction isopérimétrique sous contrainte de diamètre au plus égal à D, alors pour tout α ∈ ]0, 1[, IN −1,N,D est une fonction strictement décroissante de D ∈ ]0, π[ (ajouter des contraintes augmente strictement l’infimum isopérimétrique) [26, lemme 6.5] ; – le théorème de diamètre maximal, démontré dans ce cadre par Ketterer [60] : si (X , d, ν) vérifie RCD∗ (N − 1, N ) et diam(X ) = π, alors il existe un espace
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
255
N −1 géodésique mesuré (X 0 , d0 , ν 0 ) tel que (X , d, ν) ' [0, π] ×sin X 0 , et X 0 vérifie RCD∗ (N − 2, N − 1). Ce théorème est à son tour obtenu en combinant la propriété de courbure-dimension du cône et le théorème de décomposition en courbure positive (dû à Gigli [45] dans ce contexte) : en effet, la propriété de diamètre maximal implique que C = Cone(X ) contient une droite infinie, et par propriété de courbure-dimension il vérifie RCD∗ (0, N + 1) ; on peut donc le décomposer selon cette droite, et cela permet de décomposer X à son tour en un produit tordu. Après ces préliminaires, voici les deux théorèmes de rigidité démontrés par Cavalletti-Mondino [26]. Le premier montre que si le profil isopérimétrique de X coïncide avec le profil de référence, ne serait-ce qu’en une seule valeur, alors l’espace est une suspension sphérique.
Théorème 7.1. — Soit (X , d, ν) un espace géodésique mesuré compact vérifiant RCD∗ (N − 1, N ), 2 ≤ N < ∞. S’il existe α ∈ ]0, 1[ tel que IX (α) = IK,N (α), alors X
N −1 ' [0, π] ×sin Y,
où Y est un espace géodésique mesuré vérifiant RCD∗ (N − 2, N − 1). En outre IX = IK,N , et toute solution A du problème isopérimétrique dans X vérifie −1 A = [a, b] ×N sin Y , avec a = 0 ou b = π. Le second théorème est un résultat de stabilité en topologie de Gromov-Hausdorff mesurée ; en un sens c’est une généralisation qualitative des estimations quantitatives obtenues par Bérard, Besson et Gallot [17]. On notera dmGH l’une quelconque des distances métrisant la topologie de Gromov-Hausdorff mesurée [88] [90, chapitre 27]. Théorème 7.2. — Pour tous N > 1, α ∈]0, 1[, ε > 0 il existe η = η(N, α, ε) tel que si (X , d, ν) est RCD∗ (N − 1 − δ, N + δ) et IX (α)
≤ IN −1,N (α) + δ,
alors si δ ≤ η il existe Y un espace RCD∗ (N − 2, N − 1) tel que −1 dmGH X , [0, π] ×N sin Y ≤ ε. Preuve du théorème 7.1 (ébauche). — Si diam(X ) ≤ π − ε0 < π, alors en combinant la remarque 6.5 avec la propriété de monotonie du profil isopérimétrique, on a IN −1,N (α)
= IX (α) ≥ IN −1,N,π−ε0 (α) > IN −1,N (α),
ce qui est impossible. On en déduit que le diamètre de X est égal à π, et le théorème de diamètre maximal permet d’écrire X comme une suspension sphérique sur un espace Y , l’espace [0, π] s’identifiant à l’image d’une géodésique de longueur π. En utilisant la fonction ϕ, on identifie Y à l’espace quotient Q, les rayons Xγ étant tous isométriques à [0, π].
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
256
C. VILLANI
Ensuite, en considérant des minimiseurs de la forme [a, b] × Y , on prouve que IX (α) = IK,N (α) pour tout α ∈ [0, 1]. Reste à montrer que toute solution compacte A du problème isopérimétrique est de la forme [a, b] × Y . Pour cela on retourne à la preuve du théorème 6.1 : l’optimalité n’est possible que si A ∩ Xγ est optimal dans Xγ , soit, modulo identification, dans le segment [0, π] ; on prouve alors que A ∩ Xγ est forcément de la forme [a, b], où a = 0 ou b = π, cela pour presque tout γ ∈ Q. On montre enfin que l’optimalité de A implique un choix : soit a = 0 pour presque tout γ ; soit b = π pour presque tout γ. On renvoie à [26] pour les détails. Preuve du théorème 7.2 (ébauche). — Ce résultat découle facilement du théorème 7.1, de la propriété de diamètre maximal, de la continuité et de la monotonie de IK,N,D , et de la continuité de tous les objets considérés par rapport à la topologie de Gromov-Hausdorff mesurée (par exemple l’ensemble de tous les Y qui vérifient N −1 RCD∗ (N − 2, N − 1) est compact, et par suite l’ensemble de tous les [0, π] ×sin Y est également compact). On renvoie encore à [26] pour les détails.
8. DÉVELOPPEMENTS C’est une question naturelle de se demander si la preuve du théorème 6.1 s’adapte au cas où N = ∞, traité pour des varitétés riemanniennes par Bakry-Ledoux [14]. Cela ne va pas de soi, car le théorème 4.6 sur la structure du transport optimal (MK1 ) n’a pas de raison de s’appliquer quand N = ∞. Pour démontrer une comparaison isopérimétrique dans des espaces métriques de classe CD(K, ∞), on se retrouve alors avec deux stratégies, dont chacune généralise le théorème de Bakry-Ledoux dans une direction différente : – sur un espace vérifiant localement une inégalité de courbure-dimension, on peut reproduire l’argument de [26] dans de grandes boules, et passer à la limite pour obtenir l’inégalité souhaitée. Cette approche couvrira des espaces CD∗ (K, ∞) essentiellement non branchants qui sont « localement de dimension finie au sens de la courburedimension », c’est-à-dire dans lesquels chaque x est centre d’une boule où le critère de courbure CD(K 0 , N 0 ) sera vérifié pour des paramètres K 0 , N 0 éventuellement dépendant de x ; – sur un espace RCD(K, ∞), on peut adapter l’argument de Bakry-Ledoux, sur la base du calcul Γ2 non lisse de Savaré [86] ; cette approche, menée à bien dans [8], ne s’applique qu’aux espaces RCD, et pas aux espaces CD∗ non branchants. Ce programme peut aussi être mené à bien dans les espaces finslériens CD(K, N ) [77]. Une autre question naturelle consiste à identifier d’autres problèmes que les idées de Klartag, Cavalletti et Mondino peuvent traiter. Comme le montraient Kannan, Lovász
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
257
et Simonovits [57], la méthode de localisation en aiguilles peut en principe s’appliquer R R R R à toutes les inégalités de la forme ( g1 )α ( g2 )β ≤ ( g3 )α ( g4 )β , pourvu que l’on sache construire des décompositions adaptées. L’apport principal de Klartag dans les géométries lisses, et de Cavalletti-Mondino dans les géométries non lisses, est de démontrer que le transport optimal (MK1 ) fournit une telle décomposition, souple et générale. Pour la mettre en œuvre sur un problème donné, il convient donc d’introduire une fonction f adéquate, de moyenne nulle ; d’en déduire par le théorème 5.1 une décomposition en aiguilles géodésiques ; de montrer que l’inégalité se localise sur ces aiguilles, et ainsi de se ramener à la dimension 1. Armés de ce point de vue efficace, Cavalletti et Mondino [27] n’ont eu aucune difficulté à établir un certain nombre d’inégalités géométriques optimales dans les espaces CD∗ (K, N ) essentiellement non branchants, ainsi que les cas d’égalité correspondants dans les espaces RCD∗ (K, N ) : – Pour l’inégalité optimale de Brunn-Minkowski entre deux ensembles compacts A0 et A1 , on choisit f = 1A0 /ν[A0 ] − 1A1 /ν[A1 ] ; la localisation est possible parce que l’interpolation géodésique [A0 , A1 ]t n’est pas moins grande que celle qui est effectuée selon la décomposition particulière induite par f . – Pour l’inégalité de trou spectral L2 , appliquée à une fonction u de moyenne nulle, on pose simplement f = u ; la localisation est possible parce que |u| ˙ ≤ |∇u|, où |u| ˙ désigne la variation de u le long d’une géodésique. L’étude de l’optimalité permet de prouver une version non lisse du théorème de rigidité d’Obata ; et cette approche fonctionne aussi pour l’inégalité de p-trou spectral, avec f = u|u|p−2 . – Dans le cas où ν est une mesure de probabilité, pour l’inégalité de Sobolev logarithmique, appliquée à une densité de probabilité h, on pose simplement f = h−1 ; ˙ ≤ |∇h| qui permet de localiser. encore une fois, c’est l’inégalité |h| – Pour l’inégalité de Sobolev (p, q), appliquée à une fonction u, on pose f = 1 − |u|p /kukpLp (ν) ; et à nouveau on utilise |u| ˙ ≤ |∇u|. Dans ce dernier cas, on obtient ainsi l’inégalité optimale mentionnée par Ledoux [63, formule (16)] comme un problème ouvert ; plus généralement, presque tous les problèmes de constantes optimales dimensionnelles recensés dans [90] se retrouvent résolus.
9. CONCLUSIONS ET PERSPECTIVES Au cours des dix dernières années, la théorie de la courbure-dimension dans les espaces géodésiques mesurés s’est approprié de plus en plus de sujets, fournissant un cadre naturel même au niveau de la formulation des énoncés : par exemple, la propriété du cône s’y exprime naturellement (le cône n’est pas, sauf cas particulier, une variété
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
258
C. VILLANI
riemannienne, mais c’est un espace RCD), et le théorème de précompacité de Gromov (sous contraintes de courbure-dimension et de diamètre) y devient un théorème de compacité. Cavalletti-Mondino démontrent que cette théorie peut également couvrir des inégalités optimales en dimension finie, sans rien laisser à désirer par rapport au cadre lisse. Ils montrent en outre que cela peut se faire à partir de la condition en apparence sous-optimale CD∗ . En fait, si les résultats annoncés dans [25] sont confirmés, les conditions CD et CD∗ sont en fait équivalentes, au moins sous une hypothèse de nonbranchement ; ce qui signifierait que le choix entre CD et CD∗ (ou CDe ) est plus ou moins une question de goût. Mais comme CD∗ a l’avantage d’être « naturellement » globalisable, on peut argumenter que CD∗ émerge comme la condition naturelle de courbure-dimension quand N/K < ∞. En fin de compte, on peut maintenant distinguer trois déclinaisons de la théorie, en fonction de la régularité considérée. Le cadre le plus abouti est celui des espaces RCD∗ (K, N ) : il contient les limites de variétés riemanniennes et les espaces d’Alexandrov ; on y trouve maintenant des résultats très précis, et à peu près toute la théorie classique a pu y être adaptée. On peut définir un opérateur laplacien et faire le pont avec la théorie de Bakry-Émery [7, 36]. On a maintenant des inégalités optimales fines, avec rigidité [26, 27] ; tout au plus les résultats de rectifiabilité [58, 48, 71] laissent-ils peut-être de la place à amélioration. Se pose également la question de savoir si l’on trouve dans cette classe des espaces qui ne sont pas des limites de variétés riemanniennes. Enfin, on note que des résultats topologiques ont été récemment démontrés [72], et que d’autres suivront probablement. À un niveau plus général, viennent ensuite les espaces CD∗ essentiellement non branchants. Ce cadre autorise les espaces finslériens, et l’on peut espérer qu’il permette, autant que possible, un traitement unifié des inégalités riemanniennes et finslériennes (à l’instar des inégalités optimales de Sobolev de [33, 67], qui sont indépendantes de la norme). Le travail de Cavalletti-Mondino plaide pour faire de cette catégorie d’espaces un cadre naturel ; cependant, plusieurs problèmes restent posés : – enrichir la liste d’exemples : par exemple, a-t-on des conditions simples sur les bornes de courbure-dimension dans la sphère unité d’un espace normé uniformément convexe ? À partir de cette question, on peut espérer incorporer dans la théorie les estimations de concentration de [1, 53] (en dimension finie ou infinie) ; – trouver des sous-classes (autres que RCD∗ ) stables par topologie de GromovHausdorff mesurée, car la classe de tous les espaces CD∗ (K, N ) essentiellement non branchants ne l’est pas. On pourrait imaginer, par exemple, des classes définies par le degré d’uniforme convexité de l’espace W 1,2 (X ) ? À ce sujet on peut noter que la
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
259
preuve de la propriété de non-branchement essentiel dans la classe RCD∗ est délicate et surprenamment indirecte ; – incorporer les géométries sous-riemanniennes, du style de l’espace de Heisenberg. Si Baudoin-Bonnefont-Garofalo [16] ont proposé de gérer ces espaces par des familles d’inégalités fonctionnelles à la Bakry-Émery, en revanche Balogh-Krystály-Sipos [15] ont montré tout récemment que l’on pouvait les traiter par transport, de façon similaire aux espaces CD et CD∗ , grâce à l’emploi de coefficients de distortion bien choisis, ∗
qui ne se comparent pas aux coefficients β K,N ou β K,N, et permettent d’obtenir des inégalités isopérimétriques optimales. Un travail important de clarification reste à mener, mais on peut espérer ainsi une « grande unification » synthétique des bornes de courbure-dimension dans trois larges classes de géométries : riemanniennes, finslériennes, sous-riemanniennes. Enfin reste le cas des espaces métriques branchants, pour lequel nous avons le choix entre les différentes notions présentées dans la définition 2.6. Ici une question prioritaire consiste à trouver de nouveaux exemples d’intérêt, sachant que le branchement est souvent associé à la courbure négative : a-t-on aussi des exemples pertinents d’espaces métriques mesurés branchants en courbure positive ? Pour conclure, on rappelle que les notions non lisses se prêtent par nature à des généralisations dans des contextes encore plus singuliers, en dehors des espaces géodésiques, et que l’on peut aussi attendre de nouveaux travaux dans ces directions.
RÉFÉRENCES [1] S. Alesker – Localization technique on the sphere and the Gromov-Milman theorem on the concentration phenomenon on uniformly convex sphere, in Convex geometric analysis (Berkeley, CA, 1996), Math. Sci. Res. Inst. Publ., vol. 34, Cambridge Univ. Press, 1999, p. 17–27. [2] F. J. J. Almgren – Existence and regularity almost everywhere of solutions to elliptic variational problems with constraints, vol. 4, Mem. Amer. Math. Soc., no 165, 1976. [3] L. Ambrosio, N. Gigli, A. Mondino & T. Rajala – Riemannian Ricci curvature lower bounds in metric measure spaces with σ-finite measure, Trans. Amer. Math. Soc. 367 (2015), no 7, p. 4661–4701. [4] L. Ambrosio, N. Gigli & G. Savaré – Gradient flows in metric spaces and in the space of probability measures, second dir., Lectures in Mathematics ETH Zürich, Birkhäuser, 2008. [5] , Calculus and heat flow in metric measure spaces and applications to spaces with Ricci bounds from below, Invent. math. 195 (2014), no 2, p. 289–391.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
260
C. VILLANI
[6]
, Metric measure spaces with Riemannian Ricci curvature bounded from below, Duke Math. J. 163 (2014), no 7, p. 1405–1490.
[7]
, Bakry-émery curvature-dimension condition and Riemannian Ricci curvature bounds, Ann. Probab. 43 (2015), no 1, p. 339–404.
[8] L. Ambrosio & A. Mondino – Gaussian-type isoperimetric inequalities in RCD(K, ∞) probability spaces for positive K, Atti Accad. Naz. Lincei Rend. Lincei Mat. Appl. 27 (2016), no 4, p. 497–514. [9] L. Ambrosio, A. Mondino & G. Savaré – On the Bakry-émery condition, the gradient estimates and the local-to-global property of RCD∗ (K, N ) metric measure spaces, J. Geom. Anal. 26 (2016), no 1, p. 24–56. [10]
, Nonlinear diffusion equations and curvature conditions in metric measure spaces, prépublication arXiv:1509.07273.
[11] L. Ambrosio & P. Tilli – Topics on analysis in metric spaces, Oxford Lecture Series in Mathematics and its Applications, vol. 25, Oxford Univ. Press, 2004. [12] K. Bacher & K.-T. Sturm – Localization and tensorization properties of the curvature-dimension condition for metric measure spaces, J. Funct. Anal. 259 (2010), no 1, p. 28–56. [13] D. Bakry, I. Gentil & M. Ledoux – Analysis and geometry of Markov diffusion operators, Grundl. math. Wiss., vol. 348, Springer, 2014. [14] D. Bakry & M. Ledoux – Lévy-Gromov’s isoperimetric inequality for an infinite-dimensional diffusion generator, Invent. math. 123 (1996), no 2, p. 259– 281. [15] Z. M. Balogh, A. Kristály & K. Sipos – Geometric inequalities on Heisenberg groups, Calc. Var. Partial Differential Equations 57:61 (2018), doi: 10.1007/s00526-018-1320-3. [16] F. Baudoin, M. Bonnefont & N. Garofalo – A sub-Riemannian curvaturedimension inequality, volume doubling property and the Poincaré inequality, Math. Ann. 358 (2014), nos 3-4, p. 833–860. [17] P. Bérard, G. Besson & S. Gallot – Sur une inégalité isopérimétrique qui généralise celle de Paul Lévy-Gromov, Invent. math. 80 (1985), no 2, p. 295–308. [18] S. Bianchini & F. Cavalletti – The Monge problem for distance cost in geodesic spaces, Comm. Math. Phys. 318 (2013), no 3, p. 615–673. [19] F. Bolley, I. Gentil, A. Guillin & K. Kuwada – Equivalence between dimensional contractions in Wasserstein distance and the curvature-dimension condition, prépublication arXiv:1510.07793. [20] Y. Brenier – Décomposition polaire et réarrangement monotone des champs de vecteurs, C. R. Acad. Sci. Paris Sér. I Math. 305 (1987), no 19, p. 805–808.
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
261
[21] D. Burago, Y. Burago & S. Ivanov – A course in metric geometry, Graduate Studies in Math., vol. 33, Amer. Math. Soc., 2001. [22] Y. Burago, M. Gromov & G. Perel0 man – A. D. Aleksandrov spaces with curvatures bounded below, Uspekhi Mat. Nauk 47 (1992), no 2(284), p. 3–51, 222. [23] F. Cavalletti – Monge problem in metric measure spaces with Riemannian curvature-dimension condition, Nonlinear Anal. 99 (2014), p. 136–151. [24] , An overview of L1 optimal transportation on metric measure spaces, in Measure theory in non-smooth spaces, Partial Differ. Equ. Meas. Theory, De Gruyter Open, Warsaw, 2017, p. 98–144. [25] F. Cavalletti & E. Milman – The globalization theorem for the curvature dimension condition, prépublication arXiv:1612.07623. [26] F. Cavalletti & A. Mondino – Sharp and rigid isoperimetric inequalities in metric-measure spaces with lower Ricci curvature bounds, Invent. math. 208 (2017), no 3, p. 803–849. [27] , Sharp geometric and functional inequalities in metric measure spaces with lower Ricci curvature bounds, Geom. Topol. 21 (2017), no 1, p. 603–645. [28] T. Champion & L. De Pascale – The Monge problem in Rd , Duke Math. J. 157 (2011), no 3, p. 551–572. [29] J. Cheeger – Differentiability of Lipschitz functions on metric measure spaces, Geom. Funct. Anal. 9 (1999), no 3, p. 428–517. [30] J. Cheeger & T. H. Colding – Lower bounds on Ricci curvature and the almost rigidity of warped products, Ann. of Math. 144 (1996), no 1, p. 189–237. [31] , On the structure of spaces with Ricci curvature bounded below. I, J. Differential Geom. 46 (1997), no 3, p. 406–480 (Partie I), J. Differential Geom. 54 (2000), p. 13–35 (Partie II) et p. 37–74 (Partie III). [32] D. Cordero-Erausquin, R. J. McCann & M. Schmuckenschläger – A Riemannian interpolation inequality à la Borell, Brascamp and Lieb, Invent. math. 146 (2001), no 2, p. 219–257. [33] D. Cordero-Erausquin, B. Nazaret & C. Villani – A mass-transportation approach to sharp Sobolev and Gagliardo-Nirenberg inequalities, Adv. Math. 182 (2004), no 2, p. 307–332. [34] G. De Philippis & N. Gigli – From volume cone to metric cone in the nonsmooth setting, Geom. Funct. Anal. 26 (2016), no 6, p. 1526–1587. [35] Q. Deng & K.-T. Sturm – Localization and tensorization properties of the curvature-dimension condition for metric measure spaces, II, J. Funct. Anal. 260 (2011), no 12, p. 3718–3725. [36] M. Erbar, K. Kuwada & K.-T. Sturm – On the equivalence of the entropic curvature-dimension condition and Bochner’s inequality on metric measure spaces, Invent. math. 201 (2015), no 3, p. 993–1071.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
262
C. VILLANI
[37] M. Feldman & R. J. McCann – Monge’s transport problem on a Riemannian manifold, Trans. Amer. Math. Soc. 354 (2002), no 4, p. 1667–1697. [38] A. Figalli, F. Maggi & A. Pratelli – A mass transportation approach to quantitative isoperimetric inequalities, Invent. math. 182 (2010), no 1, p. 167–211. [39] N. Garofalo & A. Mondino – Li-Yau and Harnack type inequalities in RCD∗ (K, N ) metric measure spaces, Nonlinear Anal. 95 (2014), p. 721–734. [40] N. Gigli – Optimal maps in non branching spaces with Ricci curvature bounded from below, Geom. Funct. Anal. 22 (2012), no 4, p. 990–999. [41]
, An overview of the proof of the splitting theorem in spaces with nonnegative Ricci curvature, Anal. Geom. Metr. Spaces 2 (2014), p. 169–213.
[42]
, On the differential structure of metric measure spaces and applications, vol. 236, Mem. Amer. Math. Soc., no 1113, 2015.
[43]
, communication personnelle, 2017.
[44]
, Nonsmooth differential geometry—an approach tailored for spaces with Ricci curvature bounded from below, Mem. Amer. Math. Soc. 251 (2018), no 1196, p. 161.
[45]
, The splitting theorem in non-smooth context, prépublication arXiv:1302.5555.
[46] N. Gigli, K. Kuwada & S.-I. Ohta – Heat flow on Alexandrov spaces, Comm. Pure Appl. Math. 66 (2013), no 3, p. 307–331. [47] N. Gigli, A. Mondino & G. Savaré – Convergence of pointed non-compact metric measure spaces and stability of Ricci curvature bounds and heat flows, Proc. Lond. Math. Soc. 111 (2015), no 5, p. 1071–1129. [48] N. Gigli & E. Pasqualetto – Behaviour of the reference measure on RCD spaces under charts, prépublication arXiv:1607.05188. [49] N. Gigli, T. Rajala & K.-T. Sturm – Optimal maps and exponentiation on finite-dimensional spaces with Ricci curvature bounded from below, J. Geom. Anal. 26 (2016), no 4, p. 2914–2929. [50] M. Gromov – Paul Lévy’s isoperimetric inequality, prépublication IHÉS, reproduit dans [52, appendice C], 1980. [51]
, Sign and geometric meaning of curvature, Seminario Mat. e. Fis. di Milano 61 (1991), p. 9–123.
[52]
, Metric structures for Riemannian and non-Riemannian spaces, Modern Birkhäuser Classics, Birkhäuser, 2007.
[53] M. Gromov & V. D. Milman – Generalization of the spherical isoperimetric inequality to uniformly convex Banach spaces, Compos. math. 62 (1987), no 3, p. 263–282.
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
263
[54] E. Heintze & H. Karcher – A general comparison theorem with applications to volume estimates for submanifolds, Ann. Sci. École Norm. Sup. 11 (1978), no 4, p. 451–470. [55] C. Houdré, M. Ledoux, E. Milman & M. Milman (dir.) – Concentration, functional inequalities and isoperimetry, Contemporary Mathematics, vol. 545, Amer. Math. Soc., 2011, Papers from the International Workshop held at Florida Atlantic University, Boca Raton, FL, October 29–November 1, 2009. [56] R. Jordan, D. Kinderlehrer & F. Otto – The variational formulation of the Fokker-Planck equation, SIAM J. Math. Anal. 29 (1998), no 1, p. 1–17. [57] R. Kannan, L. Lovász & M. Simonovits – Isoperimetric problems for convex bodies and a localization lemma, Discrete Comput. Geom. 13 (1995), nos 3-4, p. 541–559. [58] M. Kell & A. Mondino – On the volume measure of non-smooth spaces with Ricci curvature bounded below, prépublication arXiv:1607.02036, à paraître dans Annali SNS. [59] C. Ketterer – Ricci curvature bounds for warped products, J. Funct. Anal. 265 (2013), no 2, p. 266–299. [60] , Cones over metric measure spaces and the maximal diameter theorem, J. Math. Pures Appl. 103 (2015), no 5, p. 1228–1275. [61] B. Klartag – Needle decompositions in Riemannian geometry, vol. 249, Mem. Amer. Math. Soc., no 1180, 2017. [62] B. Kloeckner & G. Kuperberg – The Cartan-Hadamard conjecture and the Little Prince, prépublication arXiv:1303.3115. [63] M. Ledoux – Géométrie des espaces métriques mesurés : les travaux de Lott, Villani, Sturm, Séminaire Bourbaki, vol. 2007/2008, exposé no 990, Astérisque 326 (2009), p. 257–279. [64] P. Lévy – Leçons d’analyse fonctionnelle, Gauthier-Villars, 1922, réédité en 1951 sous le titre Problèmes concrets d’analyse fonctionnelle. [65] J. Lott & C. Villani – Weak curvature conditions and functional inequalities, J. Funct. Anal. 245 (2007), no 1, p. 311–333. , Ricci curvature for metric-measure spaces via optimal transport, Ann. [66] of Math. 169 (2009), no 3, p. 903–991. [67] F. Maggi & C. Villani – Balls have the worst best Sobolev inequalities, J. Geom. Anal. 15 (2005), no 1, p. 83–121. [68] K. Marton – A measure concentration inequality for contracting Markov chains, Geom. Funct. Anal. 6 (1996), no 3, p. 556–571. [69] R. J. McCann – A convexity principle for interacting gases, Adv. Math. 128 (1997), no 1, p. 153–179.
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
264
C. VILLANI
[70] E. Milman – Sharp isoperimetric inequalities and model spaces for the curvature-dimension-diameter condition, J. Eur. Math. Soc. (JEMS) 17 (2015), no 5, p. 1041–1078. [71] A. Mondino & A. Naber – Structure theory of metric-measure spaces with lower Ricci curvature bounds I, prépublication arXiv:1405.2222. [72] A. Mondino & G. Wei – On the universal cover and the fundamental group of an RCD∗ (K, N )-space, J. reine angew. Math. (2016), doi:10.1515/ crelle-2016-0068. [73] G. Monge – Mémoire sur la théorie des déblais et des remblais, in Histoire de l’Académie Royale des Sciences de Paris, 1781, p. 666–704. [74] S.-i. Ohta – Optimal transport and Ricci curvature in Finsler geometry, in Probabilistic approach to geometry, Adv. Stud. Pure Math., vol. 57, Math. Soc. Japan, Tokyo, 2010, p. 323–342. [75]
, Needle decompositions and isoperimetric inequalities in Finsler geometry, prépublication arXiv:1506.05876, à paraître dans J. Math. Soc. Japan.
[76]
, Nonlinear geometric analysis on finsler manifolds, prépublication arXiv:1704.01257.
[77]
, A semigroup approach to finsler geometry : Bakry-Ledoux’s isoperimetric inequality, prépublication arXiv:1602.00390.
[78] F. Otto & C. Villani – Generalization of an inequality by Talagrand and links with the logarithmic Sobolev inequality, J. Funct. Anal. 173 (2000), no 2, p. 361–400. [79] L. E. Payne & H. F. Weinberger – An optimal Poincaré inequality for convex domains, Arch. Rational Mech. Anal. 5 (1960), p. 286–292. [80] A. Petrunin – Alexandrov meets Lott-Villani-Sturm, Münster J. Math. 4 (2011), p. 53–64. [81] T. Rajala – Local Poincaré inequalities from stable curvature conditions on metric spaces, Calc. Var. Partial Differential Equations 44 (2012), nos 3-4, p. 477– 494. [82]
, Failure of the local-to-global property for CD(K, N ) spaces, Ann. Sc. Norm. Super. Pisa Cl. Sci. 15 (2016), p. 45–68.
[83] T. Rajala & K.-T. Sturm – Non-branching geodesics and optimal maps in strong CD(K, ∞)-spaces, Calc. Var. Partial Differential Equations 50 (2014), nos 3-4, p. 831–846. [84] M.-K. von Renesse & K.-T. Sturm – Transport inequalities, gradient estimates, entropy, and Ricci curvature, Comm. Pure Appl. Math. 58 (2005), no 7, p. 923–940.
ASTÉRISQUE 407
(1127)
ISOPÉRIMÉTRIE DANS LES ESPACES MÉTRIQUES
265
[85] F. Santambrogio – Optimal transport for applied mathematicians, Progress in Nonlinear Differential Equations and their Applications, vol. 87, Birkhäuser, 2015. [86] G. Savaré – Self-improvement of the Bakry-émery condition and Wasserstein contraction of the heat flow in RCD(K, ∞) metric measure spaces, Discrete Contin. Dyn. Syst. 34 (2014), no 4, p. 1641–1661. [87] N. Shanmugalingam – Newtonian spaces : an extension of Sobolev spaces to metric measure spaces, Rev. Mat. Iberoamericana 16 (2000), no 2, p. 243–279. [88] K.-T. Sturm – On the geometry of metric measure spaces, Acta Math. 196 (2006), no 1, p. 65–131 (Part I), 133–177 (Part II). [89] V. N. Sudakov – Geometric problems in the theory of infinite-dimensional probability distributions, Proc. Steklov Inst. Math. (1979), no 2, p. 1–178. [90] C. Villani – Optimal transport, Grundl. math. Wiss., vol. 338, Springer, 2009. [91]
, Synthetic theory of Ricci curvature bounds, Jpn. J. Math. 11 (2016), no 2, p. 219–263.
[92] H.-C. Zhang & X.-P. Zhu – Ricci curvature on Alexandrov spaces and rigidity theorems, Comm. Anal. Geom. 18 (2010), no 3, p. 503–553.
Cédric VILLANI Institut Henri Poincaré (CNRS/UPMC) & Université Claude Bernard Lyon 1 Université de Lyon Institut Camille Jordan UMR CNRS 5208 43, boulevard du 11 novembre 1918 F-69622 Villeurbanne cedex E-mail : [email protected] E-mail : [email protected]
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
Séminaire BOURBAKI 69e année, 2016–2017, no 1128, p. 267 à 296 doi:10.24033/ast.1066
Mars 2017
LE PROBLÈME DE RIEMANN-HILBERT DANS LE CAS IRRÉGULIER [d’après des travaux de D’Agnolo, Kashiwara, Mochizuki et Schapira] par Stéphane GUILLERMOU
INTRODUCTION Le nom « problème de Riemann-Hilbert » fait référence au vingt-et-unième problème proposé par Hilbert au Congrès international de Paris en 1900 : « Prouver qu’il existe toujours une équation différentielle linéaire de la classe de Fuchs avec des singularités et un groupe de monodromie donnés. » Il s’agissait d’équations différentielles linéaires sur C ou sur une surface de Riemann. On peut avoir en tête l’exemple très simple x∂x − α, pour α ∈ C, dont les zéros sont les multiples de xα . Quand on parcourt un lacet simple autour de 0 et qu’on étend une solution par prolongement analytique, après un tour on retrouve la même solution multipliée par exp(2iπα). Cet opérateur de multiplication par exp(2iπα) s’appelle la monodromie. On peut regarder plus généralement une équation d’ordre n ou un système y 0 (x) = A(x)y(x) où A(x) est une fonction méromorphe à valeurs dans Mn (C). Là encore l’ensemble des solutions holomorphes forme un faisceau localement constant sur la surface privée des pôles de A, avec une monodromie à valeurs dans GLn (C). La question est donc de trouver A à partir de ce faisceau. La classe de Fuchs correspond au cas où A n’a que des pôles simples (on utilise aussi l’expression « à singularités régulières »). Pour des détails sur cette question en dimension 1 nous renvoyons à [1]. Dans cet exposé nous allons voir que le problème de Riemann-Hilbert sur une variété analytique complexe X de dimension quelconque a une réponse positive, bien sûr après avoir précisé quel type (de systèmes) d’équations différentielles et quel type de solutions on considère. Nous verrons que la généralisation naturelle d’une équation différentielle ordinaire linéaire est donnée par la notion de DX -module holonome. Le cas à singularités régulières correspond aux DX -modules holonomes réguliers. Dans [6] Kashiwara montre que les solutions holomorphes d’un DX -module holonome forment un faisceau C-constructible. Il conjecture (voir [27] p. 287) que le foncteur
© Astérisque 407, SMF 2019
268
S. GUILLERMOU
qui à un DX -module associe ses solutions holomorphes induit une équivalence entre Dbhr (DX ) et DbC-c (CX ), où Dbhr (DX ) désigne la catégorie dérivée bornée des complexes de DX -modules à cohomologie holonome régulière et DbC-c (CX ) la catégorie dérivée bornée des complexes de faisceaux à cohomologie C-constructible. Dans [7, 8] Kashiwara prouve cette équivalence en construisant un foncteur inverse au foncteur solution (voir aussi [23] pour une autre approche par Mebkhout). Le cas des modules holonomes quelconques a été résolu récemment. La construction de l’inverse se généralise à des outils plus précis (faisceaux sous-analytiques de fonctions holomorphes tempérées) introduits par Kashiwara-Schapira [15] et utilisés par D’Agnolo-Kashiwara [4]. Le résultat de [4] dit que le foncteur qui envoie un module holonome sur ses solutions holomorphes renforcées est pleinement fidèle. Un article de Mochizuki [26] décrit l’image de ce foncteur. Nous introduisons ici les notions qui permettent d’énoncer les résultats de [4] et nous donnons très grossièrement le schéma de la preuve. Pour un exposé plus précis on peut consulter [10]. Pour un exposé beaucoup plus détaillé mais quand même assez court nous renvoyons au livre [18]. D-modules
– solutions. — Nous précisons maintenant ce qu’on entend par « système d’équations » (D-module) et « solution holomorphe ». En dimension 1 on voit que la réponse au problème de Riemann-Hilbert dépend de la façon dont on veut représenter le système différentiel. La méthode la plus intrinsèque est probablement d’associer à un système d’EDP linéaires à coefficients holomorphes un D-module. Nous expliquons rapidement ce que cela signifie. Par la suite nous ne considérerons plus que des D-modules. Soit X une variété analytique complexe. Nous notons OX le faisceau des fonctions holomorphes sur X et DX le faisceau des opérateurs différentiels linéaires à coefficients holomorphes. C’est un faisceau d’anneaux (le produit est la composition). Un DX -module M est un faisceau de modules à gauche sur DX . Soit U un ouvert de X et P un système d’EDP linéaires holomorphes sur U à N0 inconnues et N1 équations. Autrement dit P est une matrice N0 × N1 à coefficients dans DX (U ). N1 0 On définit le DU -module M = DN U /DU · P ; on a donc la présentation finie (1)
N
DU 1
·P
0 −→ DN − M → − 0. U →
Si F est un faisceau de fonctions sur lequel les opérateurs différentiels agissent, ∞ F = OX ou F = CX , le faisceau des fonctions C ∞ , etc., la donnée de N0 fonctions inconnues dans F est la même chose que la donnée d’un morphisme D-linéaire 0 ϕ : DN − F | . Ces inconnues sont solutions de P si et seulement si ϕ se factorise U → U par M . Ainsi HomDU (M , F | ) s’identifie aux solutions de P dans F au-dessus de U . U Soient P 0 un autre système donné sur U et M 0 le DU -module correspondant, comme en (1). Si on a un isomorphisme de DU -modules M ' M 0 on voit que P et P 0 ont
ASTÉRISQUE 407
(1128)
LE PROBLÈME DE RIEMANN-HILBERT DANS LE CAS IRRÉGULIER
269
des espaces de solutions isomorphes dans tout faisceau de fonctions F donné. Il est donc naturel de considérer des systèmes comme équivalents si les D-modules associés sont isomorphes. Dans la suite nous ne considérons plus des systèmes mais seulement des DX -modules qui admettent une présentation du type (1) au voisinage de chaque point de X. De tels D-modules sont dits cohérents. Comme on vient de le voir l’ensemble des solutions holomorphes d’un DX -module M correspond au groupe HomDX (M , OX ). Il faut prendre garde que ce groupe ne vient pas avec un plongement donné dans les fonctions holomorphes et qu’il n’a pas d’autre structure que celle d’un C-espace vectoriel. Pour en tirer une information de type monodromie, il faut considérer le faisceau de C-espaces vectoriels U 7→ HomDU (M | , F | ). Dans ce cadre il est utile de pouvoir faire des dévissages U U sur M et on voit tout de suite apparaître les extensions. On définit donc plutôt les solutions en utilisant le faisceau Hom interne dérivé : (2)
Sol X (M )
= RHom DX (M , OX ).
Ainsi Sol X (M ) est un objet de Db (CX ), la catégorie dérivée bornée des faisceaux de C-espaces vectoriels sur X. Le problème de Riemann-Hilbert devient alors (provisoirement) : quels sont les F ∈ Db (CX ) qui sont du type F = Sol X (M ) ? Une question liée à celle-ci est de savoir si Sol X (M ) détermine M ? Avant de donner une formulation définitive du problème nous allons restreindre les classes de D-modules et de faisceaux considérés. Modules holonomes. — En dimension 1 le faisceau des solutions holomorphes d’un opérateur non nul a des germes de dimensions finies. En dimension plus grande ce n’est en général pas le cas mais il existe une classe de D-modules qui ont cette propriété. Si un DX -module M correspond à un système avec beaucoup d’équations on peut s’attendre à ce qu’il ait peu de solutions. Ceci peut se voir sur la variété caractéristique car(M ) ⊂ T ∗ X (voir §1). C’est une sous-variété analytique complexe de T ∗ X. Un théorème de Kashiwara dit que, si M 6= 0, alors car(M ) est de dimension au moins dim X. Un DX -module cohérent M est dit holonome si M = 0 ou car(M ) est de dimension dim X. Un autre résultat de Kashiwara dit que, si M est holonome, alors Sol X (M ) est un objet C-constructible de Db (CX ) dans le sens où il existe une stratification analytique complexe de X telle que, pour tout k ∈ Z, la restriction de H k (Sol X (M )) à chaque strate est localement constante de rang fini. Plus précisément Sol X (M ) est un faisceau pervers à décalage près, en particulier H k (Sol X (M )) a un support de dimension plus petite que n − k. On peut déjà donner une réponse partielle au problème de Riemann-Hilbert. Notons Db (DX ) la catégorie dérivée bornée des DX -modules et Dbh (DX ) la sous-catégorie des M tels que H i (M ) est holonome pour tout i ∈ Z. La définition (2) s’étend à Db (DX ). Alors tout objet C-constructible de Db (CX ) est isomorphe à Sol X (M )
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
270
S. GUILLERMOU
pour un certain M ∈ Dbh (DX ). Cependant deux DX -modules holonomes peuvent avoir les mêmes solutions. Cette remarque vaut déjà en dimension 1 mais là on sait que les équations à singularités régulières sont déterminées par leur solutions. Correspondance de Riemann-Hilbert – cas régulier. — Il y a une notion de D-module holonome régulier en toute dimension étendant la notion d’opérateur à singularité régulière – voir la définition 3.2 ci-dessous. Notons Dbhr (DX ) la sous-catégorie de Db (DX ) des complexes de DX -modules à cohomologie holonome régulière. De même notons DbC-c (CX ) la sous-catégorie de Db (CX ) des complexes à cohomologie C-constructible. Alors la correspondance de Riemann-Hilbert dans le cas régulier s’énonce ainsi : le foncteur Sol X (·) induit une équivalence de catégories entre Dbhr (DX ) et DbC-c (CX ). Comme on l’a dit plus haut Kashiwara construit un foncteur inverse. Notons DbR-c (CX ) la catégorie des complexes à cohomologie constructible pour une stratification sous-analytique réelle. Kashiwara construit un foncteur contravariant « homomorphismes tempérés » T Hom (·, OX ) : DbR-c (CX ) → − Db (DX ) et montre que b b sa restriction à DC-c (CX ) arrive dans Dhr (DX ) et fournit un inverse à la restriction de Sol X (·) à Dbhr (DX ). De plus, par des résultats antérieurs de Kashiwara, on peut voir que cette correspondance identifie les faisceaux pervers, sous-catégorie abélienne de DbC-c (CX ), aux DX -modules holonomes réguliers (vus comme complexes concentrés en degré 0). Cas irrégulier. — Le résultat précédent nous dit donc que les systèmes holonomes réguliers sont déterminés par des données de type topologique (des faisceaux constructibles). Les travaux récents mentionnés auparavant permettent une description comparable des systèmes holonomes quelconques. L’exemple 2.5 nous dit qu’il ne suffit pas de regarder les solutions holomorphes. D’autre part il est connu que les solutions des systèmes réguliers ou irréguliers ont des propriétés de convergence ou de croissance différentes. Par exemple, très grossièrement, les solutions formelles d’un système régulier convergent. Une première idée, approfondie dans [14] et [15], est de considérer des solutions holomorphes avec conditions de croissance au bord. Le problème essentiel est qu’on veut faire cela en gardant les aspects faisceautiques. Ce problème est résolu dans [15], où Kashiwara et Schapira étudient la catégorie des ind-faisceaux, qui sont des ind-objets de la catégorie des faisceaux à support compact, et introduisent en particulier un ind-faisceau de « fonctions holomorphes tempérées ». Ils peuvent alors considérer le ind-faisceau Sol tX de solutions à valeurs dans ce ind-faisceau. Ceci permet de reformuler de façon élégante le foncteur homomorphismes tempérés déjà construit par Kashiwara. Nous rappelons ces résultats dans le paragraphe 4 en utilisant le langage des faisceaux sous-analytiques, qui suffit pour exposer les résultats. Ces faisceaux sous-analytiques sont aussi introduits dans [15] pour construire les ind-faisceaux de fonctions tempérées. Le foncteur solution tempéré Sol tX permet de distinguer plus
ASTÉRISQUE 407
(1128)
LE PROBLÈME DE RIEMANN-HILBERT DANS LE CAS IRRÉGULIER
271
de D-modules holonomes que Sol X . Mais il manque encore une étape pour avoir la fidélité. Il est possible de raffiner ces faisceaux de fonctions holomorphes tempérées en ajoutant une variable. Ceci est expliqué dans [4]. D’Agnolo et Kashiwara définissent une catégorie de ind-faisceaux renforcés, Eb (ICX ), un ind-faisceau renforcé E de fonctions holomorphes tempérées, OX , et un foncteur solution correspondant, E b b Sol X , qui va de D (DX ) vers E (ICX ). En utilisant des résultats de Mochizuki et Kedlaya sur la structure locale des connexions holomorphes intégrables ils montrent que ce dernier foncteur solution est pleinement fidèle. Plus précisément ils étendent la preuve de Kashiwara du cas régulier, reformulée dans le langage des ind-faisceaux, au cas général. L’analogue du foncteur homomorphismes tempérés E devient Hom E (·, OX ) : Eb (ICX ) → − Db (DX ). Ils montrent que si M est un DX -module ∼ E E holonome, alors M − → Hom (Sol E X (M ), OX ). b Il reste encore à décrire l’image de Dh (DX ) par Sol E X et en particulier l’image des complexes en degré 0. Dans [4] on trouve une notion d’objet constructible réel de Eb (ICX ). Pour un DX -module holonome Sol E X (M ) est R-constructible. Mais la b sous-catégorie des R-constructibles, ER-c (ICX ), est plus grande que l’image de Sol E X . Il n’y a pas de notion évidente d’objet C-constructible. Néanmoins Mochizuki donne une b caractérisation de l’image de Sol E X dans [26]. Il montre qu’un objet F ∈ ER-c (ICX ) E b est de la forme F ' Sol X (M ) avec M ∈ Dh (DX ) si et seulement si c’est vrai pour Eϕ−1 (F ), pour toute application holomorphe ϕ : ∆ → − X du disque dans X (ici −1 Eϕ désigne l’image inverse pour les ind-faisceaux renforcés). On est ainsi ramené au cas de la dimension 1 où la situation est comprise ; on peut décrire les D∆ -modules E holonomes par les structures de Stokes et en déduire leurs solutions dans O∆ . Pour comprendre l’image des D-modules (les complexes en degré 0) D’Agnolo et Kashiwara introduisent dans [3] une t-structure sur EbR-c (ICX ) qui généralise la t-structure de perversité sur les DbR-c (CX ) (Kashiwara donne dans [11] une définition de t-structure très semblable à la définition usuelle, mais un peu plus générale, et équivalente à la notion de « slicing » introduite par Bridgeland dans [2]). En combinant aux résultats de Mochizuki on obtient ainsi une catégorie analogue à celle des faisceaux pervers dans ce cadre.
1. QUELQUES RAPPELS SUR LES D-MODULES Si M est une variété analytique réelle, on note CM le faisceau constant de groupe C et Mod(CM ) la catégorie des faisceaux de C-espaces vectoriels. On note Db (CM ) la catégorie dérivée bornée de Mod(CM ). Ses objets sont les complexes bornés d’objets de Mod(CM ) et les morphismes sont obtenus à partir des morphismes de complexes
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
272
S. GUILLERMOU
en inversant les quasi-isomorphismes, c’est-à-dire les morphismes qui induisent des isomorphismes en cohomologie. Pour un sous-ensemble localement fermé Z ⊂ M on notera CZ ∈ Mod(CM ) le faisceau constant de groupe C sur Z. Ses germes vérifient (CZ )x ' C si x ∈ Z et (CZ )x = 0 si x 6∈ Z. Comme dans l’introduction on désigne par X une variété holomorphe. On note dX sa dimension complexe et OX le faisceau des fonctions holomorphes sur X. On note DX le faisceau des opérateurs différentiels linéaires à coefficients holomorphes. Une P section de DX sur un ouvert de coordonnées s’écrit donc P = |α|≤d aα (x)∂xα , où αd α = (α1 , . . . , αdX ) ∈ NdX , ∂xα = ∂xα11 · · · ∂xdXX et les aα sont des fonctions holomorphes. On note ΘX le faisceau des champs de vecteurs holomorphes sur X. La multiplication par une fonction et l’action d’une section de ΘX définissent des morphismes injectifs OX ,→ Hom (OX , OX ) et ΘX ,→ Hom (OX , OX ). On peut aussi décrire DX comme le sous-anneau de Hom (OX , OX ) engendré par OX et ΘX . On note Mod(DX ) la catégorie des faisceaux de modules à gauche sur DX . Dans ce texte le terme DX -module sans autre précision désigne un objet de Mod(DX ) (voir ci-dessous pour le lien entre modules à droite et à gauche). La catégorie Mod(DX ) est abélienne et on note Db (DX ) sa catégorie dérivée bornée. L’anneau DX est filtré par le degré des opérateurs (le degré de ∂xα est la longueur totale |α|). On note σd : Fd DX → − OX [ξ] le symbole de degré d défini P P α α par σd ( |α|≤d aα (x)∂x ) = |α|=d aα (x)ξ . On peut voir que σd (P ) donne une fonction bien définie sur T ∗ X, le fibré cotangent de X. Plus exactement σd (P ) est une fonction holomorphe sur T ∗ X polynomiale homogène de degré d dans les fibres. Désignons par π : T ∗ X → − X la projection. Les σd induisent un morphisme du gradué associé de DX vers l’image directe de OT ∗ X M σ : gr DX = Fd DX /Fd−1 DX → − π∗ OT ∗ X . d
On voit que σ est injectif et que son image est les fonctions holomorphes sur T ∗ X polynomiales dans les fibres. En utilisant ce morphisme σ on peut déduire certaines propriétés de DX de celles de OT ∗ X . La première propriété importante est que DX est cohérent. Cela signifie que la sous-catégorie de Mod(DX ) faite des DX -modules localement de présentation finie est stable par sous-quotient et extension. Ces DX -modules sont aussi dits cohérents. On note Modcoh (DX ) la catégorie des DX -modules cohérents et Dbcoh (DX ) la souscatégorie de Db (DX ) à cohomologie cohérente. On rappelle qu’un DX -module M est localement de présentation finie si chaque 1 P 0 x ∈ X a un voisinage U sur lequel on a une suite exacte DN → DN − M| → − U − U → U 0. Le morphisme D-linéaire P est donné par une matrice N1 × N0 à coefficients dans DX (U ) et on peut voir P comme un système d’EDP linéaires. Inversement
ASTÉRISQUE 407
(1128)
LE PROBLÈME DE RIEMANN-HILBERT DANS LE CAS IRRÉGULIER
273
un tel système donné sur un ouvert U définit un DU -module de présentation finie. Un DX -module cohérent M est donc la donnée d’un système au voisinage de chaque point, mais a priori il n’y a pas un système défini globalement représentant M . Comme on l’a vu dans l’introduction, si M est donné par un système P sur U , les solutions de P à valeur dans un faisceau de fonctions F , ou plus généralement un autre DX -module F , sont en bijection fonctorielle avec HomDU (M | , F | ). On a U
U
aussi besoin des ExtiDU (M | , F | ) et on pose d’emblée, pour F = OX qui est le cas U U qui nous intéresse en premier, (3)
Sol X (M )
= RHom DX (M , OX )
∈ Db (CX ).
Exemple 1.1. — En coordonnées locales, on a OX ' DX /(DX ∂x1 + · · · + DX ∂xdX ). On montre alors que Sol X (OX ) ' CX (en dimension 1 on peut le voir directement ; en dimension quelconque on peut utiliser une résolution de type Koszul associée à ∂x1 , . . . , ∂xdX ). Le foncteur Sol X est contravariant. Il est utile d’introduire un foncteur analogue mais covariant, le foncteur de de Rham. Soit ΩX le faisceau des formes holomorphes de degré maximal. Les champs de vecteurs agissent sur ΩX par la dérivée de Lie, notée Lθ (ω) pour des sections θ de ΘX et ω de ΩX . L’action ω · θ = −Lθ (ω) et la structure de OX -module sur ΩX s’étendent alors de façon unique en une action à droite de DX sur ΩX . Pour M ∈ Dbcoh (DX ) on définit (4)
DR X (M )
= Ω X ⊗L M DX
∈ Db (CX ).
En utilisant ΩX on peut aussi obtenir une équivalence entre DX -modules à droite et à gauche. Pour un DX -module à droite M et un DX -module à gauche N , M ⊗OX N a une structure de OX -module. Il a aussi une action à droite de l’algèbre de Lie ΘX sur M ⊗OX N donnée par (m ⊗ n) · θ = (m · θ) ⊗ n − m ⊗ (θ · n). Les actions de OX et ΘX s’étendent en une action de DX à droite. On peut voir de même que, si M , N sont deux DX -modules à droite, alors Hom OX (M , N ) a une structure de DX -module à gauche. Les deux foncteurs M 7→ ΩX ⊗OX M et N 7→ Hom OX (ΩX , N ) donnent alors une équivalence entre les catégories de DX -modules à gauche et de DX -modules à droite. Ceci est utile pour définir la dualité dans Dbcoh (DX ). Si M ∈ Modcoh (DX ) alors Hom DX (M , DX ) est un DX -module à droite. Pour rester dans la catégorie des modules à gauche on pose, pour M ∈ Dbcoh (DX ), (5)
DX (M ) = RHom OX (ΩX , RHom DX (M , DX ))[dX ].
Ce décalage par dX est justifié par un théorème disant que RHom DX (M , DX ) est concentré en degré dX si M est concentré en degré 0 et holonome. Alors DX (M ) est aussi concentré en degré 0 et holonome. On a par exemple DX (OX ) ' OX .
SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2019
274
S. GUILLERMOU
Pour M ∈ Dbcoh (DX ) on a DX (DX (M )) ' M . Les foncteurs solutions et de de Rham sont liés par la relation, pour tout M ∈ Dbcoh (DX ), Sol X (M )
' DR X (DX (M ))[−dX ].
Avant de donner des énoncés généraux nous regardons des exemples simples pour lesquels Sol X (M ) suffit à distinguer différents M . Exemple 1.2. — Voici l’exemple de base d’un D-module holonome régulier en dimension 1. On considère X = C avec la coordonnée x. On pose U = C \ {0}. Pour α ∈ C on pose Pα = x∂x − α, Mα = D/D · Pα et Fα = Sol X (Mα ). Lorsqu’on a une résolution libre de M on peut représenter Sol X (M ) par le complexe obtenu en appliquant Hom DX (·, OX ) à la résolution. Ici on a donc P ·
Fα ' (0 → − OX −−α→ OX → − 0). Les solutions de Pα sont les multiples de x 7→ xα . Pour α ∈ N on a donc H 0 Fα ' CX le faisceau constant de groupe C. Pour α ∈ Z 0 (voir [18] et proposition 4.5 ci-dessous). Nous allons préciser et généraliser l’exemple 4.3. Nous explicitons d’abord un peu les faisceaux sous-analytiques. Pour une variété analytique réelle M le foncteur ρ∗ : Mod(CM ) → − Mod(CMsa ) n’est pas exact mais sa restriction à ModR-c (CM ) l’est (voir [15]). Pour F ∈ ModR-c (CM ) on notera souvent F ∈ Mod(CMsa ) au lieu de ρ∗ (F ). Pour une famille filtrante I et un système inductif {Fi , fji }i∈I de faisceaux (dans Mod(CM )) il existe des limites inductives limi∈I Fi dans Mod(CM ) et limi∈I ρ∗ Fi −→ −→ dans Mod(CMsa ). Mais ρ∗ ne commute pas aux limites inductives et on a même le résultat suivant. Théorème 4.4 (Thm. 6.3.5 de [15])). — Tout objet F ∈ Mod(CMsa ) peut s’écrire F ' limi∈I ρ∗ Fi pour un système inductif filtrant de faisceaux usuels constructibles −→ Fi ∈ ModR-c (CM ). Ainsi le faisceau ρ! (C{x0 } ), pour x0 ∈ M , introduit auparavant, peut s’écrire ρ! (C{x0 } ) ' limB ρ∗ CB , où B décrit l’ensemble des voisinages fermés de x0 . On peut −→ aussi reprendre plus en détail l’exemple 4.3 et montrer que H 0 (Sol tX (Nα )) ' lim ρ∗ (C{Re(α/x)