Séminaire Bourbaki. Volume 2006/2007. Exposes 967–981 2856292534, 9782856292532

395 47 10MB

English; French Pages 506 Year 2008

Table of contents :
967
1. Introduction
2. The Subspace Theorem
3. Complexity of Algebraic Numbers
4. Diophantine Equations with Power Sums
5. Integral Points
6. Conclusion
References
968
Introduction
1. Applications
2. L'approche -adique
3. Méthodes p-adiques
Références
969
1. Introduction
2. Livres ouverts
3. Le cas de la dimension trois
4. La dimension supérieure
Références
970
Introduction
1. PRÉLIMINAIRES
2. Idéaux multiplicateurs
3. LE CAS AMPLE : LE THÉORÈME D'ANGEHRN ET SIU
4. UN THÉORÈME DU TYPE ANGEHRN ET SIUDANS LE CAS GRAND
5. DÉMONSTRATION DU THÉORÈME 0.1
6. DÉMONSTRATION DU THÉORÈME 5.2
Références
971
Introduction
1. Groupes d'automates
2. Le groupe d'allumeur de réverbères comme groupe d'automate
3. LE GROUPE D'ALESHIN
4. GROUPE ENGENDRÉ PAR UN AUTOMATE À TROIS ÉTATS
5. GROUPE DE WILSON
Références
972
Introduction
1. Renormalized solutions
2. The commutator estimate of DiPerna and Lions
3. The BV case: the commutator estimateof Ambrosio
4. The Lemmas of Bouchut and Alberti
5. The continuity equationand regular Lagrangian flows
6. Beyond BV and beyond renormalized solutions: Further results, Conjectures and Open Problems
7. Appendix: Proof of Proposition 3.2
References
973
1. Introduction
2. Modules de Drinfeld et t-modules
3. Indépendance algébrique d'après Denis
4. Indépendance algébrique d'après Anderson, Brownawell, Papanikolas
5. Valeurs de la fonction zêta de Carlitz-Goss
6. Valeurs des fonctions gamma
Références
974
1. Introduction
2. Algebraization of codimension one webson (Cn,0), n3
3. Exceptional planar webs I: the history
4. Exceptional planar webs II: the methods
5. Exceptional planar webs III: the examples
6. Webs of arbitrary codimension
References
975
1. SOLUTIONS DE VISCOSITÉ
2. REPRÉSENTATION LAGRANGIENNE
3. SEMI-CONCAVITÉ ET RÉGULARITÉ C1,1
4. SOUS-SOLUTIONS CRITIQUES
5. APPLICATIONS ET COMPLÉMENTS
Références
976
1. Introduction
2. Schéma de Hilbert de points de C2
3. Espace de modules de faisceaux sans torsionsur P2
4. Définition des variétés carquois
5. Algèbre de convolution et algèbres de Kac-Moody
6. Structure de cristal de Kashiwara
7. Algèbre de convolution et algèbre affinequantique
8. Développements
Références
977
INTRODUCTION
1. Premières réductions
2. Représentations automorphes et algèbresde Hecke
3. Représentations galoisiennes associéesaux formes automorphes
4. Énoncé de théorèmes de relèvement del'automorphie
5. Espaces de déformations : T3 versus CHT
6. La méthode de Taylor : préliminaires
7. L'idée de la preuve du théorème 4.2
8. Une famille d'hypersurfaces
9. Automorphie potentielle de la représentation résiduelle
Références
978
Introduction
1. The 2 basic examples
2. Classical chaos
3. Time scales in semi-classics
4. The Schnirelman ergodic Theorem
5. Localized states for the cat map
6. Lower bounds on the entropy: the A-N Theorem
7. About the proof of the A-N Theorem
8. Equipartition by time evolutions
References
979
1. Énoncé des résultats principaux
2. La caractéristique zéro
3. Comparaison entre topologies sur J(K)
4. Une forme uniforme de la conjecture de Mordell-Lang en caractéristique p
5. Fin de la preuve du théorème 1.3
6. Lien avec l'obstruction de Brauer-Manin
Références
980
Introduction
1. Formule de Campbell-Hausdorff et symétrisation
2. La conjecture combinatoire de toKashiwara-Vergne
3. Preuve de la conjecture combinatoire deKashiwara-Vergne
4. Appendice A
5. Appendice B
Références
981
Introduction
1. Sections hyperplanes des surfaces K3
2. et la conjecture de la pente
3. Unirationalité des espaces de modules en petitgenre
4. Le théorème de Gritsenko-Hulek-Sankaran
Références

Recommend Papers

Seminaire Bourbaki: Volume 2018/2019 Exposes 1151-1165 285629930X, 9782856299302

"Ce 71e volume du Séminaire Bourbaki contient les textes des quinze exposés de survol présentés pendant l'anné

157 10 10MB Read more

SEMINAIRE BOURBAKI: Volume 2009/2010. Exposes 1012–1026 2856293263, 9782856293263

As in the preceding volumes of this seminar, which now counts more than one thousand talks, one finds here fifteen surve

162 82 13MB Read more

Seminaire Bourbaki 1973-1974 exposes 436-452 0387070230

305 79 2MB Read more

Seminaire Bourbaki 1972-1973, exposes 418-435 0387067965

315 12 3MB Read more

SEMINAIRE BOURBAKI 2019/2021: Exposes 1166-1180 2856299318, 9782856299319

197 44 26MB Read more

Seminaire Bourbaki 1971-1972, Exposes 400-417 [1 ed.] 9783540061793, 3540061797

282 96 2MB Read more

Seminaire Bourbaki 1970-1971, Exposes 382-399 [244, 1 ed.] 354005720X, 9783540057208

286 90 2MB Read more

Seminaire Bourbaki 1969-1970, Exposes 364-381 [1 ed.] 9783540053576, 3540053573

290 93 2MB Read more

Seminaire Bourbaki 1968-1969, Exposes 347-363 [1 ed.] 9783540053569, 3540053565

285 89 2MB Read more

Séminaire Bourbaki. Volume 2012/2013. Exposés 1059–1073 2856297854, 9782856297858

A note to readers: This book is in French. This 65th volume of the Bourbaki Seminar contains the texts of the fifteen su

185 38 8MB Read more

Séminaire Bourbaki. Volume 2006/2007. Exposes 967–981
2856292534, 9782856292532

Author / Uploaded
Séminaire Bourbaki

Similar Topics
Mathematics

0 0 0
Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up

File loading please wait...

Citation preview

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (967) The Many Faces of the Subspace Theorem Yuri F. BILU

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006–2007, no 967, p. 1 à 37

Novembre 2006

THE MANY FACES OF THE SUBSPACE THEOREM [after Adamczewski, Bugeaud, Corvaja, Zannier. . . ] by Yuri F. BILU*

And we discovered subspace. It gave us our galaxy and it gave us the universe. And we saw other advanced life. And we subdued it or we crushed it. . . With subspace, our empire would surely know no boundaries. (From The Great War computer game)

1. INTRODUCTION This is not a typical Bourbaki talk. A generic exposé on this seminar is, normally, a report on a recent seminal achievement, usually involving new technique. The principal character of this talk is the Subspace Theorem of Wolfgang Schmidt, known for almost forty years. All results I am going to talk about rely on this celebrated theorem (more precisely, on the generalization due to Hans Peter Schlickewei). Moreover, in all cases it is by far the most significant ingredient of the proof. Of course, the last remark is not meant to belittle the work of the authors of the results I am going to speak about. Adapting the Subspace Theorem to a concrete problem is often a formidable task, requiring great imagination and ingenuity. During the last decade the Subspace Theorem found several quite unexpected applications, mainly in the Diophantine Analysis and in the Transcendence Theory. Among the great variety of spectacular results, I have chosen several which are technically simpler and which allow one to appreciate how miraculously does the Subspace Theorem emerge in numerous situations, implying beautiful solutions to difficult problems hardly anybody hoped to solve so easily. The three main topics discussed in this article are: – the work of Adamczewski and Bugeaud on complexity of algebraic numbers; (∗)

Partially supported by Centro di Ricerca Matematica Ennio De Giorgi, Pisa.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

2

Y. F. BILU

– the work of Corvaja and Zannier on Diophantine equations with power sums; – the work of Corvaja and Zannier on integral points on curves and surfaces, and the subsequent development due to Levin and Autissier. In particular, we give a complete proof of the beautiful theorem of Levin and Autissier (see Theorem 5.8): an affine surface with 4 (or more) properly intersecting ample divisors at infinity cannot have a Zariski dense set of integral points. Originally, Schmidt proved his theorem for the needs of two important subjects: norm form equations and exponential Diophantine equations (including the polynomial-exponential equations and linear recurrence sequences). These “traditional” applications of the Subspace Theorem form a vast subject, interesting on its own; we do not discuss it here (except for a few motivating remarks in Section 4). Neither do we discuss the quantitative aspect of the Subspace Theorem. For this, the reader should consult the fundamental work of Evertse and Schlickewei (see [33, 34, 55, 56, 57] and the references therein). Some of the results stated here admit far-going generalizations, but I do not always mention them: the purpose of this talk is to exhibit ideas rather than to survey the best known results. In Section 2 we introduce the Subspace Theorem. Sections 3, 4 and 5 are totally independent and can be read in any order.

2. THE SUBSPACE THEOREM In this section we give a statement of the Subspace Theorem. Before formulating it in full generality, we consider several particular cases, to make the general case more motivated. 2.1. The Theorem of Roth In 1955, K. F. Roth [51] proved that algebraic numbers cannot be “well approximated” by rationals. Theorem 2.1 (Roth). — Let α be an irrational algebraic number. Then for any ε > 0 the inequality y 1 α − < x |x|2+ε has only finitely many solutions in non-zero x, y ∈ Z. This result is, in a sense, best possible, because, by the Dirichlet approximation theorem, the inequality |α − y/x| ≤ |x|−2 has infinitely many solutions.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

3

The theorem of Roth has a glorious history. Already Liouville showed in 1844 the inequality |α − y/x| ≥ c(α)|x|−n , where n is the degree of the algebraic number α, and used this to give first examples of transcendental numbers. However, Liouville’s theorem was too weak for serious applications in the Diophantine Analysis. In 1909 A. Thue [64] made a breakthrough, proving that |α − y/x| ≤ |x|−n/2−1−ε has finitely many solutions. A series of refinements (the most notable being due to Siegel [62]) followed, and Roth made the final (though very important and difficult) step. Kurt Mahler, who was a long proponent of p-adic Diophantine approximations, suggested to his student D. Ridout [50] to extend Roth’s theorem to the non-archimedean domain. To state Ridout’s result, we need to introduce some notation. For every prime number p, including the “infinite prime” p = ∞, we let | · |p be the usual p-adic norm on Q (so that |p|p = p−1 if p < ∞ and |2006|∞ = 2006), somehow extended to the ¯ For a rational number ξ = y/x with gcd(x, y) = 1 we define its algebraic closure Q. height by H(ξ) = max{|x|, |y|}.

(1) One immediately verifies that

!−1 (2)

H(ξ) =

Y

max {1, |ξ|p } =

p

Y

min {1, |ξ|p }

,

p

where the products extend to all prime numbers, including the infinite prime. Now let S be a finite set of primes, including p = ∞, and for every p ∈ S we fix an algebraic number αp . Ridout proved that for any ε > 0 the inequality ¶ © Y 1 min 1, |αp − ξ|p < H(ξ)2+ε p∈S

has finitely many solutions in ξ ∈ Q. While the theorem of Roth becomes interesting only when the degree of α is at least 3, the theorem of Ridout is quite non-trivial even when the “targets” αp are rational. Moreover, one can also allow “infinite” targets, with the standard convention ∞ − ξ = ξ −1 . The following particular case of Ridout’s theorem is especially useful: given an algebraic number α, a set S of prime numbers, and ε > 0, the inequality |α − ξ| < H(ξ)−1−ε has finitely many solutions in S-integers(1) ξ. To prove this, consider the theorem of Ridout with α∞ = α and with αp = ∞ for p 6= ∞, and apply (2). (1)

A rational number is called S-integer if its denominator is divisible only by the prime numbers from S.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

4

Y. F. BILU

One consequence of this result is that the decimal expansion of an algebraic number cannot have “too long” blocks of zeros. More precisely, let 0.a1 a2 . . . be the decimal expansion of an algebraic number, and for every n define `(n) as the minimal ` ≥ 0 such that an+` 6= 0; then `(n) = o(n) as n → ∞. To show this, apply the above-stated particular case of the theorem of Ridout with S = {2, 5, ∞}. More generally, the decimal expansion of an algebraic number cannot have “too long” periodic blocks. S. Lang extended the theorem of Roth-Ridout to approximation of algebraic numbers by the elements of a given number field. We invite the reader to consult Chapter 7 of his book [41] or Part D of the more recent volume [40] for the statement and the proof of Lang’s theorem. 2.2. The Statement of the Subspace Theorem Now we have enough motivation to state the Subspace Theorem. We begin with the original theorem of Schmidt [58] (see also [59] for a very detailed proof). Theorem 2.2 (W. M. Schmidt). — Let L1 , . . . , Lm be linearly independent linear forms in m variables with (real) algebraic coefficients. Then for any ε > 0 the solutions x = (x1 , . . . , xm ) ∈ Zm of the inequality |L1 (x) · · · Lm (x)| ≤ kxk−ε are contained in kxk = maxi {|xi |}.)

finitely

many

proper

linear

subspaces

of

Qm .

(Here

Putting m = 2, L1 (x, y) = xα − y and L2 (x, y) = x, we recover the theorem of Roth. The theorem of Schmidt is not sufficient for many applications. One needs a nonarchimedean generalization of it, analogous to Ridout’s generalization of Roth’s theorem. This result was obtained by Schlickewei [52, 53]. As in the previous section, let S be a finite set of prime numbers, including p = ∞, and pick an extension of ¯ every p-adic valuation to Q. Theorem 2.3 (H. P. Schlickewei). — For every p ∈ S let L1,p , . . . , Lm,p be linearly independent linear forms in m variables with algebraic coefficients. Then for any ε > 0 the solutions x ∈ Zm of the inequality m YY

|Li,p (x)|p ≤ kxk−ε

p∈S i=1

are contained in finitely many proper linear subspaces of Qm .

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

5

It is usually more convenient to allow the variables x1 , . . . , xm to be S-integers rather than integers. To restate Schlickewei’s theorem using the S-integer variables, one needs an adequate measure of the “size” of a vector with S-integer (or, more generally, rational) coordinates; evidently, the sup-norm kxk cannot serve for this purpose. Thus, let x be a non-zero vector from Qm ; we define its height by Y (3) H(x) = kxkp , p

where kxkp = max{|x1 |p , . . . , |xm |p }, and the product extends to all rational primes, including p = ∞. The height function, defined this way, is “projective”: if a ∈ Q∗ then H(ax) = H(x) (this is an immediate consequence of the product formula). When the coordinates x1 , . . . , xm are coprime integers, we have H(x) = kxk. Remark 2.4. — One piece of warning: the height of a rational number ξ, defined in (1) is not equal to the height of the “one-dimensional vector” with the coordinate ξ; in fact, the height of a non-zero one-dimensional vector is 1, by the product formula, while H(ξ) is the height of the 2-dimensional vector (1, ξ), according to (2). This abuse of notation is quite common and will not lead to any confusion.

Denote by ZS the ring of S-integers. Now Theorem 2.3 can be re-stated as follows. Theorem 2.30 . — In the set-up of Theorem 2.3, the solutions x ∈ Zm S of the inequality m YY |Li,p (x)|p ≤ H(x)−ε p∈S i=1

are contained in finitely many proper linear subspaces of Qm . It is very easy to deduce Theorem 2.30 from Theorem 2.3; we leave this as an Q exercise for the reader. (One should use the “product formula” p |a|p = 1, where a ∈ Q∗ and the product extends to all rational primes, including p = ∞.) Unfortunately, for many applications Theorem 2.30 is insufficient as well: one needs to extend it to the case when the variables x1 , . . . , xm belong to an arbitrary number field. This was also done by Schlickewei [54]. Before stating the theorem, we need to make some conventions. Let K be a number field of degree d = [K : Q] and let MK be the set of all absolute values on K. Recall that the set MK consists of infinitely many finite absolute values, corresponding to prime ideals of the field K, and finitely many infinite absolute values, corresponding to real embeddings of K (real absolute values) and pairs of complex conjugate embeddings (complex absolute values). We normalize the absolute values on K as follows. If v ∈ MK is a p-adic absolute value, then we normalize it so that |p|v = p−dv /d , where p is the prime number below the prime ideal p and dv = [Kv : Qp ] is the local degree. If v is an infinite absolute value, then we normalize it to have |2006|v = 2006dv /d , where dv is again the local

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

6

Y. F. BILU

degree (that is, dv = 1 if v is real and dv = 2 if v is complex). With this normalization Q we have the product formula in the form v∈MK |a|v = 1, where a ∈ K ∗ . We also need to define the height of a vector x ∈ K m . By analogy with (3) we Q put H(x) = v∈MK kxkv , where kxkv = max{|x1 |v , . . . , |xm |v }. An easy verification shows that for x ∈ Qm this definition agrees with (3). Now we are ready to state the Subspace Theorem in its most general form. Let K be a number field, and let S be a finite set of absolute values of K (normalized as above), including all the infinite absolute values. We denote by OS the ring of S-integers(2) of the field K. Theorem 2.5 (H. P. Schlickewei). — For every v ∈ S let L1,v , . . . , Lm,v be linearly independent linear forms in m variables with algebraic coefficients. Then for any ε > 0 m the solutions x ∈ OS of the inequality m YY

|Li,v (x)|v ≤ H(x)−ε

v∈S i=1

are contained in finitely many proper linear subspaces of K m . A complete proof of this theorem can be found, for instance, in Chapter 7 of the recent book [9] by Bombieri and Gubler (who use a slightly different definition of height).

3. COMPLEXITY OF ALGEBRAIC NUMBERS Quite recently Adamczewski and Bugeaud applied the Subspace Theorem to the long-standing problem of complexity of algebraic numbers. In particular, they proved transcendence of irrational automatic numbers. This will be the first topic of this talk. We need some definitions. Let A be a finite set. We call it an alphabet, and its elements will be referred to as letters. Let U = (u1 , u2 , u3 , . . .) be an infinite sequence of letters from A . For every positive integer n, we let ρ(n) = ρU (n) be the number of distinct n-words occurring as n successive elements of U : ρ(n) = {uk uk+1 . . . uk+n−1 | k = 1, 2, 3, . . .} . Obviously, 1 ≤ ρ(n) ≤ | A |n . The function ρ(n), defined on the set of natural numbers, is called the complexity function, or simply complexity of the sequence U . Now let α ∈ (0, 1) be a real number. For every integer b ≥ 2 we can write the b-ary digital expansion of α: (4) (2)

α = u1 b−1 + u2 b−2 + u3 b−3 + . . . ,

An element α ∈ K is called S-integer if |α|v ≤ 1 for all v ∈ / S.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

7

0 + 0 - X Y H b

Y b 1 -

0

Z 1 9 3 a

-

1 Figure 1. A finite automaton with 3 states

where u1 , u2 , u3 , . . . ∈ {0, 1, . . . , b − 1}. One may ask about the complexity of the digital sequence (u1 , u2 , u3 , . . .). For instance, if α is rational, then the expansion is (eventually) periodic, and the complexity function is bounded. Adamczewski and Bugeaud proved that the complexity function of the b-ary expansion of an irrational algebraic number is strictly non-linear. Theorem 3.1 (Adamczewski, Bugeaud). — Let α ∈ (0, 1) be an irrational algebraic number, and let b ≥ 2 be an integer. Then the complexity function ρ(n) of the b-ary expansion of α satisfies lim ρ(n)/n = ∞. n→∞

Previously, it was only known that ρ(n) − n → +∞, which follows from the results of [36]. It is widely believed since the work of Borel [10, 11] that irrational algebraic numbers are normal ; that is, every n-word occurs in the b-ary expansion with the correct frequency b−n . In particular, one should expect that ρ(n) = bn . This conjecture (let alone Borel normality) is far beyond the capabilities of the modern mathematics. An important consequence of this theorem is transcendence of irrational automatic numbers. Recall that a finite automaton consists of the following elements: • the input alphabet, which is usually the set of k ≥ 2 digits {0, 1, . . . , k − 1}; • the set of states Q , usually a finite set of 2 or more elements, with one element (called the initial state) singled out; • the transition map Q × {0, 1, . . . , k − 1} → Q , which associates to every state a new state depending on the current input; • the output alphabet A , together with the output map Q → A . On Figure 1 one can see an example of a finite automaton with inputs 0, 1, states X, Y, Z with X the initial state, and outputs a, b. The transition map is given by the arrows, and the output map is X 7→ b, Y 7→ b and Z 7→ a. An input stream for a finite automaton is a word in the input alphabet. Let us take the word 00100. We start at the initial state X and the first input 0 moves us to

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

8

Y. F. BILU

the state Y . The next input 0 moves us further to Z, and the third input 1 tells us to stay in Z. With the fourth input 0 we return to X, and with the final fifth input we end up in Y . The output of Y is b. Thus, the word 00100 produces output b. If we input consecutively the binary expansion of natural numbers 0, 1, 2, 3, . . . written from right to left (that is, 0, 1, 01, 11, 001, . . .), we obtain the sequence of outputs b, a, b, a, a, . . . called the automatic sequence generated by the automaton from Figure 1. More generally, given an automaton with K inputs 0, 1, . . . , k − 1, the sequence generated by this automaton is the result of consecutive inputs of k-ary expansions of natural numbers written from right to left. Probably, the most famous non-periodic automatic sequence is the Thue-Morse sequence 0, 1, 1, 0, 1, 0, 0, 1, . . ., the n-th term being the parity of the sum of digits of the binary expansion of n; it is generated by a finite automaton with 2 inputs, 2 states and 2 outputs. A real number α ∈ (0, 1) is called automatic if the digits of its b-ary expansion (for some b ≥ 2) form an automatic sequence. For more information on automatic sequence, see the book of Allouche and Shallit [5]. It is well-known (see, for instance, [17] or [5, Section 10.3]) that the complexity of an automatic sequence satisfies ρ(n) = O(n). Hence Theorem 3.1 implies the following remarkable result. Corollary 3.2. — An irrational automatic number is transcendental. Probably, the first one to conjecture this was Cobham [16]. Sometimes this is referred to as the problem of Loxton and van der Poorten, who obtained [44, 45] several results in favor of this conjecture. Adamczewski and Bugeaud deduce Theorem 3.1 from a new transcendence criterion they obtained jointly with F. Luca. The proof of this criterion relies on the Subspace Theorem. We say that the infinite sequence (un ) has long repetitions if there exist a real ε > 0, and infinitely many natural N such that the word u1 u2 . . . uN has two disjoint equal subwords of length exceeding εN . In symbols, the phrase “the word u1 u2 . . . uN has two disjoint equal subwords of length `” means the following: there exist k and n such that k + ` ≤ n ≤ N + 1 − ` and uk = un , uk+1 = un+1 , . . . , uk+`−1 = un+`−1 . Theorem 3.3 (Adamczewski, Bugeaud, Luca). — Assume that for some b ≥ 2 the b-ary expansion of α ∈ (0, 1) has long repetitions. Then α is either rational or transcendental.

ASTÉRISQUE 317

(967)

9

THE MANY FACES OF THE SUBSPACE THEOREM

In the introduction we remarked that the decimal expansion of an irrational algebraic number cannot have too long blocks of zeros (or too long periodic blocks), which is a relatively easy consequence of the theorem of Ridout. Theorem 3.3 is a far-going generalization of this observation. Theorem 3.1 is a consequence of Theorem 3.3, due to the following simple lemma. Lemma 3.4. — Assume that the complexity function of an infinite sequence (un ) satisfies lim inf ρ(n)/n < ∞. Then (un ) has long repetitions. n→∞

Proof. — By the assumption, there exists κ > 0 such that ρ(n) < κn for infinitely many n. Fix such n and put N = d(κ + 1)ne. By the box principle, the word u1 u2 . . . uN contains two equal subwords of length n. If they are disjoint, then we are done, because n ≥ N/2(κ + 1). Now assume they are not. This means that u1 u2 . . . uN contains a subword W = ABC, where the words A, B and C are non-empty and where AB and BC are equal words of length n. Since the words AB and BC are equal, we have W = AAB, which means that AA is a prefix(3) of W . If `(AA) ≤ n (where we denote by `(X) the length of the word X) then AA is a prefix of AB, which means that AAA is a prefix of W . Continuing by induction, we see that W has a prefix A . . A}, where k = bn/`(A)c + 1 (in particular, | .{z k

k ≥ 2 and k`(A) > n). This implies that there are two disjoint words equal to A . . A}. | .{z bk/2c

Since k ≥ 2 we have bk/2c ≥ k/3, which implies that the length of these words is at least n/3. Hence the lemma is proved with ε = 1/6(κ + 1). Proof of Theorem 3.3. — We assume that α is algebraic and show that it is rational. Write the b-ary expansion of α as in (4). By the hypothesis, there exist ε > 0 and infinitely many natural N such that the initial N -segment WN = u1 . . . uN has two disjoint subwords of length at least εN . Fix one such N . Then WN has a prefix ABCB, where `(B) ≥ εN (the words A and C may be empty). Let ξ be the rational number with the eventually periodic b-ary expansion ABCBCBC . . .. A straightforward calculation shows that ξ=

M , − 1)

br (bs

with M ∈ Z, where r = `(A) is the length of the non-periodic part, and s = `(BC) is the length of the period. Notice that s + r = `(ABC) ≤ N and that s ≥ `(B) ≥ εN . (3)

A prefix of the word v1 . . . vm is any of the words v1 . . . vs with s ≤ m.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

10

Y. F. BILU

The main point of the proof is that ξ is a good rational approximation for α. Indeed, the first `(ABCB) digits of the b-ary expansions of α and ξ coincide. Since `(ABCB) = r + s + `(B) ≥ r + s + εN , we obtain |α − ξ| ≤ b−r−s−εN .

(5)

This is not sufficient to get a contradiction with Roth’s or Ridout’s theorems, but, as we shall see, the Subspace Theorem will do the job. Rewrite (5) as r+s b α − br α − M ≤ b−εN .

(6)

Now it is the time to define the data for the Subspace Theorem: the set S of prime numbers and the linear forms Li,p . Let S consist of the infinite prime and all the prime divisors of b. Further, for p ∈ S we define the linear forms L1,p , L2,p and L3,p in variables x = (x1 , x2 , x3 ) as follows. For p = ∞ we put L1,∞ (x) = x1 ,

L2,∞ (x) = x2 ,

L3,∞ (x) = αx1 − αx2 − x3 .

And for p < ∞ we put Li,p (x) = xi for i = 1, 2, 3. We put x = (br+s , bs , M ). Since ξ ∈ (0, 1), we have |M | ≤ br+s . Thus, kxk ≤ br+s ≤ bN .

(7) Now we have 3 YY

|Li,p (x)|p =

p∈S i=1

Y p∈S

|br |p

Y p∈S

|br+s |p

Y

|M |p br+s α − br α − M ∞ .

p∈S p6=∞

Q By our definition of S and the product formula we have p∈S |b|p = 1. Further, since M ∈ Z, we have |M |p ≤ 1 for each p 6= ∞. It follows that (8)

3 YY

|Li,p (x)|p ≤ br+s α − br α − M ∞ ≤ b−εN ≤ kxk−ε .

p∈S i=1

(We used (6) and (7).) We can repeat this argument for infinitely many N and find vectors x = x(N ) satisfying (8). Moreover, recall that s(N ) ≥ εN , whence s(N ) → ∞ as N → ∞, which means that among the vectors x = x(N ) infinitely many are distinct. Theorem 2.3 implies that these vectors x(N ) lie on finitely many planes of the space Q3 . Hence infinitely many of them lie on the same plane; that is, there exist λ, µ, ν ∈ Q, not all 0 such that for infinitely many N we have (9)

ASTÉRISQUE 317

λbr(N ) + µbr(N )+s(N ) + νM (N ) = 0.

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

11

Moreover, ν 6= 0 because s(N ) → ∞. Dividing (9) by br(N ) bs(N ) − 1 , we obtain bs(N ) + νξ(N ) = 0. bs(N ) − 1 bs(N ) − 1 Sending N to infinity, we conclude that µ + να = 0, whence α ∈ Q. The theorem is proved. λ

+µ

As the reader could have noticed, it is quite irrelevant for the proof that the “digits” u1 , u2 , . . . belong to the set {0, 1, . . . , b − 1}. In fact, any finite set of rational, or even algebraic numbers, would do. Also, b is not obliged to be a rational integer; one can assume it to be any Pisot or Salem number(4). Thus, the result of Adamczewski and Bugeaud in the most general form sounds as follows: let u1 , u2 , . . . be a sequence of algebraic numbers with finitely many distinct terms, and with long repetitions, and let β be a Pisot or Salem number; then either α = u1 β −1 + u2 β −2 + . . . belongs to the number field generated by β and by the “digits” u1 , u2 , . . ., or α is transcendental. In [1, 3] Adamczewski and Bugeaud exploit a different notion of complexity, based on continued fractions rather than b-ary expansions, and obtain several results in the same spirit. The reader may consult Waldschmidt’s survey [70] for more information on the Diophantine analysis of symbolic sequences. Remark in conclusion that Adamczewski and Bugeaud were not the first to apply the Subspace Theorem in the transcendence; in [15, 21, 48, 65] it was used to prove transcendence of certain infinite sums. The argument of Troi and Zannier [65] is quite similar to that of Adamczewski and Bugeaud. See also [30] for a more recent application.

4. DIOPHANTINE EQUATIONS WITH POWER SUMS In 1984 M. Laurent [42] applied the Subspace Theorem to study the solutions x = (x1 , . . . , xr ) ∈ Zr of a polynomial-exponential equation (10)

N X

Pi (x)axi = 0,

i=1

¯ ¯ r and ax := ax1 · · · axr . (Using a specializawhere P1 , . . . , PN ∈ Q[x], a1 , . . . , aN ∈ Q 1 r ¯ tion argument, one can replace Q by any field of characteristic 0.) His results imply, in particular, that, under certain natural condition, the following holds: with finitely (4)

A real algebraic number β > 1 is called Pisot number if all its conjugates (except β itself) lie inside the unit disk of the complex plane; it is called Salem number if they lie inside or on the boundary of the unit disk.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

12

Y. F. BILU

many exceptions, every solution of (10) is also a solution of a “strictly shorter” equaP tion i∈I Pi (x)axi = 0, where I is a proper subset of {1, . . . , N }. The above mentioned condition is the following: the only x ∈ Zr satisfying axi = axj for all i, j is x = (0, . . . , 0). While the theorem of Laurent does not (and cannot) imply ultimate finiteness in general, it allows one to establish it in many special cases, usually by induction in N and/or elimination. However, there are interesting polynomial-exponential equations for which the theorem of Laurent does not yield anything non-trivial. One of the simplest is an + bn = P (x) in x, n ∈ Z, where P is a polynomial. (The equation an = P (x) can be analyzed, for instance, by Baker’s method.) For this equation r = 2 and the vectors ai are (a, 1), (b, 1) and (1, 1). For any such ai and for any x = (0, x) we have axi = (1, 1), so that Laurent’s condition is not satisfied. Corvaja and Zannier studied these and more general equations in the important and largely underestimated article [19], as well as in the later article [21]. Let us introduce some terminology. Call power sum an expression of the form (11)

u(n) = b1 an1 + · · · + bm anm ,

where a1 , . . . , am (the roots) and b1 , . . . , bm (the coefficients) are complex numbers. Power sums can be viewed as a particular case of linear recurrence sequences u(n) = b1 (n)an1 + · · · + bm (n)anm , where b1 (n), . . . , bm (n) are polynomials in n; one may say that power sums are linear recurrences with simple roots. If the roots and the coefficients belong to a ring A, then we call (11) an A-power sum, or a power sum over A. Let P (x, y) ∈ Q[x, y] be an irreducible polynomial with degy P ≥ 2. Corvaja and Zannier studied the equation P (u(n), y) = 0, where u is a power sum. They were motivated by a question of Yasumoto about universal Hilbert sets, that is, sets A of rational integers with the following property: for any irreducible (over Q) polynomial P (x, y) ∈ Q[x, y], the specialized (UHS) polynomial P (a, y) ∈ Q[y] is irreducible for all but finitely many a ∈ A. Informally, a universal Hilbert set proves the Hilbert irreducibility theorem for every polynomial, and with finitely many exceptions. A well-known elementary Galois-theoretic argument (see, for instance, [8, Section 2]) implies that A is a universal Hilbert set if and only if it has the following formally weaker property: for any absolutely irreducible P (x, y) ∈ Q[x, y] with degy P ≥ 2 the equa(UHS0 ) tion P (a, y) = 0 has only finitely many solutions (a, y) with a ∈ A and y ∈ Q.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

13

Existence of universal Hilbert sets was shown by Gilmore and Robinson [37], and the first explicit example was suggested by Sprindzhuk [63] (see [8, 32, 71, 72] for further examples). Yasumoto [71] asked whether {2n + 3n } is a universal Hilbert set. Dèbes and Zannier [32] managed to prove, using the theorem of Ridout, that {2n + 5n } is a universal Hilbert set, but their argument fails for {2n + 3n }. In [19] this problem is solved, and even a much stronger result is obtained: values of any power sum b1 an1 + · · · + bm anm with multiplicatively independent a1 , . . . , am form a universal Hilbert set (with m ≥ 2 and b1 , . . . , bm 6= 0). Another motivation for [19] was the celebrated problem of Pisot. A power series P∞ P n n f (t) = ∞ n=0 v(n)t n=0 u(n)t is called the Hadamard q-th power of the series g(t) = q if u(n) = v(n) for n = 0, 1, . . .; in this case the latter series is called an Hadamard q-th root of the former. Let f (t) be a rational power series (that is, a power series expansion of a rational function in t) with coefficients in Q, and let q be a positive integer. Assume that f (t) is the Hadamard q-th power of another series with coefficients in Q. Pisot conjectured that in this case f (t) is the Hadamard q-th power of another rational power series (with coefficients in Q). P n Since f (t) = ∞ is a rational power series if and only if the coeffin=0 u(n)t cients u(n) form a linear recurrence sequence, Pisot’s conjecture can be stated as follows: assume that {u(n)} is a linear recurrence sequence of rational numbers, such that every u(n) is a q-th power in Q; then u(n) = v(n)q for all n, where v(n) is another linear recurrence sequence of rational numbers. Zannier [73] proved Pisot’s conjecture by a method independent of the Subspace Theorem. Now, let us ask a more difficult question: assume that (12)

u(n) is a q-th power in Q for infinitely many n;

what can one say about the linear recurrence u? Since the work of Corvaja and Zannier applies to the particular equation u(n) − y q = 0, it answers this question in the special case when u is a power sum (over Q). It turns out that, while u itself is not obliged to be a q-th power of another Q-power sum, this is true for the power sum obtained from u by letting n run through an arithmetical progression (see Corollary 4.2). Below, we give a complete proof of this particular case of the theorem of Corvaja and Zannier. We shall also state the general theorem and sketch its proof. 4.1. Refined Pisot’s Conjecture for Power Sums The main result of Corvaja and Zannier concerns Q-power sums with positive roots. For these power sums (12) implies that u is a q-th power of another power sum, but ¯ More precisely, we have the following. over Q.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

14

Y. F. BILU

Theorem 4.1 (Corvaja, Zannier). — Let u be a Q-power sum with positive roots, and let q be a positive integer. Assume that u(n) is a q-th power for infinitely many n ∈ Z. Then u(n) = an+r v(n)q for all n ∈ Z, where a is a non-zero rational number, r ¯ is an integer and v is a Q-power sum. In particular, u is a q-th power of Q-power sum. Corollary 4.2. — Let u be a Q-power sum, and let q be a positive integer. Assume that u(n) is a q-th power for infinitely many n ∈ Z. Then there exist positive integers Q and R and a Q-power sum w such that u(Qn + R) = w(n)q for all n ∈ Z. In other words, though u itself is not necessarily a q-th power of a Q-power sum, the power sum obtained from u by letting n run through a certain arithmetical progression is. If u has positive roots then the corollary is immediate, with Q = q. In the general case one should consider the power sums u(2n) and u(2n + 1), both having positive roots, and the corollary follows with Q = 2q. Proof of Theorem 4.1. — We may assume that u(n) is a q-th power for infinitely many positive integers n, replacing u(n) by u(−n), if necessary. Write u(n) = b0 an0 + · · · + bm anm , where the roots a0 , . . . , am are positive rational numbers written in the decreasing order, so that a0 > a1 > . . . > am > 0. Assume first that a0 = 1. Putting b = b0 and ck = bk /b, we write u(n) = b(1 + z(n)) with z(n) = c1 an1 + · · · + cm anm . Since the roots of the power sum z are strictly smaller than 1, we have(5) |z(n)| θn for some θ ∈ (0, 1). Since u(n) is infinitely often a rational q-th power, we have b > 0 when q is even. We may assume that b > 0 when q is odd as well, replacing u by −u, if necessary. Thus, for big positive n we have u(n) > 0, which implies that u(n) has exactly one positive q-th root; we denote it by y(n). For sufficiently large n we can express y(n) using the binomial power series: Ç å Λ−1 X 1/q 1/q (13) y(n) = b z(n)` + O(θnΛ ), ` `=0

where the parameter Λ will be specified later. The sum in (13) can be expressed as β1 α1n + · · · + βµ αµn , where α1 , . . . , αµ are pairwise distinct. Since α1 , . . . , αµ are multiplicative combinations of a1 , . . . , am , they are positive rational numbers. Thus, we have µ X βk αkn θnΛ . y(n) − b1/q k=1

(5)

In this proof “”, “” and O(·) imply constants depending on the power sum u and on the parameter Λ defined below, but independent of n.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

15

Now we are in a position to apply the Subspace Theorem. We let S to be a finite set of prime numbers, including the infinite prime, such that the numbers a1 , . . . , am are S-units, and b0 , . . . , bm are S-integers. Then u(n) is an S-integer for every n, and so is y(n) = u(n)1/q (as soon as y(n) ∈ Q). Also, the numbers α1 , . . . , αµ are S-units, being multiplicative combinations of a1 , . . . , am . Next, for every p ∈ S we define µ + 1 independent linear forms in µ + 1 variables as follows. For p = ∞ we put L0,∞ (x) = x0 − b1/q

µ X

βk x k ,

Lk,∞ (x) = xk

(k = 1, . . . , µ).

k=1

And for a finite p ∈ S we put Lk (x) = xk for k = 0, . . . , µ. Now let n be such that y(n) ∈ Q. Then x = x(n) = y(n), α1n , . . . , αµn is a vector with S-integer coordinates. We have (14) µ r r Y Y X YY Y n 1/q |Lk,p (x)|p = y(n) − b βk αk |αkn |p θΛn H(y(n)). |y(n)|p p∈S p∈S k=0

k=1

k=1 p∈S

p6=∞

Indeed, the product formula implies that p∈S |αk |p = 1 (because the numbers αk are S-units), which means that the double product is 1. Also, the first product is bounded by H(y(n)), because y(n) is an S-integer. An obvious calculation shows that the height of the rational number u(n) is eO(n) . Since y(n)q = u(n), we have H(y(n)) = H(u(n))1/q = eO(n) . It follows that the righthand side of (14) is bounded by C n θΛn , where the constant C depends only on the power sum u. Now specify the parameter Λ to have CθΛ ≤ 1/2. We obtain Q

r YY

|Lk,p (x)|p 2−n .

p∈S k=0

A routine estimate gives H(x) ≤ eO(n) . We finally obtain (15)

r YY

|Lk,p (x)|p < H(x)−ε

p∈S k=0

with some ε > 0 (depending only on u). By the assumption, there exist infinitely many positive integers n such that y(n) ∈ Q. Hence (15) has infinitely many solutions in S-integer vectors x = x(n). By Theorem 2.30 , all these solutions belong to finitely many proper subspaces of Qµ+1 . It follows that infinitely many vectors x(n) belong to the same proper subspace. In other words, there exist rational numbers γ0 , . . . , γµ , not all 0, such that γ0 y(n) = b1/q γ1 α1n + · · · + γµ αµn .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

16

Y. F. BILU

If γ0 = 0 then γ1 α1n + · · · + γµ αµn would vanish for infinitely many n, which is impossible because α1 , . . . , αµ are pairwise distinct positive numbers. Thus, γ0 6= 0, and we may assume that γ0 = 1. We have shown that for infinitely many n we have y(n) ∈ Q and y(n) = b1/q γ1 α1n + · · · + γµ αµn . Since γ1 α1n + · · · + γµ αµn 6= 0 for large n, we have b1/q =

y(n) ∈ Q. γ1 α1n + · · · + γµ αµn

Thus, for infinitely many n we have y(n) = v(n), where v is a Q-power sum with positive roots. Since u(n) − v(n)q is a power sum with positive roots as well, it can vanish infinitely often only if it vanishes identically. Thus, u(n) = v(n)q . This proves the theorem in the special case a0 = 1. The general case easily reduces to the special one. For some r there exist infinitely many positive integers n, congruent to −r modulo q such that u(n) is a q-th power in Q. Replacing u(n) by a−n−r u(n), we reduce the general case to the case a0 = 1, 0 already treated. 4.2. The General Equation And here is the general theorem of Corvaja and Zannier. Theorem 4.3 (Corvaja, Zannier [21]). — Let u be a Q-power sum with positive roots, let S be a finite set of primes including the infinite prime, and let P (x, y) ∈ Q[x, y] be a polynomial non-constant in y. Assume that the equation P (u(n), y) = 0 has infinitely many solutions in integers n and S-integers y. Then ¯ there exists a Q-power sum v with positive real coefficients such that P (u(n), v(n)) = 0 for all n ∈ Z. Proof (a sketch). — As above, we may assume that there are infinitely many solutions with positive n. When n → +∞ we have u(n) → b ∈ Q ∪ {−∞, +∞}. Replacing u(n) by −u(n) we may exclude the −∞, and upon replacing u(n) by u(n) − b we may assume that in the finite case the limit is 0. Thus, lim u(n) ∈ {0, +∞}. Assume that

lim u(n) = 0. Then

n→+∞

(6)

n→+∞ n

u(n) θ with some θ ∈ (0, 1). By the as-

sumption, for infinitely many positive integers n there exists an S-integer y(n) such (6)

Here implicit constants may depend on the power sum u, the polynomial P (x, y) and the parameter Λ defined below, but not on n.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

17

that P (u(n), y(n)) = 0. Let (16)

Yi (x) =

∞ X

cki xk/ei

(i = 1, . . . , degy P )

k=−κi

be the Puiseux expansion of the algebraic function y at 0, the coefficients cki being algebraic numbers. Since u(n) → 0, for large n all the series (16) converge at x = u(n), and one of the sums Yi (u(n)) is y(n). We fix i for which Yi (u(n)) = y(n) infinitely often, and omit the index i in the sequel. Thus, for infinitely many positive integers n we have ∞ X y(n) = ck u(n)k/e . k=−κ

Truncating the series, we find y(n) =

Λe−1 X

ck u(n)k/e + O(θΛn ).

k=−κ

Now write u(n) = ban (1 + z(n)), where a is the biggest root of u. Redefining θ, we may assume that z(n) θn for positive n. Replacing each u(n)k/e by Ç å Λ−1 X k/e 1/e n/e b a z(n)j + O(θΛn ), j j=0 we obtain y(n) = β1 α1n + · · · + βµ αµn + O(θΛn ), where α1 , . . . , αµ are positive real algebraic numbers, and β1 , . . . , βµ are algebraic numbers. Now applying the Subspace Theorem in the same way as we did in the proof of ¯ Theorem 4.1, we find that y(n) = v(n) for infinitely many n, where v is a Q-power ¯ sum with positive real roots. Then P (u(n), v(n)) is a Q-power sum with positive real roots, which vanishes at infinitely many n. Hence it vanishes identically. The case u(n) → +∞ is treated similarly, the Puiseux expansions at zero being replaced by those at infinity. Among other consequences of this theorem, we have the following result mentioned above. Corollary 4.4 (Corvaja, Zannier). — Let u(n) = b1 an1 + · · · + bm anm be a Q-power sum. Assume that m ≥ 2 and that the roots a1 , . . . , am are multiplicatively independent. Then {u(n)} is a universal Hilbert set. To prove the corollary, we need a purely algebraic lemma. Let K be a field of characteristic 0 and let Γ be a multiplicatively written torsion-free abelian group. Then the group ring K[Γ] is an integral domain.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

18

Y. F. BILU

Lemma 4.5. — In the ring K[Γ] consider an element u = b1 γ1 + · · · + bm γm , where b1 , . . . , bm ∈ K ∗ and γ1 , . . . , γm are multiplicatively independent elements of Γ. Assume that m ≥ 2. Then the ring K[u] is integrally closed in K[Γ]. Since this the lemma has nothing to do with our main subject, we prove it in the addendum to this section. Proof of Corollary 4.4. — We apply the lemma with K = C and with Γ consisting of the functions Z → R defined by n 7→ an with a positive real a. Then C[Γ] is exactly the ring of power sums with complex coefficients and positive real roots. Now let u(n) = b1 an1 + · · · + bm anm be as in the corollary. We may assume that the roots a1 , . . . , am are positive, considering separately u(2n) and u(2n + 1). By the lemma, the ring C[u] is integrally closed in C[Γ]. If {u(n)} is not a universal Hilbert set then there exists a Q-irreducible polynomial P (x, y) ∈ Q[x, y] with degy P ≥ 2 such that P (u(n), y) = 0 has infinitely many solutions in n ∈ Z and y ∈ Q. We may assume the polynomial P absolutely irreducible(7) and monic(8) in y. Since P is monic, there exists a finite set of primes S such that for all solutions (n, y) as above, the number y is an S-integer. Applying Theorem 4.3, we find a power sum v with positive real roots such that P (u(n), v(n)) = 0. Since the polynomial P (x, y) is absolutely irreducible, y-monic and of y-degree at least 2, the ring C[u, v] is a non-trivial integral extension of C[u]. Hence C[u] is not integrally closed in C[Γ], a contradiction. In fact, Corvaja and Zannier prove more. For instance, using Siegel’s theorem (see Section 5), they show(9) the following: in the set-up of Theorem 4.3 assume that P is Q-irreducible and degy P ≥ 2; then either u = f (v), where v is another power sum and f is a polynomial of degree at least 2, or the roots of u generate a cyclic multiplicative group (that is u(n) = b1 aν1 n + · · · + bm aνm n with some a ∈ Q∗ and ν1 , . . . , νm ∈ Z). This implies further examples of universal Hilbert power sums, like 2n + 3n + 6n , etc. To conclude, we briefly discuss power sums over number fields. Theorems 4.1 and 4.3 stay true, with almost the same proof, if the assumption the roots of u are positive is replaced by the roots of u generate a torsion-free multiplicative abelian group. One may attempt to extend Theorems 4.1 and 4.3, with this more general assumption, to K-power sums, with an arbitrary number field K. Unfortunately, this is done only under a certain technical assumption about our power sum. We say that a K-power sum u has an upper (respectively, lower ) dominant root if there exists a root a of u (7)

It is well-known and easy to show that if P (x, y) is Q-irreducible but C-reducible then the equation P (x, y) = 0 can have only finitely many solutions in x, y ∈ Q. (8) Replace P (x, y) = aq (x)y q + · · · + a1 (x)y + 1 by aq (x)q−1 P (x, y/aq (x)). (9) In [19] they consider only power sums with integer roots, but the argument extends to rational roots without trouble.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

19

and an absolute value v ∈ MK such that |a|v > |a0 |v (respectively, |a|v < |a0 |v ) for any other root a0 . Now let u be a K-power sum satisfying the following two conditions: the roots of u generate a torsion-free multiplicative abelian group, and u has both an upper dominant root and a lower dominant root. Then u satisfies both the analogues of Theorems 4.1 and 4.3 with Q replaced by K (with very similar proofs). The existence of a “dominant root” is immediate(10) if the field K has at least one real embedding, but it may fail already for K = Q(i): the power sum u(n) = (8 + i)n + (8 − i)n + (2 + i)n + (2 − i)n has no upper dominant root. Suppressing the “dominant root” assumption looks a difficult problem. It seems that at least one cardinal new idea is needed to handle power sums without dominant roots. See, however, [20]. Addendum: Proof of Lemma 4.5 We may assume that Γ is a division group; moreover, since it is torsion-free, every γ ∈ Γ has a well-defined “n-th root” γ 1/n for any non-zero integer n. It suffices to prove that K[u] is integrally closed in the ring K[∆], for any finitely generated subgroup ∆ of Γ, containing γ1 , . . . , γm . Replacing ∆ by a bigger finitely generated subgroup, we 1/n 1/n may assume that it has a free Z-basis consisting of γ1 , . . . , γm (with some positive integer n) and, perhaps, several more elements of Γ. We have reduced the lemma to the following statement. Proposition 4.6. — Let R = K[x1 , . . . , xr ] be the polynomial ring over a field K (of characteristic 0) and let n be a positive integer. Consider u = b1 xn1 + · · · + bm xnm ∈ R, where 2 ≤ m ≤ r and b1 , . . . , bm ∈ K ∗ . Then K[u] is integrally closed in R. Proof. — We may assume that K is algebraically closed and, by a linear change of variables we may assume that b1 = . . . = bm = 1, so that u = xn1 + · · · + xnm . Let O be the integral closure of K[u] in R. We want to prove that O = K[u]. The quotient field of O is contained in the purely transcendental field K(x1 , . . . , xr ). By the theorem of Luroth (see Remark 4.7) it itself must be purely transcendental. Thus, we may write this quotient field as K(v), and the generator v may be chosen in the ring O. We have u = P (v), where, a priori, P (X) is a rational function over K. Since both u and v are polynomials in x1 , . . . , xr , the rational function P (X) must be a polynomial. Specializing x1 = t, x2 = . . . = xr = 0, we obtain tn = P (Q(t)), where Q(t) is a polynomial over K. It follows that P (X) = aX ν for some positive integer ν and some (10)

Provided the roots generate a torsion-free abelian group.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

20

Y. F. BILU

a ∈ K ∗ . Specializing x1 = t, x2 = 1, x3 = . . . = xr = 0 (it is here where we use the assumption m ≥ 2), we conclude that tn + 1 is a ν-th power of yet another polynomial in t, which is possible only if ν = 1. Thus, u = av, which proves the proposition. Remark 4.7. — We use here a slightly non-traditional form of Luroth’s theorem: if K ⊂ L ⊂ Ω is a tower of fields of characteristic 0, with K algebraically closed, Ω purely transcendental over K and L of transcendence degree 1 over K, then L is purely transcendental. In standard textbooks one usually assumes that Ω is of transcendence degree 1 as well. However, our “more general” version of Luroth’s theorem easily follows from the traditional one. Indeed, geometrically, the “traditional” version means the following: if an algebraic curve C admits a non-constant rational dominant map P1 → C, then it is isomorphic to P1 . And in our version P1 should be replaced by Pr . But if a curve admits a non-constant dominant map from a projective space, then it also admits one from the projective line.

5. INTEGRAL POINTS 5.1. Integral Points on Curves It is well-known that a binary Diophantine equation P (x, y) = 0 of degree 1 or 2 has infinitely many solutions in integers unless it has an “obvious” reason (local obstruction) for having finitely many. Siegel proved [62], relying on the already mentioned work of A. Thue [64], that an equation of degree 3 or higher must have finitely many solutions, unless it has an “obvious” reason to have infinitely many (reduces to a linear or quadratic equation by a variable change). Precisely speaking, Siegel proved that an irreducible equation P (x, y) = 0 (where P (x, y) ∈ Q[x, y]) has at most finitely many solutions x, y ∈ Z if one of the following conditions is satisfied: – the genus of the plane curve P (x, y) = 0 is at least 1, or – this curve has at least 3 points at infinity. More generally, let C¯ be an absolutely irreducible projective curve defined over a number field K and let C be an affine subset of C¯ embedded into the affine space Aν . Further, let S be a finite set of absolute values of K, including all archimedean absolute values, and let OS be the ring of S-integers of K. Again, Siegel’s theorem (in the more general form due to Mahler and Lang) asserts that C has at most finitely many points ¯ ≥ 1 or if C¯ \ C ≥ 3. in Aν ( OS ) if g(C) Of course, one should mention the celebrated result of Faltings, who proved that the set of rational points on a projective curve of genus 2 or higher is finite. We do not discuss Faltings’ work here.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

21

The conventional proof of Siegel’s theorem, as in [41, Chapter 8] or [40, Section D.9], relies on the Theorem of Roth(11) and heavily depends on the existence of ¯ because it exploits high degree étale coverings the Jacobian embedding C¯ ,→ J(C), ¯ of C. Recently Corvaja and Zannier [22] suggested a beautiful new proof, based on the Subspace Theorem rather than the Theorem of Roth, and using projective rather than Jacobian embeddings. Corvaja and Zannier prove the following theorem. Theorem 5.1. — In the above set-up assume that C¯ \ C ≥ 3. Then C has at most finitely many points in Aν ( OS ). ¯ ≥ 1 then there is Siegel’s theorem easily follows from Theorem 5.1. Indeed, if g(C) 0 ¯ ¯ an étale covering C → C of degree 3. It induces the covering of affine curves C 0 → C, and we have C¯ 0 \ C 0 ≥ 3. ¯ By the Chevalley-Weil principle, the set C(K) is covered by C¯ 0 (K 0 ), where K 0 is a number field. Theorem 5.1 implies that the set of OS 0 -integral points on C 0 is finite (where S 0 is the extension of S to K 0 ). Hence so is the set of S-integral points on C. Existence of the covering C¯ 0 → C¯ of degree 3 is the only point in the new proof of Siegel’s theorem which appeals to the Jacobian embedding: as we shall see, the proof of Theorem 5.1 is free of Jacobians. Proof of Theorem 5.1. — Write C¯ \ C = {Q1 , . . . , Qr }, where, by the assumption, r ≥ 3. Extending the field K, we may assume that each of the points Q1 , . . . , Qr is defined over K. Further, let D = Q1 + · · · + Qr be the “divisor at infinity”. Let n be a (big) positive integer, to be specified later. By the Riemann-Roch theorem, the dimension ` = `(nD) of the vector space

L = L (nD) = {y ∈ K(C) : (y) + nD ≥ 0} is given by ` = nr − O(1). In particular, for big n we have ` ∼ nr. Pick a basis y1 , . . . , y` of L . Every yj is integral over the ring K[x] = K[x1 , . . . , xν ], where x1 , . . . , xν are the coordinate functions on the affine curve C ⊂ Aν . Multiplying each by a suitable non-zero constant, we may assume that they are integral over the ring OS [x]. It follows that for every S-integral point P we have yj (P ) ∈ OS . Now assume that there exist infinitely many distinct S-integral points P1 , P2 , P3 , . . .. ¯ v ) is compact in the v-adic topology for Since C¯ is a projective curve, the set C(K every v. Hence, replacing the sequence (Pi ) by a suitable subsequence, we may assume that it converges in v-adic topology for every v ∈ S, and we denote by Qv the (11)

At the time of Siegel Roth’s theorem was not available, and Siegel had to use a weaker statement.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

22

Y. F. BILU

corresponding limits. Now we partition our set S as S = S 0 ∪ S 00 , letting S 0 consist of v ∈ S such that Qv ∈ C¯ \ C and S 00 of those v for which Qv ∈ C. We wish to estimate |yj (Pi )|v for i = 1, 2, . . . and v ∈ S. For v ∈ S 00 it is obvious that |yj (Pi )|v are bounded independently of k. For v ∈ S 0 fix a local parameter tv at Qv . −n Then |yj (Pi )|v |tv (Pi )|v , where here and below implicit constants are independent of i. Thus, for y = (y1 , . . . , y` ) we obtain ( −n |tv (Pi )|v , if v ∈ S 0 ky(Pi )kv 1, if v ∈ S 00 . Since the numbers yj (Pi ) are S-integers, we obtain Y Y −n (17) H(y(Pi )) = ky(Pi )kv |tv (Pi )|v . v∈S

v∈S 0

All this was just a preparation, and now we are coming to the heart of the CorvajaZannier argument. Fix v ∈ S 0 . If z ∈ L vanishes at Qv , then |z(Pi )|v becomes “very small” as Pi approaches Qv , which gives rise to v-adically small linear form. Since the vector space L contains “many” such z, we have many independent v-adically small linear forms. This would allow us to use the Subspace Theorem. More specifically, elementary linear algebra shows that our space L has a basis(12) z1 , . . . , z` satisfying ordQv zk ≥ k − n − 1

(k = 1, . . . , `).

Of course, not all of the functions zk vanish at Qv (some of them even have a pole at Qv ) but, “in average”, they do. Indeed (18)

` X

ordQv zk ≥

` X

(k − n − 1) =

k=1

k=1

1 `(` − 2n − 1) =: A. 2

Since ` ∼ rn for large n, and r ≥ 3 by the assumption, we may specify n to have A > 0. Express every zk as a linear form in y: zk = Lk,v (y). This defines independent linear forms L1,v , . . . , L`,v for v ∈ S 0 . For v ∈ S 00 we simply put Lk,v (y) = yk . We wish to estimate |Lk,v (y(Pi ))|v for all k and v. For v ∈ S 00 we again have |Lk,v (y(Pi ))|v = |yk (Pi )|v 1, and for v ∈ S 0 we have ordQv zk

|Lk,v (y(Pi ))|v = |zk (Pi )|v |tv (Pi )|v (12)

.

It would be more correct to write z1,v , . . . , z`,v , but this would make the notation too heavy.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

23

Putting this together, we obtain ` YY

|Lk,v (y(Pi ))|v

Y

P` Y A ord z |tv (Pi )|v , |tv (Pi )|v k=1 Qv k ≤ v∈S 0

v∈S 0

v∈S k=1

where A > 0 is defined in (18). Combining this with (17), we obtain ` YY

|Lk,v (y(Pi ))|v H(y(Pi ))−ε

v∈S k=1

with ε = A/n. Now apply the Subspace Theorem in the form of Theorem 2.5. We obtain that there exist finitely many non-zero functions u1 , . . . , us from L such that every Pi is a zero of one of uj . It follows that among the points Pi only finitely many are distinct, which contradicts the original assumption about the existence of an infinite sequence of distinct S-integral points. The theorem is proved. Since this argument does not use Jacobians, one may expect to extend to higher dimensions. This is discussed in Subsection 5.2. Another useful aspect of the new proof of Siegel’s theorem is that it allows, in many cases, to obtain good quantitative bounds for the number of integral points. This direction is exploited, in particular, in [24]. 5.2. Integral Points on Surfaces It is widely believed that an affine (respectively, projective) variety V of general type cannot have many integral (respectively, rational) points. Of course, one cannot have here ultimate finiteness, but it is expected that integral (or rational) points are not Zariski dense(13) on V . Faltings [35] did the case when V is a subvariety of an abelian variety, and Vojta extended his result to subvarieties of semiabelian varieties, but very little is known for general V . Since the argument of Corvaja and Zannier does not use Jacobians, it is very likely to extend to certain surfaces and varieties of higher dimension, the assumption there exists at least 3 points at infinity being replaced by something like the divisor at infinity is “sufficiently reducible”. Vojta [66, 68] used the Subspace Theorem to show that integral points on an irreducible affine variety of dimension d are not Zariski dense if the divisor at infinity has at least d + ρ + 1 components, where ρ is the rank of the Néron-Severi group (see also [49]). In the article [26] Corvaja and Zannier applied their argument to integral points on ¯ be a non-singular projective surface and X ⊂ Aν a non-empty affine surfaces. Let X (13)

Recall that a subset of an algebraic variety is not Zariski dense if it lies on a proper closed subvariety.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

24

Y. F. BILU

¯ We let C1 , . . . , Cr be the irreducible components of X ¯ \ X and we may subset of X. define the “divisor at infinity” D = C1 + · · · + Cr . Corvaja and Zannier, however, use the divisor D = a1 C1 + · · · + ar Cr with some positive integers a1 , . . . , ar (“weights”). This approach is much more flexible, because the weights can be chosen in a certain “optimal” way. Recall that in the case of curves we could apply the Subspace Theorem because for every point at infinity Q and for a sufficiently large n we found a basis z1 , . . . , z` of the space L (nD) such that ` X

ordQ (zj ) > 0.

j=1

Similarly, in the surface case, we must find, for every curve Ci and for a sufficiently ¯ nD) such that large n, a basis z1 , . . . , z` of the space H 0 (X, ` X

ordCi (zj ) > 0.

j=1

We want to express this property in terms of the divisor D. In the subsequent paragraph we write C for Ci and a for ai . ¯ nD) Consider the filtration of the space H 0 (X, ¯ nD) ⊇ H 0 (X, ¯ nD − C) ⊇ H 0 (X, ¯ nD − 2C) ⊇ . . . , H 0 (X,

(19)

and let z1 , . . . , z` be a basis of this filtration(14). For this basis we have ` X

ordC (zj ) =

j=1

∞ X

(k − an) h0 nD − kC − h0 nD − (k + 1)C

k=0

= −anh0 (nD) +

∞ X

h0 (nD − kC)

k=0

(of course, the infinite sums have only finitely many non-zero terms). Thus, the basic condition to be satisfied is that the inequalities P∞ 0 k=0 h (nD − kCi ) (20) > ai (i = 1, . . . , r) nh0 (nD) hold for a certain n. (14) A basis of a filtration W0 ⊇ W1 ⊇ W2 ⊇ . . . of vector spaces is, by definition, a basis of W0 which contains a basis of every Wi .

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

25

¯ be a non-singular projective surface deTheorem 5.2 (Corvaja, Zannier). — Let X ν ¯ Let fined over a number field K and let X ⊂ A be a non-empty affine subset of X. (15) ¯ \ X. Assume that C1 , . . . , Cr interC1 , . . . , Cr be effective divisors supported at X sect properly (that is, no 2 of them have a common component and no 3 of them have a common point). Further, assume that for some choice of positive integers a1 , . . . , ar the r inequalities (20) (with D = a1 C1 + · · · + ar Cr ) hold for certain n. Then for any finite set S ⊂ MK the set X ∩ Aν ( OS ) of S-integral points on X is not Zariski dense. Proof. — It is quite analogous to the proof of Theorem 5.1. We may assume that every Ci is defined over K. Let n be such that the inequalities (20) hold. As we have seen above, this implies existence of a positive B such that ` X

ordC zk ≥ B,

k=1

where C is any of C1 , . . . , Cr and z1 , . . . , z` is a basis of the filtration (19). To prove the theorem, it suffices to show that every infinite sequence of S-integral points has a subsequence contained on a curve defined over K. Indeed, since there are only countably many K-curves, a Zariski-dense set contains a sequence with finitely many elements on every K-curve. Thus, let P1 , P2 , P3 . . . be a sequence of S-integral points. Replacing it by a subsequence, we may assume that it v-adically converges for every v ∈ S, and denote the limit by Qv . Now we have 3 cases: either Qv ∈ X or Qv belongs exactly to one of the Ci (call it Cv ), or it belongs to exactly two of them (call them Cv and Cv0 ). (By the assumption, Qv cannot belong to three or more Ci .) Let S0 , S1 and S2 be the corresponding subsets of S. ¯ nD). We may assume that yj (P ) ∈ OS Fix a basis y1 , . . . , y` of the space H 0 (X, for any S-integral point P . Now, for each v ∈ S we shall define a new basis z1 = z1,v , . . . , z` = z`,v of the same space, and we let L1,v , . . . , L`,v be the linear forms such that zk = Lk,v (y). Then we shall apply the Subspace Theorem to these forms evaluated at y(Pi ). If v ∈ S0 then, as in the proof of Theorem 5.1, we define the z-basis just putting zj = yj . We have plainly ky(Pi )kv 1,

(21) (22)

` Y

|Lk,v (y(Pi ))|v 1.

k=1

(15)

We do not assume the divisors C1 , . . . , Cr irreducible.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

26

Y. F. BILU

Next, assume that v ∈ S1 and let z1 , . . . , z` be a basis of the filtration (19) with C = Cv . If tv is a local parameter of Cv near Qv then for any function u regular on X −ord u the function tv Cv u is regular in a neighborhood of Qv . It follows ordCv u

|u(Pi )|v |tv (Pi )|v

(i = 1, 2, . . .).

Applying this with u = y1 , . . . , y` and with u = z1 , . . . , z` , we find that (23) (24)

min

ord

ky(Pi )kv |tv (Pi )|v 1≤j≤` Cv P` ` Y ordCv zk |Lk,v (y(Pi ))|v |tv (Pi )|v k=1

yj

≤ |tv (Pi )|−An , v ≤ |tv (Pi )|B v ,

k=1

where A = max{a1 , . . . , ar } and B > 0 is defined in the beginning of the proof. Finally, assume that v ∈ S2 . In this case Corvaja and Zannier use the following nice elementary lemma. Lemma 5.3. — Let (25)

W = W 0 ⊇ W 1 ⊇ W2 ⊇ . . . ,

W = W00 ⊇ W10 ⊇ W20 ⊇ . . .

be two filtrations of a finitely dimensional vector space W . Then there exists a common basis for the two filtrations (that is, there exists a basis of W containing bases for every Wi and for every Wi0 .) (The proof is by induction in dim W . Without loss of generality we may assume that W1 is a hyperplane in W . Put Wi00 = W1 ∩ Wi0 . By induction, there exists a common basis w1 , . . . , wd−1 for the filtrations W1 ⊇ W2 ⊇ . . . and W1 = W000 ⊇ W100 ⊇ W200 ⊇ . . .. Now let k be the smallest index for which Wk0 6⊆ W1 (the set of such indices is non-empty because it includes 0). Then Wi00 is a hyperplane in Wi0 for i ≤ k and Wi0 = Wi00 for i > k. Now, picking a wd ∈ Wk0 \ Wk00 , we obtain a basis w1 , . . . , wd−1 , wd of both filtrations (25), which proves the lemma.)

Using the lemma, we find a common basis z1 , . . . , z` for both the filtrations (19) with C = Cv and C = Cv0 . Now let tv and t0v be local parameters near Qv at Cv and Cv0 , respectively. Then −ord u −ordC 0 u v u is regular in a for any function u regular on X the function tv Cv (t0v ) neighborhood of Qv , whence ordC 0 u ordCv u 0 |tv (Pi )|v v

|u(Pi )|v |tv (Pi )|v

(i = 1, 2, . . .).

Applying this with u = y1 , . . . , y` and with u = z1 , . . . , z` , we obtain (26)

min1≤j≤` ordCv yj

ky(Pi )kv |tv (Pi )|v

min1≤j≤` ordC 0 yj

|t0v (Pi )|v

(27) P` P` ` Y ordCv zk ordC 0 zk k=1 0 v |Lk,v (y(Pi ))|v |tv (Pi )|v |tv (Pi )|v k=1 k=1

ASTÉRISQUE 317

v

−An

≤ |tv (Pi )t0v (Pi )|v

≤ |tv (Pi )t0v (Pi )|B v .

,

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

27

Combining the inequalities (21, 23, 26) with (22, 24, 27), we find ` YY

|Lk,v (y(Pi ))|v H(y(Pi ))−ε

(i = 1, 2, . . .)

v∈S k=1

with ε = B/An. Now we complete the proof using the Subspace Theorem in the same manner as we did in the proof of Theorem 5.1. Remark 5.4. — Using Vojta’s refinement [67] of the Subspace Theorem, Levin [43] shows that, under the hypothesis of Theorem 5.2 there exists a (possibly, reducible) affine curve on X, depending only on X, but independent on K and S, such that all but finitely many S-integral points from X belong to this curve. (The exceptional finite set may, however, depend on K and S.) The same is true for the consequences of Theorem 5.2: Corollaries 5.6 and 5.7 and Theorem 5.8.

Imposing on our divisors Ci additional assumption (like ampleness), we can estimate from below the quantity on the left of (20) asymptotically (as n → ∞), using the Riemann-Roch theorem on surfaces. This would express our condition in terms of the intersection numbers of the divisors C1 , . . . , Cr and the weights a1 , . . . , ar . The Riemann-Roch theorem applies through the following lemma, proved in the addendum to this section. Lemma 5.5. — Let C be an ample divisor and D an effective divisor on a nonsingular projective surface, and let n and k be positive integers such that k ≤ αn, where α = (D · C)/C 2 . Then (28)

h0 (nD − kC) ≥

1 (nD − kC)2 − O(n). 2

Let us look closer at this lemma. We have (nD − kC)2 = D2 n2 − 2(D · C)nk + C 2 k 2 . The quadratic form q(ξ, τ ) = D2 ξ 2 − 2(D · C)ξτ + C 2 τ 2 is not positive definite by the Hodge index theorem. Hence the polynomial q(1, τ ) has two real roots, γ and γ 0 . They are, obviously, positive, and we assume that γ ≤ γ 0 . In fact, γ ≤ α ≤ γ 0 because α = (γ + γ 0 )/2. Thus, we have q(ξ, τ ) < 0 if γξ < τ < γ 0 ξ, and q(ξ, τ ) ≥ 0 otherwise. In particular, (28) remains true for k ≤ γ 0 n, but it is uninteresting for γn < k < γ 0 n and becomes interesting only for k ≤ γn.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

28

Y. F. BILU

Applying the lemma in our situation, we bound the numerator on the left of (20) as (we write C instead of Ci ) (29)

∞ X

X 1 q(n, k) − O(n2 ) 2 k≤θn ã Å 1 2 1 2 1 3 2 3 = θD − θ (D · C) + θ C n − O(n2 ), 2 2 6

h0 (nD − kC) ≥

k=0

where θ is any real number satisfying 0 ≤ θ ≤ γ 0 . Also, the Riemann-Roch theorem gives for the denominator in (20) the asymptotics nh0 (nD) =

1 3 2 n D + O(n2 ). 2

Hence the left-hand side of (20) is bounded from below by F (θ) + O(1/n), where ã Å 1 2 C2 D·C + θ . F (θ) = θ 1 − θ D2 3 D2 It remains to select the parameter θ in the optimal way. The estimate in (29) is best possible if the sum on the right of (29) contains all positive terms q(n, k) and no negative terms. It follows that the optimal choice is θ = γ. We obtain the following consequence. ¯ be a non-singular projective surface Corollary 5.6 (Corvaja, Zannier). — Let X ¯ defined over a number field K and let X ⊂ Aν be a non-empty affine subset of X. ¯ Let C1 , . . . , Cr be properly intersecting effective ample divisors supported at X \ X. Further, assume that for some choice of positive integers a1 , . . . , ar the r inequalities ã Å 1 2 Ci2 D · Ci γ > ai (i = 1, . . . r) + (30) γi 1 − γi D2 3 i D2 hold, where D = a1 C1 + · · · + ar Cr and where γi is the smallest positive root of the polynomial D2 − 2(D · Ci )T + Ci2 T 2 . Then for any finite set S ⊂ MK the S-integral points are not Zariski dense on X. By choosing suitable weights, Corvaja and Zannier showed that integral points are not Zariski-dense if they satisfy some conditions, for instance if r ≥ 4 and the intersection matrix of C1 , . . . , Cr is of rank 1. Autissier [7] suggested to take θ = β/2, where β = D2 /(D · C). (Notice that β/2 < γ and γ ≈ β/2 when γ 0 is very large.) Since Å ã Å ã Å ã β β β D·C 1 D2 C 2 β2 C 2 1 D2 F = 1− 1 + + = , 2 2 2 D2 12 D2 4D·C 6 (D · C)2 we obtain the following result.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

29

Corollary 5.7 (Autissier). — In the set-up of Corollary 5.6, assume that for some choice of positive integers a1 , . . . , ar the r inequalities Å ã 1 D2 Ci2 D2 1+ > 4ai (i = 1, . . . , r) (31) D · Ci 6 (D · Ci )2 hold. Then for any finite set S ⊂ MK the S-integral points are not Zariski dense on X. This result is formally weaker, than Corollary 5.6, but it is more practical, because inequality (31) is much easier to handle, than (30). Levin [43] and, independently, Autissier [7] observed that a “nearly optimal” choice of the weights a1 , . . . , ar implies that 4 ample divisors at infinity would suffice. More precisely, they prove the following. ¯ be a non-singular projective surface deTheorem 5.8 (Levin, Autissier). — Let X ¯ Let fined over a number field K and let X ∈ Aν be a non-empty affine subset of X. ¯ \ X. AsC1 , . . . , Cr be properly intersecting effective ample divisors supported at X sume that r ≥ 4. Then for any finite set S ⊂ MK the S-integral points on X are not Zariski dense. Remark 5.9. — In Theorem 5.8 one can relax the assumption that the divisors Ci are ample (see [43, Theorem 11.5A]), but one cannot just assume that Ci are effective and intersect ¯ = P1 × P1 and X = Gm × Gm , where Gm is obtained by properly. As an example take X ¯ \ X consists of 4 curves. The map removing the 0-point and the ∞-point from P1 . Then X −1 −1 (x, y) → (x, x , y, y ) defines an affine embedding X → A4 , and the set of S-integral points × × with respect to this embedding is OS × OS , which is Zariski-dense in general.

To prove Theorem 5.8 we need one more elementary lemma. Lemma 5.10. — Let M = [µij ]1≤i,j≤r be a symmetric r × r-matrix with positive real entries. Consider the linear forms Li (x) = µi1 x1 + · · · + µir xr

(i = 1, . . . , r)

and the quadratic form Q(x) = xt M x. Then for any ε > 0 there exist positive integers a1 , . . . , ar such that (32)

(1 − ε)Q(a) < rai Li (a) < (1 + ε)Q(a)

(i = 1, . . . , r),

where a = (a1 , . . . , ar ).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

30

Y. F. BILU

Proof. — We follow the elegant argument of Autissier [7, Proposition 2.3]. Notice that Q(x) = x1 L1 (x) + · · · + xr Lr (x). Hence we have to find a point a with positive integral coordinates such that the r numbers ai Li (a) are approximately equal. We first find a point with positive real coordinates where these numbers are exactly equal. Let ∆ be the simplex (33)

x1 + · · · + xr = 1,

0 ≤ xi ≤ 1

(i = 1, . . . , r).

Consider the map ∆ → ∆ defined by −1

x 7→ L1 (x)

−1

, . . . , Lr (x)

r X

!−1 −1

Li (x)

.

i=1

The map is well-defined because the entries of our matrix M are positive numbers. By the Brower theorem, our map has a fixed point a ∈ ∆. For this point we have a1 L1 (a) = . . . = ar Lr (a). Since none of the Li (a) vanishes, none of the ai does; in other words, the real numbers a1 , . . . , ar are strictly positive. Replacing each by a suitable rational approximation, we obtain positive rational numbers a1 , . . . , ar satisfying (32). Multiplying them by the common denominator, we arrive to the desired integers a1 , . . . , ar . Proof of Theorem 5.8. — First of all, remark that the term 1 D2 Ci2 , 6 (D · Ci )2

(34)

occurring in (31), is bounded from below, uniformly in a, by a positive constant. Indeed, (34) defines a homogeneous positive real function on non-zero vectors r a ∈ (Z≥0 ) . But, since it is a quotient of quadratic forms with positive coefficients, it r extends to a positive real continuous function on the non-zero vectors of (R≥0 ) . By homogeneity, it suffices to consider this function on the compact ∆ defined by (33), where it is bounded away from 0. Thus, to ensure (31), we must find positive integers a1 , . . . , ar such that for some ε > 0 the inequalities D2 (1 + ε) > 4ai (D · Ci )

(i = 1, . . . , r)

hold. Applying Lemma 5.10 to the intersection matrix of C1 , . . . , Cr , we find a1 , . . . , ar such that D2 (1 + ε) > rai (D · Ci ) (i = 1, . . . , r). Since r ≥ 4, we are done.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

31

In his fundamental article [43], Levin extends Theorem 5.8 to varieties of arbitrary dimension, without assuming proper intersection. One difficulty he has to overcome is that Lemma 5.3 is no longer true for three or more filtrations. Levin gives a thorough analysis of the argument of Corvaja and Zannier and, probably, reaches its “natural limitations”. In addition, he accompanies every Diophantine result with an analogous statement about holomorphic maps, in accordance with Vojta’s philosophy. For more Diophantine applications of the Subspace Theorem, see [25, 31]. Addendum: Proof of Lemma 5.5 We deduce Lemma 5.5 from the Theorem of Riemann-Roch and the following proposition. Proposition 5.11. — Let B, C and D be divisors on a non-singular projective surface X. Assume that C is very ample, that D is effective and that C 2 ≤ C · D. Then h0 (B − D + C) ≤ B · C + h0 (B) + 1. Proof. — By the Theorem of Bertini we may assume that C is an irreducible smooth curve. The exact sequence of sheaves 0 → OX (B − D) → OX (B − D + C) → OX (B − D + C)|C → 0, implies the exact sequence of cohomologies 0 → H 0 (X, B − D) → H 0 (X, B − D + C) → H 0 (C, ∆) → . . . , where ∆ is the divisor (B − D + C)|C on C. It follows that (35)

h0 (X, B − D + C) ≤ h0 (X, B − D) + h0 (C, ∆) .

We have deg ∆ = (B − D + C) · C ≤ B · C because C 2 ≤ C · D. It remains to observe that h0 (C, ∆) ≤ deg ∆ + 1 and that h0 (X, B − D) ≤ h0 (X, B), because D is effective.

Proof of Lemma 5.5. — By the theorem of Riemann-Roch, 1 1 h0 (nD − kC) ≥ (nD − kC)2 − (nD − kC) · K − h0 (K − nD + kC) + O(1), 2 2 where K is the canonical divisor. Since (nD − kC) · K = O(n), we have to prove that h0 (K − nD + kC) = O(n). We may assume k so large that kC is very ample. Applying Proposition 5.11 with B = K and with kC, nD instead of C and D, the condition (kC)2 ≤ kC · nD being assured by the assumption k ≤ αn, we find

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

32

Y. F. BILU

h0 (K − nD + kC) ≤ k(K · C) + h0 (K) + 1 = O(n), as wanted. I thank Ivan Cheltsov for explanations concerning this lemma.

6. CONCLUSION As it was indicated in the introduction, the recent remarkable applications of the Subspace Theorem are not limited to the results discussed above. Without any claim for exhaustiveness, let me just quote several more works that I personally find attractive. Mahler [46] showed, using the theorem of Ridout, that if α is a positive rational number, but not integer, and 0 < θ < 1 then the inequality |αn − m| ≤ θn has finitely many solutions in positive integers n and m. He asked for which irrational algebraic a similar statement is true, observing that it is false, for instance, Ä numbers √ ä if α = 1 + 5 /2, and, more generally, if α is a Pisot number(16). Corvaja and Zannier answered this question, showing that the corresponding statement is true for all irrational algebraic numbers except the roots of Pisot numbers (and for the latter it is obviously false). In the same article they answered a question of Mendès France [47] on the period length of the periodic continued fraction for αn , where α is a quadratic irrationality. Corvaja and Zannier showed that the period tends to infinity with n unless α is a square root of a rational number or a unit. See also [14, 29, 61]. Corvaja and Zannier [20] gave a complete answer to Pisot’s question on when the quotient u(n)/v(n) of two power sums (and, more generally, of two linear recurrences) is infinitely often an integer. By the way, this is one of the rare cases when the authors managed to overcome the difficulty stemming from the absence of the “dominant root” (see the end of Section 4). Corvaja and Zannier [23] and, independently, Hernández and Luca [39] proved that (ab + 1)(ac + 1)(bc + 1) cannot have only small prime divisors, confirming a conjecture of Győry, Sárközy and Stewart [38]. See [13] for a quantitative version of this result. Bugeaud, Corvaja and Zannier proved [12] that an − 1 and bn − 1 cannot have a large common divisor. This was extended by Corvaja and Zannier [23, 28]. (16)

See footnote 4 on page 11.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

33

Corvaja, Rudnick and Zannier [18] showed that (with obvious exceptions) the multiplicative order of an integral matrix mod N grows quicker than log N as N → ∞. This result is essentially the best possible. And there are numerous contributions that I failed to mention, because of lack of space or time or because of my ignorance. Acknowledgments. — Mayeul Bacquelin explained me the work of Adamczewski and Bugeaud. Umberto Zannier was very helpful and patient when clarifying me various aspects of his work with Corvaja. I also had useful correspondence and/or discussions with Pascal Autissier, Boris Adamczewski, Yann Bugeaud, Ivan Cheltsov, Pietro Corvaja, Aaron Levin and Hans Peter Schlickewei. Many colleagues, including Boris Adamczewski, Yann Bugeaud, Ivan Cheltsov, Pietro Corvaja, Marina Prokhorova and Umberto Zannier, read the manuscript and detected a number of inaccuracies. I am happy to thank them all. In preparation of this text, I benefited a lot from Zannier’s excellent notes [74], and I strongly recommend them to anybody wishing to learn more on the Diophantine aspect of the Subspace Theorem. My deepest gratitude goes to Elina Wojciechowska, for her constant encouragement during my work on this article. This work profited a lot from the discussions I had with Italian colleagues during my several stays at the Centro di Ricerca Matematica Ennio De Giorgi at Pisa. I thank this institution for the financial support and excellent working conditions.

REFERENCES [1] B. Adamczewski & Y. Bugeaud – “On the complexity of algebraic numbers. II. Continued fractions”, Acta Math. 195 (2005), p. 1–20. [2]

, “On the complexity of algebraic numbers. I. Expansions in integer bases”, Ann. of Math. 165 (2007), p. 547–565.

[3]

, “On the Maillet-Baker continued fractions”, J. reine angew. Math. 606 (2007), p. 105–121.

[4] B. Adamczewski, Y. Bugeaud & F. Luca – “Sur la complexité des nombres algébriques”, C. R. Math. Acad. Sci. Paris 339 (2004), p. 11–14. [5] J.-P. Allouche & J. Shallit – Automatic sequences. Theory, applications, generalizations, Cambridge Univ. Press, 2003. [6] F. Amoroso & U. Zannier (eds.) – Diophantine approximation, Lectures from the C.I.M.E. Summer School held in Cetraro, June 28–July 6, 2000. Lecture Notes in Mathematics 1819, Springer, 2003.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

34

Y. F. BILU

[7] P. Autissier – “Géométrie des surfaces algébriques et points entiers”, arXiv:math.NT/0606184. [8] Y. Bilu – “A note on universal Hilbert sets”, J. reine angew. Math. 479 (1996), p. 195–203. [9] E. Bombieri & W. Gubler – Heights in Diophantine geometry, New Mathematical Monographs, vol. 4, Cambridge Univ. Press, 2006. [10] É. Borel – “Les probabilités dénombrables et leurs applications arithmétiques”, Palermo Rend. 27 (1909), p. 247–271. √ [11] , “Sur les chiffres décimaux de 2 et divers problèmes de probabilités en chaîne”, C. R. Acad. Sci. Paris 230 (1950), p. 591–593. [12] Y. Bugeaud, P. Corvaja & U. Zannier – “An upper bound for the G.C.D. of an − 1 and bn − 1”, Math. Z. 243 (2003), p. 79–84. [13] Y. Bugeaud & F. Luca – “A quantitative lower bound for the greatest prime factor of (ab + 1)(bc + 1)(ca + 1)”, Acta Arith. 114 (2004), p. 275–294. √ [14] , “On the period of the continued fraction expansion of 22n+1 + 1”, Indag. Math. (N.S.) 16 (2005), p. 21–35. [15] P. Bundschuh & A. Pethő – “Zur Transzendenz gewisser Reihen”, Monatsh. Math. 104 (1987), p. 199–223. [16] A. Cobham – “On the Hartmanis-Stearns problem for a class of tag machines”, in IEEE Conference Record of 1968 Ninth Annual Symposium on Switching and Automata Theory, Schenectady, 1968, p. 51–60. [17] , “Uniform tag sequences”, Math. Systems Theory 6 (1972), p. 164–192. [18] P. Corvaja, Z. Rudnick & U. Zannier – “A lower bound for periods of matrices”, Comm. Math. Phys. 252 (2004), p. 535–541. [19] P. Corvaja & U. Zannier – “Diophantine equations with power sums and universal Hilbert sets”, Indag. Math. (N.S.) 9 (1998), p. 317–332. [20] , “Finiteness of integral values for the ratio of two linear recurrences”, Invent. Math. 149 (2002), p. 431–451. [21] , “Some new applications of the subspace theorem”, Compositio Math. 131 (2002), p. 319–340. , “A subspace theorem approach to integral points on curves”, C. R. Math. [22] Acad. Sci. Paris 334 (2002), p. 267–271. , “On the greatest prime factor of (ab + 1)(ac + 1)”, Proc. Amer. Math. [23] Soc. 131 (2003), p. 1705–1709. [24] , “On the number of integral points on algebraic curves”, J. reine angew. Math. 565 (2003), p. 27–42. [25] , “On a general Thue’s equation”, Amer. J. Math. 126 (2004), p. 1033– 1055.

ASTÉRISQUE 317

(967)

[26] [27]

[28] [29] [30] [31] [32] [33]

[34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44]

THE MANY FACES OF THE SUBSPACE THEOREM

35

, “On integral points on surfaces”, Ann. of Math. 160 (2004), p. 705–726. , “On the rational approximations to the powers of an algebraic number: solution of two problems of Mahler and Mendès France”, Acta Math. 193 (2004), p. 175–191. , “A lower bound for the height of a rational function at S-unit points”, Monatsh. Math. 144 (2005), p. 203–224. , “On the length of the continued fraction for values of quotients of power sums”, J. Théor. Nombres Bordeaux 17 (2005), p. 737–748. , “S-unit points on analytic hypersurfaces”, Ann. Sci. École Norm. Sup. 38 (2005), p. 76–92. , “On the integral points on certain surfaces”, Int. Math. Res. Not. 2006 (2006), Art. ID 98623. P. Dèbes & U. Zannier – “Universal Hilbert subsets”, Math. Proc. Cambridge Philos. Soc. 124 (1998), p. 127–134. J.-H. Evertse & H. P. Schlickewei – “The absolute subspace theorem and linear equations with unknowns from a multiplicative group”, in Number theory in progress, Vol. 1 (Zakopane-Kościelisko, 1997), de Gruyter, 1999, p. 121–142. , “A quantitative version of the absolute subspace theorem”, J. reine angew. Math. 548 (2002), p. 21–127. G. Faltings – “Diophantine approximation on abelian varieties”, Ann. of Math. 133 (1991), p. 549–576. S. Ferenczi & C. Mauduit – “Transcendence of numbers with a low complexity expansion”, J. Number Theory 67 (1997), p. 146–161. P. C. Gilmore & A. Robinson – “Metamathematical considerations on the relative irreducibility of polynomials”, Canad. J. Math. 7 (1955), p. 483–489. K. Győry, A. Sárközy & C. L. Stewart – “On the number of prime factors of integers of the form ab + 1”, Acta Arith. 74 (1996), p. 365–385. S. Hernández & F. Luca – “On the largest prime factor of (ab+1)(ac+1)(bc+ 1)”, Bol. Soc. Mat. Mexicana 9 (2003), p. 235–244. M. Hindry & J. H. Silverman – Diophantine geometry, an introduction, Graduate Texts in Math., vol. 201, Springer, 2000. S. Lang – Fundamentals of Diophantine geometry, Springer, 1983. M. Laurent – “Équations diophantiennes exponentielles”, Invent. Math. 78 (1984), p. 299–327. A. Levin – “Generalizations of Siegel’s and Picard’s theorems”, arXiv:math.NT/0503699, to appear. J. H. Loxton & A. J. v. d. Poorten – “Arithmetic properties of the solutions of a class of functional equations”, J. reine angew. Math. 330 (1982), p. 159–172.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

36

[45]

Y. F. BILU

, “Arithmetic properties of automata: regular sequences”, J. reine angew. Math. 392 (1988), p. 57–69.

[46] K. Mahler – “On the fractional parts of the powers of a rational number. II”, Mathematika 4 (1957), p. 122–124. [47] M. Mendès France – “Remarks and problems on finite and periodic continued fractions”, Enseign. Math. 39 (1993), p. 249–257. [48] M. Mignotte – “An application of W. Schmidt’s theorem: transcendental numbers and golden number”, Fibonacci Quart. 15 (1977), p. 15–16. [49] J. Noguchi & J. Winkelmann – “Holomorphic curves and integral points off divisors”, Math. Z. 239 (2002), p. 593–610. [50] D. Ridout – “The p-adic generalization of the Thue-Siegel-Roth theorem”, Mathematika 5 (1958), p. 40–48. [51] K. F. Roth – “Rational approximations to algebraic numbers”, Mathematika 2 (1955), p. 1–20; corrigendum, 168. [52] H. P. Schlickewei – “Die p-adische Verallgemeinerung des Satzes von ThueSiegel-Roth-Schmidt”, J. reine angew. Math. 288 (1976), p. 86–105. [53]

, “On products of special linear forms with algebraic coefficients”, Acta Arith. 31 (1976), p. 389–398.

[54]

, “The p-adic Thue-Siegel-Roth-Schmidt theorem”, Arch. Math. (Basel) 29 (1977), p. 267–270.

[55]

, “Multiplicities of recurrence sequences”, Acta Math. 176 (1996), p. 171– 243.

[56]

, “Approximation of algebraic numbers”, in Diophantine approximation (Cetraro, 2000), Lecture Notes in Math., vol. 1819, Springer, 2003, p. 107–170.

[57]

, “The subspace theorem and applications”, in Proceedings of the International Congress of Mathematicians, Vol. II (Berlin, 1998), vol. Extra Vol. II, Doc. Math., 1998, Extra Vol. II, p. 197–205 (electronic).

[58] W. M. Schmidt – “Norm form equations”, Ann. of Math. 96 (1972), p. 526–551. [59]

, Diophantine approximation, Lecture Notes in Math., vol. 785, Springer, 1980.

[60]

, Diophantine approximations and Diophantine equations, Lecture Notes in Math., vol. 1467, Springer, 1991.

[61] A. Scremin – “On the period of the continued fraction for values of the square root of power sums”, Acta Arith. 123 (2006), p. 297–312. [62] C. L. Siegel – “Über einige Anwendungen Diophantischer Approximationen”, Abh. Preuss Akad. Wiss. Phys.-Math. Kl. 1 (1929), p. 209–266.

ASTÉRISQUE 317

(967)

THE MANY FACES OF THE SUBSPACE THEOREM

37

[63] V. G. Sprindzhuk – “Diophantine equations with prime unknowns (Russian)”, Trudy Mat. Inst. Steklov. 158 (1981), p. 180–196; English translation: Proc. Steklov Inst. Math. 1983, 4, p. 197–214. [64] A. Thue – “Über Annäherungswerte algebraischer Zahlen”, J. reine angew. Math. 135 (1909), p. 284–305. [65] G. Troi & U. Zannier – “Note on the density constant in the distribution of self-numbers. II”, Boll. Unione Mat. Ital. Sez. B Artic. Ric. Mat. 2 (1999), p. 397–399. [66] P. Vojta – Diophantine approximations and value distribution theory, Lecture Notes in Math., vol. 1239, Springer, 1987. [67] , “A refinement of Schmidt’s subspace theorem”, Amer. J. Math. 111 (1989), p. 489–518. [68] , “Integral points on subvarieties of semiabelian varieties. I”, Invent. Math. 126 (1996), p. 133–181. , “Integral points on subvarieties of semiabelian varieties. II”, Amer. J. [69] Math. 121 (1999), p. 283–313. [70] M. Waldschmidt – “Diophantine analysis and words”, in Diophantine analysis and related fields 2006 (in honor of Prof. Iekata Shiokawa), Sem. Math. Sci., vol. 35, Keio Univ., 2006, p. 203–221. [71] M. Yasumoto – “Hilbert irreducibility sequences and nonstandard arithmetic”, J. Number Theory 26 (1987), p. 274–285. [72] U. Zannier – “Note on dense universal Hilbert sets”, C. R. Acad. Sci. Paris Sér. I Math. 322 (1996), p. 703–706. [73] , “A proof of Pisot’s d-th root conjecture”, Ann. of Math. 151 (2000), p. 375–383. [74] , “Some applications of diophantine approximation to diophantine equations (with special emphasis on the Schmidt subspace theorem)”, Forum, Udine, 2003.

Yuri F. BILU Université Bordeaux I UFR de Mathématiques et Informatique A2X : Laboratoire de Théorie des Nombres et d’Algorithmique Arithmétique (UMR 5465 du CNRS) 351 cours de la Libération F-33405 Talence Cedex E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (968) Compter (rapidement) le nombre de solutions d’équations dans les corps finis Antoine CHAMBERT-LOIR

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006–2007, no 968, p. 39 à 89

Novembre 2006

COMPTER (RAPIDEMENT) LE NOMBRE DE SOLUTIONS D’ÉQUATIONS DANS LES CORPS FINIS par Antoine CHAMBERT-LOIR

— Votre Sérénité, pouvez-vous me dire, c’est très important, concentrez-vous, pouvez-vous me dire quel est le numéro du compte en banque de monsieur ? — Oui. — Vous pouvez le dire ? — Oui !! — Vous pouvez le dire ? — Oui !!! — Il peut le dire !!! Bravo ! Il est extraordinaire, il est vraiment sensationnel. (Pierre Dac et Francis Blanche, Sar Rabindranath Duval )

INTRODUCTION Soit F un corps fini et soit f1 , . . . , fm des polynômes à coefficients dans F en n indéterminées x1 , . . . , xn . Le but de cet exposé est de décrire des algorithmes permettant de calculer efficacement le nombre de solutions dans Fn du système d’équations f1 = · · · = fm = 0. Pour tout entier k > 1, notons Nk le nombre de solutions de ce système dont les coordonnées appartiennent au corps F(k) , unique extension de F de degré k contenue dans une clôture algébrique fixée de F ; si X est le sous-schéma de l’espace affine défini par l’annulation des fi , on a donc Nk = |X(F(k) )|. La fonction zêta Z(X, t) du schéma X est alors donnée par la formule ! ∞ X tk (0.1) Z(X, t) = exp Nk k k=1

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

40

A. CHAMBERT-LOIR

et, ainsi que l’a démontré Dwork [41], c’est une fraction rationnelle. Par conséquent, la suite (Nk ) est déterminée par un nombre fini de ses termes. Nous verrons aussi que ces algorithmes permettent de calculer la fonction zêta Z(X, t). Tous les algorithmes décrits ci-dessous reposent sur un premier principe : il suffit, pour calculer |X(F)|, de calculer une congruence |X(F)| ≡ c (mod N ), où N est un entier strictement supérieur à |X(F)|, par exemple N > |F|n . Plus généralement, il suffit que l’on connaisse un encadrement de |X(F)| de largeur inférieure à N ; c’est là qu’interviendra l’analogue de l’hypothèse de Riemann sur les corps finis, que Deligne [34] a démontrée, généralisant ainsi des résultats de Hasse (courbes elliptiques) et Weil (courbes, variétés abéliennes,...). Fixons-nous un tel encadrement C 6 |X(F)| < C + R. Là où ces algorithmes diffèrent, c’est sur la façon de choisir un tel entier N puis de calculer c. Les premiers algorithmes, que nous qualifierons de `-adiques, font l’objet du chapitre 2 de ce rapport. Ils ont pour archétype l’algorithme découvert en 1985 par R. Schoof [106] pour calculer le nombre de points d’une courbe elliptique sur un corps fini. Ces algorithmes choisissent un ensemble fini {`1 , . . . , `s } de « petits » nombres premiers dont le produit L = `1 . . . `s vérifie L > R et calculent, pour tout i, un élément ci ∈ {0, . . . , `i − 1} tel que |X(F)| ≡ ci (mod `i ). Le théorème chinois permet d’en déduire un entier c ∈ {0, . . . , L − 1} tel que |X(F)| ≡ c (mod L). L’origine de la terminologie « `-adique » vient de ce qu’on peut interpréter la congruence modulo `i par le calcul de la cohomologie étale modulo `i . Hors du degré 1 ou de ce qui en provient, la cohomologie étale semble peu accessible au calcul formel ; même dans ce cas, son calcul effectif amène rapidement à la considération de polynômes de très grand degré. Le champ d’application des algorithmes `-adiques est ainsi limité aux courbes de petit genre, aux variétés abéliennes de petite dimension. Néanmoins, ces algorithmes sont polynomiaux en le logarithme du cardinal de F : aussi bien le temps de calcul que l’espace requis par le calcul sont majorés par une puissance de log|F|. Nous présenterons au chapitre 3 les algorithmes p-adiques, où l’entier p désigne la caractéristique du corps F. Ils procèdent en effet en choisissant pour N une puissance de p et en calculant (plus ou moins) la cohomologie p-adique de X modulo N . Par cohomologie p-adique, j’entends ici la cohomologie de Monsky-Washnitzer et ses avatars (rigide, cristalline), qui sont des analogues de la cohomologie de De Rham. Définie comme cohomologie d’un complexe explicite, la cohomologie p-adique se prête naturellement bien au calcul effectif et l’on peut espérer appliquer ces méthodes dans des situations géométriques très générales. Malgré tout, il semble que seules les courbes et les surfaces aient fait l’objet d’implémentations poussées.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

41

Toutefois, parce qu’ils demandent de manipuler des polynômes de degrés au moins p, la dépendance en log p de leur complexité n’est pas polynomiale. Ils n’en restent pas moins des algorithmes de choix lorsque p est petit, notamment dans les applications cryptographiques où l’on a souvent p = 2. Au fur et à mesure du développement de ces algorithmes, ils ont été programmés et leurs performances éprouvées à l’aune des records qu’ils permirent d’obtenir, c’està-dire le calcul de |X(F)| pour des corps F de cardinal le plus grand possible. Lorsque X est une courbe elliptique, on a pu atteindre un cardinal q de plus de 2 000 chiffres (en base 10) par l’algorithme de Schoof, et d’environ 40 000 chiffres (mais en caractéristique p = 2) par l’algorithme 2-adique de Mestre. Ces calculs ont pris plusieurs mois. La diminution de l’espace mémoire nécessité par ces algorithmes a aussi fait l’objet de travaux importants. Parallèlement, ils ont trouvé un champ d’application dans la cryptographie à clef publique et se sont retrouvés au cœur de logiciels commerciaux. Comme nous le verrons plus bas, les corps F qu’il faut alors manipuler sont de taille bien plus modeste, disons une cinquantaine de chiffres décimaux. Le premier chapitre de ce texte est consacré à quelques applications de ce problème algorithmique et de ses diverses solutions efficaces. J’exposerai ensuite les grandes lignes de la plupart des algorithmes `-adiques, puis p-adiques, actuellement utilisés. Il s’avère en fait qu’une bonne partie de la théorie générale et abstraite développée au xxe siècle dans l’étude des conjectures de Weil donne naturellement lieu à des algorithmes efficaces. Cependant, cette constatation n’est pas allée de soi et le crédit en revient bien aux mathématiciens tels que Schoof, Elkies, Atkin (pour la partie `-adique), Satoh, Mestre, Kedlaya, Lauder (pour la partie p-adique) dont les noms émailleront ce texte. À moins d’achever cet exposé juste après le chapitre consacré aux applications, il m’a ainsi fallu dépasser le lapidaire et spontané « On peut le faire ! » sans pour autant plonger le lecteur dans la complexité phénoménale des idées supplémentaires qui ont été nécessaires à l’obtention des records évoqués plus haut. Le compromis que j’ai essayé d’adopter dans ce texte, un peu différent des nombreux survols du sujet disponibles dans la littérature, est celui d’un mathématicien pur subitement intéressé par ce problème de mathématiques appliquées. Lorsque je décris la complexité d’algorithmes en temps ou en espace, j’emploie les notations O(·) et ‹ O(·). La première signifie que le nombre d’opérations élémentaires, resp. l’espace disque, requis par l’algorithme est majoré par un multiple de son argument, lorsque celui-ci tend vers l’infini. La seconde est analogue, à une puissance du logarithme de l’argument près ; en pratique, il suffit de retenir que ‹ O(x) est majoré 1+ε par O(x ) pour tout ε > 0. Toutefois, même si je n’en parlerai jamais, il ne faut pas perdre de vue que le contrôle de la constante que cachent ces notations est d’une

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

42

A. CHAMBERT-LOIR

importance pratique capitale ; il est bien différent de pouvoir obtenir un résultat en une minute plutôt qu’en mille. Je tiens à remercier Jean-Benoît Bost, Bas Edixhoven, Reynald Lercier, Bernard Le Stum, David Lubicz et Jean-François Mestre de l’aide qu’ils m’ont apportée au cours de la préparation de cet exposé. Je remercie aussi Robert Carls, David Kohel, Alan Lauder, René Schoof, Jean-Pierre Serre et Frederik Vercauteren pour leurs commentaires sur la première version de ce texte.

1. APPLICATIONS 1.1. Critères de primalité Être en mesure de décider si un entier naturel est ou pas un nombre premier est une question arithmétique fondamentale dont les techniques modernes de cryptographie ont d’ailleurs accru l’importance. En 1986, S. Goldwasser et J. Kilian ont proposé (voir [57]) le premier algorithme permettant de décider si un entier N est un nombre premier dont la complexité soit polynomiale en log N . Cet algorithme requiert de calculer le cardinal de courbes elliptiques E sur l’anneau Z/N Z « choisies au hasard ». Pour cela, on peut tenter d’appliquer l’algorithme de Schoof, en faisant comme si N était premier. Si l’algorithme échoue, cela prouve que N n’est pas premier. Supposons qu’il fournisse un cardinal putatif c. On peut tester si un point au hasard P sur la courbe E est annulé par c ; si ce n’est pas le cas, N n’est pas premier. Inversement, supposons que √ l’ordre d de P possède un facteur premier p tel que p > (1 + N )2 et tel que le point [d/p]P ne rencontre pas l’origine O de la courbe E (au sens où ce point [d/P ]P ait des coordonnées homogènes (x : y : z) dans (Z/N Z), z étant premier à N ) ; alors N est premier. (Sinon, désignant par ` le plus petit facteur premier de N , l’image de P dans E(Z/`Z) serait d’ordre multiple de p, et cela contredirait la borne de Hasse pour le cardinal d’une courbe elliptique sur un corps fini.) L’algorithme de Goldwasser et Kilian tente alors d’exhiber de telles familles (E, P, d, p) où |E(Z/N Z)| = 2p, la primalité de p étant établie récursivement par la même méthode. Comme l’algorithme de Schoof est de complexité polynomiale en log N , il en est de même de celle de l’algorithme de Goldwasser et Kilian. Toutefois, le fait que cet algorithme parvienne à conclure pour tout N dépend d’une conjecture apparemment hors de portée sur la répartition des nombres premiers dans de petits intervalles. Adleman et Huang [2] ont eu l’idée d’utiliser des courbes de genre 2. Cela fournit plus de latitude et leur permet d’affirmer l’existence d’un algorithme probabiliste de complexité polynomiale en log N permettant de décider si l’entier N est premier.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

43

Cependant, l’algorithme de Schoof, même avec les améliorations d’Atkin et Elkies (qui font l’objet du paragraphe 2.2.5 ci-dessous) n’est pas suffisamment efficace pour permettre d’envisager de tester ainsi la primalité d’entiers ayant plus de quelques centaines de chiffres décimaux. Si l’algorithme fastecpp (fast elliptic curve primality proving) a permis de prouver la primalité de nombres ayant plus de vingt mille chiffres décimaux (Morain, mi-2006), c’est en utilisant l’idée d’Atkin d’employer, plutôt que des courbes aléatoires, des courbes elliptiques à multiplication complexe (de discriminants relativement petits, au plus 106 ) dont l’algorithme de Cornacchia [96] bien que probabiliste, permet de calculer rapidement le cardinal. Pour plus de détails, je renvoie à l’exposé de F. Morain [92] à ce Séminaire, au chapitre 9 du livre [27] d’H. Cohen, ainsi qu’au chapitre 25 du manuel [28]. 1.2. Calcul d’une racine carrée modulo p Soit p un nombre Ç å premier impair et soit a un élément de Fp . Le calcul du symbole a de Legendre = a(p−1)/2 est un moyen simple pour décider si a est un carré, à p condition bien sûr de calculer la puissance par des élévations au carré successives. Ce que ce critère ne dit pas, c’est comment trouver une racine carrée, c’est-à-dire un élément b ∈ Fp tel que b2 = a. Lorsque p ≡ 3 (mod 4), on peut poser b = a(p+1)/4 . Le cas crucial est donc celui où p ≡ 1 (mod 4), Les algorithmes de factorisation de polynômes dans Fp , tel celui de Berlekamp, fournissent une solution efficace. Rappelons-en le principe dans ce cas particulier : si x est un élément de Fp , distinct de ±b, les deux racines x+b et x−b du polynôme (X − x)2 − a seront simultanément carrées ou non carrées si et seulement si (x + b)/(x − b) est un carré dans Fp . Si ce n’est pas le cas, c’est-à-dire une fois sur deux si x est choisi au hasard, le pgcd des polynômes X 2 −a et (X +x)(p−1)/2 −1 sera l’un des polynômes X ± b. Le calcul d’un tel pgcd requiert un nombre d’opérations élémentaires au plus égal à une puissance de log p : il suffit en effet de calculer (X + x)(p−1)/2 − 1 dans la Fp -algèbre Fp [X]/(X 2 − a). Comme les autres algorithmes de factorisation dans les corps finis de complexité équivalente, il s’agit toutefois d’un algorithme probabiliste c’est-à-dire que l’on a seulement une très forte probabilité que l’algorithme se termine en un temps donné. Précisément, la probabilité que l’algorithme se termine en N étapes est 1 − 2−N , mais rien n’interdit de n’avoir pas de chance. Connaissant un générateur du sous-groupe 2-primaire de F∗p , l’algorithme de Shanks présenté dans [108] permet alors de calculer des racines carrées dans Fp en temps ‹ O(log p). D’après [6], si l’hypothèse de Riemann généralisée aux fonctions L de Dirichlet est vérifiée, le plus petit entier positif x qui n’est pas un carré modulo p

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

44

A. CHAMBERT-LOIR

vérifie x < 2(log p)2 . Écrivons p − 1 sous la forme 2k q avec k > 0 et q impair ; on voit que ξ = x(p−1)/q mod p est un générateur du sous-groupe 2-primaire de F∗p . Modulo GRH, on a ainsi un algorithme pour calculer des racines carrées dans F∗p dont la complexité est polynomiale en log p. Hélas, on ne sait pas en général construire un tel générateur ξ de manière déterministe en temps polynomial en log p sans faire appel à l’hypothèse de Riemann. Comme l’a montré Schoof, une conséquence de son algorithme de calcul du cardinal d’une courbe elliptique sur Fp est un algorithme déterministe (dépendant de a) de complexité polynomiale en log p pour calculer une racine carrée de a modulo p. Supposons en effet que a ≡ −D (mod p), où −D est le discriminant d’un ordre O d’un corps quadratique imaginaire K. Par la théorie de la multiplication complexe, Schoof construit une courbe elliptique E sur une extension finie F de Fp dont l’anneau des endomorphismes est O. C’est la partie de l’algorithme la plus coûteuse √ car [F : Fp ] est de l’ordre de −D ; la complexité de son algorithme dépend donc de l’entier a. Soit q le cardinal de F. Dans le corps K, l’endomorphisme de Frobenius est √ de la forme x + y D, avec x, y ∈ 12 Z ; on a 2x = tE = q + 1 − |E(F)| et x2 + Dy 2 = q. Une fois calculé |E(F)| par la méthode de Schoof (et non par celle de Cornacchia, probabiliste), on connaît ainsi x et |y|. Comme D est un carré modulo p, la courbe elliptique E est ordinaire et tE n’est pas multiple de p ; par suite x et y ne sont pas multiples de p et la réduction modulo p de (2x)/(2y) est une racine carrée de a. Comme le remarque Schoof à la fin de [106], on peut combiner ceci avec l’algorithme de Shanks lorsqu’on suppose, par exemple, p 6≡ 1 (mod 16). En effet, si ξ est un générateur de la composante 2-primaire de F∗p , c’est une racine de l’unité dont l’ordre divise 8, donc ξ s’exprime en termes de racines carrées de −1 et 2 dans Fp . On peut ainsi calculer ξ en temps polynomial en log p par l’algorithme de Schoof utilisant les courbes elliptiques. De manière analogue, Pila a montré dans [98] comment son algorithme de calcul de la fonction zêta d’une courbe de genre supérieur, appliqué à la courbe de Fermat d’équation x` + y ` + z ` = 0 où ` est un nombre premier fixé, permet de calculer en temps polynomial en log p les racines primitives `-ièmes de l’unité dans le corps fini Fp , pourvu bien sûr que p ≡ 1 (mod `). 1.3. Cryptographie En 1975, Diffie et Hellman ont proposé [40] une solution élégante permettant à deux individus d’échanger une information secrète bien que le canal de communication puisse être espionné par une oreille indiscrète. Son principe est le suivant. Les deux protagonistes, Antoine et Bernadette, conviennent d’un groupe G (noté multiplicativement) et d’un élément g de ce groupe. Antoine choisit un entier a, calcule g a et le transmet à Bernadette ; celle-ci

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

45

choisit un entier b, calcule g b et le transmet à Antoine. Le secret commun est l’élément g ab du groupe G, que nos deux héros sont en mesure de calculer puisque g ab = (g a )b = (g b )a ; ils peuvent par exemple l’utiliser comme paramètre d’un système de codage symétrique. Il est nécessaire d’indiquer que ce protocole ne résiste pas à une attaque active : supposons que Charles s’immisce dans la conversation et parvienne à se faire passer pour Antoine à Bernadette et à Bernadette pour Antoine. Il peut alors choisir 0 0 des entiers a0 , b0 , transmettre g a à Bernadette et g b à Antoine. Ce dernier utilise 0 0 donc g ab pour coder ou décoder un message, tandis que Bernadette utilise g a b . Puis0 0 0 0 qu’il connaît g ab = (g a )b et g a b = (g b )a , Charles peut intercepter un message d’Antoine, le décoder et le recoder à l’intention de Bernadette, ou inversement, sans qu’aucun des deux n’ait pu se douter de quoi que ce soit. Même s’il n’a pu intervenir physiquement dans la conversation, Charles a connaissance de G, g ainsi que des deux éléments g a et g b . Pour qu’il puisse en déduire g ab , il suffirait qu’il soit en mesure de calculer a (ou b). Le problème, étant donné deux éléments g et h d’un groupe G, de déterminer un entier a tel que h = g a est appelé problème du logarithme discret. Pour que le protocole de Diffie–Hellman résiste à une attaque passive, il est manifestement nécessaire que le problème du logarithme discret dans le groupe G soit difficile à résoudre en pratique ; voir [85, 95] pour l’étude de la réciproque, conjecturalement vraie — il suffirait de savoir construire, pour tout facteur premier p de |G|, une courbe elliptique sur Fp , dont le nombre de points est « lisse », c’est-à-dire que ses facteurs premiers sont petits. Les groupes cycliques Z/nZ ne conviennent évidemment pas, car l’algorithme d’Euclide permet très facilement, g étant un générateur fixé de ce groupe, de calculer a (mod n) connaissant ga (mod n). Diffie et Hellman ont proposé d’utiliser les groupes multiplicatifs de corps finis. En 1985, Koblitz et Miller ont montré que les groupes formés des points d’une courbe elliptique sur un corps fini sont de bons candidats ; plus généralement, on peut imaginer utiliser les groupes Pic0 C des diviseurs de degré 0 sur une courbe C définie sur un corps fini F. Il s’agit toutefois de trouver un bon compromis entre la commodité du calcul et la difficulté du problème du logarithme discret dans le groupe G. √ Si G est d’ordre n, il y a de nombreux algorithmes en ‹ O( n) pour résoudre ce problème du logarithme discret ; citons celui des kangourous (Pollard [101]) qui repose sur le paradoxe des anniversaires : tirons au hasard, avec remise, des éléments d’un ensemble fini de cardinal n ; le nombre moyen de tirages avant qu’on obtienne p un élément déjà tiré est πn/2. Lorsque l’on connaît une factorisation de n, on peut tenter de résoudre le logarithme discret dans chacun des quotients d’ordre premier de G, puis utiliser le théorème

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

46

A. CHAMBERT-LOIR

√ chinois, d’où un algorithme de complexité ‹ O( t) si t est le plus grand facteur premier de n (algorithme de Pohlig-Hellman, [100]). Dans un groupe « générique », c’est-à-dire dont on ne sait rien et dont un oracle calcule le produit de deux éléments, l’inverse d’un élément et teste l’égalité de deux éléments, V. Shoup [110] a montré qu’un algorithme requiert un nombre de recours √ à l’oracle au moins proportionnel à n. Compte tenu de ces attaques et de la puissance des moyens de calcul actuels, l’entier n doit donc être au moins égal à 2160 , de même que son plus grand facteur premier. D’où en particulier la nécessité de connaître l’ordre du groupe G, donc de savoir calculer le cardinal d’une courbe elliptique ou, plus généralement, de la jacobienne d’une courbe définie sur un corps fini. Pour les groupes G = F∗q , G = Pic0 (C), mentionnés plus haut, il y a de nombreuses tentatives pour calculer le logarithme discret. Les techniques d’indice fournissent par exemple des algorithmes sous-exponentiels pour les groupes multiplicatifs de corps finis ; pour les groupes de classes de diviseurs de courbes hyperelliptiques, ils sont plus efficaces que les algorithmes génériques lorsque le genre est > 4. La non-dégénérescence de l’accouplement de Tate–Lichtenbaum Pic0 (C)[n] × Pic0 (CFqk )/n → F∗qk /(F∗qk )n permet une réduction du problème au cas du groupe multiplicatif d’une extension finie de Fq : si q k ≡ 1 (mod n), cet accouplement (composé avec l’élévation à la puissance (q k − 1)/n) fournit une injection de G dans F∗qk . Comme cet accouplement se calcule aisément [51], il convient donc de choisir des courbes C telles que l’ordre multiplicatif de q modulo n ne soit pas trop petit, en pratique 6 20. En particulier, cela proscrit les courbes elliptiques supersingulières. De même, il faut éviter que l’ordre n de Pic0 (C) ne soit multiple de la caractéristique du corps F. Je renvoie aux ouvrages [12, 13, 28] pour une description détaillée des diverses attaques possibles, des choix raisonnables d’un corps fini, d’une courbe C et d’un élément de Pic0 (C), et de la façon dont tout ceci peut être implanté dans une carte à puce. En outre, les articles [73, 52] m’ont été très utiles pour écrire ce paragraphe. Signalons enfin que les protocoles cryptographiques reposant sur la difficulté de résoudre le logarithme discret dans une courbe elliptique ont fait l’objet d’une spécification par divers organismes de normalisation (ANSI, ISO, etc.) et sont au cœur de nombreux systèmes cryptographiques commercialisés.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

47

2. L’APPROCHE `-ADIQUE Soit F un corps fini à q éléments et soit E une courbe elliptique sur F, donnée par une équation plane (inhomogène) de la forme (2.1)

y 2 + a1 xy + a3 y = x3 + a2 x2 + a4 x + a6 ,

où les coefficients a1 , a2 , a3 , a4 , a6 sont des éléments de F. Lorsque p > 3, on peut se ramener à une équation de la forme de Weierstrass : (2.2)

y 2 = x3 + ax + b,

où a et b sont des éléments de F. Pour tout corps k contenant F, notons E(k) les k-points de E, c’est-à-dire l’ensemble des solutions de l’équation (2.1) auquel l’on adjoint le point à l’infini O de P2 (k) de coordonnées homogènes (0 : 1 : 0). On sait que E possède une unique structure de groupe algébrique, commutatif, dont l’élément neutre est le point O. Elle se déduit de la construction par sécantes et tangentes : pour tout corps k contenant F, trois points P1 , P2 et P3 de E(k) sont alignés si et seulement l’on a P1 + P2 + P3 = O dans le groupe E(k). Nous voulons calculer le cardinal du groupe abélien E(F). 2.1. Premières approches 2.1.1. Symboles de Legendre. — Lorsque E est de la forme (2.2), on a  2 si x3 + ax + b ∈ (F∗ )2 Ç å  X x3 + ax + b X 3 =q+1+ , |E(F)| = 1 + 1 si x + ax + b = 0  q x∈F x∈F  0 sinon Ç å t où est le symbole de Legendre dans F, qui vaut 1 si t est un carré non nul p dans F, 0 si t = 0 et −1 sinon. La complexité de cette méthode est ‹ O(q). Elle n’est ainsi utilisable que si q est petit : un programme élémentaire requiert déjà 10 s pour déterminer que lorsque q = 1 048 609, et E a pour équation y 2 = x3 − 1, |E(F)| = 1 049 412. 2.1.2. Frobenius. — L’élévation des coordonnées à la puissance q définit un morphisme πE : E → E de groupes algébriques, appelé endomorphisme de Frobenius. Dans l’anneau End(E) des endomorphismes de E, πE vérifie une relation polynomiale : (2.3)

2 πE − tE πE + q = 0,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

48

A. CHAMBERT-LOIR

√ où tE est un entier relatif tel que |tE | 6 2 q. En outre (Hasse, [63, 64]), cet entier tE est relié au cardinal de E(F) par la formule (2.4)

|E(F)| = q + 1 − tE .

Rappelons enfin que tE est la trace de πE dans End(E) ; on a en effet l’égalité : (2.5)

∨ tE idE = πE + πE ,

∨ ∨ ∨ où πE est l’isogénie duale πE , définie par πE ◦ πE = q idE , traduisant le fait que la norme de πE dans End(E) est égale à q.

2.1.3. Pas de bébés, pas de géants. — Pour calculer l’ordre d d’un élément g d’un groupe abélien fini G, la méthode la plus évidente consiste à calculer g, 2g, etc. jusqu’à dg, égal à l’élément neutre. Cela requiert d opérations dans le groupe G. Voici comment D. Shanks [108] propose de procéder si l’on connaît un encadre√ ment D 6 d < D + C de d, où D et C sont des nombres entiers. Soit t = d Ce le plus √ petit entier supérieur ou égal à C. Il existe des entiers i et j vérifiant 0 6 i, j < t tels que d − D = it + j, d’où l’égalité (d − D − j)g = itg dans G. Il suffit alors de calculer d’une part les t multiples gi = itg, pour 0 6 i < t, de tg, d’autre part les t multiples bj = (d − D)g − jg, et de déterminer un élément de la première liste qui appartient à la seconde : si gi = bj , on a d = D + it + j. Le nom de la méthode, baby steps—giant steps, vient de ce que les éléments bj sont dans une progression de « pas de bébé » g, tandis que les éléments gi sont dans une progression de « pas de géant » tg, t étant approximativement égal à la racine carrée de C, supposé grand. Il en résulte un algorithme pour déterminer l’ordre d’un élément d’un groupe G, √ requérant O( C) opérations dans G et le stockage d’autant d’éléments de G lorsque l’on sait que cet ordre appartient à un intervalle de longueur C. Appliqué au groupe E(F), on peut ainsi trouver l’ordre d’un élément donné en un √ temps proportionnel à un multiple de q (multiplié par un facteur logarithmique en q, correspondant à la complexité du calcul dans un corps de cardinal q). Cela ne fournit cependant pas le cardinal de E(F). Toutefois, si P est un point de E(F) d’ordre d, on a tE ≡ q + 1 (mod d) d’après le théorème de Lagrange, d’où la valeur exacte de tE si √ d > 4 q. Un tel point n’existe pas toujours. Toutefois, un lemme de Mestre affirme que √ si E n’a pas de point d’ordre au moins 4 q, alors sa « tordue quadratique » E 0 , en possède un, tout au moins si q est assez grand (q > 1373 suffit certainement, cf. [107], th. 3.1). Si, par exemple, E est donnée par l’équation (2.2), cette courbe E 0 est donnée par l’équation y 2 = x3 + aω 2 x + bω 3 ,

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

49

où ω est un élément de F∗ qui n’est pas un carré. (Le moyen le plus simple d’obtenir un tel élément ω consiste à choisir des éléments de F∗ au hasard, jusqu’à ce que l’un convienne.) Les cardinaux de ces courbes sont reliés par la relation |E(F)| + |E 0 (F)| = 2(q + 1), si bien qu’il suffit de déterminer le cardinal de l’une d’entre elles. En choisissant des points au hasard sur ces deux courbes, on obtient rapidement un point d’ordre assez grand, puis, par la méthode de Shanks, le cardinal de E(F) et E 0 (F). Le nombre d’opérations que peut requérir l’algorithme de Shanks est O(q 1/4 ) et le calcul effectif dans E(F) nécessite au plus une puissance de log q opérations élémentaires. On a ainsi décrit un algorithme probabiliste, de complexité ‹ O(q 1/4 ) pour calculer le nombre de points d’une courbe elliptique sur un corps fini à q éléments. 2.1.4. Courbes à multiplication complexe. — Supposons que l’on sache que la courbe E admette la multiplication complexe par un ordre O de discriminant −D d’un corps quadratique imaginaire K. Comme nous l’avons dit dans le paragraphe consacré à l’extraction de racines carrées, l’endomorphisme de Frobenius est de √ norme q dans End(E), donc s’écrit πE = 21 (x + y −D) dans K, où x, y sont des entiers relatifs de même parité qui vérifient la relation (2.6)

x2 + Dy 2 = 4q.

Alors, tE = x. Comme πE n’est pas un multiple dans O, le pgcd de x et y est 1 ou 2. Supposons-les impairs pour simplifier, les adapations à faire dans la suite sont évidentes. L’algorithme de Cornacchia (voir [96] pour une démonstration élémentaire) et, en fait, tout algorithme de réduction de réseau fournissant un vecteur de petite longueur dans un réseau euclidien de dimension 2, permet de calculer tous les couples (x, y) d’entiers premiers entre eux qui vérifient l’équation (2.6). La première étape consiste à déterminer les entiers u tels que u2 ≡ −D (mod 4q) et 2q < u < 4q. Pour trouver un tel u, on commence généralement par résoudre la congruence modulo p par un algorithme probabiliste, puis on utilise la méthode de Newton p-adique. Pour chacun de ces entiers u, appliquons alors l’algorithme d’Euclide au couple √ (4q, u) et arrêtons-nous au premier reste x strictement inférieur à 2 q ; si (4q − x2 )/D est le carré d’un nombre entier y, alors (±x, ±y) est solution de (2.6). Sauf si D = −1 où il faut aussi considérer (±y, ±x), on obtient ainsi toutes les solutions (primitives) de l’équation (2.6). Par cette méthode, on peut donc calculer |E(F)| au choix du signe de x (voire celui de y si D = −1) près. Inévitable puisqu’on ne distingue pas la courbe E de sa tordue

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

50

A. CHAMBERT-LOIR

quadratique, cette ambiguïté se résout toutefois sans peine, par exemple en regardant l’ordre d’un point de E(F) pris au hasard. 2.2. Algorithme de Schoof 2.2.1. Représentations. — Fixons une clôture algébrique F de F. Soit n un entier naturel premier à la caractéristique de F et notons E[n] le sous-groupe de E(F) formé des points P tels que nP = 0 ; il est isomorphe à (Z/nZ)2 . Tout endomorphisme u de E laisse stable E[n], d’où une action de End(E) sur E[n] qui, si l’on choisit une (Z/nZ)-base de E[n], s’identifie à un homomorphisme d’anneaux (2.7)

ρn : End(E) → M2 (Z/nZ).

En particulier, il correspond à πE une (classe de conjugaison de) matrice dont le polynôme caractéristique est précisément X 2 −tE X +q, modulo n, cf. l’équation (2.3). 2.2.2. Principe de l’algorithme de Schoof. — En 1985, R. Schoof [106] propose de calculer |E(F)| de la façon suivante : a) calculer tE modulo `, pour des nombres premiers `1 , `2 , . . . distincts de la caractéristique de F ; b) en déduire, par le théorème chinois, tE modulo le produit L des `i ; √ c) en déduire tE grâce à l’inégalité de Hasse si L > 4 q. La seconde étape est relativement évidente, de même que la dernière puisqu’il n’y √ a qu’un seul entier congru à tE dans l’intervalle [q + 1 − 12 L, q + 1 + 12 L] si L > 4 q. Expliquons donc comment calculer tE modulo ` si ` est un nombre premier. Récrivons la relation (2.3) en la spécialisant aux points de E[`] : pour tout P ∈ E[`], on a 2 πE (P ) + qP = tE πE (P ). 2 Si l’on trouve un entier t tel que l’on ait πE (P )+qP = tπE (P ) pour un point P ∈ E[`], il vient alors (t − tE )πE (P ) = O, d’où t = tE (mod `) si P est d’ordre ` (c’est-à-dire P 6= O).

2.2.3. Polynômes de division. — La multiplication par ` dans E est donnée par une transformation rationnelle de P2 , de degré `2 , de la forme (x : y : z) 7→ (P` (x, y, z) : Q` (x, y, z) : R` (x, y, z)) où P` , Q` , R` sont trois polynômes homogènes de degrés `2 à coefficients dans F, premiers entre eux. L’origine O de E étant l’unique point à l’infini de E, un point (x : y : z) ∈ E(F) appartient à E[`] si et seulement si R` (x, y, z) = 0. Si l’on se restreint au complémentaire de l’origine, le schéma des points d’ordre `, E`∗ = E[`] ∩ A2 , est donné par les équations R` (x, y, 1) = 0 et (2.1). Pour effectuer la première étape, il faudrait donc être capable de calculer les co2 ordonnées d’un point de E`∗ , c’est-à-dire de trouver une solution explicite (x, y) ∈ F de ce système d’équations. Malheureusement, même s’il existe des algorithmes de

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

51

complexité polynomiale en log q pour cela, ces algorithmes sont tous probabilistes, c’est-à-dire qu’ils requièrent l’utilisation d’un générateur de nombres aléatoires et que l’on a seulement une très forte probabilité que l’algorithme se termine en un temps polynomial en log q. Schoof contourne cette difficulté en s’intéressant directement à la totalité des points d’ordre `, c’est-à-dire au schéma E`∗ lui-même. Soit A` l’anneau des fonctions de ce schéma E`∗ , c’est-à-dire (2.8)

A` = F[x, y]/(y 2 + a1 xy + a3 y − x3 − a2 x2 − a4 x − a6 , R` (x, y, 1)).

L’image du couple d’indéterminées (x, y) dans A2` donne les coordonnées d’un point, 2 tautologique, d’ordre ` de E à coefficients dans A` . Les endomorphismes πE + q et ∗ tπE , pour t ∈ Z non multiple de `, induisent des endomorphismes de E` , donc des endomorphismes de A` . Vu la présentation donnée de l’algèbre A` , un endomorphisme u de A` détermine deux éléments Xu et Yu de A` , correspondant aux coordonnées de u(P ), lorsque P est le point tautologique de E`∗ (A` ). Schoof calcule ces éléments (Xu , Yu ) lorsque u est l’un des endomorphismes v = 2 + q idE et ut = tπE , pour t ∈ {±1, . . . , ± `−1 πE 2 }. S’il y a une coïncidence (Xv , Yv ) = (Xut , Yut ), alors tE ≡ t (mod `), sinon, tE ≡ 0 (mod `). 2.2.4. Complexité. — Il correspond à l’endomorphisme πE un couple (Xπ , Yπ ) de A` , image de (xq , y q ). Son calcul revient à une élévation à la puissance q qu’on effectue, par élévations successives au carré, en O(log q) multiplications dans A` . En utilisant les formules d’addition dans E, chacun des ` − 1 couples (Xut , Yut ) à considérer demande O(1) multiplications supplémentaires. Il faut donc effectuer O(`+log q) multiplications dans A` pour calculer tE (mod `) selon la méthode décrite. L’algèbre A` est de dimension `2 − 1 sur F et sa présentation est assez pratique. Par exemple, si p > 3 et que E est donnée sous la forme (2.2), elle est de la forme (2.9)

F[x, y]/(ψ` (x), y 2 − x3 − ax − b),

où ψ` est un polynôme de degré (`2 − 1)/2, appelé polynôme de division et tel que, si P est un point de E d’abscisse x, ψ` (x) soit l’abscisse du point `P . Notons Mq (n) le nombre de multiplications dans F requises par une multiplication dans une telle algèbre de dimension n. Naïvement, Mq (n) = O(n2 ) lorsque n tend vers l’infini, mais la découverte de méthodes de multiplication rapide (Karatsuba, utilisation de la transformée de Fourier rapide par Schönhage et Strassen) a permis de voir que Mq (n) = O(n1+ε ) pour tout ε > 0, ce qu’on notera ici Mq (n) = ‹ O(n). De même, si le corps F est présenté sous la forme Fp [t]/(f ), où f est un polynôme irréductible de degré d à coefficients dans Fp , la multiplication dans F nécessite ‹ O(d) 2 ‹ multiplications dans Fp . Finalement, une multiplication dans A` requiert O(` log q) multiplications élémentaires.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

52

A. CHAMBERT-LOIR

Ce sont bien sûr des évaluations asymptotiques et les constantes implicites dans ces expressions O et ‹ O sont grandes ; ainsi, pendant longtemps, les méthodes rapides n’ont été compétitives que pour de grandes valeurs de n. Apparemment, l’évolution récente des ordinateurs les rend praticables. En définitive, le calcul de tE modulo ` a une complexité majorée par ‹ O(`3 (log q)2 ). Par ailleurs, le théorème des nombres premiers entraîne l’existence d’un nombre réel c > 0 tel que l’on ait pour tout nombre réel x > 2 la minoration (1) Y (2.10) ` > ex/c . ` 11.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

53

que l’on peut rapidement, en choisissant des points au hasard, vérifier si E est supersingulière et calculer E(F). Nous supposons donc que E n’est pas exceptionnelle. L’équation de la courbe X0 (`) dans P1 × P1 est un polynôme Φ` ∈ Z[X, Y ], symétrique et de degré ` + 1 en chacune des variables — le polynôme modulaire ; autrement dit, Φ` (j, X) est le polynôme minimal sur Q(j) de la fonction méromorphe j(q ` ) sur X0 (`). Son calcul effectif est possible, au moins si ` n’est pas trop grand, soit à l’aide du développement en série de Fourier de la fonction modulaire j(q) et des fonctions j(q ` ), j(ζq), pour ζ ` = 1 (cf. [91]), soit par interpolation en choisissant des valeurs particulières de q (cf. [47]). Toutefois, les polynômes modulaires sont de hauteur très grande : d’après P. Cohen [29], lorsque ` tend vers l’infini, h(Φ` ) ∼ 6` log ` ;

(2.11)

pour donner un exemple, le terme constant de Φ5 possède 43 chiffres décimaux ! Comme ` est de l’ordre de log q, on utilise d’autres équations de la courbe modulaire X0 (`), données par le polynôme minimal d’autres fonctions sur X0 (`). Atkin a par exemple proposé d’employer la fonction Å ã2s s η(`τ ) (2.12) f` (τ ) = ` , s = 12/ pgcd(12, ` − 1), η(τ ) où η désigne la fonction η de Dedekind, donnée par (2.13)

η(τ ) = q

1/24

∞ Y

(1 − q n ),

q = e2iπτ .

n=1

Si j est l’invariant de la courbe E, supposée non exceptionnelle, la factorisation de Φ` (j, Y ) dans F[Y ] reflète donc l’action de πE sur E[`] : a) si π` est diagonalisable, Φ` (j, Y ) possède deux facteurs de degré 1, ses autres facteurs sont de même degré r, et t22 − 4q est un carré modulo ` ; b) si π` n’est pas semi-simple, t2E − 4q ≡ 0 (mod `) et Φ` (j, Y ) possède exactement deux facteurs irréductibles, l’un de degré 1 et l’autre de degré r = ` ; c) si π` est semi-simple, non diagonalisable, t2E − 4q n’est pas un carré modulo ` et les facteurs irréductibles de Φj (j, Y ) sont tous de même degré r. ∗

Avec ces notations, r est l’ordre de la matrice π` et il existe un élément ξ ∈ F` d’ordre r tel que tE ≡ q(ξ + ξ −1 )2 (mod `). Dans les deux premiers cas, il existe un sous-groupe C de E[`] défini sur F, correspondant à un quotient A0` de l’algèbre A` utilisée par Schoof, c’est-à-dire à un facteur ψC de degré ` − 1 du polynôme de division ψ` . Pour déterminer ce facteur sans expliciter ψ` , N. Elkies explique dans [45] comment construire une courbe elliptique E 0 sur F et une isogénie ϕ : E → E 0 de noyau C. Ses formules utilisent la théorie des fonctions elliptiques et font intervenir des dénominateurs ; elles ne conviennent que si la caractéristique du corps F est supérieure à `, cf. [107] et le chapitre 17 de [28]. En

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

54

A. CHAMBERT-LOIR

« petite caractéristique », diverses méthodes existent : utilisation de la loi de groupe formel ou du sous-groupe de p-torsion (Couveignes, [83, 30]), [80] en caractéristique 2. Dans le troisième cas, la factorisation de Φ` ne fournit qu’une information partielle sur tE (mod `), dont O. Atkin a montré comment la connaissance pouvait accélérer grandement le calcul de tE . 2.2.6. Résultats. — L’algorithme obtenu en combinant la méthode de Schoof et les améliorations d’Atkin et Elkies est surnommé sea. Sa complexité, en temps et en espace, est polynomiale en log q, respectivement ‹ O((log q)4 ) et O((log q)2 ). Toutefois, comme il requiert la factorisation d’un polynôme à coefficients dans un corps fini, c’est un algorithme probabiliste. Il est décrit en grand détail dans [93] lorsque la caractéristique du corps n’est pas trop petite ; je renvoie aussi à la présentation de Morain [91]. Son implémentation concrète a été réalisée par de nombreuses personnes, dans de nombreux systèmes de calcul algébrique, dont Magma [16] et Pari/GP [97]. L’implémentation en caractéristique 2 de Vercauteren lui a permis de calculer le cardinal d’une courbe elliptique sur F21999 à l’aide de 10 Pentium II 400 Mhz en environ une semaine, cf. [114]. Le record actuel est détenu par Enge, Gaudry et Morain qui ont calculé le nombre de points d’une courbe elliptique sur un corps fini de cardinal le nombre premier p = 102099 + 6243, cf. [48]. Le temps de calcul sur une machine puissante (Processeur AMD 64 3400+, 2,4 GHz) est de l’ordre de 200 jours, non compris le calcul des polynômes modulaires ! 2.3. Généralisations 2.3.1. Cohomologie étale. — Pour expliquer le titre de ce chapitre et le principe des généralisations de l’algorithme de Schoof, il nous faut faire quelques rappels sur la cohomologie `-adique. Soit F un corps fini, notons q son cardinal. Fixons une clôture algébrique F de F et notons Fqn le sous-corps à q n éléments de F, de sorte que Fq = F. Soit ϕ l’automorphisme de Frobenius géométrique de F, inverse de l’automorphisme de Frobenius arithmétique x 7→ xq . Soit ` un nombre premier distinct de la caractéristique de F ; notons F` le corps Z/`Z, Z` l’anneau des entiers `-adiques et Q` son corps des fractions. Soit X un schéma séparé de type fini sur F, posons X = X ⊗ F. Les groupes de cohomologie `-adique à support propre de X définis par Grothendieck, (2.14)

Hci (X, F` ),

Hci (X, Q` ),

Hci (X, Z` ),

sont respectivement des espaces vectoriels de dimension finie sur F` , Q` , et des Z` -modules de type fini, nuls si i < 0 ou si i > 2 dim X. Ils sont munis d’une action de Gal(F/F) et permettent le calcul du cardinal de X(F) via une formule de

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

55

Lefschetz [60, 59] : (2.15)

|X(F)| =

2 dim XX

(−1)i Tr(ϕ|Hci (X, Q` )).

i=0

Cette formule, appliquée aux extensions finies de F, entraîne la formule suivante pour la fonction zêta de X : ! 2 dim X ∞ X Y i+1 tn (2.16) Z(X, t) = exp |X(Fqn )| = det(1 − tϕ|Hci (X, Q` )(−1) , n n=1 i=0 d’où, de nouveau, la rationalité de la fonction zêta de X. On a Hci (X, Q` ) = Hci (X, Z` ) ⊗Z` Q` , et s’il n’est pas vrai que Hci (X, Z` ) ⊗Z` F` est égal à Hci (X, F` ), ces deux groupes peuvent être reliés, de sorte que l’on a une congruence modulo ` ([35], Fonctions L modulo `n , p. 116, th. 2.2) : (2.17)

|X(F)| ≡

2 dim XX

Tr(ϕ|Hci (X, F` ))

(mod `).

i=0

Supposons par exemple que X = E soit une courbe elliptique E. Si A est l’un des anneaux F` , Z` , Q` , alors Hc0 (E, A) = A, Hc2 (E, A) = A, les endomorphismes ϕ étant respectivement l’identité et la multiplication par q, tandis que Hc1 (E, A) est un A-module libre de rang 2. En outre, Hc1 (E, F` ), muni de l’action de ϕ, s’identifie canoniquement à E[`], muni de l’action de l’endomorphisme πE , et le polynôme X 2 − tE X + q est le polynôme caractéristique de ϕ agissant sur Hc1 (E, F` ). En particulier, tE ≡ Tr(ϕ|Hc1 (E, F` )) (mod `). Dans ce cas, l’entier tE est d’ailleurs la trace commune de ϕ sur tous les espaces Hc1 (E, Z` ), Hc1 (E, Q` ) et l’on a (2.18)

Z(E, t) =

1 − tE t + qt2 . (1 − t)(1 − qt)

Ainsi, avec ces identifications, la congruence (2.17) n’est autre que celle qui est à la base de l’algorithme de Schoof, d’où le titre, approche `-adique, de ce chapitre. Revenons au cas général en supposant que X soit projective et lisse. P. Deligne [34] a démontré que, pour tout i, le polynôme caractéristique de ϕ agissant sur l’espace Hci (X, Q` ) est un polynôme à coefficients entiers qui ne dépend pas de ` (distinct de la caractéristique de F) et dont les racines complexes sont toutes de module q i/2 . Omettant par abus l’anneau Q` des notations, on a en particulier la majoration (2.19)

|Tr(ϕ|Hci (X))| 6 q i/2 dim Hci (X).

Cette inégalité généralise la majoration de Hasse ; conjecturée par Weil, c’est l’analogue pour la variété X de l’hypothèse de Riemann. Pour calculer |X(F)|, il suffit de calculer Tr(ϕ|Hci (X)). Faisons l’hypothèse que X est projective, lisse et géométriquement intègre (sans pour autant supprimer l’indice c

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

56

A. CHAMBERT-LOIR

de la cohomologie), et supposons que l’on a Hci (X, Z` )) ⊗ F` ' Hci (X, F` ). On a alors la congruence Tr(ϕ|Hci (X)) ≡ Tr(ϕ|Hci (X, F` ))

(mod `).

Adapté à ce cadre, l’algorithme de Schoof procéderait de la façon suivante : a) calculer Tr(ϕ|Hci (X, F` )) pour ` = `1 , `2 , . . . , `n et 0 6 i 6 2 dim X ; b) en déduire, par le théorème chinois, l’entier Tr(ϕ|Hci (X)) modulo L = `1 . . . `n ; c) en déduire l’entier Tr(ϕ|Hci (X)) si L est au moins égal à deux fois la borne donnée par l’équation (2.19). Le problème est d’avoir une prise raisonnable sur le groupe de cohomologie Hci (X, F` ). Sous les hypothèses données, la dualité de Poincaré identifie Hci muni de ϕ et Hc2 dim X−i muni de q dim X ϕ−1 . Supposons donc 0 6 i 6 dim X. Pour i = 0, on a Hc0 (X, F` ) = F` et ϕ = id ; la trace cherchée vaut 1. Pour i = 1, Hc1 (X, F` ) s’identifie au groupe correspondant Hc1 (A, F` ), où A est la variété d’Albanese de X. C’est une variété abélienne que l’on peut espérer décrire explicitement de sorte à appliquer la méthode de Schoof. Toutefois, pour 2 6 i 6 dim X, il ne semble pas y avoir, en général, de description raisonnablement effective de Hci (X, F` ). Cette approche restera donc limitée aux courbes et aux variétés abéliennes, dont la cohomologie est contrôlée par le H 1 , voire aux variétés pour lesquelles l’on peut décrire effectivement et efficacement la cohomologie à l’aide de variétés abéliennes. 2.3.2. Courbes et variétés abéliennes. — Généralisant des résultats de J. Pila [98], L. Adleman et M.-D. Huang ont ainsi donné dans [3] un algorithme qui calcule le nombre de points d’une variété abélienne A de dimension g définie sur un corps fini Fq à q éléments, plongée dans l’espace projectif PN . Il convient de remarquer que ces algorithmes ne calculent pas les traces Tr(ϕ|Hci (A, F` )) individuellement, mais leur somme alternée, c’est-à-dire une congruence |A(Fq )| (mod `). Supposant que l’on dispose de polynômes homogènes F1 , . . . , FS de degrés au plus T définissant l’idéal de A dans Fq [x0 , . . . , xN ], de formules pour l’addition de A données par des polynômes de degré D dans R cartes affines, la complexité de cet algorithme, 2 (log q)O(N (g+log R+log D)) . L’exposant de log q est énorme : si, pour simplifier, le plongement est donné par le cube d’une polarisation principale, on a N + 1 = 3g g!. Par ces techniques, il est aussi possible de calculer le polynôme caractéristique de l’endomorphisme de Frobenius πA agissant sur le module de Tate T` (A) de A (pour ` distinct de la caractéristique de Fq ). Pila procède par exemple en calculant, pour tout polynôme irréductible r ∈ (Z/`Z)[t], de degré au plus 2 dim A, et leurs puissances, le cardinal du noyau de l’endomorphisme r(ϕ) du groupe fini A[`]. Il en déduit le polynôme caractéristique de ϕ sur le F` -espace vectoriel A[`], puis le polynôme caractéristique de ϕ via le théorème chinois, ayant choisi des valeurs de ` 6 O(log q).

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

57

Supposons donc que A soit la jacobienne d’une courbe C sur Fq , supposée projective, lisse et géométriquement intègre. D’après Weil [119], on a l’égalité |C(Fq )| = q + 1 − Tr(πA ).

(2.20)

Comme on peut décrire effectivement une jacobienne, il existe donc un algorithme de complexité polynomiale en log q pour calculer le nombre de points d’une telle courbe sur un corps fini. D’après Pila, la complexité d’un tel algorithme est uniforme lorsque la courbe parcourt une famille algébrique, voir [99]. Si elle reste trop grande pour que cette méthode puisse être utilisée en pratique, le cas des courbes hyperelliptiques a fait l’objet d’améliorations importantes. Supposons que A soit la jacobienne d’une courbe hyperelliptique C qui est donnée par une équation sous la forme (affine) (2.21)

y 2 = f (x),

f ∈ Fq [x],

deg f = 2g + 1.

Toute classe de diviseur de degré 0 sur C est alors représentée de manière unique par deux polynômes u et v vérifiant les conditions suivantes : (i) u est unitaire ; (ii) deg v < deg u 6 g ; (iii) u divise v 2 − f . L’idéal du diviseur dans la carte affine ci-dessus n’est autre que (u(x), y − v(x)). Cette représentation, rappelée dans [94], est souvent appelée description de Mumford dans la littérature. Elle permet à Adleman et Huang de montrer l’existence d’un algorithme pour calculer le cardinal de C(Fq ) et de A(Fq ) dont la complexité est 2 (log q)O(g log g) . Bien que considérablement inférieure à celle des variétés abéliennes générales, cette complexité reste exponentielle en le genre, et ces méthodes sont impropres aux applications cryptographiques. Voir toutefois l’article [55] par Gaudry et Harley concernant les courbes de genre 2 : l’usage de l’analogue des polynômes de division introduits par D. Cantor (voir [20]) leur permit de calculer le nombre de points d’une telle courbe sur un corps fini dont le cardinal est de l’ordre de 1020 . 2.4. Formes modulaires Revenons pour l’instant au cas des courbes elliptiques et supposons que E soit une courbe elliptique définie sur Q, donnée par une équation de Weierstrass (2.2), où a et b sont des entiers relatifs. Pour tout nombre premier p, on peut réduire l’équation modulo p et en déduire, tout au moins si p ne divise pas le discriminant ∆E = −4a3 − 27b2 , une courbe elliptique sur Fp ; écrivons son cardinal sous la forme p+1−ap . Pour les quelques nombres premiers qui restent, on peut définir un entier ap

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

58

A. CHAMBERT-LOIR

analogue et définir la fonction L de Hasse-Weil de E par le produit eulérien et la série de Dirichlet ∞ Y Y X −s 1−2s −1 −s −1 (2.22) L(E, s) = (1 − ap p + p (1 − ap p ) = ) an n−s . p premier p-∆E

p-∆E

n=1

Ce produit et cette série convergent pour 3/2 ; d’après le théorème de Wiles et Taylor–Wiles, complété par [19], ils possèdent un prolongement holomorphe à C et une équation fonctionnelle reliant L(E, s) à L(E, 2 − s). Plus précisément, si NE désigne le conducteur de E, la fonction holomorphe sur le demi-plan de Poincaré donnée par le développement de Fourier fE (τ ) =

(2.23)

∞ X

an q n ,

q = e2iπτ ,

n=1

est une forme modulaire de poids 2 pour le sous-groupe de congruence Γ0 (NE ) de SL2 (Z). L’algorithme de Schoof apparaît ainsi comme un algorithme de calcul des coefficients des formes modulaires de poids 2. Dans un article récent [44], Edixhoven, en collaboration avec Couveignes, de Jong, Merkl et Bosman, explique comment calculer les coefficients de Fourier d’une forme modulaire de poids k > 2, niveau N , parabolique et propre pour les opérateurs de Hecke. Leur approche n’est cependant entièrement menée au bout que pour la fonction ∆ de Ramanujan, donnée par (2.24)

∆(τ ) = η(τ )24 = q

∞ Y

(1 − q n )24 =

n=1

∞ X

an q n ,

q = e2iπτ .

n=1

(L’entier an est classiquement noté τ (n).) Je me limite ici à une description rapide de quelques-unes des idées essentielles de ce long article. Soit donc f une forme modulaire sur Γ1 (N ), propre pour les opérateurs de Hecke, normalisée, de développement de P Fourier an q n . a) Si f était une série d’Eisenstein, son coefficient an serait une somme explicite de puissances de diviseurs de n ; on ne sait pas évaluer une telle somme sans factoriser n, et l’on ne sait pas factoriser n en temps polynomial en log n. On se contentera donc des coefficients ap , pour p un nombre premier. b) D’après Deligne, voir [32], il existe pour tout ` une représentation de degré 2 de Gal(Q/Q), à coefficients dans Z` , (2.25)

ρf,` : Gal(Q/Q) → GL2 (Z` )

telle que pour tout p 6= `N , ap soit la trace de ρf (ϕp ), où ϕp est un élément de Frobenius (géométrique) en la place p. La construction géométrique de cette représentation et la démonstration par Deligne des conjectures de Weil entraînent

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

59

en outre la majoration (2.26)

|ap | 6 2p(k−1)/2

qu’avait conjecturée Ramanujan. La méthode de Schoof suggère donc de calculer la réduction modulo `, disons ρf,` , de cette représentation pour des valeurs de ` au plus égales à O(log p). c) Lorsque k = 2, cette représentation ρf,` se réalise dans celle associée aux points de `-torsion de la jacobienne J1 (N ) de la courbe modulaire X1 (N ). Dans le cas général, la construction de Deligne fait intervenir un groupe de cohomologie de degré k − 1 d’un produit fibré (désingularisé) k − 2-fois de la « courbe elliptique universelle » sur X1 (N ). Comme on l’a évoqué plus haut, il ne semble pas possible de décrire cette cohomologie explicitement. En revanche, des phénomènes de congruence entre formes modulaires entraînent que ρf,` se réalise dans la représentation galoisienne associée aux points de `-torsion de la jacobienne J1 (N `). Comme le genre de J1 (N `) est de l’ordre de N 2 `2 , il s’agit de détecter une sousreprésentation de dimension 2 dans une représentation de très grande dimension. Autrement dit, de détecter les `2 − 1 points d’ordre ` de J1 (N `) correspondant à ρf,` , le polynôme minimal d’un générateur de l’extension de Q engendrée par leurs coordonnées et l’action du groupe de Galois Gal(Q/Q). d) Pour ce faire, Couveignes a suggéré de travailler dans C et de calculer une approximation de ce polynôme, en même temps qu’une borne pour sa hauteur. (Deux nombres rationnels distincts x = a/b et x0 = a0 /b0 de hauteurs log max(|a|, |b|) et log max(|a0 |, |b0 |) au plus h diffèrent d’au moins e−2h .) Les bornes requises sur la hauteur sont obtenues en majorant certaines quantités concernant la théorie d’Arakelov des courbes modulaires X1 (`) : la hauteur de Faltings, certaines fonctions θ et les fonctions de Green ; ces bornes sont polynomiales en `. e) Plutôt que calculer dans la jacobienne J1 (N `), les auteurs préfèrent utiliser le produit symétrique X1 (N `)(g) de la courbe modulaire, qui est muni d’une application naturelle birationnelle vers J1 (N `). Pour garantir que les points d’ordre ` intervenant dans ρf,` ont un unique antécédent, la construction géométrique d’un diviseur ayant des propriétés spécifiques est nécessaire, si bien qu’à ce stade, les auteurs de [44] se cantonnent à la forme modulaire ∆ de Ramanujan. Pour réaliser cette construction, ils réduisent modulo p, et l’utilisation d’un algorithme probabiliste leur est pour l’instant nécessaire. Tout ceci combiné, Edixhoven et al. démontrent qu’il existe un algorithme probabiliste de complexité polynomiale en ` calculant ρf,` , c’est-à-dire :

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

60

A. CHAMBERT-LOIR

a) un corps de nombres K` donné par sa table de multiplication, galoisien sur Q correspondant au noyau de la représentation ρf,` , b) des matrices correspondant aux éléments σ du groupe Gal(K` /Q) agissant Q-linéairement sur K` , et c) les matrices ρf,` (σ) ∈ GL2 (F` ) correspondantes. Ils en déduisent qu’il existe un algorithme probabiliste calculant le coefficient τ (p) de la fonction de Ramanujan, algorithme dont la complexité est polynomiale en log p.

3. MÉTHODES p-ADIQUES 3.1. Application de la théorie de Dwork Comme je l’ai dit plus haut, la première démonstration de la rationalité de la fonction zêta d’une variété algébrique définie sur un corps fini est due à Dwork [41]. A. Lauder et D. Wan ont observé [78, 117] que la démonstration de Dwork permet un moyen de calcul effectif de la fonction zêta. Même si cette méthode s’avère moins efficace que celles qui ont été développées peu après, elle fournit un algorithme indépendant de la géométrie du système d’équations considéré. 3.1.1. Calculabilité de la fonction zêta. — Soit F un corps fini, notons q son cardinal et p sa caractéristique. Considérons une variété algébrique affine X, lieu des zéros dans An de m polynômes f1 , . . . , fm ∈ F[x1 , . . . , xn ] ; soit a le maximum des degrés des fi . L’espace nécessaire pour écrire ces polynômes est de l’ordre de m(a + 1)n log q. On cherche un algorithme efficace, pour calculer la fonction zêta de X. D’après Dwork, cette fonction zêta s’écrit comme le quotient P1 /P2 de deux polynômes à coefficients entiers, premiers entre eux, de termes constants 1. Un théorème de Bombieri majore par A = (4a + 9)n+m la somme des degrés de P1 et de P2 (prop. 4.2 et th. 1 de [14], appliqué à f = 1). Autrement dit, il existe des nombres entiers a1 et a2 tels que a1 + a2 6 A, des entiers algébriques α1 , . . . , αa1 , β1 , . . . , βa2 tels que pour tout entier k > 1, (3.1)

|X(Fqk )| = −

a1 X j=1

αjk +

a2 X

βjk ,

j=1

la fonction zêta elle-même étant donnée par Qa1 j=1 (1 − αj t) . (3.2) Z(X, t) = Qa2 j=1 (1 − βj t) Par conséquent, pour calculer la fonction zêta de X, il suffit de calculer les cardinaux |X(Fqk )| pour 1 6 k 6 A+1, d’en déduire les A+1 premiers termes du développement

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

61

en série entière de Z(X, t) puis de calculer une approximante de Padé de cette série. En particulier, la fonction zêta est effectivement calculable. D’autre part, d’après Deligne [36], les valeurs absolues des αj et βj sont de la forme q s/2 , où s est un entier compris entre 0 et 2 dim X (dépendant de j). En particulier, les coefficients de P1 et de P2 sont majorés par 2A q nA . L’espace nécessaire pour écrire la fonction zêta est donc O(nA log q) = O(n(4a+9)n+m log q), sensiblement du même ordre de grandeur que celui nécessaire au stockage des données. La question algorithmique qui se pose naturellement alors est la suivante : Est-il possible de calculer la fonction zêta en temps polynomial en cette taille ? Compte tenu des bornes de Bombieri rappelées ci-dessus, cela revient à la question : Est-il possible de calculer le cardinal de X(Fqk ) en temps polynomial en k(a + 1)n+m log q ? Pour les variétés de dimension zéro de la droite affine, définies par un polynôme f ∈ F[x], de degré a, l’algorithme de Berlekamp a la complexité voulue. Si f est sans racines multiples, le pgcd de f et xq − x a pour degré le nombres de racines de f dans Fq . On calcule bien sûr ce pgcd par l’algorithme d’Euclide, en commençant par évaluer xq dans l’algèbre F[x]/(f ) ce qui requiert en gros log q opérations dans cette algèbre ; la suite de l’algorithme nécessite au plus a divisions euclidiennes de polynômes de degrés au plus a à coefficients dans F. Pour les courbes planes toutefois, les résultats du chapitre précédent faisaient apparaître une dépendance exponentielle en le genre... Si q = pd , Lauder et Wan montrent que la réponse est oui si l’on se limite aux corps de caractéristique majorée. Ils déduisent de l’étude par Dwork de la fonction zêta d’une hypersurface une congruence modulo une puissance de p pour le nombre de points d’une hypersurface sur Fq , d’où sa valeur si l’exposant de la puissance dépasse dn. 3.1.2. Une formule de congruence. — Nous allons nous borner au cas d’une hypersurface de l’espace affine d’équation f = 0, où f ∈ Fq [x1 , . . . , xn ]. La méthode de Dwork est « torique » et commence en fait par étudier la fonction zêta de l’intersection X de cette hypersurface avec le tore Gm n . Le reste s’étudie classiquement par récurrence, au moyen de la formule d’inclusion-exclusion, mais cela induit inexorablement des facteurs 2n dans la complexité des algorithmes à venir. La théorie des sommes de caractères fournit la formule X (3.3) q|X(Fq )| − (q − 1)n = χq (x0 f (x1 , . . . , xn )), (x0 ,...,xn )∈Gm n+1 (Fq )

où χq : Fq → Ω∗ est un caractère additif non trivial de Fq , Ω étant un corps de caractéristique zéro. Soit W l’anneau des vecteurs de Witt de F. C’est un anneau de valuation discrète, complet, de corps résiduel F et dont l’idéal maximal est engendré par p. Si

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

62

A. CHAMBERT-LOIR

F = Fp , W n’est autre que l’anneau Zp des entiers p-adiques ; si F est décrit sous la forme Fp [x]/(f ), où f est un polynôme de degré d, W est isomorphe à l’anneau quotient Zp [x]/(fe), où fe ∈ Zp [x] est un polynôme de degré a arbitraire dont la réduction modulo p est égale à f . Soit R l’anneau obtenu en adjoignant à W un élément π tel que π p−1 = −p. Notons Ω le corps des fractions de R. Sa valeur absolue |·| et sa valuation ord sont normalisées par |p| = 1/p et ord p = 1. Soit d l’entier tel que q = pd . Notons ω : F → Ω le caractère de Teichmüller, prolongé par ω(0) = 0. Pour tout x ∈ F∗ , ω(x) est l’unique racine de l’unité d’ordre premier à p de W qui est congrue à x modulo p ; c’est aussi la limite n de la suite ξ q , où ξ est un élément arbitraire de W qui est congru à x modulo p. Soit σ l’unique automorphisme de K tel que σ(π) = π et est congru à l’automorphisme de Frobenius modulo p ; notons τ l’inverse de σ. Si les coefficients de la série exponentielle sont p-adiquement trop grands, ceux de la série θ ∈ Ω[[z]] définie par θ(z) = exp(πz − πz p )

(3.4)

sont de valeurs absolues inférieures ou égales à 1 et tendent vers 0. Précisément, on a Å ã n(p − 1) 2 (3.5) ord θn > max , . p2 p−1 Dwork montre alors que l’on peut choisir pour caractère χq dans la formule (3.3) la fonction d−1 Y i (3.6) χq (z) = θ(1)TrFq /Fp (z) = θ(ω(z)p ). i=0

Soit F la série formelle en les indéterminées x0 , . . . , xn définie par Y X (3.7) F (x) = θ(ω(fJ )xJ ), où x0 f (x1 , . . . , xn ) = fJ xJ . J

J

Les majorations (3.5) des coefficients de la série θ et l’hypothèse que f est de degré a P entraînent que les coefficients de F = FJ xJ vérifient ( ord FJ > j0 p−1 si j0 a > j1 + · · · + jn , p2 (3.8) FJ = 0 sinon. Notons L l’ensemble des séries formelles qui vérifient ces inégalités et ∆ l’ensemble des monômes xJ tels que j0 a > j1 + · · · + jn . Soit ψ l’« opérateur de Dwork » sur Ω[[x0 , . . . , xn ]] donné par X X (3.9) ψ( uJ xJ ) = τ (upJ )xJ . J

J

L’opérateur composé α de ψ et de la multiplication par F applique L dans lui-même. Soit A sa matrice (infinie) dans la « base » ∆.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

63

Le point crucial de la démonstration de Dwork est la nucléarité de l’opérateur linéaire αd qui se déduit de majorations explicites pour les coefficients de la matrice A, elles-mêmes déduites de (3.8). En particulier, pour tout entier k > 1, αdk possède une trace, d’ailleurs égale à la somme des coefficients diagonaux de sa matrice dans la base ∆, et l’on a (3.10)

Tr(αdk )(q k − 1)n+1 = q k |X(Fqk )| − (q k − 1)n .

Comme l’ont remarqué Lauder et Wan (voir [78], th. 28), ces majorations entraînent aussi que si l’on « tronque » l’opérateur α en considérant sa restriction αν au sousespace (stable) engendré par les monômes xJ de ∆ tels que j0 6 ν(p/(p − 1))2 , on obtient une congruence (pour simplifier, on ne regarde désormais que le cas k = 1) : (3.11)

Tr(ανd )(q − 1)n+1 ≡ q|X(Fq )| − (q − 1)n

(mod pν ).

Soit Aν la matrice de l’application σ-linéaire αν ; elle est de taille N = O((νa + 1)n ). Pour calculer Tr(ανd ) modulo pν , il suffit de réduire Aν modulo pν , d’effectuer le produit Aν τ (Aν ) . . . τ d−1 (Aν ) puis de calculer la trace de cette matrice modulo pν . Le produit de ces d matrices peut être effectué efficacement en adaptant l’algorithme d’exponentiation binaire ; on n’a alors que O(log d) produits à faire. Cela fournit un algorithme pour calculer |X(Fq )| modulo pν . Comme 0 6 |X(Fq )| < pdn , il suffit, pour en déduire la valeur de |X(Fq )|, de choisir ν = nd. La complexité de l’algorithme ainsi esquissé est ‹ O(p2n+4 a3n n3n+5 d3n+7 ) en temps, 2n 2n+3 2n+4 ‹ et O(pa n d ) en espace. 3.2. Relèvement canonique et moyenne arithmético-géométrique Revenons au cas des courbes elliptiques. Soit E une courbe elliptique définie sur un corps fini F ; notons q le cardinal de F, p sa caractéristique ; soit d l’entier tel que q = pd . Notons enfin W l’anneau des vecteurs de Witt de F et K son corps des fractions. L’algorithme que nous décrivons ici permet, une fois encore, de calculer |E(F)|. Il est dû à K. Satoh [104], au moins lorsque p > 3. La présentation que nous suivons ici tient compte d’articles parus ultérieurement dans lequel p = 2 et 3 sont pris en compte ([49], [111], [105] et [116]), ainsi que de sa variante, due à Mestre, fondée sur la moyenne arithmético-géométrique. 3.2.1. Relèvements. — Soit E un relèvement de E, c’est-à-dire une courbe elliptique sur W dont la réduction modulo p est égale à E. Une telle courbe peut être obtenue en considérant une équation de Weierstrass (2.1) ou (2.2) à coefficients dans W dont la réduction modulo p est une équation de Weierstrass de E. Un endomorphisme u e de E définit, par réduction modulo p, un endomorphisme de E, d’où un homomorphisme d’anneaux, injectif, de End(E ) dans End(E).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

64

A. CHAMBERT-LOIR

Si E est mal choisi, End(E ) = Z. Toutefois, si E est ordinaire, c’est-à-dire que E possède un point d’ordre p, un théorème de Deuring [39] affirme qu’il existe un unique relèvement E pour lequel l’homomorphisme End(E ) → End(E) soit un isomorphisme ou, cela revient au même, le seul relèvement sur lequel l’endomorphisme de Frobenius πE de E se relève en un endomorphisme πE de E . Comme le corps F est fini, ce relèvement coïncide avec celui fourni par la théorie, plus profonde, du relèvement canonique, cf. [84] et, pour plus de détails, [87]. Comme les traces de πE dans End(E ) et de πE dans End(E) sont égales, il suffit de calculer la première. Celle-ci se voit au niveau des formes différentielles : si ω est une forme différentielle invariante (non nulle) sur E , πE∗ ω est une forme différentielle invariante, donc est proportionnelle à ω. Soit cE ∈ W tel que πE∗ ω = cE ω. Puisque l’isogénie duale πE∨ de πE vérifie la relation πE∨ ◦ πE = q idE ,

(3.12)

∨ cE 6= 0 et (πE∨ )∗ ω = qc−1 E ω. La somme des endomorphismes πE et πE est la multiplication par la trace de πE , c’est aussi puisque l’homomorphisme End(E ) → End(E) est un isomorphisme, la multiplication par la trace de πE . Autrement dit, on a l’égalité Å ã q (3.13) |E(F)| = q + 1 − tE = q + 1 − cE + . cE

Cette méthode n’est pas praticable telle quelle car πE est un endomorphisme de degré q, supposé très grand. L’idée de Satoh consiste, considérant la factorisation naturelle de πE en d isogénies de degré p, à relever ces isogénies et à calculer des constantes analogues ci dont cE sera le produit. En fait, une telle factorisation est un point essentiel de la construction même de la courbe E , suivant la méthode décrite dans [84]. Soit σ l’automorphisme de F donné par x 7→ xp ; comme q = pd , on a σ d = id. Si E est une courbe elliptique sur F, on notera E (σ) la courbe obtenue en appliquant l’automorphisme σ à ses coefficients ; elle est liée à E par une isogénie ϕ : E → E σ de degré p qui correspond à l’élévation des coordonnées des points à la puissance p. On a ainsi une suite d’isogénies (de degré p) ϕ

ϕ

E− → E (σ) − → E (σ

(3.14)

2

) ϕ

ϕ

− → ... − → E (σ

d

)

= E.

Notons encore σ l’unique automorphisme de W dont la réduction modulo p est l’automorphisme σ de F ; on a aussi σ d = id. À la suite de [84], Satoh propose de chercher E de sorte que l’on ait encore une suite d’isogénies de degré p : (3.15)

ϕ

ϕ(σ)

E − → E (σ) −−−→ E (σ

2

(σ ) ϕ

2)

ϕ(σ

d−1 )

−−−→ . . . −−−−−→ E (σ

d

)

= E. d−1

En effet, étant donnée une telle courbe E , l’endomorphisme composé ϕ(σ ) ◦ · · · ◦ ϕ(σ) ◦ ϕ relève l’endomorphisme πE de E, si bien que E est le relèvement canonique

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

65

de E. Autrement dit, on va chercher un relèvement E de E tel que le couple (E , E (σ) ) soit un point de la courbe modulaire X0 (p). 3.2.2. Résolution de l’équation modulaire. — Le polynôme modulaire Φp , équation de la courbe X0 (p) dans P1 × P1 , vérifie une congruence modulo p, due à Kronecker : (3.16)

Φp (X, Y ) ≡ (X p − Y )(Y p − X)

(mod p).

Lorsque l’invariant jE de la courbe E n’appartient pas au corps Fp2 , l’équation « sesquipolynomiale » Φp (j, σ(j)), où l’inconnue j appartient à l’ensemble des éléments de W dont la réduction est l’invariant jE , est alors justiciable d’une variante de la méthode de Newton, d’où une construction du relèvement canonique de la courbe E dans ce cas. À chaque itération, l’équation linéarisée est de la forme, dite équation d’Artin-Schreier : (3.17)

aσ(x) + bx = c.

Toutefois, le calcul effectif de σ est délicat. Les algorithmes efficaces de Lercier, Lubicz puis Harley pour les résoudre leur ont permis d’implémenter effectivement cette approche (voir [81, 61] et le chapitre 12 de [28]). Quant à Satoh, il procéda un peu différemment en prenant pour inconnue, non pas seulement la courbe E , i mais toutes les courbes Ei = E (σ ) simultanément. Les d invariants ji = j(Ei ), pour 0 6 i 6 d − 1, sont liés par le système d’équations polynomiales (3.18)

Φp (j0 , j1 ) = Φp (j1 , j2 ) = · · · = Φp (jd−2 , jd−1 ) = Φp (jd−1 , j0 )

dont une résolution par la méthode de Newton classique est possible. 3.2.3. Itération de quotients. — Avec les notations précédentes, les courbes E0 et E1 sont liées par une isogénie ϕ : E0 → E1 dont la réduction modulo p, le frobenius relatif, est une isogénie inséparable. Soit ϕ : E0 → E1 un relèvement arbitraire de ϕ : E → E (σ) . Le sous-schéma de p-torsion, E0 [p], possède un sous-groupe de rang p connexe canonique, G0 , le quotient E0 [p]/G0 étant un W -schéma en groupes étale. (Localement pour la topologie étale, G0 est isomorphe au schéma en groupes µp .) De plus, E1 est isomorphe à E0 /G0 et ϕ s’identifie à l’isogénie E0 → E0 /G0 . Ainsi, E1 est déterminée par E0 . Cette analyse faite, choisissons une courbe elliptique arbitraire E0 relevant E, soit G0 le plus grand sous-schéma en groupes connexe de E0 [p], soit E1 le quotient de E0 par G0 et soit ϕ0 : E0 → E1 l’isogénie canonique. La courbe elliptique E1 relève la courbe ordinaire E (ϕ) . Itérons le procédé. On en déduit une suite (En ) de courbes elliptiques liées par des isogénies de degré p, ϕi : En → En+1 , dont le noyau, Gn , est le plus grand sous-schéma en groupes connexe de En [p].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

66

A. CHAMBERT-LOIR

Comme l’application x 7→ xp est p-adiquement contractante, les sous-suites (Edn+j ) sont convergentes dans la courbe modulaire. En particulier, les courbes Edn convergent vers le relèvement canonique de E lorsque n → ∞. Une façon de le démontrer consisterait à utiliser le schéma formel des relèvements de la courbe E ([84, 87]), lequel s’identifie au schéma formel des relèvements de son groupe p-divisible. La théorie des coordonnées canoniques (qui s’appellent q d’ordinaire, mais que je noterai z ici) montre en effet qu’il est isomorphe au groupe multiplicatif formel sur W ; l’élément neutre correspond au relèvement canonique de la courbe E. Par ailleurs, les isogénies que nous considérons (ou plutôt les composées de d isogénies successives) ont pour effet d’élever à la puissance q la coordonnée canonique z essentiellement parce que l’élévation à la puissance q dans le groupe multiplicatif formel a pour noyau le schéma en groupes µq . Comme |z − 1| < 1, l’itération de l’application z 7→ z q fournit une suite qui converge vers 1. On observe que la convergence n’est que linéaire. Cette construction se généralise ainsi mutatis mutandis au cas des variétés abéliennes ordinaires (voir aussi le chapitre 2 de [21]). Citons aussi l’article [74] qui propose des variantes de ces algorithmes où la courbe modulaire correspondant à l’invariant j est remplacée par la courbe X0 (N ), surtout lorsque celle-ci est de genre 0. Dans le cas des courbes elliptiques, son intérêt fut mis en évidence dans l’article [116] de Vercauteren, Preenel et Vandewalle, parce que sa considération améliore la complexité en espace de l’algorithme de Satoh. Toutefois, dans cet article, l’invariant jn+1 est calculé en appliquant une itération de l’algorithme de Newton à l’équation modulaire Φp (j, jn ) = 0, l’inconnue étant j, le tout étant écrit à l’envers, car ces auteurs raisonnent, ainsi que Satoh, sur l’isogénie de Verschiebung. 3.2.4. Fin de l’algorithme. — Pour calculer explicitement sous forme d’une équation de Weierstrass (2.1) ces courbes En et les isogénies ϕn , on peut utiliser les formules de Vélu [113], voir aussi [21], th. 3.3.1. Supposons donc la courbe E et l’isogénie ϕ explicitées et montrons comment terminer le calcul du cardinal de E(F). Soit ω une base du W -module des formes différentielles invariantes sur E . Il existe un unique élément c ∈ W tel que ϕ∗ ω (σ) = cω, et les formules de Vélu permettent d’ailleurs de le calculer aisément. Pour i ∈ {0, . . . , d−1}, i i+1 i on a donc (ϕ(σ ) )∗ ω (σ ) = σ i (c)ω (σ ) , si bien que (3.19)

cE = cσ(c) . . . σ d−1 (c) = NK/Qp (c)

est la norme de c dans l’extension Qp ⊂ K. Si l’on ne connaît qu’une valeur approchée de c, disons modulo pN , on en déduit une valeur de cE modulo pN , donc, via la formule (3.13), la valeur de tE modulo pN −d , la perte de précision étant due au fait que c ≡ 0 (mod p). C’est pour pallier cet inconvénient que Satoh utilise l’isogénie duale ψ, dite Verschiebung ; comme E est

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

67

ordinaire, ψ est séparable et la constante analogue c qui intervient dans le calcul de la trace est une unité de W . √ Une fois calculé tE modulo pN , l’inégalité de Hasse |tE | 6 2 q permet d’en dé√ duire tE si pN > 4 q, c’est-à-dire si N > d2 , voire d2 + 2 si p = 2. Décrivons rapidement la complexité de l’algorithme obtenu. Comme il faut calculer c modulo pN , où N = O(d), et que la précision augmente de 1 à chaque itération, le nombre d’itérations à effectuer est O(d). Par ailleurs, la taille des objets à manipuler, des éléments de (Z/pN Z)[x]/(f (x)) dont la multiplication nécessite ‹ O(N d log p) 2 ‹ opérations, d’où une complexité de O(d log p) opérations pour calculer c. Comme l’a remarqué Harley [61], les techniques efficaces pour calculer les résultants permettent de calculer la norme de c modulo pN en ‹ O(N d log p) opérations. Par suite, la complexité de l’algorithme de calcul de |E(F)| suivant la méthode de Satoh est ‹ O(d2 log p). Suite à [116], la complexité en espace est du même ordre. Il convient de remarquer qu’elle n’est polynomiale en log q que si la caractéristique p du corps est fixe. Toutefois, pour les applications cryptographiques, on choisit souvent p = 2 et l’algorithme ainsi obtenu est très efficace. En 2002, Fouquet, Gaudry et Harley ont ainsi pu calculer le nombre de points d’une courbe elliptique sur un corps fini de cardinal 28 009 en environ 300 h de calcul ; le stockage des données a nécessité plus de 15 Go (voir [49]) ! 3.2.5. Moyenne arithmético-géométrique. — La moyenne arithmético-géométrique M(a, b) de deux nombres réels, disons strictement positifs, a et b, est la limite commune des deux suites (an ) et (bn ) définies par les relations de récurrence p an + bn (3.20) an+1 = , bn+1 = an bn , 2 et l’initialisation a0 = a, b0 = b. Ainsi que l’a découvert C.-F. Gauss en 1799, elle est reliée aux intégrales elliptiques par les formules Z π/2 Z ∞ dt π dx p p =2 (3.21) = 2 M(a, b) x(x + a2 )(x + b2 ) 0 0 a2 cos2 t + b2 sin t (changement de variables x = b2 tan2 t) et permettent donc de calculer très rapidement les périodes de la courbe elliptique d’équation (3.22)

y 2 = x(x + a2 )(x + b2 ).

(L’autre période est obtenue en considérant la courbe tordue, d’équation y 2 = x(x − a2 )(x − b2 ), et fait intervenir M(a + b, a − b).) La raison d’être de la formule (3.21) est l’existence d’une isogénie de degré 2 entre la courbe elliptique précédente et celle d’équation Ç Å ã å a+b 2 2 (x + ab) . (3.23) y =x x+ 2

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

68

A. CHAMBERT-LOIR

Cette isogénie fournit un changement de variables dans l’intégrale elliptique qui ramène à une intégrale similaire où a et b sont remplacés par a1 et b1 . Les suites (an ) et (bn ) apparaissent ainsi comme un procédé simple pour calculer une suite d’isogénies de degré 2 particulières, en l’occurrence la seule fournissant une suite de courbes elliptiques dont les points d’ordre 2 sont tous définis sur R. En 2000, J.-F. Mestre, voir [88], avait montré comment une variante 2-adique de la moyenne arithmético-géométrique permet de calculer efficacement relèvement canonique et nombre de points lorsque p = 2. L’algorithme agm qui en résulte est essentiellement équivalent (mais antérieur !) à la modification par Vercauteren [116] de celui de Satoh ; son implémentation est cependant très aisée et son exécution plus rapide. Gaudry, Harley, Lercier, Lubicz le mirent en œuvre fin 2002 dans des corps de très grand degré, le record semblant être détenu par Harley qui a pu calculer un tel cardinal |E(Fq )|, pour q = 2130 020 . (Un tel corps possède une base normale engendrée par une somme de Gauss, ce qui permet d’accélérer très notablement certains algorithmes.) Profitons-en pour donner des formules. Dans la suite, nous raisonnerons en fait sur la quantité ξ = a/b, dont le carré est l’invariant de Legendre de la courbe elliptique en question. Dans ce paragraphe, supposons que p = 2 et que q = pd , pour d > 1. Soit E une courbe elliptique ordinaire sur Fq , donnée par une équation y 2 + xy = x3 + c

(3.24)

où c ∈ F∗ est l’inverse de l’invariant j. (Ces courbes sont celles dont la 4-torsion est définie sur Fq ; on s’y ramène par une torsion quadratique.) Comme dans le cas complexe, le calcul de la moyenne arithmético-géométrique nécessite un choix de racines √ carrées ; pour tout t ∈ W tel que t ≡ 1 (mod 8), on note t l’unique élément de W congru à 1 modulo 4. Soit ξ4 un élément de W tel que ξ4 ≡ 1 + 8c (mod 16). On définit alors une suite (ξn ) par récurrence en posant, pour n > 4, ξn+1 =

(3.25)

1 + ξn √ . 2 ξn

Pour 0 6 i < d, la suite (ξdn+i ) converge vers un élément ξi∗ dont le carré est l’invariant i de Legendre de la courbe Ei = E (σ ) , E désignant le relèvement canonique de E. En outre, si l’on pose (3.26)

µn =

2ξn 1 + ξn

et tn = µn σ(µn ) . . . σ d−1 (µn ) = NK/Q2 (µn ),

on a, pour tout entier n > 0, la congruence

ASTÉRISQUE 317

(968)

(3.27)

COMPTER (RAPIDEMENT) ...

q + 1 − |E(F)| = Tr(πE ) ≡ tn +

q tn

69

(mod 2n ),

√ d’où le calcul de |E(F)| dès que 2n > 4 q, c’est-à-dire n > 12 d + 2. 3.2.6. Généralisation aux courbes de genre supérieur. — En 1836, Richelot a démontré l’existence d’un algorithme permettant de calculer les « intégrales hyperelliptiques de genre 2 », généralisant ainsi la formule (3.21). Comme dans le cas elliptique, ce théorème s’interprète en termes d’isogénies de surfaces abéliennes, voir [17]. Dans sa lettre [88], Mestre proposait d’utiliser ces relations de récurrence dans le cas 2-adique pour calculer le nombre de points d’une courbe de genre 2 définie sur un corps fini de caractéristique 2. Dans [89], il reprend ce sujet en genre supérieur à l’aide des formules de duplication des fonctions θ. Elles permettent de calculer par un procédé itératif (convergeant vers la moyenne de Borchardt) un déterminant 2 × 2 formé à l’aide des périodes réelles d’une courbe hyperelliptique de genre 2 définie sur R dont les points de Weierstrass sont réels ; l’initialisation de l’algorithme utilise les formules de Thomae (voir par exemple [94], chap. 3A, §8). Mestre montre que cet algorithme est d’une grande utilité pour calculer le nombre de points d’une courbe hyperelliptique ordinaire sur un corps fini. Précisément, étant donnée une courbe C de genre 2 sur un corps fini Fq , de caractéristique 2, cet algorithme, convenablement interprété dans l’anneau W des vecteurs de Witt, permet de calculer le relèvement C de C sur W dont la jacobienne JC est le relèvement canonique de celle, JC , de C. En outre, il fournit le déterminant de l’endomorphisme relevant celui de Verschiebung ψq agissant sur le W -module des formes différentielles globales de C . Autrement dit, des quatre valeurs propres du frobenius π1 , . . . , π4 on peut déterminer le produit π1 π2 des deux qui sont inversibles modulo 2. Cette dernière partie de l’algorithme, à savoir l’obtention du produit α = π1 . . . πg des valeurs propres π1 , . . . , π2g qui sont des unités 2-adiques, se généralise aux courbes hyperelliptiques ordinaires de tout genre g. Elle a en outre été étendue aux courbes de genre 3 non hyperelliptiques par Ritzenthaler [103] ; au lieu des points de Weierstrass qui apparaissent dans les formules de Thomae, il fait usage des bitangentes. Par contre, l’algorithme ne calcule pas le relèvement canonique de la jacobienne, pour la bonne raison que ce n’est pas forcément une jacobienne si g > 4.(2) Une fois obtenu α, il n’est pas toujours possible d’en déduire les πi , au moins lorsque g > 4. Mestre donne par exemple un exemple de variétés abéliennes de dimension 4 sur F2 , ordinaires, non géométriquement isogènes et dont les invariants α (2)

Pour être précis, ce résultat n’est prouvé dans [42] que sous l’hypothèse que la caractéristique du corps est différente de 2...

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

70

A. CHAMBERT-LOIR

sont égaux. Posons toutefois β = α + q g α−1 et considérons, à la suite de Mestre, le polynôme minimal P de β sur Z (calculé par exemple à l’aide d’une version 2-adique de l’algorithme LLL). Si P est de degré 2g−1 , ce qui arrive si par exemple la jacobienne JC de C est simple, les racines de P sont les éléments Q Q πi i6∈I πi q |{I| Qi∈I + q |I| Q . i6∈I πi i∈I πi Cela permet de déterminer les πi au signe près, d’où le cardinal de JC (Fq ) à une ambiguïté finie près. À l’opposé, si P est degré 1, c’est-à-dire si β ∈ Z, alors JC est géométriquement isogène à une puissance d’une courbe elliptique. Ces deux remarques permettent de démêler la situation lorsque g = 2 ou 3. En genre 2, l’algorithme a été étudié et implémenté par Lercier et Lubicz [82] ; sa complexité est ‹ O(n2 ), tant en espace qu’en temps. Il leur a permis de calculer en quelques jours le cardinal de courbes de genre 2 sur un corps à 232 770 éléments, et de genre 3 sur un corps à 24 098 éléments. En genre 3, cette méthode a permis à Ritzenthaler (voir [103]) de calculer en deux semaines le nombre de points rationnels d’une courbe quartique plane (une courbe non hyperelliptique de genre 3) sur un corps de cardinal 25 002 . Très récemment, Carls et Lubicz ont annoncé dans [23] l’existence d’un algorithme (quasi-quadratique en l’exposant de la caractéristique du corps) permettant de calculer le nombre de points d’une courbe hyperelliptique ordinaire, généralisant ainsi en toute caractéristique les algorithmes de Satoh et Mestre. Cet algorithme est fondé sur l’existence, due à Carls [22], de structures thêta canoniques sur le relèvement canonique d’une variété abélienne ordinaire. 3.3. Cohomologie de Monsky–Washnitzer En 2001, K. Kedlaya [71] a proposé un algorithme calculant le nombre de points de courbes hyperelliptiques. Le rôle principal n’est plus tenu par la jacobienne de la courbe, comme dans les algorithmes précédents, mais par sa cohomologie de Monsky– Washnitzer dont Kedlaya montre qu’elle peut être calculée efficacement, au moins si la caractéristique du corps est petite. (En 1982, l’article [69] de Kato et Lubkin, apparemment passé inaperçu, traitait le cas des courbes elliptiques.) Soit F un corps fini, de caractéristique p, de cardinal q. Soit W l’anneau des vecteurs de Witt de F et soit K son corps des fractions. Notons σ l’automorphisme de Frobenius sur F, son relèvement à W et son extension à K ; si q = pd , on a σ d = id. 3.3.1. Définition de la cohomologie de Monsky–Washnitzer. — Rappelons ce dont il s’agit, en renvoyant à [90, 9, 8, 102, 50, 79] pour plus de détails. Considérons une variété algébrique affine et lisse X définie sur F. Le but est de définir une sorte de cohomologie de De Rham de X munie d’un endomorphisme de Frobenius induit par

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

71

celui de X, de sorte que la fonction zêta de X se calcule par une formule de Lefschetz. Le premier pas consiste à relever X en caractéristique 0. D’après un théorème d’Elkik [46], il existe un W -schéma affine et lisse X dont la réduction modulo p est égale à X. Soit X ,→ AnW une immersion fermée de X dans l’espace affine sur W , et soit f1 , . . . , fm ∈ W [x1 , . . . , xn ] des générateurs de l’idéal de X . Si A désigne l’algèbre W [x1 , . . . , xn ]/(f1 , . . . , fm ) de X , on a donc un isomorphisme entre A/pA et l’anneau A des fonctions de X. Notons Ω∗A/W le complexe de De Rham de A ; le A-module Ω1A/W est engendré P ∂f par des éléments dx1 , . . . , dxn , liés par les relations dfj = ni=1 ∂xji dxi = 0 ; enfin, V ΩkA/W = k Ω1A/W . La cohomologie de ce complexe est assez pathologique, même si X est la droite affine ; en revanche, après tensorisation par K, on obtient d’après un théorème de Grothendieck [58] la cohomologie de De Rham de XK . Toutefois, l’endomorphisme (semi-linéaire) de Frobenius de A, ϕ 7→ x 7→ xp , n’a en général pas de relèvement à A ; dans le cas des courbes elliptiques ordinaires, il aurait fallu avoir choisi précisément le relèvement canonique. P Introduisons alors la W -algèbre W [x1 , . . . , xn ]† des séries formelles f = am xm ∈ W [[x1 , . . . , xn ]] qui convergent dans un polydisque de rayon > 1, autrement dit, dont les coefficients am vérifient une inégalité de la forme |am | 6 Cρ|m| , avec ρ < 1. Par définition, l’espace-dague A† , dit encore complété faible, de l’algèbre A est le quotient de l’algèbre W [x1 , . . . , xn ]† par l’idéal engendré par les polynômes fi . C’est un relèvement de l’anneau de X, au sens où A† /pA† ' A. À isomorphisme près, il ne dépend que de la réduction modulo p de l’algèbre A, c’est-à-dire que de X. L’introduction de A† permet en outre l’existence d’un relèvement semi-linéaire, noté ϕ, de l’endomorphisme de Frobenius de A à A† . Le complexe de De Rham de l’algèbre A† est le complexe Ω∗A† /W des formes différentielles surconvergentes, donné par Ω1A† /W = Ω1A/W ⊗A A† ,

ΩkA† /W =

k ^

Ω1A† /W ,

avec la différentielle évidente ; c’est un relèvement du complexe de De Rham de X. La cohomologie de Monsky–Washnitzer de X est alors définie par (3.28)

i HMW (X/K) = H i (Ω∗A† /W ) ⊗W K.

L’action de l’endomorphisme ϕ de A† induit un endomorphisme semi-linéaire bijectif i de HMW (X/K), c’est-à-dire que l’on a (3.29)

ϕ(aω) = σ(a)ϕ(ω),

i pour a ∈ K, ω ∈ HMW (X/K),

Même si ce n’est pas évident sur leur définition, ces K-espaces vectoriels, de même que l’action de ϕ, ne dépendent que de X, et sont fonctoriels en X (la tensorisation par K est nécessaire à ce point).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

72

A. CHAMBERT-LOIR

Ils sont nuls pour i < 0 ou i > dim X, de dimension finie (résultat dû indépendamment à Berthelot [11], Kedlaya [72] et Mebkhout [86]) et donnent lieu à une formule des traces de Lefschetz : |X(F)| =

(3.30)

dim XX

−1 i (−1)i q dim X Tr(q dim X FX |HMW (X/K)),

i=0 d

où FX = ϕ est aussi induit par l’endomorphisme de Frobenius de X, donné par l’élévation à la puissance q sur le faisceau OX . La définition a été étendue par P. Berthelot au cas des variétés algébriques générales sur F, mais nous ne considérerons ici que celui de variétés lisses. Les espaces i de cohomologie rigide Hrig (X/K) qu’il définit fonctoriellement sont des K-espaces vectoriels, munis d’un endomorphisme semi-linéaire bijectif « de Frobenius » ϕ (un σ-isocristal). Ils sont nuls pour i < 0 ou i > 2 dim X, de dimension finie, et donnent lieu à une formule des traces analogue à la précédente, si ce n’est que la somme va de i = 0 à i = 2 dim X. −1 L’apparition de q dim X FX dans la formule (3.30) rappelle qu’il s’agit de cohomologie sans support ; Berthelot a aussi défini une cohomologie rigide à supports compacts, reliée dans le cas lisse à la cohomologie rigide par une dualité de Poincaré [10].

Lorsque X est affine et lisse, ses espaces de cohomologie rigide coïncident avec ceux définis par Monsky et Washnitzer. Par ailleurs, lorsque X est propre et lisse, sa i i cohomologie cristalline Hcris (X/W ) définit un W -réseau de Hrig (X/K), stable par ϕ. Lorsque, de plus, X est la réduction modulo p d’un W -schéma propre et lisse X , i Hcris (X/W ) s’identifie à la cohomologie de De Rham de X , définie comme l’hypercohomologie du complexe de De Rham Ω∗X . Plus généralement, soit X ∗ un W -schéma propre et lisse, soit Y un diviseur de Cartier relatif de X ∗ lisse sur W (voire à croisements normaux stricts) et supposons que X = X ∗ \ Y . Notons X ∗ , Y , X les réductions de X ∗ , Y et X . Par un théorème de Baldassarri et Chiarellotto [7], la cohomologie de De Rham algébrique i i HdR (XK /K) et la cohomologie rigide Hrig (X/K) sont des K-espaces vectoriels isomorphes (voir aussi [26] où il est montré que l’isomorphisme construit précédemment est compatible aux poids). Si, de plus, X est affine, d’anneau A, sa cohomologie rigide i i Hrig (X/K) = HMW (X/K), définie comme la cohomologie du complexe Ω∗A† /W ⊗ K, est donc égale à la cohomologie du complexe Ω∗A/W ⊗ K. En outre, d’après un théorème de Atiyah et Hodge ([65], voir aussi [31, 33]), on a alors un isomorphisme entre la cohomologie de De Rham de XK∗ à pôles logarithmiques le long de YK et la cohomologie de De Rham de XK : (3.31)

ASTÉRISQUE 317

i i HdR ((X ∗ , Y )) ⊗W K ' HdR (X ⊗W K),

(968)

COMPTER (RAPIDEMENT) ...

73

d’où un moyen concret, ne faisant intervenir qu’un complexe de K-espaces vectoriels de dimensions finies, pour calculer la cohomologie rigide de X. Sous ces hypothèses, la cohomologie log-cristalline du couple (X ∗ , Y ) et la cohomoi logie de De Rham à pôles logarithmiques HdR ((X ∗ , Y )) sont des W -modules canonii quement isomorphes. Ils définissent un W -réseau de la cohomologie rigide Hrig (X/K), [109], munissant ainsi la cohomologie rigide d’une structure entière naturelle, stable par le frobenius ; cela peut être utile pour les calculs effectifs. Dans la suite, nous qualifierons cette situation géométrique de « bien relevée ». La cohomologie cristalline des variétés propres et lisses sur F est une cohomologie de Weil. D’après [70], les espaces de cohomologie cristalline d’une telle variété X ont même dimension que les espaces correspondants en cohomologie `-adique (pour i ` 6= p) et le polynôme caractéristique de FX agissant sur Hcris (X/W ) ⊗ K est le même (avec les notations du paragraphe 2.3.1) que celui de ϕ agissant sur Hci (X, Q` ). En i particulier, Tr(FX |Hrig (X/K)) est un entier et il vérifie la majoration (3.32)

i i |Tr(FX |Hrig (X/K))| 6 q i/2 dimK Hrig (X/K).

D’après [25], cette majoration vaut encore (de même bien sûr que sa grande cousine `-adique, établie par Deligne [36]) lorsque X est seulement supposé lisse sur F. 3.3.2. Principe de l’algorithme de Kedlaya. — Soit X une variété algébrique définie sur F. Pour calculer le cardinal de X(F), Kedlaya suggère de calculer les polynômes caractéristiques du frobenius agissant sur la cohomologie rigide de X et d’en déduire |X(F)| par la formule des traces de Lefschetz. Supposons que l’on soit dans une situation géométrique bien relevée et que X soit un sous-schéma fermé de l’espace affine de dimension n, donné par des générateurs (f1 , . . . , fm ) de son idéal dans W [x1 , . . . , xn ]. Notons A l’anneau de X et A† son complété faible. L’algorithme de Kedlaya est le suivant. a) Calculer le relèvement ϕ du frobenius sur A† , c’est-à-dire donner un algorithme pour calculer l’image d’un élément donné à une précision p-adique arbitraire. Compte tenu de la condition de surconvergence imposée aux séries, un tel algorithme ne manipule que des polynômes. b) Calculer des formes différentielles sur X dont les classes forment une base de la cohomologie de De Rham de XK (il est judicieux, mais pas nécessaire, de choisir des formes différentielles entières, au sens où leur classe de cohomologie appartient à la cohomologie log-cristalline). c) La cohomologie de Monsky–Washnitzer de X est celle du complexe Ω∗A† /W ⊗ K des formes différentielles surconvergentes, mais les classes des formes différentielles algébriques précédemment calculées en forment une base ; donner un algorithme « de réduction » calculant à une précision p-adique arbitraire la classe

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

74

A. CHAMBERT-LOIR

de cohomologie d’une forme fermée surconvergente (connue à une précision suffisante). d) En déduire une approximation p-adique de la matrice M de l’endomorphisme k semi-linéaire ϕ de HMW (X/K), pour 0 6 k 6 dim X. Le point délicat est que la primitive d’une forme exacte à coefficients entière peut faire apparaître des dénominateurs (exemple : xp−1 dx), si bien que la structure entière de Ω1A† n’induit k pas sur HMW (X/K) sa structure entière donnée par la cohomologie cristalline (lemme 2 de [71], voir aussi le th. 2.2.5 de [1] pour un énoncé général). e) En déduire une approximation p-adique de la matrice M σ(M ) · · · σ d−1 (M ), de k l’endomorphisme K-linéaire FX = ϕq de HMW (X/K), puis de sa trace. f) Compte tenu de l’inégalité (3.32), on peut en déduire la trace elle-même, puis éventuellement |X(F)|, si la précision atteinte à l’étape précédente est suffisante. 3.3.3. Le cas des courbes hyperelliptiques. — La méthode que nous venons d’esquisser est susceptible de s’appliquer dans des situations très générales, mais une présentation détaillée ne semble disponible dans la littérature que pour les courbes et le complémentaire d’une hypersurface de P3 . Nous considérons ci-dessous le cas des courbes hyperelliptiques qui faisait l’objet de l’article initial de Kedlaya [71] lorsque p > 2 et que Denef et Vercauteren [38] ont étendu au cas p = 2 ; voir aussi [115, 43]. Soit X ∗ une courbe hyperelliptique définie sur F. C’est un revêtement double de la droite projective ; les points de ramification de ce revêtement sont appelés points de Weierstrass ; notons w leur nombre. Si p 6= 2, on a w = 2g + 2, mais si p = 2, toute valeur de w telle que 1 6 w 6 g + 1 est possible. Soit Y l’ensemble des points de Weierstrass et posons X = X ∗ \ Y . De la cohomologie rigide de X, X ∗ , Y , on sait un certain nombre de choses 0 0 – on a Hrig (X/K) = Hrig (X ∗ /K) = K, les endomorphismes de Frobenius étant donnés par σ ; 0 0 – l’espace Hrig (Y /K) est la somme des espaces Hrig (P/K), où P parcourt les points 0 de Y ; en outre, si P est de degré d sur F, Hrig (P/K) s’identifie à l’extension non ramifiée de degré d de K munie de son endomorphisme de Frobenius ; 2 – on a Hrig (X ∗ /K) = K et le frobenius est donné par pσ.

De la suite exacte de localisation pour la cohomologie rigide à supports compacts et de la dualité de Poincaré, on déduit alors une suite exacte (3.33)

1 1 0 2 0 → Hrig (X ∗ /K) → Hrig (X/K) → Hrig (Y /K)(−1) → Hrig (X ∗ /K) → 0.

En outre, les morphismes de cette suite exacte commutent aux frobenius, le (−1) 0 au milieu de cette formule signifiant que le frobenius de Hrig (Y /K) est multiplié par p. Par ailleurs, l’involution hyperelliptique ε agit sur ces espaces de cohomologie

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

75

et les découpe en une partie paire et une partie impaire, notées respectivement d’un symbole + et −, donnant lieu à une suite exacte (3.34)

1 0 2 0 → Hrig (X/K)+ → Hrig (Y /K)(−1) → Hrig (X ∗ /K) → 0

1 1 (car Hrig (X ∗ /K)+ ' Hrig (P1 /K) = 0) et un isomorphisme

(3.35)

1 1 Hrig (X ∗ /K)− ' Hrig (X/K).

1 Il s’agit donc de calculer Hrig (X/K)− . Les références ci-dessus ne traitent en fait que le cas où l’un des points de Weierstrass est rationnel. Dans ce cas, la courbe X ∗ possède une équation plane de la forme (affine)

(3.36a)

y 2 = f (x),

f ∈ F[x],

deg(f ) = 2g + 1

si p 6= 2 ; lorsque p = 2, elle a une équation du type (3.36b)

y 2 + f (x)y = g(x),

deg(f ) 6 g,

deg(g) = 2g + 1.

Avec ces équations, l’involution hyperelliptique est donnée par (x, y) 7→ (x, −y), resp. (x, y) 7→ (x, −f (x) − y) ; la projection vers P1 est donnée par l’application (x, y) 7→ x ; elle applique le point de Weierstrass choisi sur le point à l’infini de P1 . Les autres points de Weierstrass sont ceux de coordonnées (x, y) tels que f (x) = 0. Lorsque p 6= 2, ce sont ceux d’ordonnée nulle ; lorsque p = 2, l’application d’une transformation convenable de la forme (x, y) 7→ (x, y + α(x)) permet de supposer que g s’annule en chacun de ces points ; leur ordonnée est encore nulle. Soit h le produit des facteurs irréductibles de f ; le diviseur de h est étale sur F et, au point à l’infini près, a pour support les points de Weierstrass de X ∗ . Soit B l’anneau F[x, h(x)−1 ] ; l’anneau A de la courbe affine X est un B-module libre de rang 2, de base (1, y), y vérifiant l’équation (3.36a) si p 6= 2, resp. (3.36b) si p = 2. En particulier, A est étale sur B. Lorsque p 6= 2, choisissons un relèvement fe de f dans l’anneau W [x] de même degré que f et posons e h = fe. L’équation analogue à (3.36a) définit une courbe hyperellip∗ tique X de genre g qui relève la courbe X ∗ ; le schéma Y des points de Weierstrass de X ∗ est étale sur W et la W -courbe affine X = X ∗ \ Y relève X. Notons B l’anneau W [x, fe(x)−1 ] ; l’anneau A de X est égal à B[y]/(y 2 − fe) et est étale sur B. Lorsque p = 2, le diviseur des points de Weierstrass d’une courbe X ∗ qui relève X ∗ n’est jamais étale sur W ; il convient alors de choisir un point de Weierstrass par classe résiduelle. De manière précise, Denef et Vercauteren commencent par relever h en un polynôme e h de même degré puis exigent que chaque facteur irréductible de e h divise fe et ge avec la même multiplicité que celle dont le facteur irréductible correspondant de h divise respectivement f et g. En particulier ge s’annule en toute racine de fe. L’équation analogue à (3.36b) définit alors une courbe hyperelliptique X ∗ de genre g

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

76

A. CHAMBERT-LOIR

qui relève la courbe X ∗ ; notons Y la réunion du point à l’infini et du lieu défini par le polynôme e h. C’est un sous-schéma étale de X ∗ dont la réduction modulo p a pour support l’ensemble des points de Weierstrass de X ∗ . Posons X = X ∗ \ Y . Posons B = W [x, e h(x)−1 ] ; l’anneau A de X est B[y]/(y 2 + fey − ge). Dans les deux cas, l’anneau B † peut être décrit explicitement, comme un anneau de séries en x et e h(x)−1 dont les coefficients tendent assez vite vers 0. L’anneau A† † est alors une B -algèbre étale, libre de rang 2, de base (1, y). Pour p = 2, ce sont les mêmes anneaux que ceux qu’on aurait obtenu en remplaçant Y par le sous-schéma des points de Weierstrass. Pour relever le frobenius, nous commençons par choisir sur l’anneau W [x] l’unique P P relèvement σ-linéaire tel que x 7→ xp , autrement dit an xn 7→ σ(an )xpn . Comme A est étale sur W [x], cet homomorphisme s’étend de manière unique en un homomorphisme σ-linéaire, noté ϕ, de A† dans lui-même. Même si cela résulte d’une variante due à Bosch [15], du théorème d’approximation d’Artin pour les anneaux de séries surconvergentes, nous devons calculer ϕ explicitement, et en particulier déterminer l’élément ϕ(y) de A† qui relève y p et tel que ϕ(y)2 = feσ (xp ) lorsque p 6= 2 et ϕ(y)2 + feσ (xp )ϕ(y) − geσ (xp ) si p = 2. Supposons d’abord p 6= 2 ; il existe un élément h ∈ W [x] tel que feσ (xp ) = (fe(x))p +ph(x), car σ relève l’automorphisme de Frobenius de F. On pose alors Ç å1/2 å ∞ Ç X h(x) 1/2 k h(x)k p p (3.37) ϕ(y) = y 1 + p p . =y k fe(x)p fe(x)pk k=0

La présence des coefficients pk permet d’analyser très facilement la convergence de cette série. En particulier, l’élément ϕ(y) écrit appartient à A† et vérifie l’équation considérée. Dans le cas p = 2, le principe est similaire : comme on a pris soin de placer les points de Weierstrass sur l’axe y = 0, y est inversible dans A† et on peut chercher ϕ(y) sous la forme y p u, avec u ≡ 1 (mod p) ; je renvoie à [38], lemma 1, pour les détails. Signalons aussi qu’en pratique, ϕ(y) n’est pas calculé en développant des séries entières mais en appliquant la méthode de Newton. ‹ est étale sur W , le théorème de comparaison entre cohomologies de De Comme Y 1 Rham algébrique et cohomologie rigide évoqué plus haut entraîne que HMW (X/K) (3) s’identifie au premier groupe de cohomologie de De Rham de X ⊗ K. Il en est de 1 même de la partie −, ce qui montre que HMW (X/K)− admet pour base les classes i −1 [x y dx], pour 0 6 i 6 2g − 1. Comme l’algorithme final n’utilisera qu’une précision finie, il est de toutes façons nécessaire de contrôler la valeur absolue des coefficients des différentielles exactes mises en jeu par une telle identification. L’« algorithme de C’est là qu’intervient le choix de Y en caractéristique 2 : il ne fallait pas enlever tous les points de Weierstrass de la courbe hyperelliptique X , mais seulement un par point de Weierstrass de la fibre spéciale.

(3)

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

77

réduction » permet d’écrire une forme différentielle fermée surconvergente à coefficients entiers ω comme somme de deux termes : d’une part une combinaison linéaire 1 explicite des formes différentielles qui constituent la base de HMW (X/K), d’autre part une forme reste dont un multiple explicite est la différentielle d’une forme différentielle surconvergente à coefficients entiers. Supposons ces deux points acquis et soit i ∈ {0, . . . , 2g − 1}. Pour calculer l’image par ϕ de la classe de la forme différentielle ωi = xi y −1 dx, il reste à effectuer les calculs suivants : – développer en série la forme différentielle

(3.38)

ϕ(ωi ) = ϕ(x)i ϕ(y)−1 dϕ(x) = pxpi+p−1 ϕ(y)−1 dx Ç å1/2 h(x) pi+p−1 e −(p−1)/2) = px f (x) 1+p y −1 dx, fe(x)p

à une précision p-adique suffisante ; – écrire le terme principal comme une somme de deux termes : le premier est une combinaison linéaire des formes différentielles ωk , pour 0 6 k 6 2g − 1, le second (qu’en fait on n’écrit pas) est une forme différentielle dont un multiple explicite est une forme exacte ; – de même, l’image du terme reste dans la cohomologie sera alors combinaison linéaire des classes ωi avec des coefficients p-adiquement petits. Si la précision a été choisie assez grande, on en déduit une approximation de l’image de [ωi ] par ϕ, donc une approximation de la matrice M de ϕ. La matrice de FX = ϕd est, quant à elle, donnée par M σ(M ) . . . σ d−1 (M ). Pour finir, si la précision est suffisante, on peut calculer la trace de FX (donc le cardinal de X(F)) et le déterminant de 1 − tFX (donc la fonction zêta de X). 3.3.4. Complexité et généralisations. — La complexité de l’algorithme que nous avons grossièrement décrit dépend de la précision requise pour effectuer les calculs ; je renvoie aux articles cités ainsi qu’à [54] pour l’analyse de cette complexité. Lorsque p 6= 2, il en ressort qu’elle est ‹ O(pg 4 d3 ) en temps et ‹ O(pg 3 d3 ) en espace. (Rappelons que d q = p .) Lorsque p = 2, la complexité est un peu moins bonne en temps, à savoir ‹ O(g 5 d3 ). Tout récemment, des idées remontant aux Chudnovsky ont permis de faire √ baisser la dépendance en p de linéaire à p (voir [62], ainsi que [18]). En pratique, l’algorithme de Kedlaya a permis de calculer le cardinal de courbes hyperelliptiques de genres 6 4 en quelques minutes ; le produit gd log2 p (approximativement égal au logarithme en base 2 du cardinal de la jacobienne) étant de l’ordre de 200 (p = 2, [38] ; p = 251, [54]). Par ailleurs, il a donné lieu à un certain nombre de généralisations : courbes superelliptiques (y m = f (x), [53]), courbes Ca,b (revêtements de P1 totalement ramifiés à

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

78

A. CHAMBERT-LOIR

l’infini) dans [37], etc. Pour les courbes, l’algorithme le plus général semble celui de Castryck, Denef et Vercauteren dans [24] qui concerne les courbes planes qui sont non dégénérées par rapport à leur polytope de Newton ; si p est fixé, la complexité en temps de cet algorithme est ‹ O(d3 g 6,5 ), celle en espace est ‹ O(d3 g 4 ). Enfin, l’article [1] utilise cette méthode de calcul de la cohomologie p-adique pour évaluer le rang du nombre de Picard de surfaces projectives lisses, ces deux quantités étant reliées par une conjecture de Tate qui relie le rang du groupe de Néron-Severi d’une surface projective lisse S définie sur F à la multiplicité de la valeur propre q de 2 l’endomorphisme FS sur Hrig (X/K). (Pour démontrer une majoration du nombre de Picard, la conjecture de Tate n’est bien sûr pas nécessaire.) 3.4. Variation de la cohomologie p-adique La complexité en temps des méthodes p-adiques décrites jusqu’ici est toujours exponentielle en la dimension de l’espace ambiant. Le dernier algorithme de ce texte, introduit par Lauder [75] en 2002, vise à supprimer ce défaut en tirant parti de la variation de la cohomologie p-adique dans une famille, longuement étudiée par Dwork dans les années 60. Plusieurs incarnations de cet algorithme sont actuellement disponibles : l’article original de Lauder [75], rédigé dans le cadre de la théorie de Dwork, concerne les familles d’hypersurfaces dont un membre est une hypersurface diagonale. Indépendamment, N. Tsuzuki [112] avait proposé un algorithme qui calcule des sommes de Kloosterman et le nombre de points des revêtements d’Artin-Scheier de Gm . R. Gerkmann [56] dans le cas des courbes elliptiques, puis H. Hubrechts (voir [67, 68, 66] ainsi que l’esquisse [76]) pour les courbes hyperelliptiques, ont utilisé cette méthode et proposé un algorithme calculant le cardinal d’une telle courbe, de genre g, définie sur un corps fini de cardinal pd , dont la complexité en espace est ‹ O(pd2 g 4 ) ; cela améliore l’algorithme de Kedlaya par rapport au paramètre d. Plus récemment, Lauder [77] a appliqué cette méthode à un pinceau de Lefschetz dont la variété est l’espace total, obtenant ainsi un algorithme récursif pour calculer la fonction zêta d’une variété algébrique sur un corps fini. Ces derniers algorithmes sont rédigés en termes de cohomologie rigide ou Monsky–Washnitzer. Comme cette énumération le montre, la portée de cette méthode est très générale ; je me contente cependant d’en esquisser ici le principe dans le cas d’une famille de courbes. On reprend les notations F, q, p, W et K. 3.4.1. La déformation. — Le but de l’algorithme est de calculer la fonction zêta d’une courbe X1 , ou plus simplement le cardinal de Xt (F), lorsque Xt est la fibre en un point t d’une famille de courbes paramétrée par un ouvert U de A1 . On peut

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

79

imaginer par exemple une famille de courbes hyperelliptiques donnée par une équation hyperelliptique Xt : y 2 = ft (x), où ft ∈ F[x, t] est de degré 2g + 1 en x, F étant un corps fini de cardinal q. Dans ce cas, on notera U le plus grand ouvert de A1 au-dessus duquel ft est séparable et de degré 2g + 1 ; son complémentaire est le lieu défini par le discriminant D(t) de ft . Si l’on s’intéresse à des courbes affines, il est prudent de considérer une famille propre et lisse u : X ∗ → U , un diviseur Y étale sur U , puis de poser X = X ∗ \ Y . Pour t ∈ U , Xt∗ , Yt , Xt désignent les fibres de X ∗ , Y , X au-dessus de t. L’algorithme de déformation repose sur le fait que lorsque t varie (en un certain 1 sens), les matrices de Frobenius de Hrig (Xt /K) vérifient une équation différentielle. L’idée de Lauder est de partir de la matrice en un point t = 0, supposée déjà calculée par une autre méthode, et de résoudre cette équation différentielle pour arriver au point t. Il y a en cohomologie rigide une notion d’image directe et les K-espaces vectoriels 1 de cohomologie rigide Hrig (Xt , K), pour t ∈ U , sont (en un certain sens que nous préciserons plus bas) les fibres d’un objet R1 (urig )∗ (X/P1 ) (cohomologie rigide relative) qui est, au moins conjecturalement(4), un F -isocristal surconvergent sur U . Pour en donner une description concrète, on suppose toute la situation bien relevée en caractéristique 0 en se donnant un ouvert U de P1W , complémentaire d’un W schéma ‹ = 0, une famille propre et lisse u : X ∗ → U et un diviseur Y étale d’équation D(t) de X ∗ , étale sur U . ‹ −1 ] et S † son complété faible ; soit σ l’endomorphisme Notons S l’anneau W [t, D(t) † semi-linéaire de S qui applique t sur tp . Identifions les éléments de SK à des séries † formelles en t ; alors, si f ∈ SK , σ(f (t)) = f σ (tp ), où f σ est la série formelle obtenue en appliquant σ aux coefficients de f . † Alors, R1 (urig )∗ (X/P1 ) est un SK -module E, libre de rang m = 2g − 1 + r (où g ∗ est le genre de Xt et r le nombre de points géométriques de Yt , c’est la version en famille de (3.34)), muni d’une connexion (3.39)

∇ : E → E ⊗S † Ω1S †

K

et d’un isomorphisme horizontal ϕ : σ ∗ E ' E. En outre, pour tout t ∈ F, de relève† ment de Teichmüller e t ∈ W considéré comme un homomorphisme d’anneaux SK → K, 1 E ⊗et K s’identifie à Hrig (Xt /K) et ϕ ⊗et 1 s’identifie à l’endomorphisme de Frobenius de la cohomologie rigide (noter que σ(e t) = e tp ). La connexion ∇ est bien sûr un avatar de la connexion de Gauss-Manin en cohomologie de De Rham (et devrait être la même (4)

Avec les hypothèses imprécises ci-dessus, c’est vraisemblable, mais je ne l’ai pas vérifié en détail ; dans le cas, présenté plus bas, des courbes hyperelliptiques, cela résulte de l’étude explicite faite par Hubrechts.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

80

A. CHAMBERT-LOIR

lorsqu’on dispose d’un théorème de comparaison d’images directes entre cohomologie de De Rham et cohomologie rigide). Fixons une base (e1 , . . . , em ) de E et soit G(t)dt la matrice de ∇ dans cette base ; † on a donc, pour tout vecteur colonne X(t) à coefficients dans SK , (3.40)

∇ ((e1 , . . . , em )X(t)) = (e1 , . . . , em )(G(t)X(t) +

dX(t) ) dt. dt

Soit aussi F (t) la matrice de ϕ dans les bases (ei ⊗ 1) et (ei ) ; on a ainsi (3.41)

ϕ ((e1 , . . . , em )X(t) ⊗ 1) = (e1 , . . . , em )(F (t)X σ (tp ))

et l’horizontalité de ϕ se traduit par l’équation différentielle (3.42)

F 0 (t) + G(t)F (t) = F (t)Gσ (tp )ptp−1 .

3.4.2. Résolution et surconvergence. — Soit X(t) une matrice fondamentale de l’équation différentielle homogène (3.43)

X 0 (t) + G(t)X(t) = 0,

X(0) = Im .

Ses coefficients sont des séries formelles à coefficients dans K. La démonstration du théorème de Cauchy fait apparaître des dénominateurs ; par exemple, le rayon de convergence p-adique de la série exponentielle, solution de y 0 = y n’est que p−1/(p−1) . Toutefois, une astuce due à Dwork reposant sur la formule (3.44) ci-dessous montre que le rayon de convergence de X(t) est égal à 1, de sorte que X(t) converge dans le disque unité ouvert. Par horizontalité de ϕ, l’image de (e1 , . . . , em )X(t) ⊗ 1 par ϕ est annulée par ∇ ; il existe donc une matrice constante C telle que l’on ait F (t)X σ (tp ) = X(t)C, d’où F (0) = C et (3.44)

F (t) = X(t)F (0)X σ (tp )−1 .

Ayant calculé X(t), on peut tout autant calculer F (t), pourvu que la matrice F (0) ait été calculée auparavant, c’est-à-dire que l’on connaisse l’action du frobenius sur la cohomologie du membre X0 de notre famille. Ce n’est a priori qu’une série formelle à coefficients dans K, de même rayon de convergence que X(t). † Mais F (t) est bien plus : c’est une matrice à coefficients dans SK . Ce fait général, qui traduit la « surconvergence » de l’isocristal R1 (urig )∗ (X/P1 ) était déjà apparu dans cet exposé : la série θ de l’équation (3.4) dont on avait mentionné la décroissance vers 0 des coefficients est celle qui correspond à l’isocristal de Dwork sur la droite affine (voir par exemple [8], p. 28-29).

Puisque le développement en série formelle en l’origine définit un homomorphisme † injectif de SK dans K[[t]], on peut exprimer de manière unique chaque entrée de la

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

81

matrice F (t) comme une série de la forme

(3.45)

f (t) =

∞ X

‹ n, fn D(t)

n=−∞

‹ dont les coefficients tendent rapideoù les fn sont des polynômes de degrés < deg D ment vers 0 lorsque |n| → ∞. Supposons pour l’instant que l’on ait réussi à écrire les entrées de la matrice F (t) sous cette forme. Si t ∈ F est un point de U , on peut alors évaluer F en le relèvement ‹ de Teichmüller e t de t, car |t| = |D(t)| = 1, d’où une matrice F (e t) qui est celle du frobenius agissant sur la cohomologie rigide de la fibre Xt . Il reste à expliquer comment l’on peut calculer les fn . Dans le cas spécifique d’une famille de courbes hyperelliptiques, Hubrechts fait dans [68] toute l’analyse précédente en grand détail, et de manière explicite ; il prouve de fait la surconvergence de l’isocristal R1 (urig )∗ (X/P1 ) en établissant une minoration explicite des valuations p-adiques des coefficients des polynômes fn . Il peut alors considérer l’équation (3.45) comme un système d’équations linéaires à coefficients dans K. En chassant les dénominateurs et en se limitant à une précision p-adique donnée, on obtient un système linéaire en dimension finie dont on peut calculer une solution ; la précision obtenue est inférieure à la précédente car le système n’est pas inversible modulo p. Ainsi, Hubrechts est en mesure de prévoir quelle précision initiale est nécessaire dans tout ce calcul pour, in fine, obtenir les entrées de la matrice F (t) à une précision suffisante pour que la congruence qui en résultera sur la fonction zêta permette de la déterminer. En pratique, plutôt que de calculer une solution fondamentale X(t) de (3.43), puis G(t) par la formule (3.44), Hubrechts donne des algorithmes itératifs efficaces pour résoudre directement des équations différentielles du type (3.42). Pour les courbes elliptiques, l’algorithme ainsi décrit est moins rapide que l’agm, ce dernier étant cependant restreint en pratique au cas p = 2. Selon les données présentées à la fin de [68], l’algorithme est plus rapide que l’algorithme sea lorsque le degré est au moins 100 si p = 3, et 40 si p = 7. Le dénombrement d’une courbe elliptique sur un corps de cardinal 3500 nécessite un peu plus d’une heure de calcul et 50 Mo d’espace disque. En genre 2, il permit de calculer le nombre de points d’une courbe sur un corps de cardinal 3400 en une vingtaine d’heures et 120 Mo d’espace disque ; un tel calcul requerrait plusieurs Go avec l’algorithme de Kedlaya.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

82

A. CHAMBERT-LOIR

RÉFÉRENCES [1] T. G. Abott, K. S. Kedlaya & D. Roe – Bounding Picard numbers of surfaces using p-adic cohomology, in Arithmetic, Geometry, and Coding Theory (AGCT-10), 2006, arXiv:math.NT/0601508. [2] L. M. Adleman & M.-D. Huang – Primality testing and abelian varieties over finite fields, Lecture Notes in Math., vol. 1512, Springer, 1992. [3] , Counting points on curves and abelian varieties over finite fields, J. Symbolic Comput. 32 (2001), p. 171–189. [4] A. O. L. Atkin – The number of points of an elliptic curve modulo a prime, 1988. [5] , The number of points of an elliptic curve modulo a prime (II), 1992. [6] E. Bach – Explicit bounds for primality testing and related problems, Math. Comp. 55 (1990), p. 355–380. [7] F. Baldassarri & B. Chiarellotto – Algebraic versus rigid cohomology with logarithmic coefficients, in Barsotti Symposium in Algebraic Geometry (Abano Terme, 1991), Perspect. Math., vol. 15, Academic Press, 1994, p. 11–50. [8] P. Berthelot – Géométrie rigide et cohomologie des variétés algébriques de caractéristique p, Mém. Soc. Math. France 23 (1986), p. 7–32, Introductions aux cohomologies p-adiques (Luminy, 1984). [9] , Cohomologie rigide et cohomologie rigide à supports propres. Première partie, Prépublication, IRMAR, Université Rennes 1, 1996. [10] , Dualité de Poincaré et formule de Künneth en cohomologie rigide, C. R. Acad. Sci. Paris Sér. I Math. 325 (1997), p. 493–498. [11] , Finitude et pureté cohomologique en cohomologie rigide, Invent. Math. 128 (1997), p. 329–377, avec un appendice en anglais par A. J. de Jong. [12] I. F. Blake, G. Seroussi & N. Smart – Elliptic curves in cryptography, London Mathematical Society Lecture Note Series, vol. 265, Cambridge Univ. Press, 2000, Reprint of the 1999 original. [13] (éds.) – Advances in elliptic curve cryptography, London Mathematical Society Lecture Note Series, vol. 317, Cambridge Univ. Press, 2005. [14] E. Bombieri – On exponential sums in finite fields. II, Invent. Math. 47 (1978), p. 29–39. [15] S. Bosch – A rigid analytic version of M. Artin’s theorem on analytic equations, Math. Ann. 255 (1981), p. 395–404. [16] W. Bosma, J. Cannon & C. Playoust – The Magma algebra system. I. The user language, J. Symbolic Comput. 24 (1997), p. 235–265, Computational algebra and number theory (London, 1993).

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

83

[17] J.-B. Bost & J.-F. Mestre – Moyenne arithmético-géométrique et périodes des courbes de genre 1 et 2, Gaz. Math. 38 (1988), p. 36–64. [18] A. Bostan, P. Gaudry & É. Schost – Linear recurrences with polynomial coefficients and application to integer factorization and Cartier-Manin operator, SIAM Journal on Computing 36 (2007), p. 1777–1806. [19] C. Breuil, B. Conrad, F. Diamond & R. Taylor – On the modularity of elliptic curves over Q : wild 3-adic exercises, Amer. J. Math. 14 (2001), p. 843–939. [20] D. G. Cantor – On the analogue of the division polynomials for hyperelliptic curves, J. reine angew. Math. 447 (1994), p. 91–145. [21] R. Carls – A generalized arithmetico-geometric mean, Thèse, Rijksuniversiteit Groningen, 2004. [22]

, Canonical coordinates on the canonical lift, The Ramanujan Journal 22 (2007), p. 1–14, arXiv:math/0508007.

[23] R. Carls & D. Lubicz – A p-adic quasi-quadratic point counting algorithm, 2007, arXiv:math/0706.0234. [24] W. Castryck, J. Denef & F. Vercauteren – Computing Zeta Functions of Nondegenerate Curves, 2006, arXiv:math.NT/0607308. [25] B. Chiarellotto – Weights in rigid cohomology applications to unipotent F -isocrystals, Ann. Sci. École Norm. Sup. 31 (1998), p. 683–715. [26] B. Chiarellotto & B. Le Stum – A comparison theorem for weights, J. reine angew. Math. 546 (2002), p. 159–176. [27] H. Cohen – A course in computational algebraic number theory, Graduate Texts in Math., vol. 138, Springer, 1993. [28] H. Cohen, G. Frey, R. Avanzi, C. Doche, T. Lange, K. Nguyen & F. Vercauteren (éds.) – Handbook of elliptic and hyperelliptic curve cryptography, Discrete Mathematics and its Applications (Boca Raton), Chapman & Hall/CRC, Boca Raton, FL, 2006. [29] P. Cohen – On the coefficients of the transformation polynomials for the elliptic modular function, Math. Proc. Cambridge Philos. Soc. 95 (1984), p. 389–402. [30] J.-M. Couveignes – Computing `-isogenies using the p-torsion, in Algorithmic number theory (Talence, 1996), Lecture Notes in Comput. Sci., vol. 1122, Springer, 1996, p. 59–65. [31] P. Deligne – Équations différentielles à points singuliers réguliers, Springer, 1970, Lecture Notes in Mathematics, Vol. 163. [32]

, Formes modulaires et représentations `-adiques, in Séminaire Bourbaki 1968/69, Lecture Notes in Math., vol. 179, 1971, Exp. 355, p. 139–172.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

84

A. CHAMBERT-LOIR

[33]

, Théorie de Hodge II, Publ. Math. Inst. Hautes Études Sci. 40 (1972), p. 5–57.

[34]

, La conjecture de Weil, I, Publ. Math. Inst. Hautes Études Sci. 43 (1974), p. 273–307.

[35]

, Cohomologie étale (Séminaire de géométrie algébrique du Bois-Marie — SGA 4 21 ), Lecture Notes in Math., vol. 569, Springer, 1977, Avec la collaboration de J.-F. Boutot, A. Grothendieck, L. Illusie et J.-L. Verdier.

[36]

, La conjecture de Weil, II, Publ. Math. Inst. Hautes Études Sci. 52 (1980), p. 137–252.

[37] J. Denef & F. Vercauteren – Counting points on Cab curves using MonskyWashnitzer cohomology, Finite Fields Appl. 12 (2006), p. 78–102. [38]

, An extension of Kedlaya’s algorithm to hyperelliptic curves in characteristic 2, J. Cryptology 19 (2006), p. 1–25.

[39] M. Deuring – Die Typen der Multiplikatorringe elliptischer Funktionenkörper, Abh. Math. Sem. Hannsischen Univ. 14 (1941), p. 197–272. [40] W. Diffie & M. Hellman – New directions in cryptography, IEEE Trans. Inform. Theory 22 (1976), p. 644–654. [41] B. Dwork – On the rationality of the zeta function of an algebraic variety, Amer. J. Math. 82 (1960), p. 631–648. [42] B. Dwork & A. Ogus – Canonical liftings of Jacobians, Compositio Math. 58 (1986), p. 111–131. [43] B. Edixhoven – Point counting after Kedlaya, EIDMA-Stieltjes Graduate course, Leiden, September 22–26, 2003, http://www.math.leidenuniv.nl/ ~edix/oww/mathofcrypt/carls_edixhoven/kedlaya.pdf, 2003. [44] B. Edixhoven, J.-M. Couveignes, R. de Jong, F. Merkl & J. Bosman – On the computation of coefficients of a modular form, Tech. report, 2006, arXiv:math.NT/0605244. [45] N. Elkies – Explicit isogenies, 1991. [46] R. Elkik – Solutions d’équations à coefficients dans un anneau hensélien, Ann. Sci. École Norm. Sup. 6 (1973), p. 553–603. [47] A. Enge – Computing modular polynomials in quasi-linear time, Prépublication, http://www.lix.polytechnique.fr/Labo/Andreas.Enge/ vorabdrucke/modcomp.pdf, 2006. [48] A. Enge, P. Gaudry & F. Morain – A new record for SEA, http://www. lix.polytechnique.fr/~morain/SEA/d2100x.annonce, 2006. [49] M. Fouquet, P. Gaudry & R. Harley – An extension of Satoh’s algorithm and its implementation, J. Ramanujan Math. Soc. 15 (2000), p. 281–318.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

85

[50] J. Fresnel & M. van der Put – Rigid analytic geometry and its applications, Progress in Math., vol. 218, Birkhäuser, 2004. [51] G. Frey & H.-G. Rück – A remark concerning m-divisibility and the discrete logarithm problem in the divisor class group of curves, Math. Comp. 62 (1994), p. 865–874. [52] S. Galbraith & A. Menezes – Algebraic curves and cryptography, Finite Fields Appl. 11 (2005), p. 544–577. [53] P. Gaudry & N. Gürel – An extension of Kedlaya’s point-counting algorithm to superelliptic curves, in Advances in cryptology—ASIACRYPT 2001 (Gold Coast), Lecture Notes in Comput. Sci., vol. 2248, Springer, 2001, p. 480–494. [54]

, Counting points in medium characteristic using Kedlaya’s algorithm, Experiment. Math. 12 (2003), p. 395–402.

[55] P. Gaudry & R. Harley – Counting points on hyperelliptic curves over finite fields, in Algorithmic number theory (Leiden, 2000), Lecture Notes in Comput. Sci., vol. 1838, Springer, 2000, p. 313–332. [56] R. Gerkmann – Relative rigid cohomology and point counting in families of elliptic curves, 2005, http://joguinf.informatik.uni-mainz.de/~gerkmann/ legendre.pdf. [57] S. Goldwasser & J. Kilian – Primality testing using elliptic curves, J. ACM 46 (1999), p. 450–472. [58] A. Grothendieck – On the de Rham cohomology of algebraic varieties, Publ. Math. I.H.É.S. 29 (1966), p. 95–103. [59]

, Cohomologie `-adique et fonctions L, Lecture Notes in Math., vol. 589, Springer, 1972-73, SGA 5.

[60]

, Formule de Lefschetz et rationalité des fonctions L, in Séminaire Bourbaki, Vol. 9, Soc. Math. France, 1995, Exp. No. 279, Année 1964–1965, p. 41–55.

[61] R. Harley – Asymptotically optimal p-adic point-counting, e-mail à la liste NMBRTHRY, décembre 2002. [62] D. Harvey – Kedlaya’s Algorithm in Larger Characteristic, Internat. Math. Res. Notices (2006), à paraître, arXiv:math.NT/0610973. [63] H. Hasse – Beweis des Analogons der Riemannschen Vermutung für die Artinschen und F. K. Schmidtschen Kongruenzzetafunktionen in gewissen elliptischen Fällen. Vorläufige Mitteilung, Nachrichten von der Gesellschaft der Wissenschaften zu Göttingen, Mathematisch-Physikalische Klasse 42 (1933), p. 253–262, http://gdzdoc.sub.uni-goettingen.de/sub/digbib/loader? did=D64289.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

86

[64]

[65] [66] [67] [68] [69] [70] [71]

[72] [73] [74]

[75] [76] [77]

[78]

A. CHAMBERT-LOIR

, Zur Theorie der abstrakten elliptischen Funktionenkörper III. Die Struktur des Meromorphismenrings. Die Riemannsche Vermutung., J. reine angew. Math. 175 (1936), p. 193–208, http://gdzdoc.sub.uni-goettingen.de/ sub/digbib/loader?did=D255900. W. V. D. Hodge & M. F. Atiyah – Integrals of the second kind on an algebraic variety, Ann. of Math. 62 (1955), p. 56–91. H. Hubrechts – Memory efficient hyperelliptic curve point counting, 2006, arXiv:math.NT/0609032. , Point counting in families of hyperelliptic curves, 2006, arXiv:math.NT/0601438. , Point counting in families of hyperelliptic curves in characteristic 2, 2006, arXiv:math.NT/0607346. G. C. Kato & S. Lubkin – Zeta matrices of elliptic curves, J. Number Theory 15 (1982), p. 318–330. N. M. Katz & W. Messing – Some consequences of the Riemann hypothesis for varieties over finite fields, Invent. Math. 23 (1974), p. 73–77. K. S. Kedlaya – Counting points on hyperelliptic curves using MonskyWashnitzer cohomology, J. Ramanujan Math. Soc. 16 (2001), p. 323–338, Erratum : J. Ramanujan Math. Soc. 18 (2003), no. 4, 417–418. , Finiteness of rigid cohomology with coefficients, Duke Math. J. 134 (2006), p. 15–97. N. Koblitz & A. Menezes – A survey of public-key cryptosystems, SIAM Rev. 46 (2004), p. 599–634. D. R. Kohel – The AGM-X0 (N ) Heegner point lifting algorithm and elliptic curve point counting, in Advances in cryptology—ASIACRYPT 2003, Lecture Notes in Comput. Sci., vol. 2894, Springer, 2003, p. 124–136. A. G. B. Lauder – Deformation theory and the computation of zeta functions, Proc. London Math. Soc. 88 (2004), p. 565–602. , Rigid cohomology and p-adic point counting, J. Théor. Nombres Bordeaux 17 (2005), p. 169–180. , A recursive method for computing zeta functions of varieties, LMS J. Comp. Math. 9 (2006), p. 222–267, http://www.lms.ac.uk/jcm/9/ lms2006-005. A. G. B. Lauder & D. Wan – Counting points on varieties over finite fields of small characteristic, in Algorithmic Number Theory : Lattices, Number Fields, Curves and Cryptography (J. Buhler & P. Stevenhagen, éds.), Mathematical Sciences Research Institute Publications, Cambridge Univ. Press, 2007, à paraître, http://www.maths.ox.ac.uk/.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

87

[79] B. Le Stum – A course on rigid cohomology, Cambridge Tracts in Mathematics, Cambridge Univ. Press, 2007, à paraître. [80] R. Lercier – Computing isogenies in F2n , in Algorithmic number theory (Talence, 1996), Lecture Notes in Comput. Sci., vol. 1122, Springer, 1996, p. 197– 212. [81] R. Lercier & D. Lubicz – Counting points in elliptic curves over finite fields of small characteristic in quasi quadratic time, in Advances in cryptology— EUROCRYPT 2003, Lecture Notes in Comput. Sci., vol. 2656, Springer, 2003, p. 360–373. [82]

, A Quasi Quadratic Time Algorithm for Hyperelliptic Curve Point Counting, The Ramanujan Journal 12 (2006), p. 399–423, http://medicis. polytechnique.fr/~lercier/file/LL05.pdf.

[83] R. Lercier & F. Morain – Computing isogenies between elliptic curves over Fpn using Couveignes’s algorithm, Math. Comp. 69 (2000), p. 351–370. [84] J. Lubin, J-P. Serre & J. Tate – Elliptic curves and formal groups, 1964, Lecture notes prepared in connection with the seminars held at the Summer institute on Algebraic Geometry, Whitney State, Woods Hole, Massachusetts, http://ma.utexas.edu/users/voloch/lst.html. [85] U. M. Maurer & S. Wolf – The relationship between breaking the DiffieHellman protocol and computing discrete logarithms, SIAM J. Comput. 28 (1999), p. 1689–1721. [86] Z. Mebkhout – Sur le théorème de finitude de la cohomologie p-adique d’une variété affine non singulière, Amer. J. Math. 119 (1997), p. 1027–1081. [87] W. Messing – The crystals associated to Barsotti-Tate groups : with applications to abelian schemes, Lecture Notes in Math., vol. 345, Springer, 1976. [88] J.-F. Mestre – Utilisation de l’AGM pour le calcul de E(F2n ), Lettre à Harley et Gaudry, décembre 2000, http://www.math.jussieu.fr/~mestre. [89]

, Algorithmes pour compter des points de courbes en petite caractéristique et en petit genre, rédigé par David Lubicz, http://www.math.jussieu. fr/~mestre/rennescrypto.ps, 2002.

[90] P. Monsky & G. Washnitzer – Formal cohomology I, Ann. of Math. 88 (1968), p. 181–217. [91] F. Morain – Calcul du nombre de points sur une courbe elliptique dans un corps fini : aspects algorithmiques, J. Théor. Nombres Bordeaux 7 (1995), p. 255–282, Les Dix-huitièmes Journées Arithmétiques (Bordeaux, 1993). [92]

, La primalité en temps polynomial (d’après Adleman, Huang ; Agrawal, Kayal, Saxena), Astérisque 294 (2004), p. 205–230.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

88

A. CHAMBERT-LOIR

[93] V. Müller – Ein Algorithmus zur Bestimmung der Punktanzahl elliptischer Kurven über endlichen Körpern der Charakteristik größer drei, Thèse, University of Saarland, Saarbrücken, 1995. [94] D. Mumford – Tata lectures on Theta II, Birkhäuser, 1984. [95] A. Muzereau, N. Smart & F. Vercauteren – The equivalence between the DHP and DLP for elliptic curves used in practical applications, LMS J. Comput. Math. 7 (2004), p. 50–72. [96] A. Nitaj – L’algorithme de Cornacchia, Exposition. Math. 13 (1995), p. 358– 365. [97] The PARI Group – PARI/GP, version 2.3.1, 2006, http://pari.math. u-bordeaux.fr/. [98] J. Pila – Frobenius maps of abelian varieties and finding roots of unity in finite fields, Math. Comp. 55 (1990), p. 745–763. [99] , Counting points on curves over families in polynomial time, 1991, arXiv:math.NT/0504570. [100] S. C. Pohlig & M. Hellman – An improved algorithm for computing logarithms over GF(p) and its cryptographic significance, IEEE Trans. Information Theory IT-24 (1978), p. 106–110. [101] J. M. Pollard – Monte Carlo methods for index computation (mod p), Math. Comp. 32 (1978), p. 918–924. [102] M. van der Put – The cohomology of Monsky and Washnitzer, Mém. Soc. Math. France (N.S.) 23 (1986), p. 4, 33–59, Introductions aux cohomologies p-adiques (Luminy, 1984). [103] C. Ritzenthaler – Point counting on genus 3 non hyperelliptic curves, in Algorithmic number theory, Lecture Notes in Comput. Sci., vol. 3076, Springer, 2004, p. 379–394. [104] T. Satoh – The canonical lift of an ordinary elliptic curve over a finite field and its point counting, J. Ramanujan Math. Soc. 15 (2000), p. 247–270. [105] T. Satoh, B. Skjernaa & Y. Taguchi – Fast computation of canonical lifts of elliptic curves and its application to point counting, Finite Fields Appl. 9 (2003), p. 89–101. [106] R. Schoof – Elliptic curves over finite fields and the computation of square roots mod p, Math. Comp. 44 (1985), p. 483–494. [107] , Counting points on elliptic curves over finite fields, J. Théor. Nombres Bordeaux 7 (1995), p. 219–254, Les Dix-huitièmes Journées Arithmétiques (Bordeaux, 1993). [108] D. Shanks – Class number, a theory of factorization, and genera, in 1969 Number Theory Institute (Proc. Sympos. Pure Math., Vol. XX, State Univ. New York, Stony Brook, N.Y., 1969), Amer. Math. Soc., 1971, p. 415–440.

ASTÉRISQUE 317

(968)

COMPTER (RAPIDEMENT) ...

89

[109] A. Shiho – Crystalline fundamental groups. II. Log convergent cohomology and rigid cohomology, J. Math. Sci. Univ. Tokyo 9 (2002), p. 1–163. [110] V. Shoup – Lower bounds for discrete logarithms and related problems, in Advances in cryptology—EUROCRYPT ’97, Lecture Notes in Comput. Sci., vol. 1233, Springer, 1997, p. 256–266. [111] B. Skjernaa – Satoh’s algorithm in characteristic 2, Math. Comp. 72 (2003), p. 477–487. [112] N. Tsuzuki – Bessel F-isocrystals and an algorithm for computing Kloosterman sums, 2003. [113] J. Vélu – Isogénies entre courbes elliptiques, C. R. Acad. Sci. Paris Sér. I Math. 273 (1971), p. 238–241. [114] F. Vercauteren – The SEA algorithm in characteristic 2, http://homes. esat.kuleuven.be/~fvercaut/papers/SEA.pdf.gz, 2000. [115]

, Computing zeta functions of hyperelliptic curves over finite fields of characteristic 2, in Advances in cryptology—CRYPTO 2002, Lecture Notes in Comput. Sci., vol. 2442, Springer, 2002, p. 369–384.

[116] F. Vercauteren, B. Preneel & J. Vandewalle – A memory efficient version of Satoh’s algorithm, in Advances in cryptology—EUROCRYPT 2001 (Innsbruck), Lecture Notes in Comput. Sci., vol. 2045, Springer, 2001, p. 1–13. [117] D. Wan – Algorithmic theory of zeta functions over finite fields, in Algorithmic Number Theory : Lattices, Number Fields, Curves and Cryptography (J. Buhler & P. Stevenhagen, éds.), Mathematical Sciences Research Institute Publications, Cambridge Univ. Press, 2007, à paraître, http://www.maths.ox.ac.uk/. [118] W. C. Waterhouse – Abelian varieties over finite fields, Ann. Sci. École Norm. Sup. 2 (1969), p. 521–560, http://www.numdam.org/item?id=ASENS_1969_4_ 2_4_521_0. [119] A. Weil – Variétés abéliennes et courbes algébriques, Actualités Sci. Ind., vol. 1064, Hermann & Cie., Paris, 1948.

Antoine CHAMBERT-LOIR Université de Rennes 1 Irmar (UMR 6625 du CNRS) Campus de Beaulieu 35042 Rennes Cedex E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (969) Livres ouverts en géométrie de contact Vincent COLIN

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 969, p. 91 à 117

Novembre 2006

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT [d’après Emmanuel Giroux] par Vincent COLIN

1. INTRODUCTION La géométrie de contact a connu récemment de nombreuses avancées, en interaction avec d’autres branches des mathématiques. Le signal déclencheur de cette évolution a été l’introduction, par Emmanuel Giroux [32], d’une nouvelle description des variétés de contact en termes de livres ouverts. Brièvement ici, un livre ouvert dans une variété V est la donnée d’une sous-variété K de codimension deux de V à fibré normal trivial, appelée la reliure, et d’une fibration θ : V \ K → S 1 qui est l’application coordonnée angulaire sur un voisinage tubulaire trivialisé de K. Les fibres de θ sont appelées les pages. Les livres ouverts qui représentent les variétés de contact sont d’un type particulier : la reliure est elle-même une variété de contact, les pages sont des variétés de Stein et la monodromie, qui décrit la fibration θ, peut être représentée par un difféomorphisme symplectique de l’une des pages. On considère cette correspondance modulo une opération de stabilisation sur les livres ouverts : le plombage lagrangien positif. En dimension trois, elle devient alors bijective. En dimension trois, cette description est purement topologique, comme l’est la topologie symplectique en dimension deux. Elle permet de traduire les problèmes de géométrie de contact en questions sur la monodromie du livre ouvert. Giroux donne ainsi une caractérisation des monodromies qui correspondent aux structures de contact holomorphiquement remplissables [32, 33] et Honda-Kazez-Matić [44] (et le travail précurseur de Goodman [36]) de celles qui correspondent aux structures de contact tendues. Depuis l’exposé [28], de nombreux résultats sont venus affiner notre compréhension des structures de contact sur les variétés de dimension trois, dans la lignée de ceux obtenus par Bennequin, Eliashberg et Giroux dans les années 80-90. On en possède une classification complète sur de nombreuses variétés [30, 31, 40, 41, 42, 43] et

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

92

V. COLIN

on a découvert une classification grossière générale [9, 10, 11, 12] : une variété close orientable et irréductible de dimension trois porte une infinité de structures de contact tendues si et seulement si elle contient un tore π1 -injecté. Tous ces résultats peuvent maintenant se transposer dans le monde des livres ouverts et des difféomorphismes de surfaces. C’est de cette manière que Giroux donne avec Goodman dans [34] la réponse à une question de Harer sur la classification des entrelacs fibrés. À tout livre ouvert portant une structure de contact ξ, on peut associer une classe particulière de champs de Reeb, i.e. de champs de vecteurs transversaux à ξ et dont le flot préserve ξ : celle des champs de Reeb transversaux aux pages. Ce contrôle de la dynamique permet dans de nombreux cas, par exemple lorsque la monodromie est isotope à un difféomorphisme périodique [13], de calculer l’homologie de contact de ξ et de montrer la conjecture de Weinstein : tout champ de Reeb pour une telle structure de contact ξ a une orbite périodique. Les livres ouverts jouent également, via la construction de remplissages symplectiques découverte indépendamment par Eliashberg [20] et Etnyre [23], un rôle clé dans la démonstration récente de la propriété P des nœuds par Kronheimer et Mrowka [46]. Ils interviennent aussi de manière cruciale dans la définition d’une classe de contact en homologie de Heegaard-Floer, par Ozsváth et Szabó [52], permettant en retour de nouvelles avancées en géométrie de contact et en topologie [47]. En dimension supérieure, la construction de Giroux est de nature différente et s’appuie sur les travaux de Donaldson [14, 15], transcrits par Ibort-Martinez-Presas [45] de la géométrie symplectique vers la géométrie de contact. Elle permet de formuler la géométrie de contact dans le langage de la géométrie symplectique. Il s’agit là de construire des sections approximativement holomorphes et équitransversales de fibrés en droites hermitiens au-dessus d’une variété de contact (V, ξ). Giroux interprète géométriquement ces sections par l’existence d’un livre ouvert particulier. Cette présentation a permis notamment à Bourgeois de répondre positivement à une question posée par Lutz dans les années 70 [5] : tout tore de dimension impaire porte une structure de contact. Je remercie très vivement Emmanuel Giroux et François Laudenbach pour leur aide lors de la confection de ce document.

2. LIVRES OUVERTS On note V une variété close (compacte sans bord) et orientée de dimension 2n + 1. Une structure de contact orientée et positive sur V est un champ d’hyperplans ξ, défini globalement comme le noyau d’une 1-forme non singulière α, sujette à la condition α ∧ (dα)n > 0. Lorsque V et ξ sont orientés, le champ ξ est aussi coorienté.

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

93

La forme α est choisie positive sur un vecteur normal direct à ξ ; elle est alors unique à multiplication près par une fonction positive. Dans ce cas, la forme (dα|ξ )n donne l’orientation de ξ : la 2-forme dα|ξ est une forme symplectique positive. Les structures de contact sont des champs de plans localement homogènes. Tout point de (V, ξ) est inclus dans une carte de Darboux, où la structure ξ a pour équation dz + Σni=1 pi dqi = 0 dans des coordonnées (p1 , q1 , ..., pn , qn , z) ∈ R2n+1 . Si on peut en général envisager des structures de contact non orientées et négatives, on ne considérera dans ce texte que des structures orientées et positives. Les champs de Reeb associés à une structure de contact ξ sont mis en bijection avec les formes de contact α de noyau ξ par les équations : iR α = 1 ; iR dα = 0, qui admettent une unique solution. On peut ainsi parler du champ de Reeb associé à une forme de contact α. On note D2 le disque unité dans le plan, muni des coordonnées polaires {(r, φ)} ∈ ]0, 1] × S 1 . Définition 2.1. — Un livre ouvert pour V est la donnée d’un couple (K, θ), où : • K est une sous-variété close de V de codimension deux à fibré normal trivial ; • θ : V \ K → S 1 est une fibration égale à (k, r, φ) 7→ φ, k ∈ K, (r, φ) ∈]0, 1] × S 1 , dans un voisinage tubulaire K × D2 \ (K × {0}) de K ' K × {0}. La sous-variété K est appelée la reliure du livre ouvert ; les fibres de θ sont ses pages. Toute page d’un livre ouvert se compactifie naturellement par ajout de la reliure, c’est pourquoi on considérera parfois par la suite des pages compactes. On peut également voir les livres ouverts de façon constructive. Soient S une variété compacte à bord et h un difféomorphisme de S qui vaut l’identité au bord. On considère la suspension Σ(S, h) = S × [0, 1]/ ∼h de h, où ∼h est la relation d’équivalence (x, 1) ∼h (h(x), 0), pour tout x ∈ S. Comme h vaut l’identité sur ∂S, le bord ∂Σ(S, h) est canoniquement difféomorphe à ∂S × S 1 . La variété V = Σ(S, h) = Σ(S, h) ∪∂ (∂S) × D2 , obtenue par collage du produit (∂S) × D2 à Σ(S, h) par identification canonique de leurs bords respectifs à (∂S) × S 1 , possède un livre ouvert. La reliure est K = (∂S) × {0} ⊂ (∂S) × D2 , et la fibration θ l’extension de la fibration θ0 : Σ(S, h) → S 1 , θ0 (x, t) 7→ t, par l’application coordonnée angulaire sur (∂S) × (D2 \ {0}). On dit que V = Σ(S, h) est la suspension relative de (S, h). Réciproquement, tout livre ouvert (K, θ) sur V est obtenu par une construction similaire. On note K × D2 un voisinage de K sur lequel la fibration est donnée par l’application coordonnée angulaire. On considère alors un champ de vecteurs X sur V ,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

94

V. COLIN

∂ sur K×D2 et transversal aux fibres de θ. Si S est une fibre de θ|V \int(K×D2 ) , égal à r ∂φ l’application de premier retour sur S donnée en suivant le flot de X est l’identité au bord de S. Elle définit un difféomorphisme h de S, dont la suspension relative s’identifie à V .

Si V est orientée et si (K, θ) est un livre ouvert pour V , la fibration θ détermine une coorientation des pages et donc une orientation des pages et de la reliure. Le lien établi par Giroux entre les structures de contact et les livres ouverts s’exprime à l’aide de la définition suivante. Définition 2.2. — Une structure de contact ξ est portée par un livre ouvert (K, θ) si elle est le noyau d’une forme de contact α telle que : 1) α donne une forme de contact positive sur K ; 2) dα induise une forme symplectique positive sur les pages. Une forme de contact α qui vérifie ces deux conditions est dite adaptée à (K, θ). La condition (2) est équivalente à l’existence d’un champ de Reeb positivement transversal aux pages. Exemple. Sur S 3 = {r12 + r22 = 1} ⊂ C2 = {(z1 = r1 eiθ1 , z2 = r2 eiθ2 )}, la forme de contact α = r12 dθ1 + r22 dθ2 de noyau ζ0 est adaptée au livre ouvert K0 = {r2 = 0}, θ(r1 , θ1 , r2 , θ2 ) = θ2 , dont les pages sont des disques. Elle l’est également au livre ouvert K+ = {r1 r2 = 0}, θ+ (r1 , θ1 , r2 , θ2 ) = θ1 + θ2 , dont les pages sont des anneaux.

3. LE CAS DE LA DIMENSION TROIS Si V est une variété de dimension trois, la reliure K d’un livre ouvert (K, θ) de V est un entrelacs. Une structure de contact ξ est portée par (K, θ) s’il existe une forme de contact α de noyau ξ dont le champ de Reeb est positivement transversal aux pages et tangent positivement à la reliure. Avant leur formalisation par Giroux, les livres ouverts apparaissaient déjà en filigrane dans la littérature de contact. Dans son travail fondateur [3], Bennequin utilise le fait que la structure standard ζ0 d’équation ker(dz + r2 dφ) dans R3 muni de coordonnées cylindriques est portée par le livre ouvert dont les pages sont des demi-plans reliés sur l’axe vertical {r = 0}. Il réussit à rendre transversal aux pages tout nœud transversal à ζ0 par une isotopie de nœuds transversaux à ζ0 . Dans [56], Thurston et Wilkenkemper utilisent les livres ouverts pour montrer que toute variété de dimension trois porte une structure de contact. En fait, ils obtiennent même que, suivant la terminologie de Giroux, tout livre ouvert porte une structure de contact. Pour finir,

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

95

Torisu a le premier dégagé dans [57] les liens entre la théorie des surfaces convexes (section 3.3) et la notion de livre ouvert. 3.1. Structures de contact portées par un livre ouvert On revient un instant sur la construction de Thurston et Wilkenkemper. Proposition 3.1 ([56]). — En dimension trois, tout livre ouvert porte une structure de contact. Démonstration. — Soient h : S → S la monodromie de (K, θ) et β une 1-forme sur S telle que dβ soit une forme de surface. On choisit β strictement positive sur ∂S. Si on pose βt = (1 − t)β + th∗ β, t ∈ [0, 1], alors pour > 0 assez petit, α = dt + βt est une forme de contact, compatible avec la suspension de h. Reste à étendre α sur la suspension relative, c’est-à-dire sur D2 × ∂S. Comme h|∂S = Id, α vaut dt + β au bord de D2 ×∂S. Dans les coordonnées cylindriques {(r, φ, z)} de D2 ×∂S, l’expression de α est Adz + Bdφ, A, B > 0, si on a pris soin de choisir β invariante par le flot de ∂ ∂z sur ∂S. On complète alors cette forme par une forme du type f (r)dz + g(r)dφ sur D2 × ∂S. La condition de contact est que f g 0 − f 0 g > 0, ce qui signifie que le point de coordonnées (f (r), g(r)) tourne dans le sens trigonométrique autour de l’origine. On veut imposer (f (0), g(0)) = (1, 0) et f 0 (r) < 0, ce qui garantit que la forme est adaptée. Il suffit pour cela de faire moins d’un quart de tour. En fait, un livre ouvert détermine, à isotopie près, une unique structure de contact. Proposition 3.2. — L’espace des structures de contact portées par un livre ouvert (K, θ) est faiblement contractile. Démonstration. — On montre ici que deux structures de contact ξ0 et ξ1 portées par (K, θ) sont isotopes parmi les structures de contact portées par (K, θ). La preuve s’étend directement au cas des groupes d’homotopie supérieurs. On note α0 et α1 des équations de ξ0 et ξ1 adaptées à (K, θ). Si dt est la forme de longueur sur le cercle, on note α la 1-forme sur V qui vaut θ∗ dt hors de N (K) et f (r)dφ dans les coordonnées de N (K) ' D2 (1) × S 1 compatibles avec le livre ouvert, où f (r) vaut 0 près de {r = 0} et 1 pour r ≥ r0 . M M Pour tout M > 0 et s ∈ [0, 1], les formes α0,s = α0 + sM α et α1,s = α1 + sM α sont M M sont elles aussi de contact. De plus, si M est assez grand, les formes (1 − s)α0,1 + sα1,1 de contact. En concaténant ces trois chemins, on obtient un chemin de structures de contact entre ξ0 et ξ1 , que le théorème de Gray [38] convertit en isotopie. Réciproquement, Giroux montre l’existence, pour toute structure de contact, d’un livre ouvert porteur.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

96

V. COLIN

Théorème 3.3. — Sur une variété close de dimension trois, toute structure de contact est portée par un livre ouvert. 3.2. Stabilisation des livres ouverts Une même structure de contact peut être portée par des livres ouverts différents, comme le montre l’exemple de (S 3 , ζ0 ). On part d’un livre ouvert (K, θ). Il est donné par la suspension relative d’un difféomorphisme h d’une surface compacte à bord et orientée S, avec h|∂S = Id. Soit S 0 une surface compacte à bord orientée obtenue par addition d’une anse A d’indice 1 à S le long de ∂S. Comme le difféomorphisme h est l’identité au bord de S, il se prolonge par l’identité sur A en un difféomorphisme, à nouveau noté h, de S 0 qui est l’identité au bord de S 0 . Soit maintenant γ une courbe fermée simple plongée dans S 0 qui intersecte exactement une fois la co-âme de A (c’est-à-dire qu’elle traverse A une fois). On note τγ le twist de Dehn positif le long de γ et h0 = τγ ◦ h. La suspension relative de (S 0 , h0 ) donne un livre ouvert canonique (K 0 , θ0 ) pour lequel il existe un difféomorphisme (V, K, θ) → (V, K 0 , θ0 ) qui induit l’inclusion sur une des pages. On dit que (K 0 , θ0 ) est un plombage positif de (K, θ). Cette opération peut être vue comme une chirurgie (également appelée plombage) entre le livre ouvert (K, θ) et le livre ouvert (K+ , θ+ ) de S 3 (cf. exemple) qui porte la structure standard ζ0 . Pour cela, on décompose γ en la réunion de deux arcs δ et δ 0 , δ ⊂ S, δ 0 ⊂ A. On note δ+ un arc proprement plongé dans une page S+ ' S 1 × [0, 1] de (K+ , θ+ ) et joignant une composante de ∂S+ à l’autre. Le livre ouvert (K 0 , θ0 ) peut être réalisé dans la somme connexe de V et S 3 le long de voisinages adaptés B et B+ des arcs δ et δ+ , de sorte que K 0 = (K − B) ∪ (K+ − B+ ) et que la fibration θ0 étende les fibrations θ et θ+ données sur chaque facteur. Le livre ouvert (K 0 , θ0 ) porte la structure de contact obtenue par somme connexe de ξ et ζ0 , qui est isotope à ξ. On détaillera ce fait dans la proposition 3.6. Vu dans V , si S ⊂ V est une surface compacte à bord et δ ⊂ S un arc proprement plongé, on dit que S 0 ⊂ V s’obtient par plombage positif (resp. négatif) de S le long b plongé dans V avec les propriétés suivantes : de δ s’il existe un anneau A • • • •

b; S0 = S ∪ A b ∩ S est un voisinage régulier de δ dans S ; A b borde un disque plongé dans V dont l’intersection avec S est δ ; l’âme de A b ont pour enlacement +1 (resp. −1). les deux composantes de ∂ A

D’après Stallings [55], si S est l’adhérence d’une page d’un livre ouvert (K, θ), alors S 0 l’est aussi pour le plombage positif de (K, θ) le long de δ. Plus généralement, on dit que (K 0 , θ0 ) est une stabilisation de (K, θ) si on peut passer de (K, θ) à (K 0 , θ0 ) par une suite de plombages positifs.

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

97

Théorème 3.4. — Sur une variété close de dimension trois, deux livres ouverts portent des structures de contact isotopes si et seulement si ils possèdent des stabilisations isotopes. 3.3. Rappels de topologie de contact de dimension trois Une courbe legendrienne dans une variété de contact (V, ξ) est une courbe tangente à ξ en tout point. L’invariant de Thurston-Bennequin tb(γ) d’une courbe legendrienne γ homologue à zéro est l’enlacement entre γ et toute courbe γ obtenue en poussant légèrement γ dans la direction normale à ξ. C’est aussi le nombre algébrique d’intersection, le long de γ, entre ξ et le plan tangent à une surface compacte orientée de bord γ. Si S est une surface plongée dans (V, ξ), le feuilletage caractéristique ξS de S est le feuilletage intégral du champ de droites singulier ξ ∩ T S. Une surface S ⊂ (V, ξ) est dite convexe si elle est transversale à un champ de vecteurs de contact (dont le flot préserve ξ). Pour les surfaces closes, cette propriété est générique [27]. Si S est une surface convexe dans une variété de contact (V, ξ), et X un champ de vecteurs de contact transversal à S, on appelle courbe de découpage de S l’ensemble ΓS = {x ∈ S | X(x) ∈ ξ(x)}. C’est une sous-variété close et orientée de S, transversale à ξ et qui ne dépend pas du choix de X, à isotopie près parmi les sous-variétés de S transversales à ξ. De plus, la multi-courbe ΓS capte l’essentiel de l’information sur le germe de ξ le long de S : si ξ0 et ξ1 sont deux structures de contact sur V pour lesquelles S est convexe et qui donnent sur S la même courbe de découpage, alors il existe une isotopie de V à support dans un voisinage de S qui envoie ξ1 sur une structure de contact ξ10 dont le germe le long de S est celui de ξ0 . On se référera souvent à ce résultat, ou à ses variantes à bord, comme au lemme de réalisation [27]. Pour une surface à bord legendrien S, on peut calculer un invariant de ThurstonBennequin relatif tb(γ, S) pour chaque composante de bord γ de S en comptant l’intersection entre γ et S. Si toutes les composantes ont un invariant négatif ou nul, alors S peut être rendue convexe par une isotopie relative au bord, C 0 -petite près du bord et C ∞ -petite en dehors d’un voisinage du bord. Lorsque S est convexe et γ ⊂ ∂S, tb(γ, S) = − 21 ](γ ∩ ΓS ). La définition d’invariant de Thurston-Bennequin relatif s’étend directement aux arcs legendriens inclus dans S et dont les extrémités sont des singularités du feuilletage caractéristique de S. Une structure de contact est dite vrillée s’il existe un disque plongé dont le bord est une courbe legendrienne d’invariant de Thurston-Bennequin nul. Sinon, elle est tendue ; c’est le cas de la structure standard de R3 = {(p, q, z)} d’équation dz+pdq = 0 et donc de la restriction de toute structure de contact sur une de ses cartes de Darboux [3]. Si S est une surface convexe close différente de S 2 dans une variété de contact tendue, aucune composante de ΓS n’est homotope à zéro dans S. Toujours lorsque

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

98

V. COLIN

la structure est tendue, la courbe de découpage d’une sphère est connexe et celle d’un disque ne contient pas de composante close. Dans le cas contraire, le lemme de réalisation permettrait en effet de faire apparaître un disque vrillé sur une surface isotope à S. Pour une exposition détaillée de ces notions et de leurs propriétés, on renvoie au texte [28]. 3.4. Construction d’un livre ouvert porteur On donne la preuve du théorème 3.3. Elle repose sur l’utilisation d’une cellulation polyédrale de V , adaptée à la structure de contact ξ. Une cellule polyédrale de V est l’image d’un polyèdre convexe compact euclidien par un plongement topologique. Une cellulation polyédrale est alors une décomposition de V en cellules polyédrales avec les propriétés suivantes : • les intérieurs intrinsèques des cellules forment une partition de V ; • le bord d’une cellule est une union de cellules ; • les cellules de dimension inférieure ou égale à deux sont lisses (images de plongements lisses) ; • la valeur de l’angle d’incidence de deux faces d’une même 3-cellule le long d’une arête commune est en tout point dans [0, π]. Lorsque V est munie d’une structure de contact ξ, une cellulation polyédrale ∆ de V est dite de contact si : le 1-squelette de ∆ est legendrien ; toutes les faces sont ξ-convexes ; les 3-cellules sont incluses dans des cartes de Darboux ; les faces sont ξ-bien positionnées, c’est-à-dire que si [a, b] est un arc inclus dans une arête faisant partie de faces F et F 0 d’une même 3-cellule, alors ]a, b[ n’est jamais une orbite régulière de ξF et de ξF 0 orientée de a vers b dans ξF et ξF 0 et joignant une singularité négative de ξF (resp. ξF 0 ) en a à une singularité positive de ξF 0 (resp. ξF ) en b (les faces F et F 0 sont coorientées comme bord de la 3-cellule). On parle de décomposition cellulaire totale lorsque de plus : (5) l’invariant de Thurston-Bennequin du bord de chaque 2-cellule vaut −1.

(1) (2) (3) (4)

Soit donc (V, ξ = ker α) une variété de contact close. Première étape. On montre que (V, ξ) admet une cellulation de contact totale. On part d’une cellulation polyédrale quelconque ∆0 de V , par exemple une triangulation, dont les 3-cellules sont assez petites pour être contenues dans des cartes

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

99

de Darboux. On déforme ∆0 par isotopie pour que son 1-squelette soit legendrien. C’est une opération aisée, car, dans une variété de contact, tout arc est isotope à un arc legendrien par une isotopie C 0 -petite. Quitte à diminuer l’invariant de ThurstonBennequin de chaque arête par un procédé classique (en la faisant spiraler dans une carte de Darboux), on obtient une cellulation pour laquelle les faces sont ξ-bien positionnées. Par une isotopie générique de ∆0 relative à son 1-squelette, on rend alors toutes les faces ξ-convexes. On note toujours ∆0 la cellulation obtenue. Elle possède toutes les propriétés pour être une cellulation de contact totale, sauf (5). Pour obtenir (5), on va subdiviser chaque face. C’est là l’avantage d’utiliser des cellulations polyédrales : toute subdivision des faces s’étend trivialement pour donner une nouvelle cellulation. Pour cela, on considère une face F de ∆0 . On note ΓF sa courbe de découpage. Tout comme les deux 3-cellules auxquelles elle est adjacente, F est incluse dans une carte de Darboux. En particulier, ξ est tendue dans un voisinage de F . La courbe ΓF est donc constituée d’arcs qui vont du bord de F au bord de F (et n’a pas de composante close) [27]. Si tb(∂F ) < −1, ΓF a au moins deux composantes. On trouve alors un arc legendrien intégral de ξF , noté γ, inclus dans F \ ΓF avec ∂γ ⊂ ∂F . La subdivision par γ donne une nouvelle cellulation polyédrale (on vérifie en particulier que par cette méthode les faces restent ξ-bien positionnées). On construit les autres arcs par récurrence sur tb(∂F ), en remarquant que γ subdivise F en deux cellules de bords legendriens et d’invariants de Thurston-Bennequin strictement supérieurs à ceux de ∂F . On obtient ainsi une cellulation polyédrale de contact totale ∆ de (V, ξ). Deuxième étape. On exhibe le livre ouvert. On note Σ ⊂ V une surface compacte contenant le 1-squelette ∆1 de ∆ dans son intérieur, tangente à ξ le long de ∆1 − N (∆0 ) et « presque » tangente à ξ dans un voisinage N (∆0 ) du 0-squelette. Si N (∆1 ) est un voisinage tubulaire de ∆1 suffisamment petit, alors : • la surface S = Σ∩N (∆1 ) est une surface compacte à bord, dont le bord K = ∂S est inclus dans ∂N (∆1 ) ; • par la condition de contact, K est transversal à ξ ; • si on oriente S le long de ∆1 comme ξ, alors K, orienté comme le bord de S, est ascendant à ξ ; • dα est non dégénérée sur S (car elle l’est le long de ∆1 où T S = ξ) ; • ∂N (∆1 ) est une surface convexe dont la courbe de découpage est K.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

100

V. COLIN

De plus, dans cette situation, on peut écrire N (∆1 ) \ K ' int(S) × [0, 1], int(S) ' int(S) × {1/2} avec, pour tout t ∈ [0, 1], dα|int(S)×{t} > 0. Bien entendu, H = V \ int(N (∆1 )) est aussi un corps en anses. Le point essentiel est que, comme pour toute face F du 2-squelette de ∆ l’invariant tb(∂F ) = −1, l’intersection entre l’entrelacs K et F vaut 2. Comme de plus les faces sont ξ-bien positionnées, on peut, par une isotopie C 0 -petite des faces, faire en sorte que la courbe K intersecte chaque face en exactement deux points (avec le même signe). Le corps en anses H admet un système maximal D1 ,...,Dn de disques de compression, constitué de son intersection avec la collection des faces F1 ,...,Fn de ∆. Chaque composante du découpage de H par ∪1≤i≤n Di est un domaine de Darboux : la structure y est tendue. D’après [8], la structure ξ est tendue sur H : on part des domaines de Darboux et on effectue des collages successifs le long des disques Di ⊂ Fi qui préservent le caractère tendu de la structure car tb(∂Fi ) = −1. Comme K intersecte ∂Di en deux points, grâce au lemme de réalisation, on modifie H et Di pour imposer à ∂Di d’être une courbe legendrienne, avec tb(∂Di ) = −1. On peut alors également assurer par généricité la convexité des disques Di . Comme la structure ξ est tendue sur H et comme de surcroît tb(∂Di ) = −1, la courbe de découpage ΓDi est connexe et constituée d’un arc. On note KDi un arc proprement plongé dans Di et joignant les deux intersections de Di avec K. Lorsqu’on découpe H le long de ∪ni=1 Di , on obtient une collection de boules B1 ,...,Bk . Après lissage de ∂Bi , la courbe de découpage Γ∂Bj est isotope à la courbe (K ∪1≤i≤n KDi ) ∩ (∂Bj ). En particulier, comme ξ|Bj est tendue, Γ∂Bj est connexe et donc aussi (K ∪1≤i≤n KDi ) ∩ (∂Bj ). On peut alors écrire une identification H \ K ' int(S) × [1, 2]. Ainsi, la fibration N (∆1 ) \ K ' intS × [0, 1], (x, t) → t se prolonge en une fibration θ : V \ K 7→ S 1 .

Troisième étape. On trouve une forme de contact adaptée à (K, θ). Il reste à montrer que la forme α s’étend sur H en une forme dont la différentielle donne une forme d’aire sur les fibres de θ|H . Pour cela, on montre que ξ|H est conjuguée à une structure modèle pour laquelle on a une telle forme de contact. On reprend la décomposition du corps en anses tendu (H, ξ) par un système complet D1 ,...,Dn de disques de compression, chacun de ces disques Di étant convexe, de bord legendrien avec tb(∂Di ) = −1. On montre que ces données déterminent ξ sur H : Proposition 3.5. — Si ξ 0 est une structure sur H qui coïncide avec ξ près de ∂H et qui est tendue sur H, alors ξ 0 est isotope à ξ, relativement à ∂H. Démonstration. — Par hypothèse, chaque courbe ∂Di est legendrienne et d’invariant tb(∂Di ) = −1 pour ξ et ξ 0 . On réalise une petite isotopie de ξ 0 pour que chaque Di

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

101

soit ξ 0 -convexe. Comme, pour ξ et ξ 0 , tb(∂Di ) = −1 et ξ et ξ 0 sont tendues, les courbes de découpage de Di sont des segments connexes. Le lemme de réalisation fournit alors une isotopie de ξ 0 relative au bord de H et à support dans un voisinage de ∪1≤i≤n Di , qui la fait coïncider avec ξ au voisinage de ∪1≤i≤n Di . Après ces isotopies préparatoires, ξ et ξ 0 coïncident au bord des boules du découpage de H par ∪1≤i≤n Di . Sur chacune de ces boules, les structures ξ et ξ 0 sont tendues. Pour conclure, on utilise un théorème de classification d’Eliashberg [16] : l’espace des structures de contact tendues sur la boule dont le germe est fixé au bord est faiblement contractile. On obtient un chemin de structures de contact entre ξ et ξ 0 que le théorème de Gray [38] transforme en isotopie. Si β est la primitive d’une forme d’aire sur S, positive sur ∂S, la forme α0 = dt + β donne une structure de contact ξ0 sur S ×R. On cherche à réaliser H dans un voisinage de S × {0}, de sorte que la structure induite par ξ0 soit conjuguée à ξ|H . On part de S × [−1, 1] ⊂ S × R dont on arrondit les coins pour obtenir un corps en anses H 0 . On effectue cette opération de lissage afin que H 0 \ (∂S × {0}) possède un feuilletage F par des copies de int(S), dont chaque feuille soit un graphe au-dessus de S × {0}. Dans cette situation, ∂H 0 est convexe et Γ∂H 0 = ∂S × {0}. Avec le lemme de réalisation, on peut modifier chaque composante de ∂H 0 \ ∂S × {0} relativement à un ∂ , pour voisinage de ∂S × {0}, parmi les surfaces transversales au champ de contact ∂t 0 obtenir que le germe de ξ0 près de l’image de ∂H soit conjugué au germe de ξ près de ∂H, la conjugaison envoyant ∂S × {0} sur K et s’étendant en un difféomorphisme de l’image de H 0 sur H. On garde la notation H 0 pour le corps en anses obtenu comme image de H 0 par cette isotopie. L’image du feuilletage F par l’isotopie est un ∂ feuilletage, toujours noté F , transversal à ∂t . La structure ξ0 est tendue sur H 0 et donc, d’après la proposition 3.5, (H 0 , ξ0 ) est contactomorphe à (H, ξ). On étend la fibration θ sur H en prenant l’image du feuilletage F de H 0 . La forme de contact α0 donnée sur H comme l’image de α0 possède la propriété désirée : sa différentielle dβ induit une forme d’aire sur chaque fibre. Il reste à ajuster les formes de contact α et α0 obtenues sur N (∆1 ) et H. On considère un petit voisinage N (K) de K, muni de coordonnées cylindriques (r, φ, z) ∈ [0, ] × [0, 2π[×R/Z, sur lequel ξ a pour équation dz + r2 dφ = 0. En interpolant entre α et α0 en dehors de U (K) = {r ≤ /2} ⊂ N (K), on obtient facilement une forme de contact, notée à nouveau α, dont la différentielle dα induit une forme d’aire sur les fibres de θ : V \ U (K) → S 1 . Sur N (K), on note χ une fonction qui vaut 0 sur {r ≤ /2} et 1 près de {r = }. Si M est assez grand, la forme α étendue par (1 − χ(r))M (dz + r2 dφ) + χ(r)α sur N (K) est (presque) adaptée à (K, θ).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

102

V. COLIN

3.5. Stabilisation Proposition 3.6. — Si (K, θ) est un livre ouvert qui porte ξ, alors tout livre ouvert (K 0 , θ0 ) obtenu par plombage positif de (K, θ) porte une structure isotope à ξ. Démonstration. — On note (S, h) et (S 0 , h0 ) des monodromies respectivement de (K, θ) et (K 0 , θ0 ). La monodromie h est obtenue en suivant le flot d’un champ de vecteurs X, transversal aux fibres de θ. On réalise géométriquement (K 0 , θ0 ) dans V . Pour cela on part de (K, θ) qui porte ξ. On note t0 et t1 deux points diamétralement opposés sur le cercle S 1 , de sorte que les pages S0 = θ−1 (t0 ) et S1 = θ−1 (t1 ) se recollent le long de K pour faire une surface lisse Σ = S0 ∪ K ∪ S1 . La surface S 0 est obtenue par adjonction d’une anse A à S et le difféomorphisme h0 en composant h avec un twist de Dehn positif le long d’une courbe fermée simple γ. On écrit γ = γ0 ∪ γ1 , où γ0 et γ1 sont deux arcs, γ0 ⊂ S, γ1 ⊂ A. On identifie S à S0 , ce qui permet de voir γ0 dans S0 . On pousse γ0 dans S1 à l’aide du flot de X pour obtenir un segment γ10 ⊂ S1 . La courbe γ 0 = γ0 ∪ γ10 est plongée dans Σ et borde un disque D dans V \ Σ (donné par des portions d’orbites de X). Or, la surface Σ est convexe et scindée par K. De plus, la courbe γ 0 intersecte deux fois K. Le lemme de réalisation fournit alors une isotopie de Σ, relative à K, qui rend γ 0 legendrienne et d’invariant tb(γ 0 ) = tb(γ 0 , Σ) = −1. Dès lors, on considère le corps en anses H0 obtenu en adjoignant un voisinage tubulaire N (γ10 ) de γ10 à un voisinage collier N (S0 ) de S0 . On observe que le bord de H0 (après lissage judicieux) est convexe. Une courbe de découpage est obtenue en prenant (K ∩ ∂H0 ) ∪ l, où l est constitué de deux arcs tracés sur ∂N (γ10 ) ∩ ∂H0 , chacun allant d’une composante de ∂N (γ10 ) ∩ ∂N (S0 ) à l’autre et coupant une fois D. On la note K 0 . La sous-variété H0 \ K 0 est un voisinage collier de l’intérieur d’une surface S00 , obtenue en ajoutant à S0 une anse A0 d’âme γ10 . Le complémentaire H1 de int(H0 ) dans V est obtenu en faisant apparaître une anse triviale dans le complémentaire de int(N (S0 )) dans V . Cette anse admet D comme disque de compression, qui coupe exactement deux fois K 0 = Γ∂H1 . Comme dans le paragraphe précédent, on obtient un livre ouvert (K 0 , θ0 ) qui porte ξ. La fibre de θ0 est difféomorphe à S 0 = S ∪ A. Reste à identifier la monodromie associée, donnée en suivant le flot de X. Si on part d’une courbe a ⊂ S0 ⊂ S00 qui ne rencontre pas γ 0 , son image par le flot de X ne rencontre pas N (γ10 ), et donc elle revient sur h(a) ⊂ S0 . La co-âme c de A0 peut être poussée dans ∂(D ∩ H1 ), de sorte que, si on note toujours c son image, ∂(D ∩ H1 ) = c ∪ c0 , c ∩ c0 = ∂c = ∂c0 = ∂(D ∩ H1 ) ∩ K 0 . On a essentiellement (après projection dans H0 ), h(c) = c0 = τγ 0 (c). On indique à présent comment démontrer le théorème 3.4. On dit qu’un livre ouvert (K, θ) est associé à une cellulation de contact totale ∆ si l’une des fibres de θ contient le 1-squelette de ∆ et se rétracte dessus par une isotopie de contact.

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

103

Proposition 3.7. — Tout livre ouvert portant une structure de contact ξ se stabilise en un livre ouvert associé à une cellulation de contact totale ∆. Démonstration. — Soit S une fibre de θ. La fibre S se rétracte sur un graphe δ ⊂ S, parfois appelé « spine ». Le lemme de réalisation de [27] permet de réaliser δ de manière legendrienne dans S, de sorte que K soit le bord d’un élargissement de δ dans la direction de ξ comme dans la preuve du théorème 3.3. On complète δ en une cellulation ∆, que l’on peut toujours raffiner en une cellulation de contact totale en suivant la méthode développée dans le paragraphe précédent. On ajoute alors successivement à δ les bords des faces de ∆. À chaque ajout, l’étude effectuée pour prouver la proposition 3.6 s’applique. Le livre ouvert obtenu est un plombage positif du précédent et la fibre se rétracte sur le 1-squelette. On aboutit à un livre ouvert associé à ∆. Pour démontrer le théorème 3.4, on part de deux livres ouverts portant une même structure ξ. D’après la proposition 3.7, ils se stabilisent tous deux en des livres ouverts (K0 , θ0 ) et (K1 , θ1 ) associés à des cellulations de contact totales ∆0 et ∆1 . On met alors ∆0 et ∆1 en position générale : leurs arêtes sont deux à deux disjointes et les faces et arêtes de l’une sont transversales aux faces et arêtes de l’autre. On trouve alors une sous-cellulation ∆2 commune à ∆0 et ∆1 . En subdivisant ∆2 , on en fait une cellulation de contact totale ∆ pour ξ (encore une fois, le point (4) est à vérifier soigneusement). Le passage de ∆0 et ∆1 à ∆ se réalise comme précédemment par ajout à ∆i , i = 0, 1, des bords des faces de ∆. Le livre ouvert associé à ∆ est une stabilisation commune à ∆0 et ∆1 . 3.6. Applications Les théorèmes 3.3 et 3.4 établissent un pont entre la géométrie de contact de dimension trois et l’étude des difféomorphismes de surfaces, modulo stabilisation, ou la théorie des entrelacs fibrés. Ils ouvrent un large champ d’étude pour comprendre comment s’expriment les propriétés classiques dans l’un et l’autre langage. De façon immédiate, ils permettent à Giroux d’introduire de nouveaux invariants des variétés de contact, comme le genre d’une structure de contact ξ, qui est le genre minimal des pages d’un livre ouvert portant ξ (où le genre d’une surface à bord S est le genre de la surface obtenue en collant un disque à chaque composante de ∂S). Pour la structure standard ζ0 de R3 , le genre est 0. Etnyre montre dans [24] qu’il existe des structures de contact de genre supérieur à 1.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

104

V. COLIN

3.6.1. Caractérisation des structures de contact Stein remplissables et des structures tendues. — Pour la définition de structure de contact Stein remplissable, on renvoie à la section 4.3. D’après Eliashberg [17] et Gromov [39], toute structure de contact Stein remplissable est tendue. Théorème 3.8. — Une structure de contact sur une variété close de dimension trois est Stein remplissable si et seulement si elle est portée par un livre ouvert dont la monodromie est un produit de twists de Dehn positifs. Ce théorème étend un résultat de Loi et Piergallini [48]. Le travail [4] permet de remplacer l’hypothèse Stein remplissable par holomorphiquement remplissable. Démonstration. — Soit (K, θ) un livre ouvert de page S et de monodromie h. Si γ est une courbe fermée simple et non séparante dans S, alors le lemme de réalisation permet, par une isotopie de ξ parmi les structures portées par (K, θ), de rendre γ legendrienne et d’invariant de Thurston-Bennequin relatif à S nul. On vérifie que la structure obtenue par chirurgie legendrienne d’indice −1 sur γ est portée par le livre ouvert de page S et de monodromie τγ ◦ h. Une fois cette relation mise à jour, on utilise la caractérisation des structures de contact Stein remplissables découverte par Eliashberg [18] : Théorème 3.9. — Une variété de contact (V, ξ) de dimension trois est Stein remplissable si et seulement si elle est obtenue à partir de la somme connexe #n S 2 × S 1 de n copies de S 2 × S 1 munies de leur structure de contact standard ξ0 par une suite de chirurgies d’indice −1 sur des nœuds legendriens. On part donc de (#n S 2 × S 1 , ξ0 ) qui est portée par un livre ouvert (K0 , θ0 ) dont la monodromie est l’identité. La variété (V, ξ) est obtenue par chirurgie legendrienne sur les composantes d’un entrelacs legendrien γ. On utilise le fait qu’il existe une stabilisation (K1 , θ1 ) de (K0 , θ0 ) qui contient γ dans une de ses pages S1 , de sorte qu’aucune composante de γ ne sépare S1 . La monodromie h1 de (K1 , θ1 ) est un produit de twists de Dehn positifs. Pour obtenir (V, ξ), on effectue des chirurgies de Dehn sur les composantes de γ. Chacune d’entre elles est équivalente à composer h1 avec un twist de Dehn positif sur la composante correspondante. Au final, (V, ξ) est portée par un livre ouvert dont la monodromie est un produit de twists de Dehn positifs. Le théorème 3.8 n’affirme pas que tous les livres ouverts portant ξ ont pour monodromie un produit de twists de Dehn positifs. On ignore actuellement si c’est le cas. Dans la même veine, Honda, Kazez et Mati`c caractérisent dans [44] les monodromies qui donnent les structures de contact tendues. Soit S une surface compacte orientée à bord. On note α : [0, 1] → S et β : [0, 1] → S deux arcs orientés et

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

105

proprement plongés dans S dont les origines α(0) = β(0) = x coïncident. On note également π : S˜ → S le revêtement universel de S. On choisit des relevés α ˜ et β˜ de ˜ tous deux issus d’un même relevé x α et β dans S, ˜ de x. L’arc α ˜ sépare S˜ en deux régions, l’une située à gauche et l’autre à droite de α ˜ (de sorte qu’en x ˜, en suivant ˜ on passe de la région gauche à la région droite). l’orientation de ∂ S, ˜ On dit que β est à droite de α si β(1) se trouve à droite de α ˜ , ou est égal à α ˜ (1). Si h est un difféomorphisme de S qui vaut l’identité au bord de S, on dit que h est dextrogire si pour tout arc proprement plongé α, l’arc h(α) est à droite de α. Théorème 3.10 ([44]). — La variété de contact (V, ξ) est tendue si et seulement si tous les livres ouverts qui portent ξ ont une monodromie dextrogire. Comme il existe des variétés de contact qui sont tendues mais pas Stein remplissables (ni même symplectiquement remplissables [26]), on déduit des théorèmes 3.8 et 3.10 qu’il existe des difféomorphismes dextrogires qui ne sont pas isotopes (rel. ∂S) à un produit de twists de Dehn positifs (alors que la réciproque est toujours vraie). 3.6.2. Comment obtenir tous les entrelacs fibrés. — Comme exemple d’application topologique, Giroux répond, en collaboration avec Goodman, à une question de Harer [34]. On considère ici le plombage/déplombage d’un livre ouvert par des entrelacs de Hopf positifs (stabilisations) et négatifs (où on compose la monodromie par un twist de Dehn négatif). Théorème 3.11. — Dans une sphère d’homologie entière, deux entrelacs fibrés quelconques sont obtenus l’un à partir de l’autre par une suite de plombages et de déplombages sur des entrelacs de Hopf positifs et négatifs. Démonstration. — On munit la variété V d’une métrique auxiliaire ainsi que d’une trivialisation de son fibré tangent. Comme la variété ambiante est une sphère d’homologie, la classe d’homotopie d’un champ de plans orienté ξ sur V est repérée par son invariant de Hopf, c’est-à-dire l’enlacement des fibres de deux valeurs régulières de l’application V → S 2 donnée par la normale directe à ξ. La preuve repose sur les faits suivants : • Tout entrelacs fibré donne un livre ouvert, qui porte une structure de contact. • Le plombage par un entrelacs de Hopf négatif augmente l’invariant de Hopf d’une unité. • Après plombage par un entrelacs de Hopf négatif, la structure portée par le livre ouvert associé est toujours vrillée. Si K1 et K2 sont des entrelacs fibrés, on considère les structures de contact ξ1 et ξ2 portées par les livres ouverts associés. Quitte à plomber l’un des deux par un nombre suffisant d’entrelacs de Hopf négatifs, on se ramène au cas où ξ1 et ξ2 sont homotopes

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

106

V. COLIN

comme champs de plans. Si on plombe à nouveau une fois K1 et K2 par des entrelacs de Hopf négatifs, on obtient en plus que les nouvelles structures ξ1 et ξ2 sont vrillées. On utilise alors un théorème d’Eliashberg [16] : deux structures de contact vrillées homotopes comme champs de plans sont isotopes. C’est le cas pour ξ1 et ξ2 et le théorème 3.4 s’applique : les livres ouverts associés à K1 et K2 ont des stabilisations isotopes. 3.6.3. Sur la dynamique des champs de Reeb. — L’existence d’un champ de Reeb adapté à un livre ouvert porteur rend envisageable le calcul de l’homologie de contact de la variété (V, ξ), en vue de démontrer la conjecture de Weinstein. Conjecture 3.12 (Weinstein). — Sur une variété close, tout champ de Reeb possède une orbite périodique. Des avancées récentes, s’appuyant sur l’existence de livres ouverts porteurs, ont eu lieu dans ce sens : Théorème 3.13 ([1]). — Toute structure de contact portée par un livre ouvert planaire (dont la fibre est de genre 0) vérifie la conjecture de Weinstein. Théorème 3.14 ([13]). — Toute structure de contact portée par un livre ouvert dont la monodromie est isotope à un difféomorphisme périodique vérifie la conjecture de Weinstein.

4. LA DIMENSION SUPÉRIEURE En dimension supérieure à trois, Giroux obtient des restrictions supplémentaires sur la structure du livre ouvert portant une structure de contact : les pages sont des variétés de Stein et la monodromie un difféomorphisme symplectique. Voici comment s’articulent la géométrie de contact et la géométrie complexe. Toute hypersurface réelle V plongée dans une variété complexe (W, J) hérite d’un champ d’hyperplans canonique ξ, celui des hyperplans complexes Tv V ∩ JTv V , v ∈ V , tangents à V . Si on note α une 1-forme de noyau ξ, la 2-forme Q = dα(., J.)|ξ est appelée une forme de Levi pour V . Si elle est non dégénérée alors ξ est une structure de contact. Lorsqu’elle est définie positive, V est dite strictement pseudo-convexe. Une source d’exemples d’hypersurfaces strictement pseudo-convexes est obtenue en prenant les niveaux réguliers d’une fonction strictement pluri-sous-harmonique, c’est-à-dire d’une fonction f : W → R pour laquelle la 2-forme ωf = −ddc f, o` u dc f = df ◦ J

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

107

vérifie ωf (v, Jv) > 0 pour tout v 6= 0. Dans ce cas en effet, si V = f −1 (c), alors ξ = ker dc f |V et Q(v) = ωf (v, Jv). Exemple. • Dans C, ωf = −∆f dx ∧ dy. • La sphère unité de Cn est strictement pseudo-convexe et porte donc une structure de contact canonique ζ0 . Une variété de Stein est une variété complexe qui se plonge holomorphiquement et proprement dans CN . Cette définition impose de fortes restrictions topologiques : d’après le théorème de Lefschetz-Serre-Andreotti-Frankel-Milnor [49], toute variété de Stein de dimension réelle 2n a le type d’homotopie d’un complexe cellulaire de dimension n. Théorème 4.1 ([37]). — Une variété complexe W est une variété de Stein si et seulement s’il existe une fonction de Morse propre f : W → [0, +∞[ qui est strictement pluri-sous-harmonique. Si W est une variété de Stein et si f : W → [0, +∞[ est une fonction de Morse propre strictement pluri-sous-harmonique, alors la forme ωf est symplectique. Le champ de vecteurs X défini par iX ωf = −dc f est un gradient pour f qui dilate exponentiellement ωf . On observe en effet que df (X) = −df (J 2 X) = −dc f (JX) = ωf (X, JX) > 0 en dehors des points critiques de f et que LX ωf = dix ωf = ωf . D’après Eliashberg et Gromov [21], la forme ωf ne dépend pas du choix de f parmi les fonctions de Morse propres strictement pluri-sous-harmoniques : si f et g sont deux telles fonctions avec des gradients associés complets, alors ωf et ωg sont isotopes. Un domaine de Stein est une variété complexe compacte à bord F qui admet une fonction de Morse strictement pluri-sous-harmonique f : F → [0, +∞[ pour laquelle ∂F est un niveau régulier. Dans ce cas, int(F ) est une variété de Stein. Une variété de Weinstein est une variété symplectique (W, ω) qui porte un champ de vecteurs X complet avec les propriétés suivantes : • X est un gradient pour une fonction de Morse propre f : W → [0, +∞[ ; • LX ω = ω. Lorsque W est compacte, on demande à ∂W d’être un niveau régulier de f . Théorème 4.2 ([18]). — Si (W, ω, f, X) est une variété de Weinstein de dimension 2n, n > 2, alors W porte une structure complexe J qui en fait une variété de Stein, qui rend f strictement pluri-sous-harmonique et pour laquelle ω = ωf . La preuve du théorème 4.2 s’étend au cas de la dimension 4 : toute variété de Weinstein est symplectomorphe à une variété de Stein.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

108

V. COLIN

De façon encore plus générale, soit F une variété compacte de bord K = ∂F munie d’une forme symplectique exacte ω. Un champ de Liouville pour ω est un champ de vecteurs ω-dual d’une primitive de ω. On dit que (F, ω) est convexe si elle porte un champ de Liouville transversal à K. En particulier, si (F, ω) est de Weinstein, le pseudo-gradient X intervenant dans la définition vérifie d(iX ω) = ω. Si on choisit β = iX ω comme primitive de ω, le champ X est de Liouville, et comme K est un niveau régulier pour la fonction de Morse associée, F est convexe. La complétion d’une variété symplectique compacte et convexe (F, ω) est la variété symplectique (F˜ , ω ˜ ) = (F, ω) ∪∂ (∂F × [0, +∞[, et ω(p)), pour (p, t) ∈ ∂F × [0, +∞[. On rencontre encore le terme de variété de Liouville. Lorsque α est une forme de contact adaptée à un livre ouvert (K, θ), alors la forme symplectique exacte dα donnée sur une page F fait de F \ int(N (K)) une variété symplectique convexe dont la complétion ne dépend pas de α et du petit voisinage tubulaire N (K) de K à isotopie près [21]. 4.1. Construction de structures de contact Soient (F, ω = dβ) une variété symplectique compacte convexe et K = ∂F . La forme β induit une forme de contact γ sur K. On se donne également un difféomorphisme symplectique φ de F qui vaut l’identité près de K. Proposition 4.3. — Le livre ouvert (K, θ) donné par la suspension relative Σ(F, φ) porte une structure de contact. Démonstration. — Comme φ∗ ω = ω, la forme φ∗ β − β est fermée. On suppose dans un premier temps qu’elle est exacte : φ∗ β − β = dh. Quitte à dilater ω et translater h, on peut supposer que h est strictement positive et vaut 1 près de K = ∂F . La 1-forme α = dt + β est alors une forme de contact sur F × R, où t désigne la coordonnée sur R. Elle est laissée invariante par le difféomorphisme (x, t) → (φ(x), t + h(x)) et induit donc une forme de contact α sur la suspension de (F, φ). Pour l’étendre à la suspension relative, on prolonge α sur K × D2 par la forme γ + r2 dφ. Dans le cas général, on utilise le lemme d’isotopie suivant, qui permet de se ramener au cas où la forme φ∗ β − β est exacte et de faire la construction dans cette situation.

Lemme 4.4. — Il existe une isotopie (φt )t∈[0,1] de φ = φ0 parmi les difféomorphismes symplectiques de (F, ω) égaux à l’identité près du bord, telle que la forme φ∗1 β − β soit exacte.

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

109

Démonstration. — On note µ la forme fermée φ∗ β − β et Y le champ de vecteurs défini par l’équation iY ω = −µ. On a LY ω = iY dω + diY ω = −dµ = 0. Ainsi, le flot ψt de Y préserve ω et vaut l’identité près de K, où µ vaut 0. On pose φt = φ ◦ ψt . d ∗ On observe alors que dt φt β = ψt∗ (LY φ∗ β) = d(ψt∗ iY φ∗ β) + ψt∗ (iY d(φ∗ β)) = dht + R1 ψt∗ (iY ω) = dht + β − φ∗ β. On en déduit que φ∗1 β − β = dh, avec h = 0 iY φ∗t β dt. Le résultat d’unicité inclut cette fois la structure symplectique des pages. Proposition 4.5. — Si deux structures de contact portées par un même livre ouvert définissent sur les pages des structures symplectiques dont les complétions sont isotopes, alors elles sont isotopes. 4.2. Existence d’un livre ouvert porteur Giroux montre l’existence d’un livre ouvert porteur pour toute structure de contact : Théorème 4.6. — Toute structure de contact ξ sur une variété close de dimension 2n + 1 est portée par un livre ouvert dont les pages sont des variétés de Stein et la monodromie est représentée par un difféomorphisme symplectique. Exemple. La fibration de Milnor [32], [6] Soit P : (Cn , 0) → (C, 0) un polynôme avec un point critique isolé en 0 ∈ Cn . L’hypersurface H = P −1 (0) possède une singularité isolée en 0. Soit ρ une norme euclidienne de Cn . On considère alors la famille de sphères Sr = {z ∈ Cn | ρ(z) = r2 }. D’après Milnor [50], pour r > 0 assez petit, la sphère Sr intersecte H transversalement le long d’une sous-variété Kr de codimension réelle 2. De plus l’application arg(P ) : Sr \Kr → S 1 est une fibration qui fait du couple (Kr , arg(P )) un livre ouvert. Giroux [32] dans un cas particulier et Caubel-Némethi-Popescu-Pampu [6] en général, montrent que le livre ouvert (K, θ) porte la structure canonique de Sr ' S 2n+1 , constituée des hyperplans complexes tangents à Sr . Par exemple, dans le cas d’un polynôme homogène et des sphères rondes, la forme de contact canonique est adaptée. Schéma de la preuve du théorème 4.6. — Soit ξ une structure de contact donnée sur V comme le noyau d’une forme de contact α et Rα le champ de Reeb associé. On note J une structure presque complexe sur ξ, compatible avec α au sens où l’opérateur J : ξ → ξ vérifie J 2 = −Id, dα(J., J.) = dα(., .) et dα(., J.) est non dégénérée positive. On complète dα(., J.) en une métrique gα définie sur V pour laquelle Rα est un vecteur orthonormal à ξ. Dans la suite, on mesure les vecteurs tangents à V à l’aide de gα .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

110

V. COLIN

On considère le fibré trivial L = V × C, muni de la connexion ∇ donnée par −iα. Autrement dit, pour une section s de L, ∇s = ds − isα. Pour f : V → C, on note ∂ξ f = 21 (df − idc f ) et ∂¯ξ f = 12 (df + idc f ) les parties C-linéaires et C-antilinéaires de df |ξ . Le résultat principal sur lequel s’adosse la preuve du théorème 4.6 est dû à Ibort, Martinez et Presas [45]. Il s’agit d’une adaptation d’un théorème de Donaldson [14, 15] à la géométrie de contact. Théorème 4.7 ([45]). — Il existe C, δ > 0 et des fonctions lisses sk : V → C, k 0, avec les propriétés suivantes : (1) en tout point p ∈ V , |sk | ≤ C, |dsk − iksk α| ≤ Ck 1/2 et |∂¯ξ sk | ≤ C ; (2) en tout point p ∈ V où |sk (p)| ≤ δ, |∂ξ sk (p)| ≥ δk 1/2 . Les fonctions sk sont des sections du fibré trivial L⊗k , muni de la connexion donnée par −ikα. L’expression dsk −iksk α est la dérivée covariante ∇sk pour cette connexion. La mise en regard des estimées sur ∂ξ sk et ∂¯ξ sk dans la zone |sk | ≤ δ assure que sk est approximativement holomorphe le long de ξ. Les inégalités portant sur ∂ξ sk et dsk − iksk α contrôlent la transversalité de sk à, respectivement, la section nulle et aux rayons {(v, Reit ), v ∈ V, R ∈ [0, +∞[}. Celle portant sur ∂ξ sk assure en particulier que sk est transversale à la section nulle en utilisant uniquement les directions de ξ. Corollaire 4.8. — Pour |w| ≤ δ et k assez grand, l’ensemble Kw = s−1 k (w) est une sous-variété de contact de (V, ξ). De plus, l’application arg(sk ) : V \ K0 → S 1 est une fibration dont les fibres sont transversales au champ de Reeb Rα en tout point p ∈ V vérifiant sk (p) ≥ δ Démonstration. — En un point p ∈ V où |sk (p)| ≤ δ, la dérivée ∂ξ sk (p) est non nulle en vertu de (2) et dsk (p) est donc surjective. Pour |w| ≤ δ, l’ensemble Kw est une sous-variété de codimension deux de V transversale à ξ. La structure ξ donne sur Kw un champ d’hyperplans ξw d’équation α|ker dsk = 0. Les inégalités |∂ξ sk | ≥ δk 1/2 et |∂¯ξ sk | ≤ C assurent que, pour k assez grand, dsk |ξ est presque C-linéaire et donc que ξw est presque J-invariante. Comme dα est non dégénérée sur tout sous-espace complexe et que la non-dégénérescence est une condition ouverte, dα est non dégénérée sur ξw et ξw est une structure de contact. On observe de plus qu’en tout point p ∈ V on a |dsk (p)(Rα ) − iksk (p)| ≤ Ck 1/2 . Lorsque |sk (p)| ≥ δ, cette inégalité montre que, pour k grand, k1 dsk (p)(Rα ) est proche de isk (p) et donc que dsk (p)(Rα ) est non nul et presque orthogonal à sk (p). Pour k assez grand, en combinant cette estimation pour |sk (p)| ≥ δ et l’estimation

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

111

it |∂ξ sk | ≥ δk 1/2 pour |sk (p)| ≤ δ, on obtient que les fibres s−1 k ({Re , R > 0})t∈S 1 de arg(sk ) sont des sous-variétés de V \ K0 . Un voisinage tubulaire de la reliure est donné par (Kw )w∈D2 (δ) ' K0 × D2 (δ), où la fibration arg(sk ) est exactement l’application arg(w). On a ainsi un modèle local de fibration adéquat. On obtient également que le champ de Reeb Rα est transversal aux fibres de arg(sk ) en dehors du voisinage N (K0 ) = {p ∈ V |sk (p) ≤ δ} de K0 .

Il reste à modifier la forme α sur N (K0 ) pour trouver un champ de Reeb transversal aux pages aussi dans ce domaine. La propriété requise est précisée dans le lemme cidessous. Lemme 4.9. — Soient (K, θ) un livre ouvert sur V et N (K) ' K × D2 un voisinage tubulaire trivialisé de la reliure sur lequel θ coïncide avec l’application coordonnées angulaire. Soit ξ = ker α une structure de contact qui induit une structure de contact positive sur chaque Kw = K × {w}, w ∈ D2 , et dont le champ de Reeb Rα est positivement transversal aux pages en dehors de N (K). Alors il existe une forme de contact α0 = F α égale à α hors de K et portée par (K, θ). C’est un exercice qu’on résout en jouant sur ∂F ∂r près de K dans de bonnes coordonnées. Ceci achève la preuve du corollaire 4.8. Le dernier point à vérifier pour prouver le théorème 4.6 est que les pages du livre ouvert (K, θ) sont des variétés de Stein et que la monodromie est représentée par un difféomorphisme symplectique. Compte tenu du théorème 4.2, il suffit de vérifier que ce sont des variétés de Weinstein. On note F = {p ∈ V | sk (p) = r, r ≥ δ} la fibre de θ au-dessus de 0, amputée d’un δ-voisinage de K. On pose φ = |sk | sur F et f = − log φ. Le champ X est le champ de Liouville donné sur F par iX dα|F = α|F . La condition LX ω = LX dα = d(iX dα) = dα = ω est automatique. Dans la pratique, il faut encore modifier sk et donc f pour faire de X un pseudo-gradient de f et de F une variété de Weinstein. Si on note Jk la projection de J sur T F parallèlement au champ de Reeb Rα , il faut choisir sk pour que 1 (i) |∂¯k φ| < √ |∂k φ|, 2 où ∂k = 12 (∇ − i∇ ◦ Jk ) et ∂¯k = 12 (∇ + i∇ ◦ Jk ) sont les parties Jk -linéaires et antilinéaires de ∇. Sous cette hypothèse, on calcule que Re(∂k φ) = 12 (dφ − kφJk∗ α) et Re(∂¯k φ) = 12 (dφ + kφJk∗ α). Les formes ∂k φ et ∂¯k φ sont respectivement des (1, 0) et (0, 1)-formes. Comme telles, les normes de leurs parties réelles et imaginaires sont égales. On obtient, en injectant les parties réelles dans (i) que, sur F , |dφ/φ + kJk∗ α| < |dφ/φ − kJk∗ α|.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

112

V. COLIN

Si on tient compte du fait que kJk∗ α(X) = kdα(X, Jk X) > 0 pour k grand, cette inégalité signifie que df (X) = −dφ/φ(X) > 0 en dehors des points critiques de f . 4.3. Stabilisation Soit S n la sphère de dimension n, et (U ∗ S n , ω0 = dp∧dq) la structure symplectique canonique (différentielle de la forme de Liouville) sur le fibré en boules unité cotangent à S n . Un twist symplectique positif le long de S n est le difféomorphisme symplectique de U ∗ S n défini en appliquant consécutivement et dans cet ordre [2] : • le flot géodésique au temps π ; • la différentielle de l’application d’antipodie de S n . Un twist symplectique positif vaut l’identité sur ∂(U ∗ S n ). Lorsque n = 1, c’est un twist de Dehn sur l’anneau U ∗ S 1 . Soit (K, θ) un livre ouvert de page (F 2n , ω) et de monodromie un difféomorphisme symplectique h. On suppose que D est un disque lagrangien paramétré proprement plongé dans F , dont le bord est une sphère legendrienne plongée dans ∂F ' K. Il existe une unique façon d’ajouter symplectiquement l’anse (U ∗ D, ω0 ) à (F, ω) le long de ∂D de sorte que le recollement entre ∂D et le bord de la section nulle D0 ' D de D soit donné par l’identité. Dans la variété symplectique (F 0 = F ∪∂ U ∗ D, ω 0 ), la sphère S = D ∪Id|∂D D0 est lagrangienne. Elle possède dans (F 0 , ω 0 ) un voisinage tubulaire N conjugué à (U ∗ S n , ω0 ). Si (F, ω) est de Weinstein, resp. Stein ou convexe, alors (F 0 , ω 0 ) est de Weinstein, resp. Stein ou convexe. On dit que le livre ouvert (K 0 , θ0 ) obtenu par suspension relative de (F 0 , ω 0 ) par le difféomorphisme symplectique τS ◦ h — où h est l’extension de h à F 0 par l’identité et τS est un twist symplectique positif effectué dans N le long de S — est un plombage lagrangien positif de (K, θ). Un livre ouvert (K 0 , θ0 ) est une stabilisation de (K, θ) s’il est obtenu à partir de (K, θ) par une suite de plombages lagrangiens positifs. On peut vérifier que deux livres ouverts stablement équivalents portent la même structure de contact. Pour cela on observe que la structure standard ζ0 de S 2n+1 est portée par un livre ouvert (K0 , θ0 ) dont la fibre est U ∗ S n et la monodromie un twist symplectique positif. Le livre ouvert (K0 , θ0 ) est obtenu par la construction de Milnor pour la singularité de Morse [2] : f : Cn+1 → C (z0 , ..., zn ) → z02 + ... + zn2 . On montre alors que tout plombage lagrangien positif (K 0 , θ0 ) de (K, θ) est obtenu par somme connexe adaptée de (K, θ) et (K0 , θ0 ), laquelle porte la structure ξ.

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

113

Théorème 4.10. — Sur une variété close de dimension 2n + 1 ≥ 5, deux livres ouverts portant une même structure de contact ξ et obtenus par la construction de Giroux-Donaldson-Ibort-Martinez-Presas ont des stabilisations isotopes. On ignore si cet énoncé est encore valable lorsqu’on part de deux livres ouverts quelconques. Une variété de contact (V, ξ) est Stein remplissable si V est le bord d’un domaine de Stein W et si ξ est le champ des hyperplans complexes T V ∩ JT V tangents à V . Théorème 4.11. — Une structure de contact sur une variété close est Stein remplissable si et seulement si elle est portée par un livre ouvert dont la monodromie est un produit de twists symplectiques positifs. Schéma de la preuve. — On suppose que la monodromie du livre ouvert est un produit de twists symplectiques positifs. On raisonne par récurrence sur le nombre de twists. Le début est assuré par le fait que si F est de Stein, la suspension relative de (F, Id) est le bord du domaine de Stein F × D2 . Le pas est donné par le résultat général suivant : si φ est un difféomorphisme symplectique de F qui vaut l’identité au bord et si S est une sphère lagrangienne de F , la suspension relative Σ(F, τS ◦ φ) est obtenue par chirurgie legendrienne sur la sphère S de Σ(F, φ). D’après Eliashberg [18], la chirurgie legendrienne préserve la classe des structures Stein remplissables. Réciproquement, d’après Eliashberg [18], toute variété Stein remplissable (V, ξ) est obtenue par chirurgie sur un entrelacs de sphères legendriennes L contenues dans une suspension relative Σ(F, Id) = (K1 , θ1 ). À l’aide d’une version relative du théorème 4.6, on montre qu’on peut trouver un livre ouvert équivalent à (K1 , θ1 ) dont les pages contiennent L . En considérant une stabilisation commune, on obtient un livre ouvert (K2 , θ2 ) qui contient L et dont la monodromie est un produit de twists symplectiques positifs. Effectuer une chirurgie legendrienne le long d’une sphère de L correspond alors à composer la monodromie de (K2 , θ2 ) par un twist symplectique positif. Au final, ξ est portée par un livre ouvert dont la monodromie est un produit de twists symplectiques positifs. 4.4. Les tores de dimension impaire sont de contact Théorème 4.12 ([5]). — Si Σ est une surface close orientable de genre g ≥ 1 et si V porte une structure de contact ξ, alors c’est aussi le cas de V × Σ. Démonstration. — Pour simplifier, on suppose Σ = T 2 . Soit (K, θ) un livre ouvert qui porte une forme de contact α de noyau ξ. On prend un voisinage tubulaire N (K) = K ×D2 de K dans lequel la fibration θ est θ((x, (r, φ)) = φ. On note (x1 , x2 ) ∈ (R/Z)2 un système de coordonnées sur le tore T 2 . Pour r0 ∈]0, 1/2[, on choisit une fonction

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

114

V. COLIN

lisse et croissante f : [0, 1] → [0, 1] qui vaut r pour r ≤ r0 et 1 pour r ≥ 2r0 . On pose alors α ˜ = f (r)(cos θdx1 − sin θdx2 ) + α. Si r0 est assez petit, un calcul montre que la forme α ˜ est de contact. Corollaire 4.13 ([5]). — Tout tore de dimension impaire porte une structure de contact.

RÉFÉRENCES [1] C. Abbas, K. Cieliebak & H. Hofer – The Weinstein conjecture for planar contact structures in dimension three, Comment. Math. Helv. 80 (2005), p. 771– 793. [2] V. I. Arnol0 d – Some remarks on symplectic monodromy of Milnor fibrations, in The Floer memorial volume, Progr. Math., vol. 133, Birkhäuser, 1995, p. 99–103. [3] D. Bennequin – Entrelacements et équations de Pfaff, in Third Schnepfenried geometry conference 1982, Vol. 1, Astérisque, vol. 107, Soc. Math. France, 1983, p. 87–161. [4] F. A. Bogomolov & B. de Oliveira – Stein small deformations of strictly pseudoconvex surfaces, in Birational algebraic geometry (Baltimore, MD, 1996), Contemp. Math., vol. 207, Amer. Math. Soc., 1997, p. 25–41. [5] F. Bourgeois – Odd dimensional tori are contact manifolds, Int. Math. Res. Not. 2002 (2002), p. 1571–1574. [6] C. Caubel, A. Némethi & P. Popescu-Pampu – Milnor open books and Milnor fillable contact 3-manifolds, Topology 45 (2006), p. 673–689. [7] V. Colin – Chirurgies d’indice un et isotopies de sphères dans les variétés de contact tendues, C. R. Acad. Sci. Paris Sér. I Math. 324 (1997), p. 659–663. [8] , Recollement de variétés de contact tendues, Bull. Soc. Math. France 127 (1999), p. 43–69. [9] , Sur la torsion des structures de contact tendues, Ann. Sci. École Norm. Sup. 34 (2001), p. 267–286. [10] , Une infinité de structures de contact tendues sur les variétés toroïdales, Comment. Math. Helv. 76 (2001), p. 353–372. [11] V. Colin, E. Giroux & K. Honda – On the coarse classification of tight contact structures, in Topology and geometry of manifolds (Athens, GA, 2001), Proc. Sympos. Pure Math., vol. 71, Amer. Math. Soc., 2003, p. 109–120. [12] , Finitude homotopique et isotopique des structures de contact tendues, en préparation.

ASTÉRISQUE 317

(969)

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

115

[13] V. Colin & K. Honda – Reeb vector fields and open book decompositions, en préparation. [14] S. K. Donaldson – Symplectic submanifolds and almost-complex geometry, J. Differential Geom. 44 (1996), p. 666–705. [15] , Lefschetz pencils on symplectic manifolds, J. Differential Geom. 53 (1999), p. 205–236. [16] Y. Eliashberg – Classification of overtwisted contact structures on 3-manifolds, Invent. Math. 98 (1989), p. 623–637. [17] , Filling by holomorphic discs and its applications, in Geometry of lowdimensional manifolds, 2 (Durham, 1989), London Math. Soc. Lecture Note Ser., vol. 151, Cambridge Univ. Press, 1990, p. 45–67. [18] , Topological characterization of Stein manifolds of dimension > 2, Internat. J. Math. 1 (1990), p. 29–46. [19] , Contact 3-manifolds twenty years since J. Martinet’s work, Ann. Inst. Fourier (Grenoble) 42 (1992), p. 165–192. [20] , A few remarks about symplectic filling, Geom. Topol. 8 (2004), p. 277– 293. [21] Y. Eliashberg & M. Gromov – Convex symplectic manifolds, in Several complex variables and complex geometry, Part 2 (Santa Cruz, CA, 1989), Proc. Sympos. Pure Math., vol. 52, Amer. Math. Soc., 1991, p. 135–162. [22] Y. Eliashberg & W. Thurston – Confoliations, University Lecture Series, vol. 13, Amer. Math. Soc., 1998. [23] J. B. Etnyre – On symplectic fillings, Algebr. Geom. Topol. 4 (2004), p. 73–80. , Planar open book decompositions and contact structures, Int. Math. [24] Res. Not. 2004 (2004), p. 4255–4267. [25] J. B. Etnyre & K. Honda – On the nonexistence of tight contact structures, Ann. of Math. 153 (2001), p. 749–766. [26] , Tight contact structures with no symplectic fillings, Invent. Math. 148 (2002), p. 609–626. [27] E. Giroux – Convexité en topologie de contact, Comment. Math. Helv. 66 (1991), p. 637–677. [28] , Topologie de contact en dimension 3 (autour des travaux de Yakov Eliashberg), Séminaire Bourbaki (1992/93), exposé no 760, Astérisque 216 (1993), p. 7–33. [29] , Une infinité de structures de contact tendues sur une infinité de variétés, Invent. Math. 135 (1999), p. 789–802. [30] , Structures de contact en dimension trois et bifurcations des feuilletages de surfaces, Invent. Math. 141 (2000), p. 615–689.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

116

[31] [32]

[33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45]

[46] [47] [48] [49]

V. COLIN

, Structures de contact sur les variétés fibrées en cercles audessus d’une surface, Comment. Math. Helv. 76 (2001), p. 218–262. , Géométrie de contact : de la dimension trois vers les dimensions supérieures, in Proceedings of the International Congress of Mathematicians, Vol. II (Beijing, 2002), Higher Ed. Press, 2002, p. 405–414. , Structures de contact, livres ouverts et tresses, en préparation. E. Giroux & N. Goodman – On the stable equivalence of open books in threemanifolds, Geom. Topol. 10 (2006), p. 97–114. E. Giroux & J.-P. Mohsen – Structures de contact et fibrations symplectiques au-dessus du cercle, en préparation, corrigendum. N. Goodman – Overtwisted open books from sobering arcs, Algebr. Geom. Topol. 5 (2005), p. 1173–1195. H. Grauert – On Levi’s problem and the imbedding of real-analytic manifolds, Ann. of Math. 68 (1958), p. 460–472. J. W. Gray – Some global properties of contact structures, Ann. of Math. 69 (1959), p. 421–450. M. Gromov – Pseudo holomorphic curves in symplectic manifolds, Invent. Math. 82 (1985), p. 307–347. K. Honda – On the classification of tight contact structures. I, Geom. Topol. 4 (2000), p. 309–368. , On the classification of tight contact structures. II, J. Differential Geom. 55 (2000), p. 83–143. , Gluing tight contact structures, Duke Math. J. 115 (2002), p. 435–478. K. Honda, W. H. Kazez & G. Matić – Convex decomposition theory, Int. Math. Res. Not. 2002 (2002), p. 55–88. , Right-veering diffeomorphisms of compact surfaces with boundary, Invent. Math. 169 (2007), p. 427–449. A. Ibort, D. Martínez-Torres & F. Presas – On the construction of contact submanifolds with prescribed topology, J. Differential Geom. 56 (2000), p. 235– 283. P. Kronheimer & T. Mrowka – Witten’s conjecture and property P, Geom. Topol. 8 (2004), p. 295–310. P. Kronheimer, T. Mrowka, P. Ozsváth & Z. Szabó – Monopoles and lens space surgeries, Ann. Math. 165 (2007), p. 457–546. A. Loi & R. Piergallini – Compact Stein surfaces with boundary as branched covers of B 4 , Invent. Math. 143 (2001), p. 325–348. J. Milnor – Morse theory, Based on lecture notes by M. Spivak and R. Wells. Annals of Math. Studies, No. 51, Princeton Univ. Press, 1963.

ASTÉRISQUE 317

(969)

[50]

LIVRES OUVERTS EN GÉOMÉTRIE DE CONTACT

117

, Singular points of complex hypersurfaces, Annals of Math. Studies, No. 61, Princeton Univ. Press, 1968.

[51] W. Neumann & L. Rudolph – Unfoldings in knot theory, Math. Ann. 278 (1987), p. 409–439. [52] P. Ozsváth & Z. Szabó – Heegaard Floer homology and contact structures, Duke Math. J. 129 (2005), p. 39–61. [53] F. Quinn – Open book decompositions, and the bordism of automorphisms, Topology 18 (1979), p. 55–73. [54] L. Siebenmann – Les bissections expliquent le théorème de Reidemeister-Singer, prépublication (Orsay), 1979. [55] J. Stallings – On fibering certain 3-manifolds, in Topology of 3-manifolds and related topics (Proc. The Univ. of Georgia Institute, 1961), Prentice-Hall, 1962, p. 95–100. [56] W. Thurston & H. E. Winkelnkemper – On the existence of contact forms, Proc. Amer. Math. Soc. 52 (1975), p. 345–347. [57] I. Torisu – Convex contact structures and fibered links in 3-manifolds, Int. Math. Res. Not. 2000 (2000), p. 441–454.

Vincent COLIN Laboratoire de mathématiques Jean Leray UMR CNRS-UN-ÉCN 6629 Université de Nantes Faculté des Sciences et Techniques 2, rue de la Houssinière B.P. 92208 F- 44322 Nantes Cedex 03 E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (970) Systèmes pluricanoniques sur les variétés de type général Olivier DEBARRE

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 970, p. 119 à 140

Novembre 2006

SYSTÈMES PLURICANONIQUES SUR LES VARIÉTÉS DE TYPE GÉNÉRAL [d’après Hacon–Mc Kernan, Takayama, Tsuji] par Olivier DEBARRE

INTRODUCTION Un des premiers objets intrinsèquement attachés à une variété(1) projective lisse X est son fibré (en droites) canonique ωX , défini comme le déterminant de son fibré cotangent. Pour tout entier m, on note Pm (X) (le m-ième plurigenre) la dimension ⊗m de l’espace vectoriel des sections (holomorphes) globales du fibré en droites ωX et on définit un invariant numérique de X, appelé sa dimension de Kodaira, en posant κ(X) = lim sup m→+∞

log Pm (X) . log m

Si n est la dimension de X, on a κ(X) ∈ {−∞, 0, . . . , n}. On dit que X est de type général si κ(X) = n. Comme leur nom l’indique, les variétés de type général sont très répandues : une courbe projective lisse est de type général si et seulement si son genre est > 2 ; une hypersurface (lisse) de Pn+1 définie par une équation homogène de degré d est de type général lorsque d > n + 3 (sa dimension de Kodaira est 0 pour d = n + 2 et −∞ pour d 6 n + 1). ⊗m Le choix d’une base de l’espace vectoriel des sections globales de ωX permet de définir une application rationnelle ϕm,X : X 99K PPm (X)−1 dont on sait montrer, si X est de type général, qu’elle est génériquement injective pour tout entier m assez grand. Le but de cet exposé est de montrer le résultat suivant. Théorème 0.1 (Hacon–Mc Kernan, Takayama, Tsuji). — Pour tout entier n > 0, il existe un entier mn tel que l’application rationnelle ϕm,X soit génériquement injective (1)

Nous travaillons sur le corps des complexes et toutes nos variétés et sous-variétés sont irréductibles.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

120

O. DEBARRE

pour toute variété projective lisse de type général X de dimension n et tout entier m > mn . Comme Maehara le montre dans [14], cela entraîne la conjecture suivante de Severi– Iitaka. Corollaire 0.2. — Une variété X étant fixée, il n’y a qu’un nombre fini de classes d’équivalence birationnelle de variétés de type général qui sont images de X par une application rationnelle. Pour les courbes, on peut prendre m1 = 3 (cela résulte du théorème de Riemann– Roch). Pour les surfaces, on peut prendre m2 = 5 ([3]). Pour les variétés de dimension 3, on peut prendre m3 = 18(29 · 37 )! ([21]) et on a en tout état de cause m3 > 27 ([9]). En dimension 2, la démonstration s’appuie de façon essentielle sur l’existence d’un modèle minimal (c’est-à-dire pour lequel le fibré canonique est nef (2)) lisse. En dimension supérieure, le résultat était déjà connu (avec une constante mn effective) pour les variétés de type général dont le fibré canonique est nef, grâce aux travaux de Demailly, Angehrn–Siu, Kollár et Tsuji sur la conjecture de Fujita (cf. cor. 3.2). Le Programme du Modèle Minimal de Mori prédit l’existence d’un modèle minimal pour toutes les variétés de type général, dont des démonstrations viennent d’ailleurs d’être proposées par Birkar, Cascini, Hacon et Mc Kernan d’une part ([2]) et Siu d’autre part ([19]). Cependant, les singularités de ce modèle empêchent d’obtenir notre résultat à partir du cas nef. Il existe deux démonstrations, publiées simultanément, du th. 0.1, toutes deux basées sur des idées de Tsuji ([22], [23]) : celle de Hacon et Mc Kernan ([8]) et celle de Takayama ([20]). Aucune ne donne de valeur explicite pour mn . La stratégie de Tsuji est, brièvement, la suivante (la terminologie est définie dans le texte). Grâce au théorème d’annulation de Nadel (th. 2.1), il suffit, étant donnés deux points très généraux x1 et x2 de X, de produire un Q-diviseur effectif numériquement équivalent à un multiple positif du diviseur canonique KX et dont le lieu non klt contient x1 comme point isolé, et x2 . Il est facile de produire un diviseur dont le lieu non klt contient x1 et x2 ; on cherche ensuite à diminuer la dimension d’une composante V de ce lieu contenant x1 . Comme x1 est très général, V est de type général et par récurrence sur la dimension, on peut trouver un diviseur convenable sur V . Tout le problème est de relever ce diviseur à X. Lorsque KX est nef, c’est simplement le théorème d’annulation de Serre (c’est la stratégie qui mène au th. 3.1), mais (2)

Cela signifie que son degré sur toute courbe est positif.

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

121

en général, on a besoin d’un énoncé d’extension de formes pluricanoniques de V à X. Lorsque V est un diviseur, de tels énoncés existaient déjà dans la littérature, tous plus ou moins issus de [17], et à la fois Hacon–Mc Kernan et Takayama démontrent d’abord un résultat de ce type (th. 6.1). Pour traiter le cas général, on éclate V dans X et on se ramène au cas précédent en comparant les formes pluricanoniques sur V aux formes pluricanoniques sur l’éclaté. Takayama utilise pour cela des résultats de Kawamata sur la positivité de certaines images directes, tandis que Hacon et Mc Kernan utilisent un résultat de Campana généralisant des résultats de positivité analogues de Viehweg. Cet exposé suit la preuve de Takayama, sauf à cet endroit où nous préférons utiliser le résultat de Campana. On obtient ainsi l’injectivité générique de ϕm,X dès que m est plus grand qu’un entier qui dépend de n et du volume de KX . Si ce volume est grand, on en déduit le théorème ; s’il est petit, X appartient à une famille limitée de variétés et l’existence de mn est claire (c’est ici que l’on perd l’effectivité). Je remercie pour leur aide à la préparation de cet exposé Arnaud Beauville, Laurent Bonavero, Frédéric Campana, Stéphane Druel, Gianluca Pacienza, Mihai Păun, Shigeharu Takayama et Eckart Viehweg, ainsi que tous les participants aux groupes de travail de Strasbourg et du Kleebach.

1. PRÉLIMINAIRES 1.1. Diviseurs grands et volume Soit L un diviseur de Cartier sur une variété projective X de dimension n, c’està-dire une combinaison linéaire à coefficients entiers d’hypersurfaces de X qui peut être définie localement par une seule équation (on permettra parfois des coefficients rationnels, et on parlera alors de Q-diviseur). On note OX (L) le fibré en droites sur X associé à L, puis H 0 (X, L) l’espace vectoriel de ses sections globales et h0 (X, L) sa dimension. On désigne par ≡ l’équivalence linéaire entre diviseurs de Cartier (qui signifie que les fibrés en droites associés sont isomorphes). Pour des Q-diviseurs de Cartier D et D0 sur X, on note D ≡Q D0 s’il existe un entier q 6= 0 pour lequel les Q-diviseurs qD et qD0 sont entiers et linéairement équivalents, et D ∼ D0 si D et D0 sont numériquement équivalents, c’est-à-dire que leur degré sur toute courbe de X est le même. On appelle volume de L le réel positif vol(L) = lim sup m→+∞

h0 (X, mL) mn /n!

(c’est en fait une limite). Pour tout entier positif q, on a vol(qL) = q n vol(L), ce qui permet de définir le volume d’un Q-diviseur D en posant vol(D) = q −n vol(qD), où

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

122

O. DEBARRE

q est un entier > 0 quelconque tel que qD soit un diviseur (entier). Le volume d’un Q-diviseur est invariant par image inverse par un morphisme birationnel. Si D est nef (cf. note 2), on a vol(D) = Dn (théorème de Riemann–Roch), où Dn désigne le n fois

z }| { produit d’intersection D · . . . · D (3). Le volume d’un diviseur (entier) nef est donc un nombre entier, mais on sait construire des diviseurs de volume irrationnel. On dit que D est grand (« big » en anglais) si vol(D) > 0. Tout Q-diviseur ample est grand (et nef), mais la notion est plus souple : l’image inverse d’un Q-diviseur grand par un morphisme génériquement fini entre variétés projectives est encore un Q-diviseur grand. Un Q-diviseur est grand si et seulement si c’est la somme d’un Q-diviseur ample et d’un Q-diviseur effectif (lemme de Kodaira). Si L est un diviseur grand, l’application rationnelle ϕ|mL| : X 99K PH 0 (X, mL)∗ définie par les sections globales de OX (mL) est génériquement injective pour tout entier m 0. Lorsque X est de plus lisse, on désigne par KX tout diviseur sur X vérifiant ωX = OX (KX ) (il est donc défini à équivalence linéaire près). Comme expliqué dans l’introduction, X est de type général si et seulement si KX est grand, et l’application ϕm,X de cette introduction est ϕ|mKX | . Plus généralement, une variété projective est de type général si une désingularisation l’est (elles le sont alors toutes). Donnons à titre d’exemple un corollaire du th. 0.1 qui fait intervenir la notion de volume. Corollaire 1.1. — Pour toute variété projective lisse de type général X de dimension n, on a vol(KX ) > m−n n . Preuve — Si µ : X 0 → X est une désingularisation de l’éclatement de l’idéal du lieu de base(4) du système linéaire |mn KX |, on a une décomposition µ∗ (mn KX ) ≡ M + F , (3)

D’un point de vue topologique, pour un diviseur entier L, c’est le cup-produit n fois

z

}|

{

c1 (OX (L)) ^ · · · ^ c1 (OX (L)) ∈ H 2n (X, Z) ' Z. (4)

On appelle lieu de base d’un système linéaire |T | sur une variété X l’intersection schématique Base(|T |) =

T

L∈|T |

L.

On note b(|T |) ⊂ OX le faisceau d’idéaux associé. Si µ : X 0 → X est une désingularisation de l’éclatement de b(|T |), on a une décomposition µ∗ (|T |) = |M | + F en somme d’une partie sans point base (donc nef) |M | et d’une partie fixe (effective) F . On a b(|T |) = µ∗ OX 0 (−F ) et la composée ϕ|T | ◦ µ est le morphisme ϕ|M | .

ASTÉRISQUE 317

(970)

123

SYSTÈMES PLURICANONIQUES

avec M diviseur nef et grand et F diviseur effectif. On a alors ϕ|mn KX | ◦ µ = ϕ|M | et (1)

vol(KX )

vol(µ∗ (mn KX )) >

=

1 mn n

=

1 Mn mn n

=

1 mn n

1 mn n

vol(M )

deg(ϕ|M | ) deg ϕ|M | (X 0 ) >

1 mn n

,

d’où le corollaire.

2. IDÉAUX MULTIPLICATEURS 2.1. Motivations Soit X une variété projective lisse de dimension n. Lorsque L est un diviseur ample, on a (théorème de Kodaira) ∀i > 0

H i (X, KX + L) = 0.

Il n’est pas très difficile de montrer que cela subsiste si L est nef et grand, mais on a encore mieux. Théorème 2.1 (Nadel). — Soit X une variété projective lisse. Soit D un Q-diviseur effectif et soit L un diviseur sur X tels que L − D soit nef et grand. Pour tout i > 0, on a H i (X, ID (KX + L)) = 0. Dans cet énoncé, ID est un faisceau d’idéaux sur X, appelé idéal multiplicateur de D, que l’on peut considérer ici comme un terme compensateur du défaut éventuel de positivité de L. Il est défini ainsi(5) : par le théorème d’Hironaka, il existe une variété projective lisse X 0 et une log-résolution µ : X 0 → X de D, c’est-à-dire un morphisme birationnel dont le lieu exceptionnel(6) Exc(µ) est tel que (le support de) Exc(µ)+µ∗ D est un diviseur à croisements normaux simples. On pose KX 0 /X = KX 0 − µ∗ KX et(7) ID = µ∗ OX 0 (KX 0 /X − [µ∗ D]).

(5)

Pour une définition analytique des idéaux multiplicateurs, voir [6]. C’est-à-dire le complémentaire du plus grand ouvert de X 0 sur lequel µ est un isomorphisme. (7) Bien que les diviseurs KX 0 et KX ne soient pas bien définis, KX 0 /X l’est ; c’est un diviseur effectif combinaison linéaire de diviseurs µ-exceptionnels, c’est-à-dire dont l’image par µ est de codimension au moins 2. D’autre part, on note [D] la partie entière d’un Q-diviseur D, obtenue en prenant les parties entières de ses coefficients. De la même façon, on note {D} = D − [D] sa partie fractionnaire. (6)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

124

O. DEBARRE

On vérifie que ID est bien un faisceau d’idéaux qui ne dépend pas des choix faits. Il est trivial hors du support de D et vérifie : • si D est à coefficients entiers, ID = OX (−D) ; • si D est à croisements normaux simples, ID = OX (−[D]) ; (2)

• si D0 est un Q-diviseur effectif, ID+εD0 = ID pour tout ε > 0 suffisamment petit ;

(3)

• si multx D > n, on a ID,x 6= OX,x .

On dit que la paire (X, D) (ou simplement le Q-diviseur D) est klt (8) en un point x si ID,x = OX,x . Le lieu des points de X où la paire (X, D) n’est pas klt sera noté Nklt(X, D) ; c’est le cosupport(9) de ID , muni de la structure réduite. On appellera seuil en x de la paire (X, D) le nombre(10) inf{t ∈ Q+ | (X, 1t D) est klt en x}. C’est un rationnel positif qui est < 1 si et seulement si la paire (X, D) est klt en x. La fonction seuil est semi-continue supérieurement : elle augmente par spécialisation. Le lieu non klt de la paire (X, D) est le fermé où son seuil est > 1. Exemple 2.2. — Un Q-diviseur effectif à croisements normaux simples est klt si et seulement si ses coefficients sont tous < 1. Exemple 2.3. — Soit C la courbe d’équation y 2 = x3 dans C2 . Les éclatements

C

E1

C

E1 E 2 C

E3

C E1 E2

fournissent une log-résolution µ : X 0 → C2 de la paire (C2 , C). On a µ∗ C

=

C + 2E1 + 3E2 + 6E3

KX 0

≡

E1 + 2E2 + 4E3

de sorte que KX 0 − [µ∗ ( 1t C)] ≡ −[ 1t ]C + (1 − [ 2t ])E1 + (2 − [ 3t ])E2 + (4 − [ 6t ])E3 . (8)

Pour Kawamata log-terminale ; la terminologie est abominable, mais il semble hélas trop tard pour en changer. (9) On appellera « cosupport » d’un faisceau d’idéaux I sur X le sous-schéma de X qu’il définit, c’est-à-dire le support de OX /I . (10) Attention : c’est l’inverse du « log-canonical threshold » tel qu’il est défini habituellement, comme par exemple dans [13], Definition 9.3.12.

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

125

L’idéal I 1t C est trivial si et seulement si tous ces coefficients sont positifs, c’est-à-dire lorsque t > 56 . Le seuil de (C2 , C) en l’origine est 65 .

3. LE CAS AMPLE : LE THÉORÈME D’ANGEHRN ET SIU Si A est un diviseur ample sur une variété projective lisse X de dimension n, Fujita a conjecturé en 1987 que ϕ|KX +mA| est un morphisme injectif (et même un plongement) pour m > n + 2. Cette conjecture est encore ouverte, mais beaucoup de progrès ont été réalisés. Un des meilleurs résultats connus est le suivant ([1]). Théorème 3.1 (Angehrn–Siu). — Soit A un diviseur ample sur une variété projective lisse X de dimension n. Pour tout entier m > 12 (n + 1)(n + 2), l’application rationnelle ϕ|KX +mA| est un morphisme injectif. Lorsque A n’est que nef et grand, et avec la même hypothèse sur m, une variante due à Kollár ([12], Theorem 5.9) entraîne que l’application rationnelle ϕ|KX +mA| est génériquement injective(11). La même remarque s’applique bien sûr au corollaire ci-dessous. Corollaire 3.2. — Soit X une variété projective lisse de dimension n dont le diviseur canonique KX est ample. Pour tout entier m > 1 + 12 (n + 1)(n + 2), l’application rationnelle ϕ|mKX | est un morphisme injectif. Preuve du théorème — Nous allons étudier l’application ϕ|KX +A| . Soient x1 et x2 des points distincts de X. Supposons construit un Q-diviseur effectif D0 ∼ t0 A, avec t0 < 1, qui n’est klt ni en x1 ni en x2 . Comme A − D0 est ample, le th. 2.1 entraîne H 1 (X, ID0 (KX + A)) = 0 d’où une surjection H 0 (X, KX + A) H 0 (Z, (KX + A)|Z ) où Z est le sous-schéma de X défini par le faisceau d’idéaux ID0 (il contient donc les points x1 et x2 ). Si on arrive à faire en sorte que x1 soit isolé dans Z, il existe alors un élément de H 0 (Z, (KX + A)|Z ) non nul en x1 et nul partout ailleurs sur Z, qui se remonte en un élément de H 0 (X, KX + A) non nul en x1 et nul en x2 . Cela signifie que ϕ|KX +A| est un morphisme et que ϕ|KX +A| (x1 ) 6= ϕ|KX +A| (x2 ). (11)

Plus exactement, sa restriction à l’ouvert dense X phisme injectif.

B+ (A), qui sera défini en (4), est un mor-

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

126

O. DEBARRE

La construction de D0 se fait de la façon suivante : on exhibe tout d’abord un Q-diviseur effectif D non klt en x1 et x2 et de seuil 1 en, disons, x1 et on procède par récurrence pour diminuer la dimension d de Nklt(X, D) en x1 (en ajoutant à chaque pas à D des petits multiples de A) jusqu’à ce qu’elle soit nulle. 3.1. Premier pas : construction d’un diviseur très singulier en x1 et x2 C’est classique : avoir multiplicité au moins r en chacun des points (lisses !) x1 et n x2 impose 2 n+r−1 ∼ 2 rn! conditions sur les éléments d’un système linéaire. Posons n p vn = n n 2/ vol(A) + ε (avec ε > 0 petit) ; on a h0 (X, [mvn ]A) ∼ vol(A)

[mvn ]n 2mn nn > n! n!

pour m 0. On peut donc trouver un diviseur G ∈ |[mvn ]A| de multiplicité au moins 1 mn en x1 et en x2 . Le Q-diviseur m G a alors multiplicité au moins n en x1 et en x2 , 1 G par un rationnel de ]0, 1] donc n’est klt ni en x1 , ni en x2 par (3). En multipliant m convenable, on obtient un Q-diviseur effectif Dn−1 ∼ tn−1 A, avec tn−1 6 vn , qui est de seuil 1 en x1 ou x2 . Cela initie la récurrence pour d = n − 1. On supposera pour simplifier que le seuil est 1 en x1 , mais > 1 en x2 (12). 3.2. Deuxième pas : rendre le lieu non klt irréductible en x1 Soit D un Q-diviseur effectif de seuil 1 en x1 et > 1 en x2 . Soit V une composante irréductible de Nklt(X, D) passant par x1 et soit B un élément général de |mA| contenant V , pour un m 0. Fixons un rationnel δ ∈ ]0, 1[. Hors de V , le lieu non klt de (1 − δ)D + bB coïncide avec celui de (1 − δ)D pour tout rationnel b ∈ [0, 1[ (cela résulte du théorème de Bertini : B est lisse hors de V ) donc évite un voisinage de x1 . En revanche, pour tout δ assez petit, le seuil reste > 1 en x2 par (2). En x1 , il existe un unique rationnel bδ > 0 pour lequel le seuil de (1 − δ)D + bδ B est exactement 1, et lim inf δ→0 bδ = 0. Pour des δ arbitrairement petits, on a bδ < 1, le lieu Nklt(X, (1 − δ)D + bδ B) contient x1 , et toutes ses composantes passant par x1 sont contenues dans V . Après une perturbation de D arbitrairement petite, on arrive donc, avec toujours un seuil > 1 en x2 , à un lieu non klt qui est • soit de dimension < d en x1 , auquel cas on a gagné (on évite même ainsi le troisième pas) ; • soit égal à V , donc irréductible, au voisinage de x1 . (12)

La méthode est identique, mais la rédaction plus lourde, si le seuil est 1 en x1 et en x2 .

ASTÉRISQUE 317

(970)

127

SYSTÈMES PLURICANONIQUES

3.3. Troisième pas : diminuer la dimension du lieu non klt Supposons donc construits un Q-diviseur effectif Dd ∼ td A et une variété V de dimension d tels que V est la seule composante irréductible de Nklt(X, Dd ) passant par x1 (elle peut ou non contenir x2 ). Comme dans le premier pas, on peut choisir, p pour vd = d d 2/ vol(A|V ) + ε et m 0, un diviseur GV ∈ |[mvd ]A|V | tel que multx1 GV > md (13). Le théorème d’annulation de Serre permet de remonter GV en un diviseur G de X. Fixons un rationnel δ ∈ ]0, 1[. De nouveau, pour G ∈ |[mvd ]A| général relevant GV , le Q-diviseur (1 − δ)Dd + uG est klt hors de V au voisinage de x1 pour tout rationnel u ∈ ]0, 1[, mais est de seuil > 1 en x2 pour tout δ assez petit. Un calcul local montre que le Q-diviseur (1 − δ)Dd + tout δ assez petit. Posons

1 mG

n’est pas klt en x1 pour

1 uδ = inf{u ∈ Q+ | (1 − δ)Dd + u m G n’est pas klt en x1 } 6 1.

C’est un rationnel, et le Q-diviseur effectif Dd−1 = (1 − δ)Dd + uδ

[mvd ] 1 G ∼ ((1 − δ)td + uδ )A m m

est alors de seuil 1 en x1 et > 1 en x2 pour tout δ assez petit. Au voisinage de x1 , il est klt hors du support de GV , donc son lieu non klt est non vide de dimension < d. En outre, on a bien Dd−1 ∼ td−1 A, avec td−1 6 td + vd . Au bout du compte, on arrive à un Q-diviseur effectif D0 ∼ t0 A dont le lieu non klt contient x1 comme point isolé et x2 , et t0 6

n X d=1

(vd + ε) 6

n » X d d 2/ vol(A|Vd ) + 2ε d=1

où Vd est une sous-variété de X de dimension d. Dès que A est divisible par un entier m, comme vol(A|Vd ) = Ad · Vd > md , le membre de droite de cette inégalité est 6

n n X X d 1 d √ d 2 + 2ε 6 1+ + 2ε m m d d=1

d=1

qui est < 1 lorsque m > 12 (n + 1)(n + 2). Ceci termine la preuve du th. 3.1.

(13)

Cela ne marche en fait que si x1 est lisse sur V . Dans le cas contraire, il faut faire cette construction pour une suite de points lisses de V convergeant vers x1 et passer à la limite (voir [13], 10.4.C pour plus de détails).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

128

O. DEBARRE

4. UN THÉORÈME DU TYPE ANGEHRN ET SIU DANS LE CAS GRAND Nous allons examiner comment modifier la démonstration précédente lorsque le diviseur A n’est plus que grand. Le premier pas 3.1 ne nécessite aucun changement, mais vol(A) n’est plus nécessairement égal à An . 4.1. Lieux de base stable et augmenté Pour le deuxième pas 3.2, nous avons utilisé le fait qu’un élément général de |mA| contenant V , pour m 0, est lisse hors de V (théorème de Bertini). En général, il faut aussi être hors du lieu de base (cf. note 4) de ce système linéaire. Il suffit donc de supposer que x1 et x2 sont hors du lieu de base stable de A, défini comme suit. Soit L un diviseur de Cartier sur une variété X. Le lieu de base stable de L est \ \ \ M B(L) = Base(|mL|) = m∈N∗

m∈N∗ M ∈|mL|

muni de la structure réduite. On définit aussi le lieu de base augmenté de L par(14) B+ (L) = B(mL − H) ⊃ B(L)

(4)

où H est un diviseur ample sur X et m est un entier assez grand. Il est indépendant des choix de H et de m ([13], Lemma 10.3.1). Le diviseur L est ample si et seulement si B+ (L) = ∅ ; il est grand si et seulement si B+ (L) 6= X, auquel cas X B+ (L) est le plus grand ouvert de X sur lequel L est ample. 4.2. Volumes restreints Le problème pour le troisième pas 3.3 est de relever à X le diviseur GV de grande multiplicité en le point x1 de V . À la suite de [22], puis [20] et [7], nous sommes amenés à poser les définitions suivantes. Si L est un diviseur de Cartier sur une variété projective X et si V est une sous-variété de X, on pose, en suivant les notations de [7], H 0 (X|V, L) = Im H 0 (X, L) −→ H 0 (V, L|V ) et l’on note h0 (X|V, L) la dimension de cet espace. On appelle volX|V (L) = lim sup m→+∞

h0 (X|V, mL) , md /d!

où d est la dimension de V , le volume de L restreint à V (c’est en fait une limite et, lorsque V = X, c’est le volume « usuel » de L). Il est bien sûr inférieur à vol(L|V ). (14)

c dans [20]. Il est noté XL

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

129

Avec ces définitions, la démonstration du troisième pas 3.3 fonctionne en remplaçant vol(A|V ) par volX|V (A) : si on suppose n » X d d 2/ volX|Vd (A) < 1 , d=1

on arrive comme dans le cas ample à un Q-diviseur effectif D0 ∼ t0 A, avec t0 < 1, dont le lieu non klt contient x1 comme point isolé et x2 . Écrivons A = A0 + E, avec A0 et E respectivement ample et effectif, et x1 et x2 hors du support de E (cf. (4)). Le th. 2.1 entraîne H 1 (X, ID0 +(1−t0 )E (KX + A)) = 0 et on termine comme précédemment puisque les lieux non klt de D0 et de D0 + (1 − t0 )E coïncident hors du support de E. On a ainsi montré le résultat suivant ([20], Proposition 5.3 ; cf. aussi [7], Theorem 2.20). Théorème 4.1. — Soit X une variété projective lisse de dimension n, soit A un diviseur grand sur X et soient x1 et x2 des points distincts de X B+ (A). On suppose qu’il existe c1 , . . . , cn > 0 tels que, pour toute sous-variété V de X passant par x1 ou x2 , on ait volX|V (A) > 2cdd ,

où

d = dim(V ) > 0.

Pn

d d=1 cd

Si < 1, l’application rationnelle ϕ|KX +A| est définie en x1 et en x2 et ϕ|KX +A| (x1 ) 6= ϕ|KX +A| (x2 ). Dans la pratique, tout le problème est d’arriver à estimer ces volumes restreints.

5. DÉMONSTRATION DU THÉORÈME 0.1 On a vu que le th. 0.1 en dimension n entraîne une minoration uniforme du volume d’un diviseur canonique d’une variété projective lisse de type général de dimension n (cor. 1.1). En suivant Tsuji, nous allons démontrer ce théorème par récurrence sur n, mais en prenant comme hypothèse seulement la conclusion de ce corollaire en dimension < n. Nous supposons donc qu’il existe une constante v > 0 telle que vol(KV ) > v pour toute variété projective de type général V de dimension < n, et montrons dans un premier temps que cela entraîne l’injectivité générique de ϕ|mKX | pour toute variété projective de type général X de dimension n et tout entier m plus grand qu’une borne dépendant linéairement de v et de vol(KX )−1/n . Théorème 5.1. — Soit n un entier > 0. Supposons qu’il existe une constante v > 0 telle que vol(KV ) > v pour toute variété projective de type général V de dimension < n.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

130

O. DEBARRE

Il existe des constantes an et bn telles que, pour toute variété projective lisse de type général X de dimension n, l’application rationnelle ϕ|mKX | soit génériquement injective pour tout entier m > an + bn vol(KX )−1/n . Preuve — Soient x1 et x2 deux points très généraux de X. Nous suivons le schéma de la preuve des th. 3.1 et 4.1. Lors du premier pas, on construit un Q-diviseur effectif Dn−1 ∼ tn−1 KX , avec tn−1 6 n21/n vol(KX )−1/n + ε. Aucun changement pour le second pas. Pour le troisième pas, nous avons un Q-diviseur effectif Dd ∼ td KX , de seuil 1 en x1 et > 1 en x2 , dont le lieu non klt a une unique composante irréductible V , de dimension d, passant par x1 , et il nous faut une borne inférieure sur le volume restreint volX|V (KX ). Comme x1 est très général, V est de type général(15), et l’estimation voulue est fournie par le résultat suivant ([20], Theorem 4.5), qui est central dans la preuve de Takayama et qui fournit la minoration sur les volumes restreints requise pour appliquer la méthode de démonstration du th. 4.1 ; on remarquera (c’est crucial !) en examinant la preuve de ce théorème que cette minoration n’est nécessaire que pour les sous-variétés V du type de celles qui interviennent dans l’énoncé du théorème ci-dessous. Théorème 5.2 (Takayama). — Soit X une variété projective lisse et soit V une sous-variété de X. Soit L un diviseur sur X et soit L ∼ A + E une décomposition où A est un Q-diviseur ample et E est un Q-diviseur effectif tel que V soit une composante irréductible de Nklt(X, E) de seuil général 1. On a volX|V (KX + L) > vol(KV ). Nous remettons la démonstration de ce résultat au § 6 et montrons comment terminer la démonstration du th. 5.1. Écrivons (lemme de Kodaira) KX ∼ A + E, où A et E sont des Q-diviseurs respectivement ample et effectif, et posons t = [td ] + 1 − td > 0. Comme x1 et x2 sont généraux, ils ne sont pas dans le support de E, de sorte que V est encore une composante irréductible de seuil général 1 de Nklt(X, Dd + tE). Le th. 5.2, appliqué au diviseur L = ([td ] + 1)KX ∼ tA + (Dd + tE), entraîne ([td ] + 2)d volX|V (KX ) = volX|V (KX + ([td ] + 1)KX ) > vol(KV ) > v. Pour diminuer la dimension de Nklt(X, Dd ), on ajoute à D un Q-diviseur effectif équivalent à » d d 2/ volX|V (KX ) + ε KX 6 d(2/v)1/d (td + 2) + ε KX (15)

Toute sous-variété de X qui passe par un point très général de X est de type général. En d’autres termes, la réunion des sous-variétés de X qui ne sont pas de type général est contenue dans une réunion dénombrable de sous-variétés propres de X.

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

131

pour obtenir un diviseur Dd−1 ∼ td−1 KX avec td−1 6 td + d(2/v)1/d (td + 2) + ε. On arrive au final à un Q-diviseur effectif D0 ∼ t0 KX dont le lieu non klt contient x1 comme point isolé et x2 , avec t0 < an + b0n tn−1 6 an + b0n n21/n vol(KX )−1/n où an et b0n sont des constantes (que l’on pourrait calculer) ne dépendant que de n et de v. On conclut la démonstration du th. 5.1 en raisonnant comme au § 4.2. Il n’est maintenant pas difficile de conclure la preuve du th. 0.1. Soit X une variété projective lisse de type général de dimension n. Par le th. 5.1, le morphisme ϕ|mKX | est birationnel sur son image pour m > mX = [1 + an + bn vol(KX )−1/n ]. Si vol(KX ) > 1, on a terminé. Supposons donc vol(KX ) < 1. La variété X est birationnellement isomorphe à une sous-variété d’un espace projectif (que l’on peut après projection supposer être P2n+1 ) qui, par (1), est de degré 6 mnX vol(KX ) 6 (1 + an + bn vol(KX )−1/n )n vol(KX ) 6 ((1 + an ) vol(KX )1/n + bn )n 6 (1 + an + bn )n nombre qui ne dépend que de n et de v. Ces variétés sont paramétrées par une variété algébrique (schéma de Chow). Il n’est pas très difficile d’en déduire, en utilisant la semi-continuité supérieure des plurigenres, que le volume de leur diviseur canonique est minoré par une constante strictement positive ([20], Lemma 6.1). On a donc démontré le th. 0.1.

6. DÉMONSTRATION DU THÉORÈME 5.2 Cette démonstration est très technique. Nous allons essayer d’en présenter les étapes et les idées principales. 6.1. Cas où V est une hypersurface de X Dans ce cas, l’hypothèse du th. 5.2 dit simplement que V apparaît avec multiplicité 1 dans E. Soit µ : X 0 → X une log-résolution de E. On écrit µ∗ E = V 0 + F

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

132

O. DEBARRE

où V 0 est le transformé strict (lisse) de V et F est un Q-diviseur effectif. Il s’agit de comparer d’un côté h0 (X 0 , m(KX 0 + µ∗ L)) = h0 (X 0 , m(KX 0 + V 0 + µ∗ A + F )) et de l’autre h0 (V 0 , mKV 0 ). Cela se fait à l’aide d’un théorème d’extension de sections d’un type initié par Siu en 1998 dans sa démonstration de l’invariance des plurigenres par déformation ([17], [18]) et qui a depuis eu une nombreuse descendance(16). Théorème 6.1 (Takayama). — Soit X une variété complexe projective lisse et soit H une hypersurface irréductible lisse de X. Soit L ∼ A + E un diviseur sur X où A est un Q-diviseur nef et grand tel que H 6⊂ B+ (A) et E est un Q-diviseur effectif dont le support ne contient pas H et tel que la paire (H, E|H ) soit klt. Alors la restriction H 0 (X, m(KX + H + L)) −→ H 0 (H, m(KH + L|H )) est surjective pour tout entier m > 0. Avant de démontrer ce théorème, montrons qu’il est suffisant pour notre propos. On travaille sur X 0 , avec l’hypersurface H = V 0 , et on aimerait appliquer le th. 6.1 au diviseur µ∗ L − V 0 ∼ µ∗ A + F ; le Q-diviseur µ∗ A est bien nef et grand et V 0 6⊂ B+ (µ∗ A), mais la paire (V 0 , F |V 0 ) n’a pas de raison d’être klt, puisqu’il faudrait pour cela que tous les coefficients de F |V 0 soient < 1 (ex. 2.2). Le théorème s’applique en revanche au diviseur µ∗ L − V 0 − [F ] ∼ µ∗ A + {F } et entraîne la surjectivité de la restriction (5)

H 0 (X 0 , m(KX 0 + V 0 + µ∗ A + {F })) H 0 (V 0 , m(KV 0 + (µ∗ A + {F })|V 0 ))

pour tout entier m > 0. Soit m0 un entier > 0 tel m0 (µ∗ A + {F }) soit un diviseur (entier effectif). L’espace vectoriel de gauche dans (5) est contenu dans H 0 (X 0 , m(KX 0 + µ∗ L)), tandis que, dès que m est divisible par m0 , l’espace vectoriel de droite dans (5) contient H 0 (V 0 , mKV 0 ). On a donc bien h0 (V, mKV ) = h0 (V 0 , mKV 0 ) 6 h0 (X 0 , m(KX 0 + µ∗ L)) = h0 (X, m(KX + L)) pour tout entier positif m divisible par m0 , ce qui démontre le th. 5.2 dans le cas où V est de codimension 1. Preuve du th. 6.1 — Commençons par énoncer quelques résultats complémentaires sur les idéaux multiplicateurs. (16)

Le th. 6.1 est [20], Theorem 4.1. Des versions plus générales, avec des démonstrations analytiques, sont données dans [15], [5] et [24].

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

133

6.1.1. Idéal multiplicateur d’un système linéaire. — Si D est un Q-diviseur effectif et |T | un système linéaire sur une variété lisse X, on définit un faisceau d’idéaux ID;|T | ⊂ OX de la façon suivante : si µ : X 0 → X est une modification telle que µ∗ |T | = |M | + F , où |M | est sans point base et Exc(µ) + F + µ∗ D est un diviseur à croisements normaux simples, on pose ([13], § 9.3.G) ID;|T | = µ∗ OX 0 (KX 0 /X − [µ∗ D] − F ). Notons que si la paire (X, D) est klt, le diviseur KX 0 /X − [µ∗ D] est effectif, donc ID;|T | contient l’idéal b(|T |) = µ∗ OX 0 (−F ) définissant le lieu de base de |T | (17). 6.1.2. Restriction des idéaux multiplicateurs. — On garde les hypothèses et les notations précédentes. Soit H une hypersurface lisse de X non contenue dans Base(|V |) ∪ Supp(D). L’idéal multiplicateur ID|H ;|V ||H est contenu dans l’image ID;|V | |H de ID;|V | dans OH ([13], Theorem 9.5.5). Plus précisément, il existe un faisceau d’idéaux adjH,D;|V | ⊂ ID;|V | dit idéal adjoint ([13], Definition 9.3.47) et une suite exacte 0 −→ ID;|V | (−H) −→ adjH,D;|V | −→ ID|H ;|V ||H −→ 0.

(6)

En particulier, si |V | est vide, on a une suite exacte 0 −→ ID (−H) −→ adjH,D;∅ −→ ID|H −→ 0.

(7)

Passons maintenant à la preuve proprement dite du th. 6.1. On peut supposer A ample(18). Notons n la dimension de X. On choisit un diviseur effectif très ample B sur X dont le support ne contient pas H. Soit ` un entier suffisamment grand pour m−1 que A − m−1 `m nB soit ample et que la paire (H, `m nB|H + E|H ) soit klt (utiliser (2)). 0 Soit s un élément de H (H, m(KH + L|H )) et soit S son diviseur. Pour chaque entier r > 0, on pose Ir = I r−1 S+E|H ⊂ OH . Comme la paire (H, E|H ) est klt, on a m

I`m ⊃ I`m+1 = I`S+E|H = IE|H (−`S) = OH (−`S). La section s` est donc nulle le long de I`m . Soit b un élément de H 0 (H, B|H ) de diviseur B|H . Par le lemme 6.2 ci-dessous, le produit s` bn se remonte en t ∈ H 0 (X, m`(KX + H + L) + nB). Posons N = (m − 1)(KX + H + L) + L

et

P =

m−1 div(t) + E. `m

(17) Cf. note 4. Le lien avec les idéaux multiplicateurs définis dans le § 2.1 est le suivant : on a ID = ID;∅ et, si m est un entier > 1 et D1 , . . . , Dm des diviseurs généraux dans |T |, on a ID;|M | = ID+ 1 (D1 +···+Dm ) ([13], Proposition 9.2.26). m

Écrivons A = A0 + E 0 , où A0 et E 0 sont des Q-diviseurs respectivement ample et effectif avec Supp(E 0 ) 6⊃ H, puis L ∼ (1 − ε)A + εA0 + εE 0 + E. Pour ε ∈ ]0, 1], le Q-diviseur (1 − ε)A + εA0 est ample, le Q-diviseur εE 0 +E est effectif et son support ne contient pas H, et la paire (H, εE 0 |H +E|H ) est klt pour ε 1 par (2).

(18)

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

134

O. DEBARRE

On a

m−1 m−1 nB − E ∼ A − nB. `m `m C’est donc un Q-diviseur ample sur X et le th. 2.1 entraîne H 1 (X, IP (KX +N )) = 0. Comme KX + N = m(KX + H + L) − H, la suite exacte (7) pour D = P , tensorisée par OX (m(KX + N + H)), fournit une surjection N −P ∼L−

(8)

H 0 (X, adjH,P ;∅ (m(KX + H + L))) H 0 (H, IP |H (m(KX + H + L))).

On a d’autre part P |H =

m−1 m−1 (`S + nB|H ) + E|H 6 nB|H + E|H + S `m `m

de sorte que IP |H ⊃ I m−1 nB|H +E|H +S = I m−1 nB|H +E|H (−S) = OH (−S) `m

`m

m−1 `m nB|H

puisque la paire (H, + E|H ) est klt. La section s est ainsi nulle le long de IP |H , donc par (8) se relève à X. Ceci montre le th. 6.1, sous réserve du lemme suivant. Lemme 6.2. — Pour chaque entier r > 0, l’image de la restriction H 0 (X, r(KX + H + L) + nB) −→ H 0 (H, r(KH + L|H ) + nB|H ) contient les sections nulles le long de Ir . Preuve — On procède par récurrence sur r. Pour r = 1, on invoque la suite exacte (7) pour D = E et le fait que L+nB−E ∼ A+nB étant ample, H 1 (X, IE (KX +L+nB)) est nul (th. 2.1) d’où une surjection H 0 (X, adjH,E;∅ (KX + H + L + nB)) H 0 (H, I1 (KH + L|H + nB|H )). Passons maintenant de r à r + 1. On a tout d’abord Ir (r(KH + L|H ) + nB|H ) = Ir (KH + (r − 1)(KH + L|H ) + L|H + nB|H ). Comme (r − 1)(KH + L|H ) + L|H −

r − 1

S + E|H ∼ A|H

m est ample, le faisceau Ir (r(KH + L|H ) + nB|H ) est engendré par ses sections globales ([13], Proposition 9.4.26). Si |T | ⊂ |r(KX + H + L) + nB| est le système linéaire des sections nulles sur Ir , on en déduit, avec l’hypothèse de récurrence, Ir = b(|T ||H ). D’autre part, b(|T ||H ) ⊂ IE|H ;|T ||H puisque E|H est klt. On utilise alors la suite exacte 0 −→ IE;|T | (−H) −→ adjE,H;|T | −→ IE|H ;|T ||H −→ 0

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

135

(cf. (6)). Comme L − E est ample, le th. 2.1 entraîne H 1 (X, IE;|T | (KX + r(KX + H + L) + nB + L)) = 0. On a donc une surjection H 0 (X, adjE,H;|T | ((r + 1)(KX + H + L) + nB)) H 0 (H, IE|H ;|T ||H ((r + 1)(KH + L|H ) + nB|H )). L’image de la restriction H 0 (X, (r + 1)(KX + H + L) + nB) −→ H 0 (H, (r + 1)(KH + L|H ) + nB|H ) contient donc les sections nulles le long de IE|H ;|T ||H donc a fortiori les sections nulles le long de Ir , donc celles nulles le long de Ir+1 ⊂ Ir . 6.2. Cas où V est de codimension > 2 Il n’est pas difficile de voir que l’on peut supposer V lisse. Soit µ : X 0 → X une log-résolution de E. On écrit X µ∗ E − KX 0 /X = aF F F

où le Q-diviseur de droite est à croisements normaux simples. Dire que V est une composante irréductible de Nklt(X, E) de seuil général 1 signifie que • si V ( µ(F ), alors aF < 1 ; • si V = µ(F ), alors aF 6 1, avec égalité pour au moins un F . Un procédé (un peu technique, mais court) dit de « concentration », dû à Kawamata et Shokurov ([11], § 3-1 ; [20], Lemma 4.8) permet de trouver une nouvelle décomposition L ≡Q A + E satisfaisant aux conditions du théorème pour laquelle on a V = µ(F ) et aF = 1 pour un unique F , que l’on note V 0 (19). On a ainsi un diagramme : V0 f

,→

↓ V

X0 ↓µ

,→

X

P où toutes les variétés sont lisses. Posons alors G = F 6=V 0 aF F . Si on écrit [G] = G1 − G2 , avec G1 et G2 effectifs sans composante commune, on a ainsi • G2 est µ-exceptionnel ; • µ(Supp(G1 )) ne contient pas V . (19)

Avec la terminologie de [8], V est un centre log-canonique exceptionnel de la paire (X, E).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

136

O. DEBARRE

Cela entraîne que, pour tout entier m > 0, (9) µ∗ OX 0 (−m[G]) est un faisceau d’idéaux sur X de cosupport ne contenant pas V , de sorte que (10)

H 0 (X, m(KX + L)) ⊃

(11)

H 0 (X, µ∗ OX 0 (−m[G])(m(KX + L)))

'

H 0 (X 0 , m(µ∗ (KX + A + E) − [G]))

'

H 0 (X 0 , m(KX 0 + V 0 + {G} + µ∗ A)).

Puisque la paire (V 0 , {G}|V 0 ) est klt(20), le th. 6.1 appliqué au diviseur (entier) L0 = µ∗ L − KX 0 /X − V 0 − [G] ≡Q {G} + µ∗ A sur X 0 et à l’hypersurface lisse V 0 ⊂ X 0 entraîne que l’espace (11) s’envoie surjectivement, par restriction à V 0 , sur H 0 (V 0 , m(KV 0 + L0 |V 0 )). Comme le cosupport de µ∗ OX 0 (−[G]) ne contient pas V , l’injection (10) se restreint aussi en une injection (12)

H 0 (V 0 , m(KV 0 + L0 |V 0 )) ,→ H 0 (X|V, m(KX + L))

et il ne nous reste plus qu’à comparer l’espace vectoriel de gauche avec H 0 (V, mKV ). Pour ce faire, nous allons appliquer une amélioration due à Campana ([4], Theorem 4.13) d’un résultat de positivité d’images directes de Viehweg ([25]) au morphisme f : V 0 → V et au diviseur D = {G}|V 0 (21). Théorème 6.3 (Campana). — Soit f : V 0 → V un morphisme à fibres connexes(22) entre variétés projectives lisses et soit D un Q-diviseur effectif sur V 0 dont la restriction à une fibre générale de f est à croisements normaux simples et à coefficients 6 1. Le faisceau f∗ OV 0 (m(KV 0 /V + D)) est faiblement positif pour tout entier positif m tel que mD soit entier. La faible positivité d’un faisceau cohérent sans torsion E sur une variété projective V est une notion assez subtile introduite par Viehweg ([25] ; [26], Definitions 2.11 et 2.13) : elle signifie que, si V0 est le plus grand ouvert de V sur lequel E est localement libre, il existe un ouvert dense U de V0 tel que, pour tout diviseur ample H sur V Car le diviseur {G} + V 0 est à croisements normaux simples, et les coefficients de {G} sont dans [0, 1[ ; cf. ex. 2.2. (21) Takayama utilise un résultat de positivité de Kawamata dont l’énoncé est plus technique et la démonstration difficile à suivre dans [10]. La méthode suivie ici m’a été indiquée par Druel, Păun et Campana. Le résultat de Campana est aussi utilisé dans [8] (Lemma 2.9 ; attention, Hacon et Mc Kernan disent « KX + ∆ est log canonique » lorsqu’ils veulent dire « la paire (X, ∆) est log canonique »). (22) On se ramène facilement, en suivant par exemple les arguments de 6.2.1, au cas où la fibration f est « préparée » (c’est-à-dire que f est lisse hors d’un diviseur à croisements normaux simples de V dont l’image inverse est contenue dans un diviseur à croisements normaux simples de V 0 ). (20)

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

137

et tout entier a > 0, il existe un entier b > 0 tel que le faisceau (Symab E |V0 )(bH|V0 ) soit engendré sur U par ses sections globales sur V0 . Lorsque U = V , c’est équivalent à dire que E est un faisceau localement libre nef sur V . On note m0 un entier > 0 tel que le diviseur m0 {G} soit entier. Vérifions que, dans notre situation, les fibres de f sont connexes et Em0 est non nul. Lemme 6.4 (Kawamata). — Pour tout entier m > 0 divisible par m0 , le faisceau Em = f∗ OV 0 (m(KV 0 /V + D)) est de rang 1 sur V et les fibres de f sont connexes. Preuve — On a Em

'

f∗ OV 0 (m(KX 0 + V 0 + G − [G])|V 0 )(−mKV )

'

f∗ OV 0 (−m[G]|V 0 )(m((KX + E)|V − KV )).

Par (9), µ∗ OX 0 (−m[G]) est un faisceau d’idéaux sur X dont le cosupport ne contient pas V , donc f∗ OV 0 (−m[G]|V 0 ) est de rang au moins 1. Ce faisceau est contenu dans f∗ OV 0 (−[G]|V 0 ) et on a une suite exacte µ∗ OX 0 (−[G]) −→ f∗ OV 0 (−[G]|V 0 ) −→ R1 µ∗ OX 0 (−[G] − V 0 ). Comme −[G] − V 0 ∼ KX 0 /X − [µ∗ (E)], le groupe de droite est nul par un théorème d’annulation qui se déduit facilement du th. 2.1 ([13], Theorem 9.4.1), de sorte que f∗ OV 0 (−[G]|V 0 ), donc aussi f∗ OV 0 (−m[G]|V 0 ), est de rang au plus, donc exactement 1. Il en est donc de même du faisceau localement libre f∗ OV 0 , qui est ainsi isomorphe à OV . Les fibres de f sont alors connexes par le théorème principal de Zariski, ce qui termine la démonstration du lemme. On veut déduire de la faible positivité de Em qu’un multiple positif convenable de KV 0 /V + {G}|V 0 + f ∗ A|V est linéairement équivalent à un diviseur effectif (je remercie Viehweg de m’avoir expliqué l’argument qui suit). 6.2.1. — Un résultat d’aplatissement de Raynaud ([16]) et le théorème d’Hironaka permettent de construire un diagramme ‹0 V

τ0

→

fe ↓

‹ V

V0 ↓f

τ

→

V

où τ 0 et τ sont des modifications vérifiant fe(Exc(τ 0 )) ⊂ Exc(τ ) et (13)

‹0 dont l’image par fe est de codimension > 2 toute hypersurface S 0 ⊂ V ‹ est τ 0 -exceptionnelle(23). dans V

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

138

O. DEBARRE

‹ = τ 0 ∗ D + fe∗ K Posons D e /V , de sorte que V ‹ ≡Q K 0 0 + τ 0 ∗ (KV 0 /V + D). KVe 0 /Ve + D e /V V ‹ est Si m est un entier > 0 divisible par m0 , le faisceau Eem = fe∗ OVe 0 (m(KVe 0 /Ve + D)) faiblement positif (th. 6.3), et comme τ∗ Eem ' f∗ OV 0 (m(KV 0 + D)) ' Em il est non nul (lemme 6.4). ‹, soit m1 un entier > 0 divisible par m0 tel que m1 A Soit H un diviseur ample sur V ‹⊂V ‹ le plus grand ouvert sur soit un diviseur entier vérifiant τ ∗ m1 A|V > H et soit U e lequel le faisceau Em1 est localement libre. Ce faisceau étant faiblement positif et non nul, (Symb (Eem1 ))(bH)|Ue a en particulier une section non nulle pour un entier b > 0 convenable. On en déduit 0

6= ' '

∗ ‹, fe∗ O 0 (bm1 (K 0 + D))(bm ‹ H 0 (U 1 τ A|V )) e e /Ve V V

‹), bm1 (K 0 + D ‹ + fe∗ τ ∗ A )) H 0 (fe−1 (U e /Ve e V V

‹), bm1 τ 0 ∗ (KV 0 /V + D + f ∗ A|V )). H 0 (fe−1 (U

‹ dans V ‹ est de codimension au moins 2, la partie de Comme le complémentaire de U ‹) dans V ‹0 est τ 0 -exceptionnelle par (13). codimension 1 du complémentaire de fe−1 (U On en déduit H 0 (V 0 , bm1 (KV 0 /V + D + f ∗ A|V )) 6= 0. Comme L0 |V 0 ≡Q D + f ∗ A|V , on obtient, pour tout entier m > 0, par multiplication, une injection H 0 (V, mbm1 KV ) ,→ H 0 (V 0 , mbm1 (KV 0 + L0 |V 0 )). Ceci, combiné avec l’inclusion (12) et le fait que les volumes restreints sont des limites, termine la démonstration du th. 5.2.

RÉFÉRENCES [1] U. Angehrn & Y.-T. Siu – Effective freeness and point separation for adjoint bundles, Invent. Math. 122 (1995), p. 291–308. [2] C. Birkar, P. Cascini, C. Hacon & J. McKernan – Existence of minimal models for varieties of log general type, prépublication électronique arXiv:math.AG/0610203. (23) Cf. [25], Lemma 7.3 et [20], Lemma 4.14. On peut aussi, si l’on veut, supposer que la fibration fe est « préparée » au sens de la note 22 ([20], Notation 4.16).

ASTÉRISQUE 317

(970)

SYSTÈMES PLURICANONIQUES

139

[3] E. Bombieri – Canonical models of surfaces of general type, Publ. Math. I.H.É.S. 42 (1973), p. 171–219. [4] F. Campana – Orbifolds, special varieties and classification theory, Ann. Inst. Fourier (Grenoble) 54 (2004), p. 499–630. [5] B. Claudon – Invariance for multiples of the twisted canonical bundle, Ann. Inst. Fourier (Grenoble) 57 (2007), p. 289–300. [6] J.-P. Demailly – L2 vanishing theorems for positive line bundles and adjunction theory, in Transcendental methods in algebraic geometry (Cetraro, 1994), Lecture Notes in Math., vol. 1646, Springer, 1996, p. 1–97. ˇ , M. Nakayame & M. Popa – [7] L. Ein, R. Lazarsfeld, M. Mustaţa Restricted volumes and base loci of linear series, prépublication électronique arXiv:math.AG/0607221. [8] C. Hacon & J. McKernan – Boundedness of pluricanonical maps of varieties of general type, Invent. Math. 166 (2006), p. 1–25. [9] A. R. Iano-Fletcher – Working with weighted complete intersections, in Explicit birational geometry of 3-folds, London Math. Soc. Lecture Note Ser., vol. 281, Cambridge Univ. Press, 2000, p. 101–173. [10] Y. Kawamata – Subadjunction of log canonical divisors. II, Amer. J. Math. 120 (1998), p. 893–899. [11] Y. Kawamata, K. Matsuda & K. Matsuki – Introduction to the minimal model problem, in Algebraic geometry, Sendai, 1985, Adv. Stud. Pure Math., vol. 10, North-Holland, 1987, p. 283–360. [12] J. Kollár – Singularities of pairs, in Algebraic geometry—Santa Cruz 1995, Proc. Sympos. Pure Math., vol. 62, Amer. Math. Soc., 1997, p. 221–287. [13] R. Lazarsfeld – Positivity in algebraic geometry. II, Ergebnisse Math. Grenzg., 3. Folge, vol. 49, Springer-Verlag, Heidelberg, 2004. [14] K. Maehara – A finiteness property of varieties of general type, Math. Ann. 262 (1983), p. 101–123. ˇ un – Siu’s invariance of plurigenera : a one-tower proof, à paraître dans [15] M. Pa J. Diff. Geom.. [16] M. Raynaud – Flat modules in algebraic geometry, Compositio Math. 24 (1972), p. 11–31. [17] Y.-T. Siu – Invariance of plurigenera, Invent. Math. 134 (1998), p. 661–673. [18]

, Extension of twisted pluricanonical sections with plurisubharmonic weight and invariance of semipositively twisted plurigenera for manifolds not necessarily of general type, in Complex geometry (Göttingen, 2000), Springer, 2002, p. 223–277.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

140

[19]

O. DEBARRE

, A general non-vanishing theorem and an analytic proof of the finite generation of the canonical ring, prépublication électronique arXiv:math.AG/0610740.

[20] S. Takayama – Pluricanonical systems on algebraic varieties of general type, Invent. Math. 165 (2006), p. 551–587. [21] H. Tsuji – Pluricanonical systems of projective 3-folds, prépublication électronique arXiv:math.AG/0204096. [22]

, Pluricanonical systems of projective varieties of general type, prépublication électronique arXiv:math.AG/9909021.

[23]

, Pluricanonical systems of projective varieties of general type ii, prépublication électronique arXiv:math.AG/0409318.

[24] D. Varolin – A Takayama-type extension theorem, prépublication électronique arXiv:math.CV/0607323. [25] E. Viehweg – Weak positivity and the additivity of the Kodaira dimension for certain fibre spaces, in Algebraic varieties and analytic varieties (Tokyo, 1981), Adv. Stud. Pure Math., vol. 1, North-Holland, 1983, p. 329–353. [26]

, Quasi-projective moduli for polarized manifolds, Ergebnisse Math. Grenzg., 3. Folge, vol. 30, Springer, 1995.

Olivier DEBARRE Institut de Recherche Mathématique Avancée Université Louis Pasteur 7, rue René Descartes F-67084 Strasbourg Cedex E-mail : [email protected]

ASTÉRISQUE 317

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (971) Groupes engendrés par les automates Andrzej ŻUK

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 971, p. 141 à 174

Novembre 2006

GROUPES ENGENDRÉS PAR LES AUTOMATES par Andrzej ŻUK

INTRODUCTION

La classe des groupes d’automates contient plusieurs groupes infinis de type fini remarquables. Leur étude a permis de résoudre des problèmes importants de théorie des groupes. Des applications récentes s’étendent à l’algèbre, la géométrie, l’analyse et les probabilités. Avec les groupes arithmétiques [24] et hyperboliques [19], les groupes d’automates dominent actuellement notre vision de la théorie des groupes infinis. Les groupes présentés dans ce texte pourraient être rassemblés sous d’autres noms, comme groupes branchés ou groupes auto-similaires (les définitions précises de ces deux classes sont données plus loin). Nous avons choisi le nom « groupes d’automates » pour souligner l’importance de cette construction, qui produit des groupes aux propriétés intéressantes. Comme exemples d’application de cette théorie, nous avons choisi les problèmes suivants. – – – – –

Problème Problème Problème Problème Problème

de Burnside. Groupes infinis de type fini de torsion. de Milnor. Constructions de groupes à croissance intermédiaire. d’Atiyah. Calculs de nombres de Betti L2 . de Day. Nouveaux exemples de groupes moyennables. de Gromov. Groupes sans croissance uniforme.

Pour chacun d’entre eux, nous avons choisi les premiers exemples historiques de groupes d’automates considérés pour résoudre ces problèmes. Il s’agit du groupe d’Aleshin, du groupe d’allumeur de réverbères (qui peut être engendré par un automate à deux états), du groupe de Wilson et d’un groupe engendré par un automate à trois états.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

142

A. ŻUK

Nous avons le sentiment que la classe des groupes d’automates est très riche et qu’on est loin d’une compréhension complète de ces groupes qui défient souvent notre intuition. Nous espérons que cette introduction au monde des groupes engendrés par les automates pourrait stimuler les développements futurs.

1. GROUPES D’AUTOMATES 1.1. Définition du groupe engendré par un automate Les automates qui nous intéressent sont finis, inversibles, avec le même alphabet à l’entrée et à la sortie, disons D = {0, 1, . . . , d − 1} pour un certain entier d > 1. À un tel automate A sont associés un ensemble fini d’états Q, une fonction de transition φ : Q × D → Q et une fonction de sortie : ψ : Q×D → D ; l’automate A est caractérisé par le quadruplet (D, Q, φ, ψ). L’automate A est dit inversible si, pour chaque q ∈ Q, la fonction ψ(q, ·) : D → D est une bijection. Dans ce cas, ψ(q, ·) peut être identifiée avec l’élément correspondant σq du groupe symétrique Sd sur d = |D| symboles. Il existe un moyen convenable de représenter un automate fini par un graphe marqué Γ(A) dont les sommets correspondent aux éléments de Q. Deux états q, s ∈ Q sont liés par une arête orientée étiquetée par i ∈ D si φ(q, i) = s ; chaque sommet q ∈ Q est étiqueté par l’élément correspondant σq du groupe symétrique. Les automates que l’on vient de définir sont les automates non initiaux. Pour les rendre initiaux, on doit pointer un état q ∈ Q comme état initial. L’automate initial Aq = (D, Q, φ, ψ, q) agit à droite sur les suites finies et infinies sur D de la manière suivante. Pour chaque symbole x ∈ D, l’automate donne immédiatement la sortie y = ψ(q, x) et change son état initial en φ(q, x). En joignant la sortie de Aq avec l’entrée d’un autre automate Bs = (S, α, β, s), on obtient une application qui correspond à un automate appelé la composition de Aq et Bs et désigné par Aq ? Bs . Cet automate est formellement décrit comme l’automate dont l’ensemble des états est Q × S et les fonctions de transition et de sortie Φ, Ψ sont définies par Φ((x, y), i) = (φ(x, i), α(y, ψ(x, i))), Ψ((x, y), i) = β(y, ψ(x, i)) et avec l’état initial (q, s). La composition A ? B de deux automates non initiaux est définie par les mêmes formules pour les fonctions d’entrée et de sortie mais sans indiquer l’état initial.

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

143

Deux automates initiaux sont dits équivalents s’ils déterminent la même application sur l’ensemble des états. Il existe un algorithme pour minimiser le nombre d’états. L’automate qui produit l’application identité sur l’ensemble des suites est appelé trivial. Si A est un automate inversible, alors pour chaque état q l’automate Aq admet −1 −1 un automate inverse A−1 q tel que Aq ?Aq , Aq ?Aq soient équivalents à l’automate trie ψ, e q) vial. L’automate inverse peut formellement être décrit comme l’automate (Q, φ, −1 e i) = φ(s, σs (i)), ψ(s, e i) = σ (i) pour s ∈ Q. Les classes d’équivalence d’auoù φ(s, s tomates finis inversibles sur un alphabet D constituent un groupe qui est appelé le groupe des automates finis ; il dépend de D. Chaque ensemble d’automates initiaux engendre un sous-groupe de ce groupe. Soit maintenant A un automate inversible non initial. Soit Q = {q1 , . . . , qt } l’ensemble des états de A et soit Aq1 , . . . , Aqt l’ensemble des automates initiaux que l’on peut obtenir à partir de A. Le groupe G(A) = hAq1 , . . . , Aqt i est appelé le groupe déterminé ou engendré par A. 1.2. Groupes d’automates et produits en couronne Il existe une relation entre les groupes d’automates et les produits en couronne. Pour un groupe de la forme G(A), on a l’interprétation suivante. Soit q ∈ Q un état de A et soit σq ∈ Sd la permutation associée à cet état. Pour chaque symbole i ∈ D, on note Aq,i l’automate initial ayant pour état initial φ(q, i) (alors Aq,i pour i = 0, 1, . . . , d − 1 parcourt l’ensemble des automates initiaux qui sont les voisins de Aq , i.e. tels que le graphe Γ(A) admette une arête de Aq à Aq,i ). Soient G et F des groupes de type fini tels que F soit un groupe de permutations d’un ensemble X (nous nous intéressons au cas où F est le groupe symétrique Sd et X est l’ensemble {0, 1, . . . , d − 1}). On définit le produit en couronne G o F de ces groupes comme suit. Les éléments de G o F sont les couples (g, γ) où g : X → G est une fonction telle que g(x) soit différente de l’élément neutre de G, noté Id, seulement pour un nombre fini d’éléments x de X, et où γ est un élément de F . La multiplication dans G o F est définie par : (g1 , γ1 )(g2 , γ2 ) = (g3 , γ1 γ2 ) où g3 (x) = g1 (x)g2 (γ1−1 (x)) pour x ∈ X. On écrira les éléments du groupe GoSd sous la forme (a0 , . . . , ad−1 )σ, où a0 , . . . , ad−1 ∈ G et σ ∈ Sd . Le groupe G = G(A) admet un plongement dans le produit en couronne G o Sd via l’application Aq → (Aq,0 , . . . , Aq,d−1 )σq ,

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

144

A. ŻUK

où q ∈ Q. L’expression à droite est appelée décomposition en couronne de A. On écrira ainsi dans le texte Aq = (Aq,0 , . . . , Aq,d−1 )σq . Pour simplifier, on note a le générateur Aa du groupe engendré par l’automate A. 1.3. Action sur un arbre Les suites finies sur l’alphabet D = {0, . . . , d−1} sont en bijection avec les sommets d’un arbre enraciné Td de degré d (dont la racine correspond à la suite vide). Un automate initial Aq agit sur les suites sur D et agit aussi sur Td par automorphismes. Ainsi pour chaque groupe engendré par un automate, en particulier pour un groupe de forme G(A), il existe une action canonique correspondante sur un arbre (pour la théorie des actions sur les arbres sans racine, voir [30]). Soit maintenant G un groupe agissant sur un arbre enraciné T . Le bord ∂T , constitué des rayons géodésiques infinis issus de la racine, admet une topologie naturelle qui le rend homéomorphe à l’ensemble de Cantor. L’action de G sur T induit une action sur ∂T par homéomorphismes et admet une mesure canonique invariante µ sur ∂T qui est la mesure de Bernoulli sur DN donnée par la distribution d1 , . . . , d1 . Il existe un moyen canonique d’associer une représentation unitaire à un système dynamique muni d’une mesure invariante. Dans notre cas, on obtient la représentation régulière π sur L2 (∂T, µ), définie par (π(g)f )(x) = f (g −1 x). 1.4. Projections de stabilisateurs Pour un groupe G = G(A) agissant par automorphismes sur T , on note StG (n) le sous-groupe de G constitué des éléments de G qui agissent trivialement sur le niveau n de l’arbre T . D’une manière analogue, pour un sommet u ∈ T , on note StG (u) le sous-groupe de G constitué des éléments fixant u. Le plongement de G dans le produit en couronne G o Sd induit un plongement φ : StG (1) → Gd dans le groupe de base du produit en couronne. Celui-ci définit les projections canoniques ψi : StG (1) → G (i = 1, . . . , d) données par ψi (g) = φ(g)|i pour g ∈ StG (1). 1.5. Groupes branchés et fractals Le stabilisateur StG (n) du n-ième niveau est l’intersection des stabilisateurs de tous les sommets de ce niveau. Pour tout sommet u ∈ T , on peut définir la projection ψu : StG (u) → G. Définition 1.1. — Un groupe G est dit fractal si pour chaque sommet u, on a ψu (StG (u)) = G après identification de l’arbre T avec le sous-arbre Tu issu de la racine u.

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

145

Le stabilisateur rigide du sommet u est le sous-groupe, noté RistG (u), des automorphismes de G qui agissent trivialement sur le sous-arbre Tu . Le stabilisateur rigide du n-ième niveau RistG (n) est le groupe engendré par les stabilisateurs rigides des sommets sur ce niveau. Un groupe G agissant sur un arbre enraciné T est dit sphériquement transitif s’il agit transitivement sur chaque niveau. Un groupe sphériquement transitif G ⊆ Aut(T ) est dit branché si RistG (n) est un sous-groupe d’indice fini pour chaque n ∈ N. Un groupe sphériquement transitif G ⊆ Aut(T ) est dit faiblement branché si |RistG (n)| = ∞ pour chaque n ∈ N. S’il n’y a pas de risque de confusion, on omettra l’indice G dans les notations StG (u), RistG (u), etc. Le plongement G → G o Sd , g → (g0 , . . . , gd−1 )σ définit la restriction gi de g au sommet i du premier niveau. L’itération de cette procédure conduit à une notion de restriction gu de g à un sommet u. Définition 1.2. — On dit que le groupe G est régulièrement faiblement branché sur un sous-groupe K 6= {1} si K ⊇ K × . . . × K (produit direct de d facteurs, chacun d’entre eux agissant sur le sous-arbre correspondant Tu , |u| = 1). On utilise les notations xy = y −1 xy, [x, y] = x−1 y −1 xy et on note hXiY la clôture normale de X dans Y . La longueur d’un mot w et d’un élément g est notée |w| et |g| respectivement. 1.6. Le problème des mots Le problème des mots a une solution pour chaque groupe engendré par un automate, grâce à l’algorithme presenté ci-dessous : Proposition 1.3. — Le problème des mots est résoluble pour les groupes d’automates. Preuve. — Soit w un mot sur l’alphabet consistant en les étiquettes des états de l’automate et leurs inverses. 1. Vérifier si w ∈ StG (1) (sinon w 6= 1 dans G). 2. Calculer w = (w0 , . . . , wd−1 ). Alors w=1 dans G si et seulement si wi = 1 dans G pour i = 0, . . . , d − 1. Aller à 1. en remplaçant w par wi et procéder avec chaque wi comme avec w. Si, dans une étape, on obtient un mot qui n’est pas dans StG (1), alors w 6= 1 dans G. Si dans une étape tous les mots wi1 , . . . , win sont déjà apparus dans l’algorithme, alors w = 1 dans G.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

146

A. ŻUK

Cet algorithme converge car les longueurs de w0 , . . ., wd−1 sont au plus la longueur de w et, après suffisamment d’étapes, les mots se répètent. 1.7. Classification des groupes d’automates à deux états sur l’alphabet {0, 1} Pour l’alphabet à deux lettres, les automates à un état produisent seulement le groupe trivial et le groupe d’ordre deux. Certains automates à deux états sont déjà intéressants, par exemple le groupe d’allumeur de réverbères. On se propose maintenant d’analyser tous les groupes engendrés par les automates à deux états avec un alphabet à deux lettres. En plus du groupe d’allumeur de réverbères engendré par l’automate de la figure 2, il y a cinq autres groupes engendrés par les automates de la figure 1 (on note 1 ou Id l’identité de S2 et e l’élément non trivial de S2 ). Les deux premiers automates engendrent le groupe trivial et le groupe d’ordre 2. Le groupe donné par le troisième automate est isomorphe au groupe de Klein (Z/2Z) ⊕ (Z/2Z). Le quatrième automate définit le groupe diédral D∞ . Le dernier automate définit le groupe cyclique infini. Ce sont les seules possibilités [15]. Théorème 1.4. — Les seuls groupes engendrés par les automates à deux états sur un alphabet à deux lettres sont : – – – – – –

le le le le le le

groupe groupe groupe groupe groupe groupe

trivial ; d’ordre deux Z/2Z ; de Klein (Z/2Z) ⊕ (Z/2Z) ; cyclique inifini Z ; diédral infini D∞ ; d’allumeur de réverbères (⊕Z Z/2Z) o Z.

Preuve. — On note a et b les deux états de l’automate. Si les deux sont étiquetés par l’identité ou les deux par e, alors le groupe engendré par un tel automate est trivial ou bien Z/2Z. Donc on peut supposer qu’un état, disons a, est étiqueté par l’identité et l’autre par e. En échangeant si nécessaire 0 avec 1, on peut supposer que a = (a, a) ou a = (b, b) ou a = (a, b). (i) Cas a = (a, a). Dans ce cas, a correspond à l’identité dans le groupe. L’échange de 0 et 1 (cela ne change pas a) réduit b à trois possibilités : b = (b, b)e, b = (a, b)e ou b = (a, a)e. Le premier cas correspond à Z/2Z, le second à Z et le troisième à Z/2Z.

ASTÉRISQUE 317

(971)

Id

0,1

0,1

1

147

GROUPES D’AUTOMATES

e

0,1

0,1

e

1

e

Id

Id

0

e

0,1

Id

0

0,1

Figure 1. Les automates qui engendrent le groupe trivial, le groupe d’ordre deux, le groupe de Klein, le groupe diédral et le groupe cyclique infini.

(ii) Cas a = (b, b). L’échange de 0 et 1 (cela ne change pas a) réduit b à trois possibilités : b = (b, b)e, b = (b, b)e ou b = (a, b)e. Les deux premières possibilités correspondent au groupe de Klein Z/2Z ⊕ Z/2Z. En effet a et b sont d’ordre deux et commutent. Le troisième cas correspond au groupe cyclique infini. En effet on a ab = (ba, b2 )e, ba = (ab, b2 )e, donc a et b commutent. Deuxièmement, b2 a = (b2 a, b2 a), ce qui implique la trivialité de b2 a. Alors le groupe est cyclique. La relation précédente assure que l’ordre de a est deux fois l’ordre de b. Mais a et b ont le même ordre d’après

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

148

A. ŻUK

1

0

Id

e

a

0

1

b

Figure 2. L’automate qui engendre le groupe d’allumeur de réverbères

la relation a = (b, b). Comme a et b sont non triviaux, ceci implique que le groupe est Z. (iii) Cas a = (a, b). En considérant si nécessaire l’automate inverse (qui engendre le même groupe et ne change pas a) on peut supposer que b satisfait une des trois possibilités : b = (b, b)e, b = (a, b)e ou bien b = (a, a)e. Dans le premier cas, b2 = (b2 , b2 ) donc b est d’ordre 2. Comme a2 = (a2 , b2 ), a aussi est d’ordre deux. La relation a−1 b = (a−1 b, 1)e et (a−1 b)2 = (a−1 b, a−1 b) implique que a−1 b est d’ordre infini. Donc il s’agit du groupe diédral infini D∞ . Le second cas correspond au groupe d’allumeur de réverbères (voir la section suivante). Le troisième cas peut être analysé d’une manière similaire.

1.8. Exemples importants Dans les sections suivantes, on présente les exemples importants de groupes engendrés par les automates. Il s’agit du groupe d’allumeur de réverbères (qui peut être engendré par un automate à deux états), du groupe d’Aleshin, d’un groupe engendré par un automate à trois états et du groupe de Wilson. Il existe d’autres groupes d’automates dont l’étude a été importante pour le développement de la théorie. Mentionnons ici le groupe de Fabrykowski-Gupta [9], le groupe de Sushchansky [31] et le groupe de Gupta-Sidki [20]. Pour une théorie générale des automates et des groupes d’automates, on peut consulter [11], [22] et [34].

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

149

2. LE GROUPE D’ALLUMEUR DE RÉVERBÈRES COMME GROUPE D’AUTOMATE L’automate de la figure 2 engendre le groupe d’allumeur de réverbères [15]. Ce groupe peut être défini comme le produit en couronne (Z/2Z o Z) ou comme le produit semi-direct (⊕Z Z/2Z) o Z avec l’action de Z sur ⊕Z (Z/2Z) par translation. Soient a et b les générateurs du groupe d’allumeur de réverbères (⊕Z Z/2Z) o Z tels que a = (fa , ga ), b = (fb , gb ), où ga = gb ∈ Z est un générateur de Z, fa ∈ ⊕Z (Z/2Z) est l’identité et fb = (. . . , 0, 0, 1, 0, 0, . . .) ∈ ⊕Z (Z/2Z) est tel que 1 soit en position 1. Il existe un isomorphisme entre ce groupe et le groupe engendré par l’automate de la figure 2, où a et b correspondent aux états de cet automate. L’étude de ce groupe, et de son action sur l’arbre enraciné de degré 2 correspondant à l’automate, a permis de répondre à une question d’Atiyah. 2.1. Récurrence d’opérateurs Soit maintenant G le groupe engendré par l’automate de la figure 2. On note ∂T = E0 t E1 la partition du bord ∂T associée aux sous-arbres T0 et T1 issus de chacun des deux sommets du premier niveau. On a un isomorphisme L2 (∂T, µ) ' L2 (E0 , µ0 ) ⊕ L2 (E1 , µ1 ) où µi est la restriction de µ à Ei , ainsi qu’un isomorphisme L2 (∂T, µ) ' L2 (Ei , µi ), pour i = 0, 1, provenant de T ' Ti . On obtient ainsi un isomorphisme entre H et H ⊕ H , où H est un espace de Hilbert de dimension infinie. Grâce à cet isomorphisme, les opérateurs π(a), π(b) (encore notés a et b, respectivement), où π est une représentation comme dans la section 1.3, satisfont les relations d’opérateurs suivantes : ! ! a 0 0 a , b= a= b 0 0 b qui correspondent aux relations de type produit en couronne : a = (a, b)e et b = (a, b). Soit πn une représentation par permutations du groupe G provenant de l’action de G sur le niveau n de l’arbre associé et soit H n l’espace des fonctions sur le n-ième niveau. Soient an et bn les matrices correspondant aux générateurs pour la représentation πn . Alors a0 = b0 = 1 et ! ! 0 an−1 an−1 0 (1) an = , bn = bn−1 0 0 bn−1 en tenant compte de l’isomorphisme naturel H n ' H n−1 ⊕ H n−1 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

150

A. ŻUK

2.2. Le groupe d’allumeur de réverbères et sa mesure spectrale On s’intéresse au spectre et à la mesure spectrale correspondant à l’opérateur de Markov pour le groupe d’allumeur de réverbères. Pour une partie génératrice S finie et symétrique (S = S −1 ), on considère la marche aléatoire simple sur le graphe de Cayley Cay(G, S). Alors l’opérateur de marche aléatoire A : `2 (G) → `2 (G) est défini par 1 X Af (g) = f (sg), |S| s∈S

où f ∈ `2 (G) et g ∈ G. Comme l’opérateur A est borné (on a kAk ≤ 1) et auto-adjoint, il admet une décomposition spectrale Z 1 A= λdE(λ), −1

où E est une mesure spectrale. Cette mesure est définie sur les sous-ensembles boréliens de l’intervalle [−1, 1] et est à valeurs dans l’espace des projecteurs de l’espace de Hilbert `2 (G). La mesure spectrale de Kesten µ sur l’intervalle [−1, 1] est définie par µ(B) = hE(B)δId , δId i, où B est un sous-ensemble borélien de [−1, 1] et δId ∈ `2 (G) est une fonction égale à 1 sur l’élément neutre et à 0 ailleurs. Pour un sous-espace fermé et G-invariant H de `2 (G), on définit sa dimension de von Neumann dim(H) comme étant dim(H) = hPr(H)δId , δId i, où Pr(H) est une projection de `2 (G) sur H. Pour le groupe d’allumeur de réverbères, on peut expliciter cette mesure [15] : Théorème 2.1. — Soit G le groupe défini par l’automate de la figure 2, de générateurs a et b. L’opérateur de marche aléatoire A sur `2 (G) possède les valeurs propres suivantes : Å ã l π cos q où q = 2, 3, 4, . . . et l = 1, . . . , q − 1. La dimension de von Neumann du sous-espace propre correspondant est égale à Å Å Å ããã l 1 dim ker A − cos π = q q 2 −1 où (l, q) = 1.

ASTÉRISQUE 317

(971)

151

GROUPES D’AUTOMATES

350

300

250

200

150

100

50

0

–4

–3

–2

–1

0

1

2

3

4

−1 Figure 3. L’histogramme du spectre de an + a−1 n + bn + bn pour n = 10

Pour démontrer ce théorème, on utilise les approximations de dimension finie πn décrites précédemment. Le calcul de la mesure spectrale a plusieurs applications aux marches aléatoires. Dans la section suivante, on présente une application de ce calcul à la conjecture d’Atiyah sur les nombres de Betti L2 de variétés fermées. 2.3. Une question d’Atiyah En 1976, Atiyah [2] a défini les nombres de Betti L2 des variétés fermées. Il a conclu son article par une question concernant les valeurs de ces nombres. Plus tard cette question a donné lieu à une conjecture, dite d’Atiyah. Pour un groupe Γ on note fin−1 (Γ) le sous-groupe de Q engendré par les inverses des ordres des sous-groupes finis de Γ. Pour une variété fermée M , on désigne par (2) bi (M ) son i-ième nombre de Betti L2 . Conjecture. — Soit M une variété fermée dont le groupe fondamental π1 (M ) est isomorphe à Γ. Alors on a (2)

bi (M ) ∈ fin−1 (Γ) pour tout nombre entier i. Il existe plusieurs textes présentant les résultats obtenus sur cette conjecture, le plus récent étant un livre de Lück [23]. Plusieurs résultats confirment différentes formes de la conjecture d’Atiyah. On montre cependant que la version forte formulée ici est fausse [14].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

152

A. ŻUK

Théorème 2.2. — Soit G le groupe donné par la présentation G = ha, t, s | a2 = 1, [t, s] = 1, [t−1 at, a] = 1, s−1 as = at−1 ati. Chaque sous-groupe fini de G est un 2-groupe abélien élémentaire, en particulier l’ordre de chaque sous-groupe fini de G est une puissance de 2. Il existe une variété riemannienne fermée (M, g) de dimension 7 telle que π1 (M ) = G pour laquelle le troisième nombre de Betti L2 est égal à 1 (2) b3 (M, g) = . 3 La preuve du théorème 2.2 repose sur les résultats décrits précédemment, sur le spectre et la mesure spectrale de l’opérateur de Markov A de la marche aléatoire simple sur le groupe de l’allumeur de réverbères, dont G est une extension HNN. Les résultats impliquent que 1 dim ker(A) = , 3 mais le dénominateur 3 ne divise pas les puissances de 2, qui sont les ordres des sous-groupes finis du groupe de l’allumeur de réverbères. La conjecture d’Atiyah peut être formulée d’une manière équivalente en termes de dimension de sous-espaces propres des opérateurs dans Z[G] agissant sur `2 (G) où G = π1 (M ). Si G est un groupe de présentation finie et A un opérateur de marche aléatoire sur G, il existe une construction d’une variété fermée M dont le groupe fondamental est G et telle que le troisième nombre de Betti L2 de M soit égal à la dimension de von Neumann du noyau de l’opérateur A. Le groupe d’allumeur de réverbères n’est pas de présentation finie.

3. LE GROUPE D’ALESHIN Considérons l’automate fini inversible représenté par la figure 4. Le groupe d’Aleshin [1] est le groupe G engendré par U et V . Son étude a permis de donner une réponse particulièrement simple au problème de Burnside et de résoudre un problème de Milnor. 3.1. Une réponse au problème de Burnside En 1902, Burnside a demandé s’il existe des groupes de type fini qui sont infinis et tels que chaque élément soit d’ordre fini. Le résultat le plus important concernant l’existence de tels groupes est le théorème d’Adyan-Novikov [28]. Le groupe d’Aleshin donne une réponse très simple à ce problème même si, contrairement aux groupes d’Adyan-Novikov, l’ordre des éléments n’est pas uniformément borné. Aleshin [1] démontre :

ASTÉRISQUE 317

(971)

153

GROUPES D’AUTOMATES

1 1

b

1

1

d

1

1

0

0

c

0

1

0,1

e

0,1

1

a V

0

1

0

e 1

U

1 1

Figure 4. L’automate d’Aleshin de 1972

Théorème 3.1. — Le groupe G = hU, V i est de torsion et infini. Bien qu’il y ait des preuves plus directes de ce théorème, nous présentons la démonstration originale car elle permet la construction d’une quantité non dénombrable de p-groupes infinis pour tout nombre premier p. Le groupe d’Aleshin est par définition de type fini. Les prochaines sous-sections donnent la preuve des deux assertions du théorème. Préliminaires. — Soit A un automate fini, δ un mot et q un état de Γ(A). On note q[δ] la permutation que porte le sommet d’arrivée du chemin de Γ(A) partant de q et suivant δ. On constate : Proposition 3.2. — Soit δ un mot de longueur l. i) si l ≥ 3, alors V [δ] = Id ; ii) si U [δ] = e, alors l ≥ 3 et δ est de la forme ξ, 1, 1, ..., 1, 0 avec ξ ∈ {0, 1} ; iii) plus précisément, m = 011...10, U [m] = e si et seulement si m est de longueur l ≡ 0 ou 2 modulo 3 m = 111...10, U [m] = e si et seulement si m est de longueur l ≡ 1 ou 2 modulo 3. Lemme 3.3. — Les générateurs sont d’ordre fini : i) U est d’ordre 2.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

154

A. ŻUK

ii) V est d’ordre 4 et agit transitivement sur les 2 premières lettres des suites de {0, 1} et uniquement celles-ci. Preuve. — i) Soit δ un mot. Le second point de la proposition précédente indique que seule la lettre suivant un éventuel préfixe de δ de la forme ξ, 0, 0, ..., 0, 1 pourra être modifiée sous l’action de U . Il en va de même pour l’action de U sur la suite U (δ) et donc U 2 (δ) = δ. ii) Utilisons l’image de V dans le produit en couronne : V = (Id, a)e. Donc V 2 = (a, a). Or a = (Id, Id)e et donc a2 = (Id, Id) = Id, a 6= Id. Finalement, V est exactement d’ordre 4. Comme il n’y que 4 mots à 2 lettres, V agit bien transitivement sur les mots à 2 lettres. Le premier point de la proposition 3.2 achève la preuve de ce lemme. Puisque U et V sont d’ordre fini, tout élément de G s’écrit X = Xm Xm−1 . . . X1 , Xi = U ou V . Pour tout mot δ, on note alors X[δ] = Xm [Xm−1 . . . X1 (δ)]. Nous allons associer à tout élément X = Xm ...X1 ∈ G, avec Xi = U ou V , une fonction RX : {mots de longueur l ≥ 3} −→ N . Soit donc δ un mot de longueur l ≥ 3. Soit d le plus petit entier tel que X d (δ) = δ (il existe car l’ensemble {X i (δ), i ∈ N} est fini). 1 2 d avec pour j ∈ On pose Γ1 (X, δ) = δ01 , δ11 , . . . , δm−1 , δ02 , . . . , δm−1 , . . . , δm−1 {0, ..., m − 2} et pour i ∈ {1, ...., d − 1}

δ01 = δ,

i δ0i+1 = Xm (δm−1 ).

i δj+1 = Xj+1 (δji ),

On note Γ2 (X, δ) la sous-suite de Γ1 (X, δ) qui consiste en les δji vérifiant – Xj+1 = U (les mots δji en entrée de l’opérateur U ) – δji est de la forme ξ, 1, 1, ..., 1, ν avec ξ et ν égaux à 0 ou 1. Dans cette suite, on remplace chaque δji par 0 s’il finit par 0 et par 1 sinon. On obtient ainsi une suite de la forme 0

1

0

1

0s1 1s1 0s2 ...1sk 0 1 avec sm l > 0 sauf peut-être pour s1 ou sk . x On remplace maintenant, pour x = 0 ou 1, chaque xsl par x (la suite obtenue commence par 0 si s01 > 0 et par 1 sinon ; de même, elle finit par 1 si et seulement si s1k > 0).

Cette suite est notée Γ3 (X, δ).

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

155

Définition 3.4. — On pose ( max(k0 , k1 ) si k0 et k1 sont non nuls RX (δ) = 0 sinon où k0 et k1 sont respectivement le nombre de 0 et de 1 dans Γ3 (X, δ). RX (δ) est en fait le nombre d’alternances dans la suite Γ3 (X, δ). Le groupe G est de torsion. — Soit X = Xm ...X1 ∈ G. Il nous faut montrer l’existence de D tel que X D = 1. Lemme 3.5. — Soit δ un mot de longueur l ≥ 3 et d tel que X d (δ) = δ. Si RX (δ) = 0, alors pour tout mot η, X 2d (δη) = δη. Preuve. — Supposons que RX (δ) = 0. On distingue alors 3 cas : 1. Γ3 (X, δ) = ∅. Dans ce cas, la suite Γ1 (X, δ) ne possède pas de mot de la forme ξ11...0 et donc, d’après la proposition 3.2, pour toute lettre x, on a X d (δx) = δx. Comme Γ1 (X, δ) ne contient pas non plus de mot de la forme ξ11...1, Γ3 (X, δx) = ∅ et ce premier cas est traité. 2. Γ3 (X, δ) = 0. Étant donné une lettre x, on a toujours X 2d (δx) = X 2d (δ)(X d [δ])2 (x) = δx (car Id2 = e2 = Id). De plus, par hypothèse, la suite Γ1 (X, δ) ne contient pas de mots de la forme ξ11...1 et ainsi la suite Γ3 (X, δx) est vide : on est ramené au premier cas. 3. Γ3 (X, δ) = 1. On a X d [δ] = Id et donc, pour tout x, X d (δx) = δx. De plus, Γ1 (X, δx) est alors obtenu en ajoutant x à la fin de chaque mot de Γ1 (X, δ) et donc Γ3 (X, δx) est égal à: i) 0 si et seulement si x = 0. On est ramené au deuxième cas et donc, pour tout η, X 2d (δxη) = δxη. ii) 1 sinon. On applique le raisonnement du troisième point à δx, jusqu’à ce que l’on soit dans le cas i) précédent. Lemme 3.6. — La fonction RX est décroissante pour l’ordre partiel habituel sur les mots, i.e. RX (δx) ≤ RX (δ). De plus, si d est le plus petit entier vérifiant X d (δ) = δ, alors X d [δ] = Id et RX (δ) > 0 implique RX (δx) < RX (δ).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

156

A. ŻUK

Preuve. — Le cas RX (δ) = 0 a été traité dans la preuve du lemme précédent. On suppose donc RX (δ) > 0. i) Cas X d [δ] = Id. La suite Γ1 (X, δx) est donc aussi de longueur md. De plus, les mots de la suite Γ2 (X, δx) proviennent des mots de Γ2 (X, δ) de la forme ξ11...1 et le nombre d’alternances entre les mots de Γ2 (X, δx) finissant par 0 et ceux finissant par 1 est inférieur au nombre de 0 dans Γ3 (X, δ) (car seul un mot de la forme ξ11...0 de Γ2 (X, δ) peut générer la permutation e). Finalement les nombres de 0 et de 1 dans la suite Γ3 (X, δx) sont strictement plus petits que le maximum des nombres de 0 et de 1 dans Γ3 (X, δ) : on a bien RX (δx) < RX (δ). ii) Cas X d [δ] = e. Ici la suite Γ1 (X, δx) est de longueur 2md. Si on note Γ1 (X, δ) = 1 2 d δ01 , δ11 , ..., δm−1 , δ02 , ..., δm−1 , ......δm−1 , alors Γ1 (X, δx) = δ01 x

δ11 x11

...

δ01 e(x) δ11 e(x11 ) ...

1 δm−1 x1m−1

δ02 x20

...

1 δm−1 e(x1m−1 ) δ02 e(x20 ) ...

2 δm−1 x2m−1

....

2 δm−1 e(x2m−1 ) ....

d δm−1 xdm−1 d δm−1 e(xdm−1 )

! .

En raisonnant comme dans le premier cas, on voit que les mots de la suite Γ2 (X, δx) proviennent des mots de Γ2 (X, δ) de la forme ξ11...1 mais, cette fois-ci, sur les deux copies de Γ1 (X, δ) correspondant aux deux lignes de la matrice ci-dessus. Donc la longueur de la suite Γ3 (X, δx) n’est pas plus grande que deux fois le nombre de 1 dans Γ3 (X, δ), ce nombre étant lui-même ≤ RX (δ). On remarque de plus que dans Γ2 (X, δx) on a autant de mots finissant par 0 que de mots finissant par 1. On a bien RX (δx) ≤ RX (δ). Lemme 3.7. — Soit δ un mot de longueur l ≥ 2. Alors RX (δ) = RX (X(δ)). Preuve. — Il faut juste remarquer que la suite Γ1 (X, X(δ)) est obtenue en mettant les m premiers mots de Γ1 (X, δ) à sa fin. Lemme 3.8. — Il existe tX ≥ 3 tel que pour tout δ mot de longueur l ≥ tX et toute suite (finie ou infinie) η RX (δ) = RX (δη). Preuve. — L’élément X agit sur l’ensemble des mots à 3 lettres. Considérons alors une orbite B à laquelle nous pouvons d’après le lemme précédent associer un entier RX (B) = RX (δ), pour tout δ ∈ B. Supposons ce nombre non nul. Regardons alors l’ensemble B 01 des mots de 4 lettres dont les 3 premières forment un mot de B. Soit ηx ∈ B 01 , η ∈ B, x = 0 ou 1. Son orbite est nécessairement incluse dans B 01 et deux cas se distinguent alors : 1. X[η] = e et dans ce cas l’orbite de ηx est B 01 . 2. X[η] = Id et dans ce cas B 01 est la réunion disjointe B11 t B21 de deux orbites sur les mots à 4 lettres. Mais ici, d’après le lemme 3.6, RX (B11 ) et RX (B21 ) sont strictement inférieurs à RX (B).

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

157

Les descendants de B sont donc réunis en « blocs » Bqp (correspondant à certaines orbites) que l’on peut représenter par les sommets d’un arbre enraciné tel que chaque sommet possède 1 ou 2 fils ; à chacun de ces blocs est associé un nombre RX (Bqp ) qui est strictement plus petit que celui du père de Bqp si celui-ci a deux fils. Le nombre de sommets ayant deux fils est donc nécessairement fini et il existe un niveau p tel que, pour tout bloc Bqp , les blocs fils de Bqp aient tous la même étiquette RX (Bqp ). La preuve est achevée une fois remarqué qu’il n’existe qu’un nombre fini d’orbites B sur l’ensemble des mots à 3 lettres. Nous allons maintenant montrer que, pour tout δ de longueur au moins tX , RX (δ) = 0. Définition 3.9. — Soit δ un mot de longueur l ≥ 3. Notons aξ le nombre d’occurrences du mot ξ11...10 dans Γ2 (X, δ). Soit A un sous-alphabet de {0, 1}. On dit que P Γ2 (X, δ) admet le type A si ξ∈ A aξ est pair. Remarque 3.10. — Soit un des aξ est pair, soit c’est leur somme et donc Γ2 (X, δ) admet au moins un type. Lemme 3.11. — Supposons l’existence d’un mot δ et de deux lettres x1 et x2 tels que RX (δ) = RX (δx1 ) = RX (δx1 x2 ) 6= 0. Alors les suites Γ2 (X, δx1 ) et Γ2 (X, δx1 x2 ) admettent les mêmes types. Preuve. — Nécessairement, X[δ] = e. La preuve du lemme 3.6 indique alors que, si la suite Γ2 (X, δx1 ) contient le mot η0, elle contient aussi le mot η1 et donc les aξ de Γ2 (X, δx1 ) peuvent se lire aussi sur les mots de la forme ξ11...11, lesquels vont donner les mots définissant les types de Γ2 (X, δx1 x2 ). En effet, X[δx1 ] = e et l’ensemble des mots de Γ2 (X, δx1 x2 ) de la forme ξ11...10 est en bijection avec l’ensemble des mots de la forme ξ11...11 (on modifie la dernière lettre), eux-mêmes en bijection avec l’ensemble des mots de la forme ξ11...1 dans Γ2 (X, δx1 ) (on ôte la dernière lettre). Ainsi les valeurs des aξ sont identiques dans Γ2 (X, δx1 ) et dans Γ2 (X, δx1 x2 ) et le lemme est prouvé. Lemme 3.12. — Soit δ de longueur tX . Alors RX (δ) = 0. Preuve. — Raisonnons par l’absurde. Nous sommes alors dans les conditions du lemme précédent et les types admis par les suites Γ2 (X, δx1 ), Γ2 (X, δx1 x2 ),...,Γ2 (X, δx1 x2 ...xk ) sont les mêmes. Soit donc A un tel type (qui existe grâce à la remarque 3.10). Il résulte du dernier point de la proposition 3.2 qu’il existe une longueur l > tX telle que les mots η de longueur l vérifiant U [η] = e soient exactement ceux de la forme

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

158

A. ŻUK

ξ11...10 pour ξ ∈ A . Mais alors pour le mot m = δ11...1 de longueur l et d tel que X d (m) = m, P a X d [m] = e ξ∈ A ξ = Id et donc RX (m1) < RX (m) ce qui contredit la propriété de tX . Soit maintenant D = ppcm{cardinal de l’orbite de δ|δ de longueur tX }. Par définition de D, pour tout mot η de longueur au plus tX , X 2D (η) = η. D’après le lemme précédent, pour tout mot η de longueur tX , on a RX (η) = 0 et donc pour toute suite γ finie ou infinie, X 2D (ηγ) = ηγ (lemme 3.5). Finalement, X 2D = 1 et donc le groupe G est de torsion. G est infini. — Lemme 3.13. — Pour tout k ≥ 0, pour tout ξ ∈ {0, 1}, il existe Xk,ξ ∈ G et il existe x1 , x2 , y1 , y2 ∈ {0, 1} tels que, pour tout mot γ, on ait Xk,ξ (x1 x2 0...0 |{z} ξγ) = y1 y2 0...0 |{z} γ. k

k+1

Preuve. — Par récurrence sur k. Pour k = 0. On voit que U d (00ξγ) = 00ed (ξ)γ. Ici, (x1 , x2 , y1 , y2 ) = (0, 0, 0, 0) convient. X0,0 = Id et X0,1 = U . Supposons le résultat vrai pour tout k ≤ K. Nous partons de x1 x2 0...0 |{z} ξγ et allons K+1

essayer d’arriver à y1 y2 0...0 |{z} γ. K+2

Tout d’abord, une remarque : le lemme 3.3 nous indique que, en utilisant une puissance appropriée de V , on peut faire apparaître les deux premières lettres que l’on souhaite sur n’importe quel mot, sans modifier le reste de celui-ci. Cela est notamment utile pour utiliser les Xk,ξ sur des mots dont les deux premières lettres ne sont pas celles requises par les hypothèses de récurrence. Par hypothèse de récurrence, il existe XK−1,1 tel que −1 0 0 0 0 XK−1,1 (y10 y20 0...0 |{z} 10γ . |{z} 0γ ) = x1 x2 0...0 K

K−1

0

On pose γ = ξγ et on utilise une bonne puissance de V ; on obtient ainsi l’existence de T1 tel que : 0 0 T1 (x1 x2 0...0 |{z} ξγ) = x1 x2 0...0 |{z} 10ξγ. K+1

ASTÉRISQUE 317

K−1

(971)

GROUPES D’AUTOMATES

159

−1 −1 −1 On itère ce procédé en utilisant successivement XK−2,1 , XK−3,1 ,...,X0,1 et les bonnes puissances de V pour enfin obtenir un élément TK vérifiant :

TK (x1 x2 0...0 |{z} 0ξγ. |{z} ξγ) = y1 y2 1...1 K+1

K

D’après le dernier point de la proposition 3.2, il existe σ ∈ {0, 1} tel que U [σ 11..1 | {z } 0] = e. On pose alors K+1

T = U V i TK où i est tel que V i (y1 y2 ) = σ1. Cet élément vérifie T (x1 x2 0...0 |{z} ξγ) = σ 1...1 |{z} 00γ. K+1

K+1

Maintenant on utilise successivement X0,1 , X1,1 ,...,XK−1,1 et les puissances appropriées de V pour, à chaque étape, faire apparaître les deux premières lettres requises à l’utilisation de Xi,1 . On obtient alors la suite d’égalités T10 (x1 x2 0...0 |{z} ξγ)

=

∗ ∗ 0 |1.....1 {z } 00γ

T20 (x1 x2 0...0 |{z} ξγ)

=

∗ ∗ 00 |{z} 1..1 00γ

K+1

K−1

K+1

K−2

.. . 0 TK (x1 x2 0...0 |{z} ξγ) K+1

=

∗ ∗ 0...........0 | {z } γ K+2

ce qui achève la preuve de l’hérédité et donc celle du lemme. Le lemme précédent exhibe alors pour tout k ∈ N des éléments Zk de G vérifiant Zk (1...1 0...0 111... |{z} 111...) = |{z} k

k

(on utilise les Xk,1 multipliés à droite et à gauche par des puissances adéquates de V ). Ces Zk sont tous distincts et donc le groupe G est infini. On remercie Jean-François Planchat qui nous a expliqué la preuve d’Aleshin [29]. 3.2. Croissance Pour un groupe G engendré par une partie S, finie et symétrique (i.e. telle que S = S −1 ), on note |g|S le nombre minimal de générateurs requis pour représenter g. La croissance du groupe G décrit le comportement asymptotique de la fonction bG (n) = |{g ∈ G : |g|S ≤ n}|.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

160

A. ŻUK

Ce type de croissance est indépendant de la partie génératrice. Par exemple, pour les groupes nilpotents, elle est polynomiale et, pour un groupe qui contient un sousgroupe ou même un semi-groupe libre, elle est exponentielle. Pour l’histoire de cette notion, voir [18]. Dans [25] il a été demandé s’il existe d’autres types de croissance. On présente la réponse donnée par Grigorchuk dans [13]. Soit G le groupe engendré par les états a, b, c et d de l’automate de la figure 4. Il est facile de voir que ce groupe est commensurable au groupe engendré par les états U et V et au groupe engendré par tous les états de cet automate (i.e. ces groupes ont des sous-groupes d’indice fini isomorphes). Proposition 3.14. — Le groupe G n’est pas à croissance polynomiale. Preuve. — Un groupe à croissance polynomiale contient un sous-groupe d’indice fini nilpotent (Gromov) qui contient un sous-groupe d’indice fini sans torsion (Malcev). Or le théorème d’Aleshin (voir la section précédente) affirme que G est infini de torsion. On peut aussi vérifier cette proposition par un calcul simple. Montrons que le groupe d’Aleshin est à croissance sous-exponentielle. Nous avons les relations : a = (1, 1)e

(2)

b =

(a, c)

c =

(a, d)

d =

(1, b)

et aussi

(3)

aba =

(c, a)

aca =

(d, a)

ada =

(b, 1).

Lemme 3.15. — Le groupe engendré par b, c et d est isomorphe au groupe de Klein Z/2Z ⊕ Z/2Z. Preuve. — Il s’agit d’une vérification simple. Soit Γ = StG (3). Alors [G : Γ] < ∞. Lemme 3.16. — Considérons pour g ∈ Γ son image dans G8 ; on note g = (g1 , . . . , g8 ). Alors (4)

8 X i=1

|gi | ≤

3 |g| + 8, 4

pour la longueur par rapport aux générateurs a, b, c et d.

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

161

Preuve. — Sachant que a est d’ordre 2 et que b, c et d sont les éléments du groupe de Klein, chaque élément g ∈ G s’écrit : g = ak1 ak2 a . . . akn a, où ki ∈ {b, c, d} et le premier et le dernier a, notés a, n’apparaissent pas forcément. Considérons un bloc γ = ki aki+1 a ou γ = aki aki+1 . Grâce aux relations (2) et (3) son image γ = (γ1 , γ2 ) dans G × G vérifie |γ1 | + |γ2 | ≤ |γ|. Si ki ou ki+1 est égal à d, cette inégalité devient |γ1 | + |γ2 | ≤

(5)

3 |γ|. 4

Les relations (2) et (3) montrent que l’image de ki ou aki a dans G × G donne c si ki = b et donne d si ki = c. Donc en itérant cette procédure 3 fois, on est sûr de se retrouver dans la situation (5). D’où l’inégalité (4) (le terme 8 est dû au fait que la longueur de |g| n’est pas forcément divisible par 8). Proposition 3.17. — Le groupe d’Aleshin est à croissance sous-exponentielle. Preuve. — L’inégalité (4) nous montre que X (6) |bΓ (k)| ≤ |bG (k1 )| × . . . × |bG (k8 )|. k1 +...+k8 ≤ 34 k+8

Il est important de calculer la longueur des éléments par rapport aux générateurs a, b, c et d même si a n’appartient pas à Γ. Comme Γ est d’indice fini dans G, on a » » (7) lim n |bG (n)| = lim n |bΓ (n)| = α. n→∞

n→∞

Pour chaque ε > 0, il existe c > 0 tel que, pour n suffisamment grand, on ait |bG (n)| ≤ c(α + ε)n . La majoration (6) assure alors qu’il existe c0 tel que 3

|bΓ (n)| ≤ c0 n8 (α + ε) 4 n+8 . Donc limn→∞

p n

3

|bΓ (n)| ≤ α 4 ce qui, avec (7), implique » lim n |bG (n)| = 1. n→∞

Le groupe d’Aleshin est donc à croissance sous-exponentielle. On ne connaît pas le comportement exact de la fonction de croissance du groupe d’Aleshin. Pour de meilleures estimations, voir [5].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

162

A. ŻUK

b

e

0

1

1

1

0,1

0 1

a

Figure 5. L’automate à trois états

4. GROUPE ENGENDRÉ PAR UN AUTOMATE À TROIS ÉTATS On s’intéresse au groupe engendré par l’automate de la figure 5 introduit dans [16]. Ce groupe apparaît aussi comme le groupe de Galois des itérations du polynôme x2 − 1 sur les corps finis (Pink) et comme le groupe de monodromie du revêtement ramifié de la sphère de Riemann donné par le polynôme z 2 − 1 (voir [26]). Une des propriétés les plus remarquables de ce groupe est liée à la notion de moyennabilité. 4.1. Propriétés algébriques de G Théorème 4.1 ([16]). — Soit G le groupe engendré par l’automate de la figure 5. Le groupe G possède les propriétés suivantes. a) Il est fractal ; b) il est régulièrement faiblement branché sur G0 ; c) il est sans torsion ; d) le semi-groupe engendré par a et b est libre ; e) il admet la présentation : G = ha, b|σ ε (θm ([a, ab ])) = 1, m = 0, 1, . . . , ε = 0, 1i, où ( σ:

a

7→ b2

b

7→

a

( θ:

a 7→ b

7→

2

ab

+1

b.

On présente ici les démonstrations de quelques propriétés algébriques de G mentionnées dans le théorème 4.1. Pour G = ha, bi, on a les relations a = (1, b) et b = (1, a)e.

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

163

Proposition 4.2. — Le groupe G est fractal. Preuve. — Nous avons StG (1) = ha, ab , b2 i. Mais a (8)

=

(1, b)

a

= e(1, a−1 )(1, b)(1, a)e = (ba , 1)

b2

=

b

(a, a),

et chacune des images des deux projections de StG (1) est G, i.e. G est fractal. Proposition 4.3. — Le groupe G est régulièrement faiblement branché sur G0 , i.e. G0 ≥ G0 × G0 . Preuve. — En effet, comme [a, b2 ] = (1, [b, a]), en utilisant la fractalité de G, on obtient G0 ≥ h[a, b2 ]iG ≥ 1 × h[b, a]iG = 1 × G0 et (1 × G0 )b = G0 × 1. Donc G0 contient G0 × G0 et comme G0 6= 1 le groupe G est régulièrement faiblement branché sur G0 . Lemme 4.4. — Le semi-groupe engendré par a et b est libre. Preuve. — Considérons deux mots différents U (a, b) et V (a, b) qui représentent le même élément et tels que ρ = max{|U |, |V |} soit minimal. Une vérification directe montre que ρ ne peut valoir ni 0 ni 1. Supposons que |U |b , le nombre d’occurrences de b dans U , est pair (et donc |V |b également). Si ce n’est pas le cas, on peut considérer les mots bU et bV augmentant ainsi ρ par 1. Maintenant U et V sont les produits de am = (1, bm ) et de bam b = (1, a)e(1, bm )(1, a)e = (bm a, a). Si, dans un de ces mots, il n’y a pas b, disons U = am , après avoir projeté U et V sur la première coordonnée, on obtient 1 = V0 où la projection V0 est un mot non vide vérifiant |V0 | < |V | ≤ ρ. Ceci contredit la minimalité de U et V . On considère maintenant la situation où b apparaît dans les deux mots au moins deux fois. Si le nombre d’occurrences de b dans U et V était un, alors par minimalité ils doivent être égaux à ban et am b. Mais ban = (bn , a)e et am b = (1, bm a)e, ce qui montre que, si ces mots sont différents, ils représentent des éléments différents.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

164

A. ŻUK

Donc les deux mots contiennent deux b et |U |, |V | ≤ ρ, ou l’un d’entre eux contient au moins quatre b et |U |, |V | ≤ ρ + 1. Si on considère les projections de U et V sur la seconde coordonnée, on obtient deux mots différents (à cause de la minimalité de U et V , ils doivent finir avec des lettres différentes) et de longueur strictement plus petite. Ceci contredit la minimalité de ρ. Lemme 4.5. — Nous avons la relation suivante : γ3 (G) = (γ3 (G) × γ3 (G)) o h[[a, b], b]i où γ3 (G) = [[G, G], G]. Preuve. — On part des relations γ3 (G) = h[[a, b], a], [[a, b], b]iG , [[a, b], a] = [(ba , b−1 ), (1, b)] = 1, (9)

[[a, b], b] = (b−a , b)e(1, a−1 )(ba , b−1 )(1, a)e = (b−a , b)(b−a , ba ) = (b−2a , bba ).

Les deux premières nous permettent de conclure que γ3 (G) = h[[a, b], b]iG . Grâce à la relation [a, b2 ] = (1, [a, b]) on a [[a, b2 ], a] = [(1, [a, b]), (1, b)] = (1, [[a, b], b]). −1

−1

Soit ξ = [[a, b], b]. Des calculs directs montrent que ξ a , ξ a , ξ b , ξ b ∈ hξi mod γ3 (G) × γ3 (G) et hξi ∩ (γ3 (G) × γ3 (G)) = 1 à cause de (9) et du fait que (bba )n ∈ G0 si et seulement si n = 0 et γ3 (G) ≤ G0 . Lemme 4.6. — On a la relation suivante : G00 = γ3 (G) × γ3 (G). Preuve. — Soit f = (1, c) ∈ G où c = [a, b]. On a pour d = (b, b−1 ) ∈ G0 [f, d−1 ] = [(1, [a, b]), (b−1 , b)] = (1, [[a, b], b]) ∈ G00 . Ceci implique que G00 ⊇ 1 × γ3 (G) et alors G00 ⊇ γ3 (G) × γ3 (G). Comme G00 ⊆ γ3 (G), d’après le lemme 4.5, il suffit de démontrer que hξi ∩ G00 = 1. Il est facile de démontrer que (10)

ASTÉRISQUE 317

G0 = (G0 × G0 ) o hci.

(971)

GROUPES D’AUTOMATES

165

En utilisant la relation (9) et la relation (10), on a G00 = h[c, f ]iG . Mais [c, f ] = [(ba , b−1 ), (1, c)] = [1, [b−1 , [a, b]]] ∈ 1 × γ3 (G). Cela finit la démonstration. Voici encore une propriété générale des groupes faiblement régulièrement branchés qui est facile à démontrer. Proposition 4.7. — Soit G un groupe faiblement régulièrement branché sur K. Alors, pour tout sous-groupe distingué N / G, il existe n tel que Kn0 < N où Kn = K × . . . × K (produit direct de dn facteurs, chacun agissant sur le sous-arbre correspondant). 4.2. Moyennabilité En 1929, von Neumann [27] a défini la notion de moyennablité qui est devenue fondamentale. Définition 4.8. — Le groupe G est dit moyennable s’il existe une mesure µ définie sur toutes les parties de G telle que – µ(G) = 1 – µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B) pour tous A, B ⊂ G – µ(gA) = µ(A) pour tout g ∈ G et tout A ⊂ G. Il découle des travaux de von Neumann [27] que les groupes à croissance sousexponentielle sont moyennables et que cette classe est fermée par rapport aux opérations élémentaires : extensions, quotients, sous-groupes et limites directes. Avant la construction du groupe engendré par l’automate de la figure 5, tous les groupes moyennables connus pouvaient être obtenus à partir de groupes à croissance sousexponentielle en utilisant les opérations élémentaires décrites ci-dessus. Pour l’histoire des différentes conjectures concernant la classe des groupes moyennables, voir [17], la première référence étant l’article de Day [6]. Soit SG0 la classe des groupes dont tous les sous-groupes de type fini sont à croissance sous-exponentielle. Supposons que α > 0 est un ordinal et qu’on a défini SGβ pour chaque ordinal β < α. Alors, si α est un ordinal limite, soit [ SGα = SGβ . β (RistG (n))0 ≥ G00 × . . . × G00 (2n fois). Donc G00 ∈ SGα−1 et alors γ3 (G) ∈ SGα−1 d’après le lemme 4.6. Chaque classe SGα est fermée par rapport aux quotients et passages aux sous-groupes. D’après les lemmes 4.10, 4.11, 4.12 on déduit que G ∈ SGα−1 . Contradiction.

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

167

Pour démontrer la moyennabilité de G, on utilise un critère dû à Kesten [21] utilisant les marches aléatoires sur G. Soit µ une mesure de probabilité symétrique dont le support est une partie génératrice symétrique S de G, i.e. G = hSi, µ(s) = µ(s−1 ) pour chaque s ∈ S et µ(S) = 1. Soit pn la probabilité de retour à l’identité après n pas pour la marche aléatoire donnée par µ, i.e. pn (Id, Id) = µ∗n (Id) où µ∗n est la n-ième puissance de convolution de µ sur G. Théorème 4.13 (Kesten [21]). — Le groupe G est moyennable si et seulement si » lim 2n p2n (Id, Id) = 1. n→∞

La moyennabilité de G a été démontrée par Virag [32]. Cette preuve a été publiée dans [3]. Sur G, considérons la marche aléatoire Zn suivant la mesure symétrique µ sur 1 S = {a, a−1 , b, b−1 } avec les poids {1, 1, r, r}, i.e. µ(a−1 ) = µ(a) = 2r+2 , µ(b−1 ) = r µ(b) = 2r+2 . L’image de Zn par le plongement de G dans G o S2 est notée : Zn = (Xn , Yn )εn où Xn , Yn ∈ G et εn ∈ S2 . On définit les temps d’arrêts σ et τ : σ(0)

=

0

σ(m + 1)

=

min{n > σ(m) : εn = 1, Xn 6= Xσ(m) }

τ (0)

=

min{n > 0 : εn = e}

τ (m + 1)

=

min{n > τ (m) : εn = e, Yn 6= Yτ (m) }

Un calcul simple montre : Lemme 4.14. — Xσ(m) et Yτ (m) sont des marches aléatoires simples sur G suivant r 1 la distribution µ0 (a−1 ) = µ0 (a) = 2r+4 , µ0 (b−1 ) = µ0 (b) = r+2 . √ On remarque que, pour r = 2, on obtient la même distribution sur Zn , Xσ(n) et Yτ (n) . On vérifie aussi Lemme 4.15. — Presque sûrement m m 2+r 1 lim = lim = < . m→∞ τ (m) m→∞ σ(m) 4 + 4r 2

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

168

A. ŻUK

Pour conclure nous devons modifier la distance sur G, afin de pouvoir contrôler la norme de Zn par les normes de Xn et Yn . Soit Tn le sous-arbre fini à n niveaux de T sur lequel agit G. Pour g ∈ G, on définit ||| · |||Tn par : X ||| g |||Tn = |g|γ | + 1 − 1. γ∈∂Tn

Finalement on définit la distance ||| ||| sur G : ||| g ||| = min ||| g |||Tn . n

On vérifie que pour g = (g0 , g1 )e0,1 |||g0 ||| + |||g1 ||| ≤ |||g||| ≤ |||g0 ||| + |||g1 ||| + 1 et que la croissance par rapport à la métrique ||| · ||| est au plus exponentielle, i.e. il existe a > 1 tel que |{g : |||g||| ≤ n}| ≤ an .

(11) Nous avons

Proposition 4.16. — Presque sûrement |||Zn ||| = 0. n Preuve. — L’existence de cette limite, qu’on note s, est une conséquence du théorème ergodique de Kingman. Maintenant lim

n→∞

|||Zn ||| |||Xn ||| |||Yn ||| 1 ≤ + + . n n n n Mais

|||Xσ(n) ||| |||Xσ(n) ||| |||Xn ||| n = lim = lim lim n→∞ n→∞ n→∞ n σ(n) n σ(n) √ et similairement pour Yn . Donc pour r = 2 si s > 0, d’après le lemme (4.15), s < s 21 + s 12 = s. Cette contradiction signifie que s = 0. lim

n→∞

Proposition 4.17. — La probabilité p(Z2n = Id) ne décroît pas exponentiellement. Preuve. — Pour chaque ε > 0, on a X p(|||Z2n ||| ≤ εn) = p(Z2n = g) ≤ p(Z2n = Id) × |{g ∈ G; |||g||| ≤ εn}|. g∈G,|||g|||≤εn

Donc d’après (11)

ã |||Zn ||| < ε · a−εn . n D’après la proposition 4.16 et le critère de Kesten, le groupe engendré par l’automate de la figure 5 est donc moyennable. Å

p(Z2n = Id) ≥ p

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

169

En utilisant des extensions HNN du groupe G, on peut construire des groupes moyennables de présentation finie qui ne sont pas sous-exponentiellement moyennables. Dans [17] on démontre que le groupe ‹ = hb, t|[btb , bt ] = 1, bt2 = b2 i G a ces propriétés.

5. GROUPE DE WILSON On présente ici le groupe que Wilson a construit pour répondre à un problème de Gromov. Pour le définir, on utilise le langage des produits en couronne (voir la section 1.2). 5.1. Problème de Gromov Pour les groupes à croissance exponentielle, la fonction de croissance dépend fortement de la partie génératrice. Il est naturel de demander si on peut associer un invariant lié à la croissance qui soit indépendant de la partie génératrice. Plus précisément, pour un groupe G engendré par une partie finie S, on définit » h(G, S) = lim n |{g ∈ G : |g|S ≤ n}|. n→∞

L’entropie du groupe G est alors h(G) =

inf

h(G, S).

S;hSi=G

En 1981, Gromov [18] a demandé si pour chaque G à croissance exponentielle h(G) > 1, i.e. s’il est à croissance exponentielle uniforme, ce qui signifie qu’il existe a > 1 tel que pour chaque partie génératrice |{g ∈ G : |g|S ≤ n}| ≥ an . La réponse est positive pour plusieurs classes de groupes comme les groupes hyperboliques ou linéaires de type fini [4], [8]. Le premier groupe sans croissance exponentielle uniforme a été construit par Wilson en 2003 [33].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

170

A. ŻUK

5.2. Construction de Wilson Désignons par A31 le sous-groupe alterné du groupe symétrique à 31 éléments. Théorème 5.1. — Soit H un groupe parfait de type fini vérifiant la propriété H ' H oA31 . Alors il existe une suite (xn ) d’éléments d’ordre 2 et une suite (yn ) d’éléments d’ordre 3 tels que 1. hxn , yn i = H pour chaque n ; 2. limn→∞ h(H, {xn , yn }) = 1. Construction de H. — Soit T31 un arbre enraciné de degré 31. Soit x ∈ Aut(T31 ) qui agit non trivialement seulement sur le premier niveau. On définit x ∈ Aut(T31 ) par son image dans le produit en couronne x = (x, x, Id, . . . , Id). Et finalement soit H = hx, x|x ∈ A31 i. Le groupe H est de type fini et H est parfait car A31 l’est. Proposition 5.2. — On a H ' H o A31 . Preuve. — Soit σ = (2, 3, 4), ρ = (1, 3, 2) ∈ A31 ; considérons x, y ∈ A31 . Alors [x, σy] = ([x, y], Id, . . . , Id). Comme H est parfait ceci montre que, pour chaque x ∈ A31 , on a (x, Id, . . . , Id) ∈ H. Ensuite ρ(x, Id, . . . , Id)−1 x = (x, Id, . . . , Id). Donc H contient {(h, Id, . . . , Id)|h ∈ H} e,t en utilisant x ∈ A31 , on a H o A31 ⊆ H. Maintenant on va expliquer quelles sont les propriétés du groupe A31 dont on a besoin. Proposition 5.3. — Le groupe A31 peut être engendré par un élément d’ordre 2 et un élément d’ordre 3. Comme H ' H o A31 et H est parfait, ceci implique qu’il existe u, v ∈ H tel que u2 = v 3 = Id et H = hu, vi. Proposition 5.4. — Soit H ' H o A31 un groupe parfait engendré par u et v tels que u2 = v 3 = id. Alors il existe x, y ∈ A31 tel que – il existe α, β ∈ {1, . . . , 31}, α 6= β

ASTÉRISQUE 317

x(α)

=

xy (α) = α

y(β)

=

β

(971)

GROUPES D’AUTOMATES

171

– les élements x b =

(. . . , u, . . .)x

yb =

(. . . , v, . . .)y,

où u est en position α et v en position β, satisfassent x b2 = yb3 = id et hb x, ybi = H. Preuve. — On vérifie facilement cette proposition avec x, y, α et β explicites [33]. Maintenant soient γ 0 (n)

= |{w ∈ H : |w|hb ≤ n}|, x,b yi

= |{w ∈ H : |w|hu,vi ≤ n}|. » » Proposition 5.5. — Si on note lim n γ(n) = c et lim n γ 0 (n) = c0 , alors pour n→∞ n→∞ s ≥ 3 on a Ä ä 1 c0 ≤ max c1− 2c , (1 + 2/s)(s + 2)2/s . γ(n)

Preuve. — Commençons par expliquer le second terme. Considérons Z/3Z ∗ Z/2Z. Soient ρn = {w ∈ Z/3Z ∗ Z/2Z; |w|hx,yi ≤ n et | {xy −1 xy ∈ w} |≤ [n/s]}. √ Alors lim n ρn ≤ (1 + 2/s)(s + 2)2/s . n→∞

Maintenant soient B(n)

= {w ∈ hb x, ybi; |w| ≤ n}

B+ (n)

= {w ∈ B(n); | {b xyb−1 x byb ∈ w} |≤ [n/s]}

B− (n)

= B(n) \ B+ (n).

On a x byb−1 x bybx b = (1, . . . , 1, v −1 , . . . , u, . . . , v)xy −1 xyx où v −1 est en position xyx(β), u est en yx(α) et v en x(β). Si w ∈ B+ (n), alors | {b xyb−1 x bybx b} | est au moins 21 [n/s] = r. Donc |B+ (n)| ≤ |A31 |

X

31 Y

γ(ni ) ≤ K(n)(c + ε)n−2r = K(n)(c + ε)n(1−1/2s)

n1 +...+n31 ≤n−2r j=1

où K(n) est un polynôme en n. On obtient donc l’estimation de la proposition. La preuve du théorème se ramène donc à celle du lemme élémentaire : Lemme 5.6. — Il existe une suite sn → ∞ telle que cn → 1 Å ã 1 1− 2sn 2/sn où c1 = 2 et cn = max cn−1 , (1 + 2/sn )(sn + 2) pour n ≥ 2.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

172

A. ŻUK

Finalement pour démontrer que H est à croissance exponentielle, on prouve qu’il admet un semi-groupe libre.

RÉFÉRENCES [1] S. V. Alešin – Finite automata and the Burnside problem for periodic groups, Mat. Zametki 11 (1972), p. 319–328. [2] M. F. Atiyah – Elliptic operators, discrete groups and von Neumann algebras, in Colloque “Analyse et Topologie” en l’honneur de Henri Cartan (Orsay, 1974), Soc. Math. France, 1976, p. 43–72. Astérisque, No. 32–33. [3] L. Bartholdi & B. Virág – Amenability via random walks, Duke Math. J. 130 (2005), p. 39–56. [4] E. Breuillard & T. Gelander – Cheeger constant and algebraic entropy of linear groups, International Mathematical Research Notices 56 (2005), p. 3511– 3523. [5] J. Brieussel – Croissance et moyennabilité de certains groupes d’automorphismes d’un arbre enraciné, Thèse, Université Paris 7, 2008. [6] M. M. Day – Amenable semigroups, Illinois J. Math. 1 (1957), p. 509–544. [7] W. Dicks & T. Schick – The spectral measure of certain elements of the complex group ring of a wreath product, Geom. Dedicata 93 (2002), p. 121–137. [8] A. Eskin, S. Mozes & H. Oh – On uniform exponential growth for linear groups, Invent. Math. 160 (2005), p. 1–30. [9] J. Fabrykowski & N. Gupta – On groups with sub-exponential growth functions, J. Indian Math. Soc. (N.S.) 49 (1985), p. 249–256 (1987). [10]

, On groups with sub-exponential growth functions. II, J. Indian Math. Soc. (N.S.) 56 (1991), p. 217–228.

[11] F. Gecseg & I. Peák – Algebraic theory of automata, Akadémiai Kiadó, 1972, Disquisitiones Mathematicae Hungaricae, 2. [12] Y. Glasner & S. Mozes – Automata and square complexes, Geom. Dedicata 111 (2005), p. 43–64. [13] R. Grigorchuk – Degrees of growth of finitely generated groups and the theory of invariant means, Izv. Akad. Nauk SSSR Ser. Mat. 48 (1984), p. 939–985. [14] R. Grigorchuk, P. Linnell, T. Schick & A. Żuk – On a question of Atiyah, C. R. Acad. Sci. Paris Sér. I Math. 331 (2000), p. 663–668.

ASTÉRISQUE 317

(971)

GROUPES D’AUTOMATES

173

[15] R. Grigorchuk & A. Żuk – The lamplighter group as a group generated by a 2-state automaton, and its spectrum, Geom. Dedicata 87 (2001), p. 209–244. [16]

, On a torsion-free weakly branch group defined by a three state automaton, Internat. J. Algebra Comput. 12 (2002), p. 223–246, International Conference on Geometric and Combinatorial Methods in Group Theory and Semigroup Theory (Lincoln, NE, 2000).

[17]

, Spectral properties of a torsion-free weakly branch group defined by a three state automaton, in Computational and statistical group theory (Las Vegas, NV/Hoboken, NJ, 2001), Contemp. Math., vol. 298, Amer. Math. Soc., 2002, p. 57–82.

[18] M. Gromov – Structures métriques pour les variétés riemanniennes, Textes Mathématiques, vol. 1, CEDIC, 1981, Edited by J. Lafontaine and P. Pansu. [19]

, Hyperbolic groups, in Essays in group theory, Math. Sci. Res. Inst. Publ., vol. 8, Springer, 1987, p. 75–263.

[20] N. Gupta & S. Sidki – Some infinite p-groups, Algebra i Logika 22 (1983), p. 584–589. [21] H. Kesten – Full Banach mean values on countable groups, Math. Scand. 7 (1959), p. 146–156. [22] V. B. Kudryavtsev, S. V. Aleshin & A. S. Podkolzin – Vvedenie v teoriyu avtomatov (Introduction to automata theory), “Nauka”, 1985. [23] W. Lück – L2 -invariants : theory and applications to geometry and K-theory, Ergebnisse Math. Grenzg.. 3. Folge, vol. 44, Springer, 2002. [24] G. A. Margulis – Discrete subgroups of semisimple Lie groups, Ergebnisse Math. Grenzg.. 3. Folge, vol. 17, Springer, 1991. [25] J. Milnor – Problems and Solutions : Advanced Problems : 5600-5609, Amer. Math. Monthly 75 (1968), p. 685–687. [26] V. Nekrashevych – Self-similar groups, Mathematical Surveys and Monographs, vol. 117, Amer. Math. Soc., 2005. [27] J. von Neumann – Zur allgemeinen Theorie des Maßes, Fundamenta Mathematica 13 (1929), p. 73–116. [28] P. S. Novikov & S. I. Adjan – Infinite periodic groups. I, Izv. Akad. Nauk SSSR Ser. Mat. 32 (1968), p. 212–244, 251–524, 709–731. [29] J.-F. Planchat – Groupe d’Aleshin, mémoire de DEA, Paris VII, 2005. [30] J-P. Serre – Arbres, amalgames, SL2 , Soc. Math. France, 1977, Astérisque, No. 46.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

174

A. ŻUK

[31] V. ¯I. Suščans0 ki˘ı – Periodic p-groups of permutations and the unrestricted Burnside problem, Dokl. Akad. Nauk SSSR 247 (1979), p. 557–561. [32] B. Virag – Self-similar walk on a self-similar group, prépublication, 2003. [33] J. S. Wilson – On exponential growth and uniformly exponential growth for groups, Invent. Math. 155 (2004), p. 287–303. [34] A. Żuk – Automata groups, livre à paraître.

Andrzej ŻUK Université Paris VII Institut de Mathématiques de Jussieu UMR 7586 du CNRS Boîte 7012 2 place Jussieu 75251 Paris Cedex 05 E-mail : [email protected]

ASTÉRISQUE 317

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (972) The Renormalization Theorem of Ambrosio Camillo DE LELLIS

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 972, p. 175 à 203

Mars 2007

ORDINARY DIFFERENTIAL EQUATIONS WITH ROUGH COEFFICIENTS AND THE RENORMALIZATION THEOREM OF AMBROSIO [after Ambrosio, DiPerna, Lions] by Camillo DE LELLIS

INTRODUCTION Consider the Cauchy problem for transport equations on R+ × Rn :     ∂t u(t, x) + b(t, x) · ∇x u(t, x) = 0

(1)

   u(0, x) = u(x) . Here b : R+ × Rn → Rn is a given smooth vector field, u a given smooth initial condition and u the unknown function. Smooth solutions of (1) are constant along ˙ curves φ : [a, b] → Rn solving the system of ordinary differential equations φ(t) = b(t, φ(t)). Indeed, differentiating g(t) = u(t, φ(t)) we find dg ˙ · ∇x u(t, φ(t)) = ∂t u(t, φ(t)) + b(t, φ(t)) · ∇x u(t, φ(t)) = 0 . = ∂t u(t, φ(t)) + φ(t) dt Thus, if Φ : R+ × Rn → Rn is the one–parameter family of diffeomorphisms solving    ∂t Φ(x, t) = b(t, Φ(x, t))  (2)    Φ(0, x) = x and Φ−1 (t, ·) denotes the inverse of the diffeomorphism Φ(t, ·), then the unique solution u of (1) is given through the formula u(t, x) = u(Φ−1 (t, x)). This is the classical method of characteristics for transport equations. Our discussion justifies the name transport equation: the quantity u is simply “transported” along the trajectories of the ODE (2). It is therefore not surprising that these equations appear in the mathematical description of many phenomena in classical and statistical physics.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

176

C. DE LELLIS

When b is Lipschitz, existence and uniqueness of solutions to (2) are given by the classical Cauchy–Lipschitz Theorem, but for less regular b this elegant and elementary picture breaks down. On the other hand, many physical phenomena lead naturally to consider transport equations where the coefficients b are discontinuous. The literature related to this kind of problems is huge and I will not try to give an account of it here. Let me just mention that in many of these problems one deals with coefficients which typically have jump discontinuities, take for instance the theory of shock waves. It is therefore desirable to have a theory of solutions for ODEs and transport equations which allows for non–smooth coefficients. The Sobolev spaces W 1,p (given by functions u ∈ Lp with distributional derivatives in Lp ) are probably the most popular spaces of irregular functions in partial differential equations. In their groundbreaking paper [28], motivated by their celebrated work on the Boltzmann equation, DiPerna and Lions introduced a theory of generalized solutions for transport equations and ODEs with Sobolev coefficients. Loosely speaking, this is done at the loss of a “pointwise” point of view into an “almost everywhere” point of view. Though a generic function u ∈ W 1,p (Ω) might be extremely irregular, its singular set, at least in a suitable measure theoretic sense, has necessarily codimension higher than 1. In particular, functions with jump discontinuities do not belong to W 1,p . Indeed, if the discontinuities are along nice regular surfaces, the distributional derivatives are nothing more than Radon measures. A commonly used functional–analytic closure of such “jump functions” is the BV space, i.e. the set of summable functions whose distributional derivatives are Radon measures. The extention of the DiPerna–Lions theory to BV functions has been for a while an important open problem. After some attempts by other authors leading to partial results (see [33], [15], [21]; some of these works were motivated by specific problems in partial differential equations and mathematical physics), Ambrosio solved the problem in its full generality in [4]. This note is an attempt to illustrate the most important ideas of the DiPerna–Lions theory and of Ambrosio’s result. In order to focus on the main points, I will not consider the most general results proved so far. Moreover, I will not follow the shortest proofs and often I will consider cases which later on become corollaries of more general theorems. In the first section, I discuss the first key idea of [28]: the notion of renormalized solutions and its link to the uniqueness and stability for (1). In Section 2, I discuss the hard core of the DiPerna–Lions theory for W 1,p fields: the so called commutator estimate. In Section 3, following the ideas of Ambrosio, I push gradually the DiPerna– Lions approach towards the BV case. The proof of Ambrosio’s Theorem is finally achieved in Section 4 in two different ways, based on observations of Bouchut and Alberti. Section 5 discusses the third key idea of [28], a sort of converse of the classical theory of characteristics: appropriate results on transport equations can be used to

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

177

infer interesting conclusions on ODEs. Section 6 surveys further results, conjectures and open problems in three different directions of research. Section 7 contains the proof of one technical proposition on BV functions used in Section 3.

1. RENORMALIZED SOLUTIONS 1.1. Distributional solutions Let us start by rewriting (1) in the following way:     ∂t u + divx (ub) − u divx b = 0 (3)    u(0, x) = u(x) . Here and in what follows I denote by divx b the divergence (in space) of the vector b. Clearly any classical solution of (3) is a solution of (1) and viceversa. However, equation (3) can be understood in the distributional sense under very mild assumptions on u and b. This is stated more precisely in the following definition. Definition 1.1. — Let b and u be locally summable functions such that the distributional divergence of b is locally summable. We say that u ∈ L∞ loc is a distributional solution of (3) if the following identity holds for every test function ϕ ∈ Cc∞ (R × Rn ) Z ∞Z Z (4) u [∂t ϕ + b · ∇x ϕ + ϕ divx b] dx dt = − u(x)ϕ(0, x) dx . 0

Rn

Rn

Of course for classical solutions the identity (4) follows from a simple integration by parts. The existence of weak solutions under quite general assumptions is an obvious corollary of the maximum principle for transport equations combined with a standard approximation argument. Lemma 1.2 (Maximum Principle). — Let b be smooth and let u be a smooth solution of (3). Then, for every t we have supx∈Rn u(t, x) ≤ supx∈Rn u(x) and inf x∈Rn u(t, x) ≥ inf x∈Rn u(x). Hence ku(t, ·)kL∞ (Rn ) ≤ kuk∞ . Proof. — The lemma is a trivial consequence of the method of characteristics. Indeed, arguing as in the introduction u(t, x) = u(Φ−1 (t, x)), where Φ is the solution of (2). From this representation formula the inequalities follow trivially. Theorem 1.3. — Let b ∈ Lp with divx b ∈ L1loc and let u ∈ L∞ . Then there exists a distributional solution of (3).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

178

C. DE LELLIS

Proof. — Consider a standard family of mollifiers ζε and ηε respectively on Rn and R × Rn . Let bε = b ∗ ηε and uε = u ∗ ζε be the corresponding regularizations of b and u. Then kuε k∞ is uniformly bounded. Consider the classical solutions uε of    ∂t uε + bε · ∇x uε = 0  (5)    u (0, ·) = u . ε

ε

Note that such solutions exist because we can solve the equation with the method of characteristics: indeed each bε is Lipschitz and we can apply the classical Cauchy– Lipschitz theorem to solve (2). By Lemma 1.2 we conclude that kuε k∞ is uniformly bounded. Hence there exists a subsequence converging weakly∗ to a function u ∈ L∞ (R+ × Rn ). Let us fix a test function ϕ ∈ Cc∞ (R × Rn ). Since the uε are classical solutions of (5), the identity (4) is satisfied if we replace u, b and u with uε , bε and uε . On the other hand, since bε → b, divx bε → divx b and uε → u locally strongly in L1loc , we can pass into the limit in such identities to achieve (4) for u, u and b. 1.2. Renormalized solutions Of course the next relevant questions are whether such distributional solutions are unique and stable. Under the general assumptions above, the answer is negative, as it is for instance witnessed by the elegant example of [27]. However, DiPerna and Lions in [28] proved stability and uniqueness when b ∈ W 1,p ∩ L∞ and divx b ∈ L∞ . Theorem 1.4. — Let b ∈ L1 (R+ , W 1,p (Rn )) ∩ L∞ with bounded divergence. Then for every u ∈ L∞ there exists a unique distributional solution of (3). Moreover, let bk and uk be two smooth approximating sequences converging strongly in L1loc to b and u such that kuk k∞ is uniformly bounded. Then the solutions uk of the corresponding transport equations converge strongly in L1loc to u. In order to understand their proof, we first go back to classical solutions u of (3), and we observe that, whenever β : R → R is a C 1 function, β(u) solves ( ∂t [β(u)] + divx [β(u)b] − β(u) divx b = 0 (6) [β(u)] = β(u) . This can be seen, for instance, using the chain rule for differentiable functions, i.e. ∂t β(u) + b · ∇x β(u) = β 0 (u)[∂t u + b · ∇x u]. Otherwise, one can observe that, since u must be constant along the trajectories (2), so must be β(u). Motivated by this observation, we introduce the following terminology. Definition 1.5. — Let b ∈ L1loc with divx b ∈ L1loc . A bounded distributional solution of (3) is said renormalized if β(u) is a solution of (6) for any β ∈ C 1 . The field b is

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

179

said to have the renormalization property if every bounded distributional solution of (3) is renormalized. When b and u are not regular we cannot use the chain rule, neither the theory of characteristics. Therefore, whether a distributional solution is renormalized might be a nontrivial question. Actually, for quite general b, there do exist distributional solutions which are not renormalized (see again [27]). The proof of Theorem 1.4 by DiPerna and Lions consists of two parts, the first one, which is “soft” can be stated as follows. Proposition 1.6. — If b ∈ L∞ has the renormalization property and its divergence is bounded, then the uniqueness and stability properties of Theorem 1.4 hold. The second one, which is the “hard” part of the proof, states essentially that W 1,p fields have the renormalization property. Theorem 1.7. — Any b ∈ L1 ([0, ∞[, W 1,p (Rn )) has the renormalization property. We postpone the “hard part” to the next section and come first to Proposition 1.6. Proof. — Uniqueness. Fix a u0 and let u and v be two distributional solutions of (3). It then follows that w = u − v is a distributional solution of the same transport equation with initial data 0. By the renormalization property so is w2 , i.e.    ∂t w2 + divx (w2 b) = w2 divx b  (7)    w2 (0, ·) = 0 . Integrating (7) “formally” in space we obtain Z Z Z ∂t w2 (t, x) dx = w2 (t, x) divx b ≤ kdivx bk∞ Rn

Rn

w2 (t, x) .

Rn

R R Since Rn w2 (0, x) dx = 0, by Gronwall’s Lemma we would conclude Rn w2 (t, x) dx = 0 for every t. We sketch how to make rigorous this formal argument. Assume for simplicity kbk∞ ≤ 1. Let T, R > 0 be given and choose a smooth cut–off function ϕ ∈ Cc∞ (R ×Rn ) such that ϕ = 1 on [0, T ]×BR (0) and ∂t ϕ ≤ −|∇x ϕ| on [0, 2T ]×Rn . Now let ψ ∈ Cc∞ (] − 2T, 2T [) be nonnegative and test (7) with ψ(t)ϕ(t, x). Define R f (t) = Rn w2 (t, x) ϕ(t, x) dx and use Fubini’s Theorem to get Z ∞ Z ∞Z − f (t)∂t ψ(t) dt = ψ(t)ϕ(t, x) w2 (t, x) divx b(t, x) dx dt 0 0 Z ∞Z + ψ(t)w2 (t, x) ∂t ϕ(t, x) + b(t, x) · ∇x ϕ(t, x) dx dt . 0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

180

C. DE LELLIS

Note that the second integral in the right hand side is nonpositive, whereas the first R one can be estimated by kdivx bk∞ f (t)ψ(t) dt. We conclude that f satisfies a “distributional” form of Gronwall’s inequality for t ∈ [0, 2T [. It can be easily seen that this implies f = 0. Thus w = 0 a.e. on [0, T ] × BR (0), and by the arbitrariness of R and T we conclude w = 0. Stability. Arguing as in Theorem 1.3, we easily conclude that, up to subsequences, uk converges weakly∗ in L∞ to a distributional solution u of (3). However, by the uniqueness part of the Theorem, this solution is unique, and hence the whole sequence converges to u. Since the bk and the uk are both smooth, u2k solve the corresponding transport equations with initial data u2 . Arguing as above, u2k must then converge, weakly∗ in L∞ , to the unique solution of (3) with initial data u2 . But by the renor∗ ∗ malization property this solution is u2 . Summarizing, uk * u and u2k * u2 in L∞ , which clearly implies the strong convergence in L1loc .

2. THE COMMUTATOR ESTIMATE OF DIPERNA AND LIONS In this section we come to the “hard part”, i.e. Theorem 1.7. We first prove a milder conclusion, neglecting the initial conditions, which will be adjusted later. Proposition 2.1. — Assume b ∈ L1 (R+ , W 1,p (Rn )) and let u ∈ L∞ solve ∂t u + divx (ub) − u divx b = 0

(8)

distributionally on R+ × Rn . Then, for every β ∈ C 1 , ∂t [β(u)] + divx (β(u)b) − β(u) divx b = 0 .

(9) 2.1. Commutators

Let us fix u and b as in Proposition 2.1 and consider a standard smooth and even kernel ρ in Rn . By a slight abuse of notation we denote by u ∗ ρε the convolution R in the x variable, that is [u ∗ ρε ](t, x) = u(t, y)ρε (x − y)dy. Mollify (8) to obtain 0 = ∂t u ∗ ρε + [divx (bu)] ∗ ρε − [u divx b] ∗ ρε . We rewrite this identity as (10)

∂t u ∗ ρε + b · ∇x u ∗ ρε = −Rε + [(u divx b) ∗ ρε − u ∗ ρε divx b]

where Rε are simply the commutators (11)

Rε = [divx (bu)] ∗ ρε − divx [b(u ∗ ρε )] .

Since Rε is a locally summable function, the identity (10) implies that ∂t u ∗ ρε is also locally summable. Thus, u ∗ ρε is a Sobolev function in space and time, and we

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

181

can use the chain rule for Sobolev functions (see for instance Section 4.2.2 of [30]) to compute ∂t [β(u ∗ ρε )] + b · ∇x β(u ∗ ρε ) = β 0 (u ∗ ρε ) ∂t u ∗ ρε + b · ∇x u ∗ ρε . Inserting (10) in this identity we get (12) ∂t [β(u ∗ ρε )] + b · ∇x β(u ∗ ρε ) = β 0 (u ∗ ρε ) Rε + [(u divx b) ∗ ρε − u ∗ ρε divx b] . Now, the left hand side of (12) converges distributionally to the left hand side of (9). Recall that kβ 0 (uε )k∞ and ku ∗ ρε k∞ are uniformly bounded, whereas [(u divx b) ∗ ρε − u ∗ ρε divx b]

−→

0

strongly in L1loc . Therefore, in order to prove Proposition 2.1 we just need to show that β 0 (u ∗ ρε )Rε converges to 0. This is implied by the following lemma. Lemma 2.2 (Commutator estimate). — Let b ∈ L1 (R+ , W 1,p (Rn )), u ∈ L∞ and Rε as in (11). Then Rε → 0 in L1loc . 2.2. The commutator estimate of DiPerna and Lions Proof of Lemma 2.2. — Without loss of generality we assume that the kernel ρ is supported in B1 (0). First we use the elementary identity X X Rε = − (ubi ) ∗ ∂xi ρε + bi (u ∗ ∂xi ρε ) − u ∗ ρε divx b i

i

and we expand the convolutions to obtain Z (13) Rε (t, x) = u(t, y)(b(t, x) − b(t, y)) · ∇ρε (x − y) dy − u ∗ ρε divx b (t, x) . Since ∇ρε (ξ) = ε−n−1 ∇ρ(ξ/ε), we perform the change of variables z = (x − y)/ε to get Z b(t, x + εz) − b(t, x) (14) Rε (t, x) = − u(t, x+εz) ·∇ρ(z) dz − u∗ρε divx b (t, x) . ε Next, fix a compact set K. By standard properties of Sobolev functions (see for instance Section 5.8.2 of [29]), the difference quotients (15)

dε,z (t, x) =

b(t, x + εz) − b(t, x) ε

are bounded in Lp (K) independently of z ∈ B1 (0) and ε ∈]0, 1[. We now let ε ↓ 0. For each fixed z, dε,z converges strongly in Lp (K) to ∂z b. The functions uz,ε (t, x) = u(t, x + εz) are instead uniformly bounded in L∞ , and, by the L1 –continuity of the translation, they converge strongly in L1 (K) to u.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

182

C. DE LELLIS

Therefore we conclude that Rε converges strongly in L1loc to Z R0 (t, x) = −u(t, x) ∂z b(t, x) · ∇ρ(z) dz − u divx b (t, x) Z X j = −u(t, x) ∂i b (t, x) zi ∂zj ρ(z) dz − u(t, x) divx b(t, x) . i,j

Integrating by parts we have

R

zi ∂zj ρ = −δij . So R0 = 0, which completes the proof.

2.3. The initial condition In order to prove Theorem 1.7 we still need to show that β(u) takes the initial condition [β(u)](0, ·) = β(u)(·). This is achieved with a small trick. Proof of Theorem 1.7. — Consider b and u as in Theorem 1.7 and extend both of them to negative times by setting b(t, x) = 0 and u(t, x) = u(x) for t < 0. It is then immediate to check that ∂t u + divx (bu) = u divx b distributionally on the whole space–time R ×Rn . On the other hand the proof of Proposition 2.1 remains valid if we replace R+ with R (actually the proof remains the same on any open set Ω ⊂ R ×Rn ). Therefore ∂t [β(u)] + divx [bβ(u)] = β(u) divx b distributionally on R × Rn . We test this equation with a ϕ ∈ Cc∞ (R × Rn ), recalling that [β(u)](t, x) = β(u(x)) and b(t, x) = 0 for t < 0. We then conclude (16) Z ∞Z Z Z 0 β(u) ∂t ϕ + b · ∇x ϕ + divx b ϕ dx dt = − β(u(x)) ∂t ϕ(t, x) dt dx . 0

Rn

Rn

−∞

On the other hand, since ϕ is smooth, we can integrate by parts in t in the right hand R side of (16) in order to get − β(u(x))ϕ(0, x)dx. This concludes the proof.

3. THE BV CASE: THE COMMUTATOR ESTIMATE OF AMBROSIO Let us try to push the proof of DiPerna and Lions to the BV case (we recall here that a function of bounded variation is simply a summable function whose distributional derivatives are Radon measures). Notice however that, in order to make sense of a distributional solution of (3) as in Definition 1.1, we do need the additional assumption divx b ∈ L1 , because for a generic BV function the divergence is only a Radon measure. The only point where the strategy of DiPerna and Lions does not work is in the proof of Lemma 2.2. There we can still conclude that the difference quotients (15) are

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

183

bounded in L1loc , but we cannot conclude that they converge strongly in L1loc to ∂z b. In fact, ∂z b is now a Radon measure, and dε,z converges to it weakly∗ in the space of Radon measures (this weak∗ convergence is the one coming from duality with continuous functions through the Riesz Representation Theorem). However, though we cannot conclude that Lemma 2.2 holds, we still get some information: the right hand side of (12) is uniformly bounded in L1loc , and hence converges (up to subsequences) to a Radon measure µ. We include this statement in a lemma to which we will refer later. Lemma 3.1. — Let u ∈ L∞ and b ∈ L1 (R+ , BV (Rn )) with divx b ∈ L1 . Assume that ∂t u + divx (ub) − u divx b = 0 distributionally on R+ × Rn . Then, for every β ∈ C 1 , (17)

∂t [β(u)] + divx (β(u)b) − β(u) divx b = µ

for some Radon measure µ. 3.1. Difference quotients of BV functions In what follows we will denote by Dx b the distributional differential in the space variables of the vector field b. That is, the matrix of distributional partial derivatives. In order to go beyond Lemma 3.1, consider that, by the Radon–Nikodym decomposition, the distributional derivative Dx b, which is a measure, can be split into the part which is absolutely continuous with respect to the Lebesgue measure and the singular part. We denote them by Dxa b and Dxs b. The Sobolev space W 1,1 is simply given by those BV functions b for which the singular part Dxs b vanishes. For such functions, according to Proposition 2.1, the measure µ in (17) vanishes. It is therefore natural to conjecture that, in the general BV case, µ is a singular measure. In order to show this, we need a refined analysis of the difference quotients of BV functions. We start by introducing a bit of terminology. First of all, we can regard Dx b as a matrix of measures or as a matrix–valued measure. Since Dxa b is an absolutely continuous function, we can write it as f L n+1 , where L n+1 denotes the n + 1–dimensional Lebesgue measure, and f is a matrix–valued function. In this case f is usually denoted by ∇x b in the literature (indeed it coincides with an appropriate measure–theoretic notion of pointwise differential of b, see [12]). Thanks to the Radon–Nikodym decomposition, a similar splitting holds for Dxs b as well. That is, we might write Dxs b = M |Dxs b|, where |Dxs b| is the total variation measure of Dxs b (and hence a nonnegative measure), and M is a matrix–valued Borel function. We are now ready to state the following Proposition 3.2. — Let b ∈ BV (R × Rn , Rn ) and let z ∈ Rn . Then the difference quotients b(t, x + δz) − b(t, x) δ

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

184

C. DE LELLIS

can be canonically written as b1,δ (z)(t, x) + b2,δ (z)(t, x), where (a) b1,δ (z) converges strongly in L1loc to ∇x b · z as δ ↓ 0. (b) For any compact set K Z (18) lim sup δ↓0

⊂ R × Rn we have b2,δ (z)(t, x) dx dt ≤ |Dxs b · z|(K) .

K

(c) For every compact set K ⊂ R × Rn we have Z b1,δ (z)(t, x) + b2,δ (z)(t, x) dx dt ≤ |z||Dx b|(Kε ) (19) sup δ∈]0,ε[

K

where Kε = {(t, x) : dist ((t, x), K) ≤ ε}. Loosely speaking, in this canonical splitting b1,δ (z) is converging towards the absolutely continuous part of ∂z b, whereas b2,δ (z) is converging towards the singular part. In order to understand why this decomposition is possible, consider the case when b is a function of one real variable, and split its derivative b0 into the sum b0a + b0s of its absolutely continuous part and its singular part. Let b1 be a primitive of b0a and b2 a primitive of b0s . For instance we can define b1 (x) = b0a ([0, τ [) and b2 (x) = b0s ([0, τ [) for τ positive and b1 (x) = −b0a (]τ, 0]) and b2 (x) = b0s (] − τ, 0]) for τ negative. The sum of the difference quotients of b1 and b2 give the difference quotients of b, and it is, actually, the splitting of Proposition 3.2. For instance, since b1 is a W 1,1 function, its difference quotients converge strongly in L1 to its derivative, that is b0a : this gives (a). The remaining points (b) and (c) follow in a similar way. The proof of the proposition in the general case is perhaps the most technical part of this note, but it is based on the 1–dimensional case sketched above through the “slicing theory” of BV functions. The interested reader will find it in the appendix. Remark 3.3. — The decomposition of the proof is canonical in the sense that we give an explicit way of constructing b1,δ and b2,δ from the measures Dxa b·z and Dxs b·z. One important consequence of this explicit construction is the following linearity property: If b1 , b2 ∈ BVloc , λ1 , λ2 ∈ R, and z ∈ Rn , then (λ1 b1 + λ2 b2 )i,δ (z)(t, x) = λ1 b1i,δ (z)(t, x) + λ2 b2i,δ (z)(t, x) . 3.2. The commutator estimate of Ambrosio We now use the technical Proposition 3.2 to give a more careful estimate on the commutators Rε . The idea is again to follow the proof of Lemma 2.2, but this time, once arrived to (14), we will substitute the difference quotients of b with the splitting given by Proposition 3.2. We will then show that the “b1,ε ” cancels with the divergence, whereas for the singular part “b2,ε ” we will use the crudest estimate available. In order to state the final result, we first need some notation.

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

185

Definition 3.4. — For any η ∈ Cc∞ (Rn ) and any n × n matrix M we define Z Λ(M, η) = |∇η(z) · M · z| dz . Rn

We are now ready to state Ambrosio’s Commutators Estimate. Proposition 3.5 (Commutators estimate). — Let b, u and β be as in Lemma 3.1. Let ρ be any even convolution kernel and let M be the matrix–valued Borel function such that Dxs b = M |Dxs b|. Then the measure µ of (17) satisfies the inequality |µ| ≤ CΛ(M, ρ)|Dxs b| .

(20)

Proof. — Consider a continuous compactly supported test function ϕ and use the computations of Subsection 2.2 in order to conclude Z Z Z − ϕ dµ = lim − ϕβ 0 (u ∗ ρε )Rε = ϕβ 0 (u)u divx b ε↓0 Z b(t, x + εz) − b(t, x) + lim ϕ(t, x)[β 0 (u)u](t, x + εz) · ∇ρ(z) dz dx dt ε↓0 ε Z (21) = ϕβ 0 (u)u divx b Z + lim ϕ(t, x)[β 0 (u)u](t, x + εz)b1,ε (z)(t, x) · ∇ρ(z) dz dx dt (22) ε↓0 Z (23) + lim ϕ(t, x)[β 0 (u)u](t, x + εz)b2,ε (z)(t, x) · ∇ρ(z) dz dx dt . ε↓0

We now use Proposition 3.2 to show that (22) vanishes and to estimate (23) with (a suitable modification of) the right hand side of (20). Indeed, from Proposition 3.2(a) and (c), and from the strong L1loc convergence of u ∗ ρε to u, the second integral in (22) converges to Z Z X (24) ϕ(t, x)β 0 (y(t, x))u(t, x) ej · ∇b(t, x) · ei zj ∂zi ρ(z) dz dx dt . i,j

Arguing as in Subsection 2.2, (24) is equal to Z − ϕ(t, x)u(t, x)β 0 (u(t, x)) tr ∇b(t, x) dx dt . On the other hand, tr ∇b is just the absolutely continuous part of the divergence of b. Since by assumption divx b is absolutely continuous, it coincides with its absolutely continuous part. Therefore, (22) cancels with (21). We now come to (23). Since β 0 and u are both bounded, (23) can be estimated by Z Z (25) C lim sup |ϕ(t, x)| |b2,ε (z)(t, x) · ∇ρ(z)| dz dx dt . ε↓0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

186

C. DE LELLIS

Next, let S = kϕkC 0 , let Kσ be the closure of {(t, x) : |ϕ(t, x)| > σ} and rewrite (25) as Z SZ Z |b2,ε (z)(t, x) · ∇ρ(z)| dz dx dt dσ . (26) C lim sup ε↓0

0

Kσ

From Proposition 3.2(c), we know that Z |b2,ε (z)(t, x) · ∇ρ(z)| dt dx ≤ |Dxs b · ∇ρ(z)|(Kσ ) . (27) lim sup ε↓0

Kσ

Moreover, since for z outside the support of ρ the integral in (27) vanishes, the map Z |b2,ε (z)(t, x) · ∇ρ(z)| dt dx (σ, z) → Kσ

is bounded. Therefore, we integrate (26) first in (t, x) and use (27) and the dominated convergence theorem to bound (26) with a constant time Z SZ (28) |∇ρ(z) · Dxs b · z|(Kσ ) dz dσ . 0

Let νz be the measure |∇ρ(z) · Dxs b · z| = |∇ρ(z) · M · z||Dxs b|. Then (28) is simply Z Z Z Z |ϕ(t, x)|dνz (t, x) dz = |ϕ(t, x)| |∇ρ(z) · M (t, x) · z| d|Dxs b|(t, x) dz Z ïZ ò = |ϕ(t, x)| |∇ρ(z) · M (t, x) · z| dz d|Dxs b|(t, x) Z = |ϕ(t, x)|Λ(M (t, x), ρ) d|Dxs b|(t, x) . Summarizing, we get Z

Z ϕdµ ≤ C

|ϕ(t, x)|Λ(M (t, x), ρ)d|Dxs b|(t, x)

for any continuous compactly supported ϕ. This is indeed the desired claim (20). 3.3. Optimizing the choice of the kernel Let us recollect what proved so far in this section. We started with a BV field b, a distributional solution u of ∂t u + divx (ub) = u divx b and a function β ∈ C 1 (R) and we have proved that the distribution ∂t [β(u)] + divx [β(u)b] − β(u) divx b is a measure µ satisfying (29)

|µ| ≤ CΛ(M, ρ)|Dxs b| ,

for any choice of an even convolution kernel ρ ∈ Cc∞ (Rn ). Clearly our estimate is far from being optimal: the measure µ and the constant C are both independent of the kernel ρ. We can therefore optimize in ρ. Since the estimate (29) has a local nature, this optimization procedure is, in a certain sense,

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

187

equivalent to vary the regularizing kernel in t and x. In order to state our optimized estimate, we define the set of kernels ¶ © R (30) K = η ∈ Cc∞ (B1 (0)) such that η ≥ 0 is even, and B1 (0) η = 1 . Theorem 3.6. — Let u, b, and β be as in Lemma 3.1. Then ∂t [β(u)] + divx [β(u)b] − β(u) divx b = f |Dxs b| for some Borel function f satisfying (31)

|f (t, x)| ≤ C inf Λ(M (t, x), ρ) ρ∈ K

for |Dxs b|–a.e. (t, x).

Proof. — Let µ be as in (17). The inequality (29) implies its absolute continuity with respect of |Dxs b|. Therefore there exists a Borel function f such that µ = f |Dxs b|. There is only one technical subtlety to take into account. From Proposition 3.5 we know that |f (t, x)| ≤ Λ(M (t, x), ρ) for |Dxs b|–a.e. (t, x) whenever we fix a convolution kernel ρ. However, the set of measure zero where the inequality fails might in principle depend on ρ. This gives no trouble as soon as we infimize on a countable set of kernels K 0 (because a countable union of sets of measure zero has measure zero!): |f (t, x)| ≤ inf 0 Λ(M (t, x), ρ) ρ∈ K

for |Dxs b|–a.e. (t, x).

However, for any fixed matrix M , the map ρ 7→ Λ(M, ρ) is continuous for the W 1,1 topology. Therefore, if we choose K 0 to be any countable subset of K dense in the W 1,1 topology, then the infimum over K 0 coincides with the infimum over K .

4. THE LEMMAS OF BOUCHUT AND ALBERTI Our plan so far leads us to the following question: given a matrix M , what is the infimum of the functional Λ(M, ρ) over the set of kernels K ? One lower bound for this infimum follows from a simple integration by parts: Z X Z ∂ρ Λ(M, ρ) ≥ ∇ρ(y) · M · y dy = Mjk yj (y) dy B1 (0) zk k,j B1 (0) X Z (32) = − Mjk δjk ρ(y) dy = |tr M | . k,j B1 (0) Now, in the case at hand, recall that M |Dxs b| is the singular part of the derivative Dx b. Therefore tr M |Dxs b| is just the singular part of the divergence, which by our assumptions is zero. The proof that ∂t [β(u)] + divx [β(u)b] = 0 is therefore completed by the following lemma, whose proof is due to Alberti:

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

188

C. DE LELLIS

Lemma 4.1 (Alberti). — For any n × n matrix M we have (33) inf Λ(M, η) = tr M . η∈ K

However, Ambrosio’s original proof was instead based on the following special case of Alberti’s Lemma. Lemma 4.2 (Bouchut). — For any pair of vectors ξ, χ ∈ Rn we have (34) inf Λ(χ ⊗ ξ, η) = |ξ · χ| = tr (χ ⊗ ξ) . η∈ K

Actually this statement does not appear in Bouchut’s work: the formulation above is due to Ambrosio, who introduced the whole framework containing the Λ–estimate for the commutators and the local optimization of the kernel. However the lemma is inspired by the paper of Bouchut [15], where the idea of using a certain class of very anysotropic kernels was used for the first time. Let us informally explain why Lemma 4.2 suffices. When M |Dxs b| is the singular part of the distributional derivative of a BV function, M (t, x) is a rank–one matrix for |Dxs b|–a.e. (t, x). This result, which is probably the deepest one in the theory of BV functions, is also due to Alberti (see [2]; for a recent brief, but nonetheless complete, account of the proof, see [26]). In order to understand its statement, the reader might check it on the easiest examples, i.e. functions which are piecewise constants. In this case the result is a trivial fact: the hard core of Alberti’s result is that the same property holds also when (part of) the distributional derivative of b is a fractal–type measure. In any case, by Alberti’s Rank–one Theorem, Bouchut’s Lemma is already sufficient to prove the renormalization theorem of Ambrosio. Theorem 4.3. — Let u, b, and β be as in Lemma 3.1. Then ∂t [β(u)] + divx [β(u)b] − β(u) divx b = 0 Moreover, arguing exactly as in Subsection 2.3, we can adjust the initial condition to conclude Theorem 4.4. — Let b ∈ L1 (R+ , BV (Rn )) with absolutely continuous divergence. Then b has the renormalization property. Before coming to the proof of these lemmas, we want to point out an important fact. As already said, we can regard the optimization procedure of Theorem 3.6 as an implementation of the idea “a varying regularizing kernel approximates better than a fixed one”. Then both Bouchut’s and Alberti’s Lemmas tell us that, close to points where the singular part of Dxs b is large, the optimal choice is a very anisotropic kernel. As already said above, this intuition originated in Bouchut’s paper [15].

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

189

4.1. Bouchut’s Lemma The proof of Bouchut’s Lemma is very elementary and it exploits convolution kernels which have a very simple structure, i.e. they are close to the indicator function of a very thin rectangle, whose long sides are parallel to χ. Proof of Lemma 4.2. — If d = 2 we can fix an orthonormal basis of coordinates z1 , z2 in such a way that ξ = (a, b) and χ = (0, c). Consider the rectangle rε = [−ε/2, ε/2] × [−1/2, 1/2] and consider the kernel ηε = 1ε 1rε . Let ζ ∈ K and denote by ζδ the family of mollifiers generated by ζ. Clearly ηε ∗ ζδ ∈ K for ε + δ small enough. Denote by ν = (ν1 , ν2 ) the unit normal to ∂rε and recall that ∂(ηε ∗ ζδ ) |νi | 1 ∗ * H ∂rε (35) lim δ↓0 ∂zi ε in the sense of measures (here H 1 the boundary of rε ).

∂rε denotes the usual 1–dimensional measure on

Thus, we can compute ∂(ηε ∗ ζδ ) dz1 dz2 |az1 | + |bz2 | |c| ∂z2 δ↓0 R2 Z Å ã |b| ε 2|c| ε/2 |az1 | + dz1 = |ac| + |bc| . ε −ε/2 2 2 Z

lim sup Λ(M, ηε ∗ ζδ ) ≤ lim sup δ↓0

=

Note that bc = tr M . Thus, if we define the convolution kernels λε,δ = ηε ∗ ζδ we get: (36)

lim sup lim sup Λ(M, ηε ∗ ζδ ) ≤ |tr M | . ε↓0

δ↓0

For n ≥ 2 we consider a system of coordinates x1 , x2 , . . . , xn such that η = (a, b, 0, . . . , 0), ξ = (0, c, 0, . . . , 0) and we define the convolution kernels λε,δ (x) = [ηε ∗ ζδ ](x1 , x2 ) · ζ(x3 ) · . . . · ζ(xn ) . The conclusion of the lemma follows easily. 4.2. Alberti’s Lemma The proof of Alberti’s Lemma is in a certain sense a generalization of Bouchut’s proof. The basic idea is to take a convolution kernel which is concentrated on a very long tube made of trajectories of the ODE γ˙ = M · γ. Proof of Lemma 4.1. — By the identity ∇η(z) · M · z = div (M · zη(z)) − tr M η(z), it suffices to show that for every T > 0 there exists η ∈ K such that Z 2 . (37) |div(M · zη(z))| dz ≤ T Rn

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

190

C. DE LELLIS

Given a smooth nonnegative convolution kernel θ with compact support, we claim that the function Z 1 T η(z) = θ(e−tM · z) e−ttr M dt T 0 P i i tM has the required properties. Here etM is the matrix i t M · z is just i! . That is, e the solution of the ODE γ˙ = M · γ with initial condition γ(0) = z, and e−ttr M is the determinant of e−tM . The usual change of variables yields Z η(z)ϕ(z) dz (38)

1 T

Z

=

Z

=

1 T

T

Z

ϕ(z)θ(e−tM · z)e−ttr M dz dt

0 T

Z

ϕ(etM · ζ)θ(ζ) dζ dt ,

0

for any integrable bounded ϕ. Hence ηL d is the time average of the push-forward of the measure θL d along the trajectories of γ˙ = M · γ. This is the point of view taken in [6] to prove (37), for which we argue with the direct computations shown below. Note that div (M · zη(z)) =

1 T

Z

T

div (M · z θ(e−tM · z))e−ttr M dt .

0

A tedious but straightforward computation (see [25]) shows div (M · zθ(e−tM · z))e−t tr M = −

d θ(e−tM · z)e−t tr M . dt

Thus Z

Z | div (M · zη(z))| dz

=

Rn

Rn

Z = Rn

Z T −tM −t tr M div (M · zθ(e · z))e dt dz 0 Z 1 T d θ(e−tM · z)e−t tr M dt dz T 0 dt 1 T

Z = ≤ =

1 −T M θ(e · z)e−T tr M − θ(z) dz Rn T Z ÅZ ã 1 θ(e−T M · z)e−T tr M dz + θ(z) dz T n Rn Z ÅZR ã 1 2 θ(ζ) dζ + θ(z) dz = . T T Rn Rn

This shows (37) and concludes the proof.

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

191

5. THE CONTINUITY EQUATION AND REGULAR LAGRANGIAN FLOWS Another major point of the DiPerna–Lions theory is that the classical road from characteristics to transport equations can be reversed: the renormalization property and the induced uniqueness and stability of weak solutions to transport equations can be used to infer existence, uniqueness and stability of a suitable generalized notion of flow for the ODEs (2). In his paper [4], Ambrosio has proposed a new way of looking at this side of the DiPerna–Lions theory, based on the analysis of probability measures on the space of paths. In the present note we follow yet another presentation, given in [25]. We start by defining our generalized notion of flow. Definition 5.1. — Let b ∈ L∞ ([0, ∞[×Rn , Rn ). A map Φ : [0, ∞[×Rn → Rn is a regular Lagrangian flow for b if (a) for L 1 –a.e. t we have |{x : Φ(t, x) ∈ A}| = 0 for every Borel set A with |A| = 0; (b) the following identity is valid in the sense of distributions     ∂t Φ(t, x) = b(t, Φ(t, x))

(39)

   Φ(0, x) = x . Note that assumption (a) guarantees that b(t, Φ(t, x)) is well defined. Indeed, if ˆb = b L n+1 –a.e., then ˆb(t, Φ(t, x)) = b(t, Φ(t, x)) for L n+1 –a.e. (t, x). Ideally one could divide the DiPerna–Lions theory into two separate parts: how to prove “renormalization–type” properties and which kind of “renormalization–type” properties implies existence, uniqueness and stability of regular Lagrangian flows. An example of this approach is given by the notes [25], where the two parts are presented in completely independent ways. Instead, here we focus on the specific theorem below, with the hope to keep the notation and details to a minimum and highlight the mechanisms which link renormalized solutions to regular Lagrangian flows. Theorem 5.2. — Let b ∈ L1 (R+ , BV (Rn )) ∩ L∞ with bounded divergence. Then there exists a unique regular Lagrangian flow Φ for b. Moreover, if bk is a sequence of smooth vector fields converging strongly in L1loc to b such that kdivx bk∞ is uniformly bounded, then the flows of bk converge strongly in L1loc to Φ. During the proof of this theorem we will recover an important fact: the regular Lagrangian flow is a suitable weak notion of characteristics for the transport equation.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

192

C. DE LELLIS

5.1. The density of a regular Lagrangian flow and the continuity equation Denote by µΦ the measure (id , Φ)# L n+1 ([0, ∞[×Rn ), i.e. the push–forward via the map (t, x) 7→ (t, Φ(t, x)) of the Lebesgue n+1–dimensional measure on [0, ∞[×Rn . Such push–forward is simply defined by the property Z Z ψ(t, Φ(t, x)) dL n+1 (t, x) ψ(t, x) dµΦ (t, x) = [0,∞[×Rn

[0,∞[×Rn

valid for every ψ ∈ Cc (R × Rm ). Observe that (a) is equivalent to the absolute continuity of µΦ with respect to the Lebesgue measure, and hence to the existence of a ρ ∈ L1loc ([0, ∞[×Rn ) such that µΦ = ρL n+1 . Definition 5.3. — The ρ defined above will be called the density of the regular Lagrangian flow Φ. When b is smooth and Φ is the classical solution of (39), t 7→ Φ(t, ·) is a one– parameter family of diffeomorphisms. For each t let us denote by Φ−1 (t, ·) the inverse of Φ(t, ·). Then ρ can be explicitly computed as ρ(t, x) = det ∇x Φ(t, Φ−1 (t, x)) and the classical Liouville Theorem states that ρ solves the continuity equation ∂t ρ + divx (ρb) = 0. Moreover, since Φ(0, x) = x, the initial condition for ρ is ρ(0, x) = 1. This property remains true for regular Lagrangian flows and it is simply the special case ζ = 1 in the following proposition. Proposition 5.4. — Let Φ be a regular Lagrangian flow for a field b. Let ζ ∈ L∞ (Rn ) set µ = (id , Φ)# (ζL n+1 ). Then there exists ζ ∈ L1loc ([0, ∞[×Rn ) such that µ = ζL n+1 . This ζ solves (distributionally)     ∂t ζ + divx (ζb) = 0 (40)

   ζ(0, ·) = ζ . Proof. — First of all, notice that µ ≤ kζk∞ µΦ . So µ is absolutely continuous and hence there exists a ζ ∈ L1loc such that µ = ζL n+1 . Now, let ψ ∈ Cc∞ (R × Rn ) be any given test function. Our goal is to show that Z Z (41) − ζ(t, x) ∂t ψ(t, x) + b(t, x) · ∇x ψ(t, x) dx dt = ζ(x)ψ(0, x) dx . [0,∞[×Rn

Rn

By definition, the left hand side of (41) is equal to Z ïZ ∞ ò ∂t ψ(t, Φ(t, x)) + ∇x ψ(t, Φ(t, x)) · b(t, Φ(t, x)) dt dx . (42) − ζ(x) Rn

0

The proof would follow if we could integrate by parts in t, since ψ(0, Φx (0)) = ψ(0, x) and ψ(T, Φx (T )) = 0 for any T large enough (because ψ is compactly supported). On

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

193

the other hand this integration by parts is easy to justify for a.e. x, since (39) implies that the curve t 7→ Φ(t, x) is Lipschitz for a.e. x. 5.2. Uniqueness of solutions to the continuity equation Next, let us assume that divx b is bounded in L∞ . Then we would expect, formally, that the density of Φ is bounded away from 0 and +∞. Indeed, assume that b and Φ are both smooth and rewrite the continuity equation as ∂t ρ + b · ∇x ρ + ρ divx b = 0. Fix x and differentiate the function ω(t) = ρ(t, Φ(t, x)) to get dω (t) dt

= ∂t ρ(t, Φ(t, x)) + ∂t Φ(t, x) · ∇x ρ(t, Φ(t, x)) = ∂t ρ(t, Φt, x)) + b(t, Φ(t, x)) · ∇x ρ(t, Φ(t, x)) = −divx b(t, Φ(t, x))ρ(t, Φ(t, x))

(43) = −divx b(t, Φ(t, x))ω(t) . Since −kdivx bk∞ ≤ −divx b(t, Φ(t, x)) ≤ kdivx bk∞ and ω(0) = 1, we can use Gronwall’s Lemma to conclude exp(−T kdivx bk∞ ) ≤ ω(T ) ≤ exp(T kdivx bk∞ ). But Φ(T, ·) is surjective, because it is a diffeomorphism. Therefore we conclude (44)

exp(−T kdivx bk∞ ) ≤ ρ ≤ exp(T kdivx bk∞ ).

We cannot use this formal argument on the density of a general regular Lagrangian flow. On the other hand, by a standard approximation procedure, we can show the following Lemma. Lemma 5.5. — Let b ∈ L∞ with bounded divergence. Then there exists a ρ˜ ∈ L∞ loc satisfying the bounds (44) and solving   ρb) = 0   ∂t ρ˜ + divx (˜ (45)

   ρ˜(0, ·) = 1 . Proof. — Let ϕ be a standard convolution kernel, and consider bk = b∗ϕk−1 . Consider the densities ρk of the classical flows of bk . Equation (40) holds with b and ρ˜ replaced by bk and ρk . On the other hand, for ρk we can argue as above and get the bounds exp(−tkdivx bk k∞ ) ≤ ρk (t, x) ≤ exp(tkdivx bk k∞ ). Since kdivx bk k∞ ≤ kdivx bk∞ , there exists a subsequence of ρk which converges weakly∗ in L∞ to a ρ˜ satisfying (44). Arguing as in Theorem 1.3 we obtain (45) by passing into the limit in the continuity equations for ρ˜k . If we knew the uniqueness of solutions to the continuity equation, this existence result would become a proof of the formal bound (44) for the density of any regular Lagrangian flow. As usual, we consider the case of b smooth in order to get some

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

194

C. DE LELLIS

insight. Let ρ and ρ˜ be two smooth solutions of (45), with ρ˜ > 0, and define u = ρ/˜ ρ. Then we could use the chain rule to compute ∂t u + b · ∇x u = ρ˜−2 ρ˜ ∂t ρ + b · ∇x ρ − ρ ∂t ρ˜ + b · ∇x ρ˜ . Adding and subtracting ρ˜−2 (ρ˜ ρ divx b), we achieve ∂t u + b · ∇x u = ρ˜−2 ρ˜ ∂t ρ + divx (ρb) − ρ ∂t ρ˜ + divx (˜ ρb) = 0. But since u(0, x) = ρ(0, x)/˜ ρ(0, x) = 1, we conclude u(t, x) = 1 for every t and x. The computations above are very similar, in spirit, to the renormalization property. It is therefore not a surprise that the theorem below follows from suitable modifications of the proof of Theorem 4.4. Theorem 5.6. — Let b ∈ L1 (R+ , BV (Rn )) ∩ L∞ with bounded divergence and let ρ˜ ρ and ζ be L1loc functions solving respectively (45) and (40). If ρ˜ ≥ C > 0, then u = ζ/˜ is a distributional solution of     ∂t u + divx (ub) − u divx b = 0 (46)    u(0, ·) = ζ . By minor modifications of the ideas of Section 1, Lemma 5.5 and Theorem 5.6 yield the desired uniqueness for solutions of the continuity equations. Corollary 5.7. — Let b be as in Theorem 5.6. Then there exists a unique ζ ∈ L1loc solving (40). Therefore, if Φ is a regular Lagrangian flow for b, the density of Φ coincides with the density ρ˜ of Lemma 5.5 and hence satisfies the bounds (44). 5.3. Uniqueness and stability of regular Lagrangian flows The uniqueness of solutions of the continuity equations yields easily the uniqueness and stability of regular Lagrangian flows. Proof of the uniqueness and stability parts in Theorem 5.2. — Uniqueness. Let Φ and Ψ be two regular Lagrangian flows for b. Fix a ζ ∈ Cc (Rn ) and consider the unique solution ζ of (40). According to Proposition 5.4 we have (id , Φ)# (ζL n+1 ) = ζL n+1 = (id , Ψ)# (ζL n+1 ). This identity means that Z Z ϕ(t, Φ(t, x))ζ(x) dt dx = ϕ(t, Ψ(t, x))ζ(x) dt dx for every test function ϕ ∈ Cc (R × Rn ). But since ζ has compact support, one can infer the equality even when ϕ(t, y) = χ(t)yi for χ ∈ Cc (R). So Z Z Ψi (t, x))χ(t)ζ(x) dt dx Φi (t, x))χ(t)ζ(x) dt dx =

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

195

for any pair of functions χ ∈ Cc (R) and ζ ∈ Cc (Rn ). This easily implies Φi = Ψi a.e. Stability. Consider a sequence {bk } as in the statement of the theorem and let Φk be the corresponding classical flows. Fix a ζ ∈ Cc (Rn ) and consider the ζk and uk solving, respectively, the continuity equations and the transport equations with coefficients bk and initial data ζ. Recall that, if ρk are the densities of Φk , then ζk = uk ρk . The uk are essentially bounded functions, and by the bounds in Subsection 5.2, the ρk are locally uniformly bounded. Therefore the ζk are locally uniformly bounded and, up to subsequences, they converge, weakly∗ in L∞ loc , to some ζ. Arguing as in Theorem 1.3, this ζ must be the unique distributional solution of (40). So, fixing a test function ϕ ∈ Cc (R × Rn ) and arguing as in the uniqueness part, we get Z Z lim ϕ(t, Φk (t, x))ζ(x) dt dx = ϕ(t, Φ(t, x))ζ(x) dt dx , k↑∞

where we are allowed to test with ϕ(t, y) = χ(t)yi : this gives the weak∗ convergence 2 ∗ of Φk to Φ in L∞ loc . Testing with ϕ(t, y) = χ(t)|y| , we conclude as well the weak k 2 2 1 convergence of |Φ | to |Φ| . This implies of course the strong Lloc convergence. 5.4. Existence of regular Lagrangian flows The proof of existence of regular Lagrangian flows follows from an approximation argument. Indeed, let bk be a standard regularization of b, with kbk k∞ + kdivx bk k∞ bounded by a constant C and bk → b strongly in L1loc . Consider the flows Φk of bk . By the bounds of Subsection 5.2, exp(−Ct) ≤ det ∇x Φk (t, x) ≤ exp(Ct), which translates into the bounds exp(−Ct)|A| ≤ |Φk (t, A)| ≤ exp(Ct)|A| for every Borel set A. Assume for the moment that we could prove the strong convergence of Φk to a map Φ. Then, clearly exp(−Ct)|A| ≤ |Φ(t, A)| ≤ exp(Ct)|A|, and hence Φ satisfies condition (a) in Definition 5.1. It is then an exercise in elementary measure theory to show that bk (t, Φk (t, x)) converges to b(t, Φ(t, x)) strongly in L1loc . Since Φk solves  k k    ∂t Φ (t, x) = bk (t, Φ (t, x))    Φk (0, x) = x it is straightforward to conclude that Φ solves (39) distributionally. The main point is therefore to show the strong convergence of Φk . This follows from the stability of the corresponding transport equations. Proof of the strong convergence of Φk . — Consider, backward in time, the ODE  k k    ∂t Λ (t, x) = bk (t, Λ (t, x))

(47)

   Λk (T, x) = x .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

196

C. DE LELLIS

Let Γk (t, ·) be the inverse of the diffeomorphism Λk (t, ·). If u ∈ L∞ (Rn ), then uk (t, x) = u(Γk (t, x)) is the unique (backward) solution of the transport equation     ∂t uk + divx (bk uk ) = uk divx bk    u (T, ·) = u(·) . k By Theorem 4.4 and Proposition 1.6, uk converges strongly in L1loc to the unique (backward) solution u of     ∂t u + divx (bu) = u divx b    u(T, ·) = u(·) . Choose u(x) = χ(x)xi , where χ is a smooth cut-off function. Since uk (t, x) = χ(Γk (t, x))Γki (t, x), we infer easily the strong L1loc convergence of the components Γki . This implies that Γk converges to a map Γ strongly in L1loc ([0, T ] × Rn ). On the other hand, for any given x, Γk (·, x) is a Lipschitz curve with Lipschitz constant bounded independently of k. It is then easy to see that Γk (t, ·) is a Cauchy sequence in L1 (A) for every bounded A and every t ∈ [0, T ]. In particular, Γk (0, ·) converges to some map strongly in L1loc . Now, Γk (0, ·) is the inverse of Λk (0, ·), which in view of (47) is the inverse of Φk (T, ·). Therefore we conclude that for each T there exists a map Φ(T, ·) such that Φk (T, ·) → Φ(T, ·) strongly in L1loc . Again, using the fact that, for each x, Φk (·, x) is a Lipschitz curve with Lipschitz constant bounded independently of k, it is not difficult to see that Φk is a Cauchy sequence in L1 (A) for any bounded A ⊂ R+ × Rn . This concludes the proof.

6. BEYOND BV AND BEYOND RENORMALIZED SOLUTIONS: FURTHER RESULTS, CONJECTURES AND OPEN PROBLEMS 6.1. Nearly incompressible BV fields By nearly incompressible fields b we understand those fields for which there exists a regular Lagrangian flow Φ satisfying the bounds c(t)|A| ≤ |Φ(t, A)| ≤ C(t)|A|, for some continuous and nonvanishing functions c and C. At a first glance there are at least two obstructions to build a theory of renormalized solutions for nearly incompressible flows. On the one hand, it seems necessary to give a meaning to u divx b in order to define distributional solutions u of (3). On the other hand, it is not clear how to define nearly incompressible fields without referring to some flow.

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

197

Both these issues can be naturally solved by using the continuity equation. Indeed, we can define nearly incompressible fields as those b for which there exists a distributional solution ρ˜ of (45). Moreover, there are appropriate versions of the renormalization property which use only the continuity equation and hence can be stated without assumptions on the divergence of b. This point of view was first taken in [7] and it has been systematically explored in [25]. The “soft” part of the DiPerna–Lions theory can be extended naturally to this setting. Concerning the “hard” part, i.e. the proof of the corresponding renormalization properties, the W 1,p case of this theory follows from the DiPerna–Lions estimate for the commutators. The BV case is instead still open. Indeed, the motivation in [7] was the following conjecture raised by Bressan in [17]. Conjecture 6.1 (Bressan’s compactness conjecture). — Let bk : R × Rn → Rn be a sequence of smooth vector fields and denote by Φk the corresponding flows. Assume that kbk k∞ + k∇bk kL1 is uniformly bounded and that C −1 ≤ det(∇x Φk (t, x)) ≤ C for some constant C > 0. Then the sequence {Φk } is strongly precompact in L1loc . Bressan’s conjecture was initially motivated by a problem in the theory of hyperbolic systems of conservation laws. However, in order to solve this problem one does not need to tackle Conjecture 6.1: a milder statement, which is a corollary of Ambrosio’s result, suffices (see [10] and [7]). At present, the best result available in the direction of Conjecture 6.1 is contained in [11] and goes towards a theory of renormalized solutions for nearly incompressible BV fields. This paper makes strong use of a refined theory of traces for transport equations, developed in [9]. 6.2. Beyond BV fields Can one hope for the renormalization property when b is in a space larger than BV ? The counterexamples available in the literature show fields which are quite close to be BV and do not have the renormalization property (see [27] and [22], both inspired by an older construction of Aizenmann [1]). Moreover, these examples have severe consequences on the possibility of building a general theory of existence for hyperbolic systems of conservation laws on transport equations (see [23]). Nonetheless there are still many interesting open problems in this direction. For instance, in two dimensions and for divergence–free autonomous fields, renormalization theorems are available even under very mild assumptions, because of the underlying Hamiltonian structure (see [16], [31], [20]). In the recent paper [3] the authors have given a necessary and sufficient condition for the renormalization property when b is divergence–free, planar, autonomous and bounded. In particular, they produce a striking example of such a b which does not have the renormalization property.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

198

C. DE LELLIS

A very interesting open question, naturally linked to Euler’s equations, is whether the renormalization property holds for divergence–free fields b ∈ L∞ (R, L2 (R2 )) when the vorticity of b is a measure. Another open question is whether the renormalization property holds for fields b with absolutely continuous divergence when the symmetric part of the gradient is a measure. The property indeed holds when the symmetric part of the gradient is in L1 , see [19]. For a more general result in this direction, see [9]. 6.3. A direct Lagrangian approach In the DiPerna–Lions theory, conclusions on the “Lagrangian point of view” are recovered from theorems on the “Eulerian point of view”. A natural question is whether one could get the same results directly, for instance proving a–priori estimates on the solutions of the ODEs. Indeed, the whole theory of regular Lagrangian flows for W 1,p fields with p > 1 can be recovered by proving appropriate estimates in the Lagrangian formulation, as it has been recently shown in [24]. These estimates also provide mild regularity properties for regular Lagrangian flows and distributional solutions to transport equations. In a nutshell, if b ∈ W 1,p and Φ is the corresponding flow, the Lp norm of the difference of Φ(t, ·)−Φ(t, ·+v) can be estimated by a constant (depending on the compressibility of b, and the Lp norm of ∇b) times | log(|v|)|−1 . The estimates of [24] were inspired by some computations of [13], where the authors proved the approximate differentiability of regular Lagrangian flows. In turn, [13] was inspired by another result of [32] on weak differentiability properties for regular Lagrangian flows. See also [14] for a comparison among the various weak notions of differentiability used in these papers. The estimates of [23] quantify the compactifying properties of transport equations with Sobolev coefficients. In particular they imply the Lp version of a second conjecture of Bressan on the mixing of flows (see [18]), which we state below. Fix coordinates x = (x1 , x2 ) ∈ [0, 1[×[0, 1[ on the torus T = R2 /Z2 and consider the set A = (x1 , x2 ) : 0 ≤ x2 ≤ 1/2 ⊂ T. Given a smooth divergence–free field b : [0, 1] × T → R2 denote by Φ its flow. For a fixed κ ∈]0, 1/2[, we say that Φ mixes the set A up to scale ε if for every ball Bε (x) we have κ|Bε (x)| ≤ |Bε (x) ∩ Φ(1, A)| ≤ (1 − κ)|Bε (x)| . Conjecture 6.2 (Bressan’s mixing conjecture). — Under these assumptions, there exists a constant C depending only on κ s.t., if Φ mixes the set A up to scale ε, then Z 1Z |Dx b| dxdt ≥ C| log ε| for every 0 < ε < 1/4. 0

ASTÉRISQUE 317

T

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

199

7. APPENDIX: PROOF OF PROPOSITION 3.2 Proof. — Let e1 , . . . , en be orthonormal vectors in Rn . In the corresponding system of coordinates we use the notation x = (x1 , . . . , xn−1 , xn ) = (x0 , xn ). Without loss of generality we can assume that z = en . Recall the following elementary fact: if µ is a Radon measure on R, then the functions µ ˆδ (τ ) =

1[−δ,0] µ([τ, τ + δ]) = µ∗ (τ ) δ δ

τ ∈R

satisfy Z |ˆ µδ | dτ ≤ µ(Kδ )

(48) K

for every compact set K ⊂ R, where Kδ denotes the δ–neighborhood of K. Consider the measure Den b = Dx b · en , and the vector–valued function ∇x b · en . Clearly this function is the Radon–Nikodym derivative of Den b with respect to L n+1 and we denote by Desn b the singular measure Dxs b · en = Den b − ∇x b · en L n+1 . We define b1,δ (t, x0 , xd ) =

1 δ

Z

xn +δ

∇x b · en (t, x0 , s) ds .

xn

By Fubini’s Theorem and standard arguments on convolutions, we get that b1,δ → ∇x b · en strongly in L1loc . Next set b2,δ (t, x0 , xn ) =

b(t, x0 , xn + δ) − b(t, x0 , xn ) − b1,δ (t, x0 , xn ) , δ

and, for L n –a.e. (t, x) ∈ R × Rn−1 , define bt,y : R → R by bt,y (s) = b(t, y, s). We recall the following slicing properties of BV functions (see Theorem 3.103, Theorem 3.107, and Theorem 3.108 of [12]): (a) bt,y ∈ BVloc (R, Rn ) for L n –a.e. (t, y); (b) if we let Ds bt,y + b0t,y L 1 be the Radon–Nikodym decomposition of Dbt,y , then we have ∇x b(t, y, s) · en = b0t,y (s)

for L n+1 –a.e. (t, y, s)

and |Desn |(A)

Z =

|Ds bt,y |(A ∩ {(t, y, s) : s ∈ R}) dt dy ;

Rn

(c) bt,y (s + δ) − bt,y (s) = Dbt,y ([s, s + δ]).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

200

C. DE LELLIS

Therefore, for any δ > 0 and for L n –a.e. (t, y) we have b(t, y, xn + δ) − b(t, y, xn ) δ

Therefore Z

=

bt,y (xn + δ) − bt,y (xn ) Dbt,y ([xn , xn + δ]) = δ δ 0 ÿ ÿ 1 s (b L ) (xn ) + (D bt,y ) (xn )

=

ÿ s bt,y ) (xn ) b1,δ (t, y, xn ) + (D δ

=

t,y

Z

Z |b2,δ | ≤ Rn

K

Z (49) ≤ Rn

{xn :(t,y,xn )∈K}

for L 1 –a.e. xn .

ÿ s (D bt,y )δ (xn ) dxn dy dt

|Ds bt,y | ({xn : (t, y, xn ) ∈ Kδ }) dy dt = |Dxs b · en |(Kδ ) ≤ |Dxs b|(Kδ ) .

Letting δ ↓ 0, this gives (18). Note moreover that Z Z Z |b1,δ | ≤ Rn

K

{xn :(t,y,xn )∈K}

ÿ0 (bt,y L 1 )δ (xn ) dxn dy dt

Z (50)

δ

δ

≤

Z |∇x b · en |(t, y, xn ) dy dt dxn ≤

Kδ

|∇x b|(t, y, xn ) dy dt dxn . Kδ

Adding the bounds (49) and (50) we get (19).

REFERENCES [1] M. Aizenman – “On vector fields as generators of flows: a counterexample to Nelson’s conjecture”, Ann. Math. 107 (1978), p. 287–296. [2] G. Alberti – “Rank one property for derivatives of functions with bounded variation”, Proc. Roy. Soc. Edinburgh Sect. A 123 (1993), p. 239–274. [3] G. Alberti, S. Bianchini & C. Gianluca – In preparation.

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

201

[4] L. Ambrosio – “Transport equation and Cauchy problem for BV vector fields”, Invent. Math. 158 (2004), p. 227–260. [5] , “Lecture notes on transport equation and Cauchy problem for bv vector fields and applications”, Lectures of a course given in Luminy, October 2003. [6]

, “Transport equation and Cauchy problem for non-smooth vector fields”, Lecture Notes of the CIME Summer school in Cetrary, June 27-July 2, 2005. [7] L. Ambrosio, F. Bouchut & C. De Lellis – “Well-posedness for a class of hyperbolic systems of conservation laws in several space dimensions”, Comm. Partial Differential Equations 29 (2004), p. 1635–1651. [8] L. Ambrosio & G. Crippa – “Existence, uniqueness, stability and differentiability properties of the flow associated to weakly differentiable vector fields”, in Transport Equations and Multi-D Hyperbolic Conservation Laws, Lecture Notes of the Unione Matematica Italiana, Springer Verlag, Berlin-Heidelberg, 2008. [9] L. Ambrosio, G. Crippa & S. Maniglia – “Traces and fine properties of a BD class of vector fields and applications”, Ann. Fac. Sci. Toulouse Math. 14 (2005), p. 527–561. [10] L. Ambrosio & C. De Lellis – “Existence of solutions for a class of hyperbolic systems of conservation laws in several space dimensions”, Int. Math. Res. Not. 2003 (2003), p. 2205–2220. [11] L. Ambrosio, C. De Lellis & J. Malý – “On the chain rule for the divergence of vector fields: applications, partial results, open problems”, in Perspectives in nonlinear partial differential equations, 2007, p. 31–67, Contemp. Math. 446, Amer. Math. Soc., Providence, RI. [12] L. Ambrosio, N. Fusco & D. Pallara – Functions of bounded variation and free discontinuity problems, Oxford Mathematical Monographs, The Clarendon Press, Oxford Univ. Press, 2000. [13] L. Ambrosio, M. Lecumberry & S. Maniglia – “Lipschitz regularity and approximate differentiability of the DiPerna-Lions flow”, Rend. Sem. Mat. Univ. Padova 114 (2005), p. 29–50 (2006). [14] L. Ambrosio & J. Malý – “Very weak notions of differentiability”, Proc. Roy. Soc. Edinburgh Sect. A 137 (2007), p. 447–455. [15] F. Bouchut – “Renormalized solutions to the Vlasov equation with coefficients of bounded variation”, Arch. Ration. Mech. Anal. 157 (2001), p. 75–90. [16] F. Bouchut & L. Desvillettes – “On two-dimensional Hamiltonian transport equations with continuous coefficients”, Differential Integral Equations 14 (2001), p. 1015–1024. [17] A. Bressan – “An ill posed Cauchy problem for a hyperbolic system in two space dimensions”, Rend. Sem. Mat. Univ. Padova 110 (2003), p. 103–117.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

202

[18] [19]

[20]

[21] [22]

[23] [24] [25] [26]

[27]

[28] [29] [30] [31] [32]

[33]

C. DE LELLIS

, “A lemma and a conjecture on the cost of rearrangements”, Rend. Sem. Mat. Univ. Padova 110 (2003), p. 97–102. I. Capuzzo Dolcetta & B. Perthame – “On some analogy between different approaches to first order PDE’s with nonsmooth coefficients”, Adv. Math. Sci. Appl. 6 (1996), p. 689–703. F. Colombini, G. Crippa & J. Rauch – “A note on two-dimensional transport with bounded divergence”, Comm. Partial Differential Equations 31 (2006), p. 1109–1115. F. Colombini & N. Lerner – “Uniqueness of continuous solutions for BV vector fields”, Duke Math. J. 111 (2002), p. 357–384. F. Colombini, T. Luo & J. Rauch – “Uniqueness and nonuniqueness for nonsmooth divergence free transport”, in Seminaire: Équations aux Dérivées Partielles, 2002–2003, Sémin. Équ. Dériv. Partielles, École polytech., 2003, p. 21. G. Crippa & C. De Lellis – “Oscillatory solutions to transport equations”, Indiana Univ. Math. J. 55 (2006), p. 1–13. , “Estimates and regularity results for the DiPerna-Lions flow”, J. reine angew. Math. 616 (2008), p. 15–46. C. De Lellis – “Notes on hyperbolic systems of conservation laws and transport equations”, Handbook of evolutionary differential equations, Vol. III, 2006. , “A note on Alberti’s rank-one theorem”, in Transport Equations and Multi-D Hyperbolic Conservation Laws, Lecture Notes of the Unione Matematica Italiana, Springer Verlag, Berlin-Heidelberg, 2008. N. Depauw – “Non-unicité du transport par un champ de vecteurs presque BV”, in Seminaire: Équations aux Dérivées Partielles, 2002–2003, Sémin. Équ. Dériv. Partielles, École polytech., 2003, p. 9. R. J. DiPerna & P.-L. Lions – “Ordinary differential equations, transport theory and Sobolev spaces”, Invent. Math. 98 (1989), p. 511–547. L. C. Evans – Partial differential equations, Graduate Studies in Math., vol. 19, Amer. Math. Soc., 1998. L. C. Evans & R. F. Gariepy – Measure theory and fine properties of functions, Studies in Advanced Math., CRC Press, 1992. M. Hauray – “On two-dimensional Hamiltonian transport equations with Lploc coefficients”, Ann. Inst. H. Poincaré Anal. Non Linéaire 20 (2003), p. 625–644. C. Le Bris & P.-L. Lions – “Renormalized solutions of some transport equations with partially W 1,1 velocities and applications”, Ann. Mat. Pura Appl. 183 (2004), p. 97–130. P.-L. Lions – “Sur les équations différentielles ordinaires et les équations de transport”, C. R. Acad. Sci. Paris Sér. I Math. 326 (1998), p. 833–838.

ASTÉRISQUE 317

(972)

THE RENORMALIZATION THEOREM OF AMBROSIO

203

Camillo DE LELLIS Universität Zürich Institut für Mathematik Winterthurerstrasse 190 CH–8057 Zürich (Suisse) E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (973) Aspects de l’indépendance algébrique en caractéristique non nulle Federico PELLARIN

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 973, p. 205 à 242

Mars 2007

ASPECTS DE L’INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE [d’après Anderson, Brownawell, Denis, Papanikolas, Thakur, Yu,...] par Federico PELLARIN

1. INTRODUCTION Un célèbre théorème de Baker affirme que si `1 , . . . , `n sont des nombres complexes linéairement indépendants sur Q tels que e`i ∈ Q pour tout i, alors 1, `1 , . . . , `n sont linéairement indépendants sur Q. Sous ces mêmes conditions, on conjecture aussi que `1 , . . . , `n sont algébriquement indépendants : les nombres π, log 2, log 3, log 5, . . . seraient en particulier algébriquement indépendants. Le caractère arithmétique des valeurs de la fonction zêta de Riemann ζ(n) = −n aux entiers n ≥ 2 est encore moins connu. On connaît la transcendance de k≥1 k ζ(2) = π 2 /6 et de ζ(2n) en général grâce à la transcendance de π et aux formules d’Euler, l’irrationalité de ζ(3) par Apéry, et l’indépendance linéaire sur Q d’une infinité de nombres dans l’ensemble {ζ(3), ζ(5), ζ(7), . . .} par Ball et Rivoal. On conjecture l’indépendance algébrique des nombres π, ζ(3), ζ(5), ζ(7), . . . P

Des questions similaires se posent pour les valeurs de la fonction gamma d’Euler Γ aux rationnels non entiers. La conjecture de Rohrlich-Lang affirme que les seules relations algébriques entre ces nombres sont obtenues en combinant les équations fonctionnelles connues, mais on sait démontrer seulement l’indépendance algébrique √ de Γ(1/2) = π et de Γ(r) avec r congru à 1/3, 2/3, 1/4, 3/4, 1/6, 5/6 modulo 1. Soient q = pr une puissance d’un nombre premier, Fq le corps à q éléments, T une indéterminée ; écrivons A = Fq [T ], K = Fq (T ). La valuation opposée du degré (en T ) v : K → Z ∪ {∞} donnée par v(a/b) = deg b − deg a donne la valeur absolue | · | définie par |x| = q −v(x) . On note K∞ = Fq ((T −1 )) (complété de K pour v). Le degré d’une clôture algébrique K∞ sur K∞ est infini et K∞ n’est pas complet pour l’unique extension de | · |.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

206

F. PELLARIN

Soit C le complété de K∞ pour | · |. D’après le lemme de Krasner, C est à la fois algébriquement clos et complet ; son corps résiduel est Fq . On note K une clôture algébrique de K et on fixe une fois pour toutes des plongements K ⊂ K∞ ⊂ C. Nous appellerons nombres les éléments de C. Un nombre qui n’est pas dans K est un nombre transcendant. Des nombres a1 , . . . , am tels que le sous-corps K(a1 , . . . , am ) de C soit de degré de transcendance m sur K sont algébriquement indépendants. Il existe des nombres dans C qui se trouvent en analogie profonde avec les nombres complexes 2πi, log n avec n entier ≥ 2, ζ(n) avec n ≥ 2 (et bien d’autres). On expliquera certains aspects de ces analogies dans ce texte mais nous pouvons dire tout de suite qu’il est possible de retrouver ces nombres dans les matrices de périodes de t-modules, qui sont essentiellement des groupes additifs Gda munis de certaines actions de A (décrites plus bas). La notion de t-module a été introduite par Anderson ; on peut y attacher des fonctions exponentielles. Elle a poussé dans la bonne direction une théorie de la transcendance, de l’indépendance K-linéaire et de l’indépendance algébrique dans C car on dispose aujourd’hui, grâce à Jing Yu, d’un analogue du théorème du sous-espace analytique de Wüstholz pour une classe très générale de t-modules qui sera décrit dans ce texte. Anderson a aussi introduit les t-motifs, qui sont essentiellement des ensembles de morphismes Fq -linéaires de Gna vers Ga avec action de A, et des conditions de compatibilité. On peut construire des catégories de t-modules et des catégories de t-motifs anti-équivalentes, mais les t-motifs possèdent des avantages sur les t-modules, remarqués par Anderson, quand on s’intéresse à l’interpolation analytique de leurs périodes. Guidés par ce point de vue, Anderson, Brownawell et Papanikolas ont démontré un critère d’indépendance linéaire pour les valeurs de solutions de certains systèmes aux σ-différences. Ce critère a permis à Papanikolas de démontrer l’analogue de la conjecture d’indépendance algébrique des logarithmes des nombres algébriques mentionnée au début de cette introduction. Par une méthode différente, liée à la méthode de Mahler sur C, Denis a obtenu des cas particuliers de cette conjecture. Grâce au travail de Chieh-Yu Chang et Jing Yu, nous savons calculer toutes les relations de dépendance algébrique entre les valeurs de la fonction zêta de Goss aux entiers positifs. Le critère d’indépendance linéaire d’Anderson, Brownawell et Papanikolas a aussi permis à ces auteurs de déterminer un analogue de la conjecture de Rohrlich-Lang pour les valeurs de la fonction gamma géométrique de Thakur.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

207

2. MODULES DE DRINFELD ET t-MODULES Un A-réseau Λ de rang n ≥ 1 (ou plus simplement réseau de rang n ≥ 1) est un A-module libre de rang n ≥ 1 discret (qui a intersection finie avec toute boule de C). Il en existe de tout rang fini : par exemple Λ = Aλ1 + · · · + Aλn quand λ1 , . . . , λn sont des éléments K∞ -linéairement indépendants de C. Écrivons, par analogie avec la fonction sigma de Weierstrass : Y (1) eΛ (z) = z (1 − z/λ). λ∈Λ\{0}

Ce produit converge (uniformément sur les boules) vers une fonction eΛ : C → C P i admettant un développement en série entière eΛ (z) = i≥0 αi z q avec αi ∈ C, convergeant pour tout z ∈ C. C’est la fonction exponentielle de Λ ; elle vérifie ecΛ (cz) = ceΛ (z) pour tout c ∈ C × , elle est surjective et Fq -linéaire. La dérivée deΛ /dz de eΛ est égale à 1, donc eΛ possède une série réciproque locale en 0 que nous notons logΛ et qui converge dans toutes les boules de centre 0 ne contenant pas d’élément de Λ. Soit a un polynôme dans A = Fq [T ]. L’analogue du théorème de Liouville pour P i les séries entières i ci z convergentes dans toute boule de C (cf. [44]) implique l’existence d’un polynôme Fq -linéaire φ(a) à coefficients dans C tel que : eΛ (az) = φ(a)(eΛ (z)).

(2)

L’application a 7→ φ(a) définit un homomorphisme injectif de Fq -algèbres A → EndFq -lin. (Ga /C) = C[τ ] (endomorphismes Fq -linéaires définis sur C), où C[τ ] est l’anneau non commutatif des polynômes en τ avec l’opération τ c = cq τ pour c ∈ C. Ceci induit une nouvelle structure de A-module sur le groupe Ga et un isomorphisme C ∼ = C/Λ. Noter que, si z ∈ C, a ∈ A \ {0} et az ∈ Λ, alors eΛ (z) est dans le noyau de φ(a). Pour n ≥ 1, il existe des éléments l0 , . . . , ln ∈ C tels que X (3) φ(T ) = li τ i avec ln 6= 0 et l0 = T. 0≤i≤n

On en déduit que, pour tout a ∈ A, il existe l0 (a), . . . , ln deg(a) (a) ∈ C tels que X φ(a) = li (a)τ i , 0≤i≤n deg a

avec l0 (a) = a, ln deg a (a) 6= 0, et φ(λ) = λτ 0 pour tout λ ∈ Fq .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

208

F. PELLARIN

Définition 2.1. — Un homomorphisme injectif de Fq -algèbres φ : A → C[τ ] satisfaisant (3) est appelé A-module de Drinfeld de rang n ≥ 1 (ou plus simplement, module de Drinfeld de rang n ≥ 1). On dit que le module de Drinfeld φ est défini sur K si l1 , . . . , ln ∈ K. L’application Λ 7→ φ avec φ(a) comme dans (2) est une bijection entre l’ensemble des réseaux de rang n et l’ensemble des modules de Drinfeld de rang n. On dit que Λ est le réseau des périodes de φ. Pour construire le réseau des périodes associé à un module de Drinfeld φ comme dans (3), il suffit de construire l’exponentielle associée P i eφ (z) = i αi z q . Tenant compte de (2) et de la convention αi = 0 pour i < 0, on trouve les relations dans C : (4)

n

i

q q (T q − T )αi = l1 (T )αi−1 + · · · + ln (T )αi−n ,

i ≥ 1,

auxquelles il convient d’ajouter α0 = 1. Sauf mention contraire, dans la suite tout module de Drinfeld sera défini sur K. Soient φ1 , φ2 deux modules de Drinfeld. Les morphismes φ1 → φ2 sont les applications Fq -linéaires Ga → Ga compatibles aux deux différentes actions de A définissant φ1 , φ2 . On note Hom(φ1 , φ2 ) le A-module des morphismes de φ1 vers φ2 . Un morphisme non nul φ1 → φ2 est une isogénie. Si φ1 , φ2 sont de rangs différents, il ne sont pas isogènes : il n’existe pas d’isogénie φ1 → φ2 . Si Λ1 , Λ2 sont les réseaux des périodes associés à φ1 , φ2 isogènes, Hom(φ1 , φ2 ) s’identifie à l’ensemble des z ∈ C tels que zΛ1 ⊂ Λ2 . On note End(φ) = Hom(φ, φ) ; c’est une A-algèbre de type fini. En revenant à deux modules de Drinfeld φ1 , φ2 , Hom(φ1 , φ2 ) est aussi un End(φ1 )-module de rang fini. 2.1. Module de Carlitz Comme A est principal, les modules de Drinfeld de rang 1 sont tous isomorphes entre eux. Le module de Carlitz (cf. [18](1)) est le module de Drinfeld de rang 1 associé à l’homomorphisme A → C[τ ] défini par T 7→ T τ 0 + τ, que l’on note φCar . À l’origine, il a été introduit pour développer une théorie des extensions cyclotomiques de K débouchant sur une solution dans ce contexte au douzième problème de Hilbert (par Carlitz et Hayes [16, 48, 49]) et a été le précurseur des modules de Drinfeld. Le réseau de périodes associé s’écrit Λ = πA pour un certain élément π défini à multiplication près par un élément de F× q . Dans la suite, on pose eCar = eπA et logCar = logπA . Dans ce texte, on étudiera plusieurs propriétés de π mais il convient tout de suite d’en citer trois : on a π ∈ Fq (((−T )1/(q−1) )) \ K∞ , π q−1 ∈ K∞ et (1)

Dans les premiers travaux, Carlitz étudiait plutôt le module T 7→ T τ 0 − τ .

ASTÉRISQUE 317

(973)

209

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

|π| = q q/(q−1) . Ces propriétés découlent toutes de la formule suivante, qui sera démontrée plus bas (valable pour un choix approprié de (−T )1/(q−1) ) : π = T (−T )1/(q−1)

(5)

∞ Y

i

(1 − T 1−q )−1 .

i=1 i

On a End(φCar ) = A. Avec les relations (4) on vérifie ensuite qu’avec [i] = T q − T (i ≥ 1) et [0] = 1 : i

i

(6)

eCar (z) =

X i≥0

zq , q [i][i − 1] · · · [1]qi−1 [0]qi

logCar (z) =

X i≥0

(−1)i z q , [i][i − 1] · · · [1][0]

la série logCar convergeant pour |z| < q q/(q−1) = |π|. 2.2. Premières approches à la transcendance Il semblerait que la première construction de nombres transcendants (dans K∞ \K) soit due à Wade [70] en 1941 et concerne les valeurs de la fonction eCar . Théorème 2.2. — Pour a ∈ K \ {0}, eCar (a) 6∈ K. Pour montrer ce résultat, il utilise les deux propriétés suivantes : tout polynôme de P i K[t] divise un polynôme Fq -linéaire (c’est-à-dire de la forme i ci tq ), et les valeurs de eCar sont des limites de suites de valeurs de polynômes Fq -linéaires, qui convergent donc très rapidement. On en déduit la transcendance de e := eCar (1). Comme eCar (π/T ) ∈ K, on a aussi la transcendance de π. Un survol des multiples approches à la transcendance de π se trouve dans le texte de l’exposé au séminaire Bourbaki de Hellegouarch [49] daté de 1997, voir aussi [73]. Une démonstration très simple de π 6∈ K a été obtenue par de Mathan pour q ≥ 3 en appliquant un critère de Denis [32] analogue de la méthode de Liouville (qui s’applique aussi à e, des détails se trouvent dans [66]). Denis [30] a en outre démontré, pour q ≥ 3, l’indépendance algébrique de e et π ; si q = 2, on sait seulement que 1, π et e sont K-linéairement indépendants. Un résultat de transcendance qui évoque le huitième problème de Schneider a aussi été démontré par Dion [36] : l’un des deux nombres eCar (e) et eCar (e2 ) est transcendant, on ne sait pas montrer que ces nombres sont tous les deux transcendants. Une autre manière de démontrer que π est transcendant consiste à appliquer la méthode dite « automatique » (la transcendance de π découle de la transcendance de sa « dérivée logarithmique » par rapport à T , facile à calculer à partir de (5)). Son résultat fondateur est dû à Christol [21] ; il a été complété ensuite par Christol, P Kamae, Mendès France et Rauzy [22] (1980) : une série formelle i ci ti ∈ Fq [[t]] est algébrique si et seulement si l’ensemble {(cpk n+j )n≥0 , k ≥ 0, 0 ≤ j ≤ pk − 1} est un

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

210

F. PELLARIN

ensemble fini de sous-suites de la suite (cn )n≥0 . (Cette dernière suite peut alors être « engendrée par un automate fini » au sens de Cobham [23].) Dans cet article, les auteurs en déduisent un analogue d’une conjecture généralement attribuée à Mahler qui implique la propriété suivante. Si p1 < p2 sont deux nombres premiers et si P a : N → {0, . . . , p1 −1} est une application, alors les deux séries formelles i≥0 ai T i ∈ P Fp1 [[T ]], i≥0 ai T i ∈ Fp2 [[T ]] sont simultanément algébriques si et seulement si elles sont rationnelles. La clôture algébrique de K se plonge dans le corps algébriquement clos des séries généralisées de Hahn(2). Kedlaya [50], en généralisant les méthodes de [22], a donné une caractérisation en termes d’automates de ses éléments qui a permis à Adamczewski et Bell [1] d’étendre l’analogue de la solution de la conjecture de Mahler ci-dessus aux séries de Hahn. La méthode automatique a aussi été développée et généralisée par Beals et Thakur [65, 8, 66]. Ils étudient, en appliquant des outils de la théorie des langages formels (notamment le « lemme de pompage »), comment certains automates infinis engendrent des nombres dans certaines classes et quelles opérations laissent ces classes stables, et obtiennent de remarquables applications à T −q/(q−1) π, T q/(q−1) π −1 et e ∈ K∞ . Ils obtiennent une classification des nombres dans Fq ((1/T )) qui fournit entre autres des critères d’indépendance algébrique. 2.3. t-modules La notion de t-module est due à Anderson [4] ; on considère ci-dessous l’action diagonale de τ sur Gsa . Définition 2.3. — Un t-module de dimension s (défini sur K) est un couple G = (Gsa , φ) avec φ un homomorphisme injectif de Fq -algèbres φ : A → EndFq -lin (Gsa /C) = Mats×s (C[τ ]) tel que φ(T ) = a0 τ 0 + · · · + ad τ d , où ai ∈ Mats×s (K) sont des matrices avec ad 6= 0 et avec a0 −T τ 0 matrice nilpotente. Comme pour les modules de Drinfeld, on vérifie que, pour tout t-module G = de dimension s, il existe une unique fonction Fq -linéaire eφ : C s → Gsa (C), P dont les coordonnées sont développables en séries entières i ci z i convergentes dans toute boule, l’exponentielle de G, telle que eG (a0 z) = φ(T )eG (z). Les notions d’homomorphisme, endomorphisme etc. de t-modules sont les généralisations naturelles de celles relatives aux modules de Drinfeld.

(Gsa , φ)

(2)

Des séries formelles

élément, et ci ∈ Fq .

ASTÉRISQUE 317

P

i∈ I

ci T i avec I ⊂ Q tel que tout sous-ensemble non vide a un plus grand

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

211

Soit G = (Gsa , φ) un t-module. Un sous-t-module F de G de dimension s0 ≤ s est un sous-groupe algébrique connexe de Gsa de dimension s0 stable sous l’action de φ(A). Un t-module sans sous-t-modules propres est un t-module simple. On considère l’opérateur σ inverse de τ ; si c ∈ C, alors σ(c) = c1/q . Soit G = (Gsa , φ) un t-module. L’ensemble M ∗ (G) = Mats×1 (K[σ]) est un K[σ]-module à droite muni d’une action à gauche de A donnée par l’adjointe [44, 66] φ∗ de l’action (à droite) de φ sur Mats×1 (K[τ ]). Par exemple, si φ = φCar , alors φ∗ (T ) = T σ 0 + σ. Si f ∈ M ∗ (G) et a ∈ A, l’action est f 7→ φ∗ (a) ◦ f , ce qui donne à M ∗ (G) une structure de K[σ] ⊗Fq A-bimodule. Soit t une indéterminée indépendante ; considérons l’anneau non commutatif K[t, σ] des polynômes en σ et t avec tσ = σt, tc = ct pour c ∈ K. L’ensemble M ∗ (G) est alors muni d’une structure de K[t, σ]-module. Si M ∗ (G) est libre de rang fini r comme K[t]-module, alors on dit que le t-module G est abélien, de rang r. On appelle M ∗ (G) le t-motif dual associé à G. Si de plus eφ est surjective, alors on dit que G est abélien uniformisable. Le noyau de eφ est dans ce cas un réseau de C s de rang r (la notion de réseau dans ce contexte est l’adaptation naturelle de la notion correspondante en dimension 1). Un module de Drinfeld de rang n est un t-module abélien uniformisable de dimension 1 et rang n. Tout t-module abélien uniformisable s’identifie, via la fonction exponentielle, à un quotient de C s par un A-module libre de rang fini (discret), s étant la dimension. L’algèbre des endomorphismes d’un t-module abélien uniformisable de dimension s s’identifie à l’algèbre des matrices s × s à coefficients dans C qui fixent ce réseau et c’est un A-module de type fini. On peut tracer une analogie entre les tmodules abéliens et uniformisables et les variétés semi-abéliennes complexes définies sur les corps de nombres. Un t-module G = (Gsa , φ = T τ 0 + N τ 0 ) avec N nilpotente n’est certainement pas abélien, mais pour tout a ∈ A, le noyau de φ(a) est un A/(a)-module de rang fini (en fait de rang nul) indépendant de a : de tels t-modules sont dits réguliers. Les t-modules abéliens sont réguliers, et les t-modules réguliers sont en un sens les plus proches analogues des groupes algébriques commutatifs définis sur les corps de nombres. 2.4. La théorie de l’indépendance linéaire dans les t-modules Les travaux de Baker sur l’indépendance linéaire des logarithmes des nombres algébriques ont été prolongés aux groupes algébriques commutatifs définis sur les corps de nombres et l’un des résultats les plus importants dans cette direction est le théorème du sous-groupe analytique de Wüstholz [77, 11, 76]. L’analogue drinfeldien de cette

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

212

F. PELLARIN

théorie a suivi un parcours similaire, le début se situant dans les travaux de Wade, et des survols détaillés se trouvent dans [14, 66, 76]. C’est à Jing Yu que l’on doit l’analogue du théorème du sous-groupe analytique de Wüstholz, le théorème du sous-t-module analytique [84], dont le point clé a été l’analogue drinfeldien du lemme de zéros de Philippon [56]. La plus grande difficulté était de montrer que le sous-groupe algébrique obstructeur (au sens de Philippon) était stable sous φ(A), c’est-à-dire un sous-t-module. À ce sujet, voir aussi [31]. Théorème 2.4. — Soit G = (Gsa , φ) un t-module régulier d’exponentielle eφ , avec φ(g) = a0 (g)τ 0 + · · · , pour tout g ∈ A. Soit u ∈ C s tel que eφ (u) ∈ Gsa (K). Soit V le plus petit sous-espace vectoriel de C s contenant u, défini sur K, stable par multiplication de a0 (g) pour tout g ∈ A. Alors le sous-Fq -espace vectoriel eφ (V ) de C s est égal à H(C) avec H sous-t-module de G. On en déduit l’analogue du théorème de Hermite-Lindemann : Théorème 2.5. — Soit G = (Gsa , φ) un t-module abélien uniformisable simple d’exponentielle eφ . Si u = (u1 , . . . , us ) ∈ C s \ {0} est tel que eφ (u) ∈ K, alors us 6∈ K. Le théorème 2.4 implique aussi l’analogue du théorème de Baker sur les formes linéaires non homogènes de logarithmes de nombres algébriques : Théorème 2.6. — Soit φ un module de Drinfeld, soit eφ son application exponentielle. Soient `1 , . . . , `n ∈ C tels que eφ (`i ) ∈ K (i = 1, . . . , n). Si 1, `1 , . . . , `n sont K-linéairement dépendants, alors `1 , . . . , `n sont End(φ)-linéairement dépendants. 2.4.1. — Il est opportun d’ajouter à ce paragraphe un court historique des résultats remarquables qui ont précédé le théorème 2.4 en renvoyant à [14, 66] pour plus de détails. Dans [78, 79, 80], Jing Yu adapte au contexte des modules de Drinfeld les théorèmes de Gelfond-Schneider, Schneider-Lang, le théorème des six exponentielles (voir [71, 75] pour la théorie classique en caractéristique zéro). C’est dans ces travaux qu’il élabore la notion de Eq -fonction susceptible d’avoir des bonnes propriétés de croissance analytique et un bon contrôle arithmétique des coefficients des séries de Taylor, et de fournir des résultats de transcendance (les Eq -fonctions sont analogues, dans une certaine mesure, des E-fonctions de Siegel). Les fonctions exponentielles des modules de Drinfeld définis sur K en sont des exemples (voir aussi [66, 69]), grâce aux équations fonctionnelles (2). Le théorème 2.6, analogue du théorème de Baker pour les modules de Drinfeld, est démontré par Jing Yu dans [81] sans besoin d’un lemme de zéros, mais faisant recours à une astuce due à Bertrand et Masser l’obligeant à admettre une hypothèse de séparabilité du corps engendré par les coefficients

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

213

des formes linéaires pour faire fonctionner la méthode de Schneider-Lang comme dans [80]. Dans [82], des résultats de transcendance sont obtenus incluant aussi les quasipériodes des modules de Drinfeld (on reviendra sur cette notion plus bas). Noter que, dans [28, 34], Denis a également obtenu le théorème 2.6 sans utiliser de lemme de zéros et sans hypothèse de séparabilité. Citons aussi le travail de Denis et David [25], dans lequel est démontré un analogue du théorème de Siegel-Shidlovski pour les valeurs des fonctions de Bessel-Carlitz d’indice entier rationnel sans passer par la méthode de Siegel-Shidlovski, mais en étendant la théorie de transcendance classique (voir par exemple Philippon, [55]) via un lemme de zéros [31] à des t-modules non uniformisables (mais munis d’exponentielle « faible »). Ce travail permet de retrouver entre autres l’analogue du théorème de Lindemann-Weierstrass pour les modules de Drinfeld obtenu par Thiéry [68].

3. INDÉPENDANCE ALGÉBRIQUE D’APRÈS DENIS Dans ce paragraphe, nous décrirons comment Denis a obtenu, en utilisant la méthode de transcendance dite « de Mahler »(3), le résultat suivant. Théorème 3.1. — Soient β1 , . . . , βm ∈ K tels que |βi | < q q/(q−1) pour tout i = 1, . . . , m ; posons `i = logCar βi (i = 1, . . . , m). Si `1 , . . . , `m sont K-linéairement indépendants, alors ils sont aussi algébriquement indépendants. On vérifie que logCar (T −1 ), . . . , logCar (T −(q−1) ) sont K-linéairement indépendants. Donc ils sont algébriquement indépendants. Pour montrer le théorème 3.1, Denis applique le théorème suivant qu’il démontre dans [33, 34], dont la preuve utilise un critère d’indépendance algébrique de Philippon [57]. Dans la suite, nous utiliserons les notions de fonction analytique, holomorphe, méromorphe (cf. [44, 37]). Théorème 3.2. — Soit L ⊂ K une extension finie de K. On considère f1 , . . . , fm des fonctions holomorphes dans un domaine |x| > r ≥ 1 à développement de Taylor dans L((1/x)). Supposons qu’il existe des éléments ai , bi ∈ L(x) (i = 1, . . . , m) tels que fi (x) = ai (x)fi (xq ) + bi (x),

1 ≤ i ≤ m.

(3)

Méthode inventée par Mahler, pour obtenir la transcendance et l’indépendance algébrique de valeurs en des nombres algébriques complexes de certaines fonctions solutions d’équations fonctionP∞ di nelles. Pour avoir un exemple de ces fonctions, on peut penser aux séries f (x) = x sur la i=0 d boule unité de C, d > 1 étant un entier, qui satisfont à f (x ) = f (x) − x.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

214

F. PELLARIN

n

Soit x0 ∈ L, |x0 | > r tel que, pour tout n, xq0 n’est zéro d’aucune des fonctions ai et n’est pôle d’aucune des fonctions bi . Si les séries f1 , . . . , fm sont algébriquement indépendantes sur K(x), alors les nombres f1 (x0 ), . . . , fm (x0 ) sont algébriquement indépendants. On considère le produit z(x) =

∞ Y

i

(1 − T x−q )−1 ,

i=1

qui converge pour |x| > q 1/q vers une fonction holomorphe dans K((1/x)), se pro2 longeant à une fonction méromorphe pour |x| > 1 avec pôles T 1/q , T 1/q , . . . (d’où la transcendance de cette fonction sur K(x)). La formule (5) implique que z(T ) ∈ Kπ. On a aussi l’équation fonctionnelle z(x) = (1 − T x−q )−1 z(xq ). Le théorème 3.2 s’applique à z et nous donne la transcendance de π. Plus généralement, on considère les Fqr [T ]-modules de Carlitz φCar,r : T 7→ T τ 0 +τ r (r ≥ 1), dont on sait qu’une période fondamentale π r se trouve dans Fqr ((1/T )) ⊂ K∞ . On trouvera dans [33] le résultat suivant de Denis : les nombres π = π 1 , π 2 , . . . sont algébriquement indépendants (l’indépendance algébrique de π et π 2 peut se déduire du résultat de Thiéry [68]). De même, en posant Π(T ) = T −q π(1/T )q−1 ∈ Fq [[T ]], notons pour tout n ≥ 0, Πn (T ) la n-ième dérivée divisée de Π(T ) par rapport à T ((4)). Allouche a posé la question de savoir si les nombres (Πn (T ))n≥0 sont algébriquement indépendants (en d’autres termes, il demande si la série formelle Π(T ) est hypertranscendante). La question reste ouverte mais dans [34] Denis démontre l’indépendance algébrique de Π(T ) = Π0 (T ), . . . , Πp−1 (T ). 3.1. Démonstration du théorème 3.1 Nous allons travailler sous l’hypothèse q 6= 2 pour simplifier en signalant que le cas q = 2 est un peu différent, essentiellement par le fait que dans ce cas, π et logCar (1) sont l’un proportionnel à l’autre avec facteur de proportionnalité dans K, comme l’on vérifie facilement. P βi Soit β ∈ K∞ = Fq ((1/T )). On peut écrire β = i≥i0 T i , βi ∈ Fq et on note P e β(x) = i≥i0 xβii ∈ Fq ((1/x)). On considère β1 , . . . , βm comme dans l’énoncé du théorème 3.1. Ce sont en particulier des séries formelles dans Fq ((1/T )). Nous définissons les séries : fj (x) = β‹j (x) +

∞ X i=1

(−1)i β‹j (x)q , q (x − T ) · · · (xqi − T ) i

Ces dérivées divisées sont définies par la formule Π(T + T 0 ) = indéterminée indépendante de T .

(4)

ASTÉRISQUE 317

j = 1, . . . , m. P∞

n=0

Πn (T )T 0n , T 0 étant une

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

215

Ces séries, dans K((1/x)), définissent des fonctions holomorphes pour |x| > q 1/q satisfaisant aux équations fonctionnelles : fj (xq ) = (T − xq )(fj (x) − β‹j (x)), qui se prolongent en fonctions méromorphes pour |x| > 1 avec une infinité de pôles i (aux T 1/q ) ; on en déduit que ce sont des fonctions transcendantes. Observons de plus que : fj (T ) = βj +

∞ X i=1

(−1)i βjq

i

(T q − T ) · · · (T qi − T )

= logCar βj = `j ,

j = 1, . . . , m.

Le hypothèses du théorème 3.2 sont satisfaites avec x0 = T et l’indépendance algébrique de `1 , . . . , `m est prouvée si l’on montre l’indépendance algébrique sur K(x) des fonctions f1 , . . . , fm . S i 3.1.1. Indépendance algébrique des fonctions fi .— Posons U = i≥0 K(x1/p ). Proposition 3.3. — Si f1 , . . . , fm sont algébriquement dépendantes, alors il existe des éléments c1 , . . . , cm ∈ K non tous nuls, c(x) ∈ U , tels que : c1 f1 + · · · + cm fm = c(x). Pour m = 1 nous avons déjà remarqué la transcendance des fonctions fj (d’où la transcendance des logarithmes de Carlitz en question par le théorème 3.2). Nous pouvons donc supposer que m ≥ 2, que tout sous-ensemble à m − 1 éléments de {f1 , . . . , fm } est formé d’éléments algébriquement indépendants et que f1 , . . . , fm sont algébriquement dépendantes. Dans ces circonstances, l’idéal P des polynômes dans R := U [X1 , . . . , Xm ] s’annulant en (f1 (x), . . . , fm (x)), non nul, est premier et principal. Soit P un générateur de P . On a : (7)

f1 (x)), . . . , (T − xq )(Xm − β › ‹ := P 0 ((T − xq )(X1 − β P m (x)) = QP

(P 0 étant le polynôme dans lequel on a substitué x par xq ) et Q ∈ U est non nul. ‹/F ∈ U , alors G = (∂/∂Xi )F , si non nul, satisfait à Si F ∈ R est non nul tel que F ‹ ‹ G/G ∈ U , et si F = Gp , alors on a aussi G/G ∈ U . Ceci permet de construire un ‹ polynôme G ∈ R non nul tel que G/G ∈ U , de la forme G = A + B p , avec A un polynôme linéaire homogène non nul, et B un autre polynôme de R . Écrivons A = c1 X1 +· · ·+cm Xm . Si i 6= j sont deux indices tels que ci , cj 6= 0, alors puisque B est une puissance p-ième, on a ci (xq )(T −xq ) = ci (x)Q(x), cj (xq )(T −xq ) = cj (x)Q(x). Donc, en posant r(x) = ci (x)/cj (x), r(xq ) = r(x). Mais les seules solutions de cette équation fonctionnelle dans U sont les éléments de K : donc r(x) ∈ K. psm Montrons que B ne dépend pas de X1 , . . . , Xm . Soit dX1ps1 · · · Xm un monôme p q q ps de degré maximal non nul de B , avec d ∈ U . On a d(x )(T − x ) = d(x)Q(x) avec

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

216

F. PELLARIN

s = s1 + · · · + sm ≥ 1. Soit i tel que ci 6= 0. Posons cette fois-ci r(x) = d(x)/ci (x) qui vérifie l’équation fonctionnelle r(xq ) = (T − xq )1−ps r(x). La seule solution dans 0 U d’une équation fonctionnelle r(xq ) = (T − xq )s r(x) avec s0 6= 0 est la série nulle. P Ici s0 = 1 − ps 6= 0, donc d = 0 et G = c0 + m i=1 ci Xi avec c0 ∈ U et c1 , . . . , cm ∈ K. S S u Le degré deg c d’un élément c de u K((1/x1/p )) est bien défini dans u Z[p−u ] ∪ {−∞}. Nous allons maintenant montrer que G s’annule en (f1 , . . . , fm ). En revenant à (7) avec G au lieu de P nous trouvons, en comparant les termes de degré 0 en X1 , . . . , Xm , Q = T − xq et c0 (x) = −

m X

ci βei (x) + c0 (xq )/(T − xq ),

i=1

d’où l’on déduit que deg c0 ≤ q/(q − 1) (on a deg βei < q/(q − 1) pour tout i). Mais deg c0 ∈ Z[p−u ] pour un certain entier u ≥ 0 car c0 ∈ U . Si q > 2 on a donc deg c0 < q/(q − 1). On déduit de l’égalité précédente pour c0 que pour tout s ≥ 0 : (8) ! s+1 j m s X X (−1)s+1 c0 (xq ) (−1)j βei (xq ) e + q . c0 (x) = − ci βi (x) + (xq − T ) · · · (xqj − T ) (x − T ) · · · (xqs+1 − T ) i=1 j=1 On montre, en utilisant l’inégalité deg c0 < q/(q − 1), que pour s → ∞ la suite de s+1 s+1 fonctions c0 (xq )/((T − xq ) · · · (T − xq )) converge uniformément vers la fonction nulle sur le domaine {x ∈ C, |x| > q 1/q } et on en déduit que G s’annule en (f1 , . . . , fm ). Cela montre la proposition 3.3. En posant x = T dans cette relation, nous obtenons une relation de dépendance K-linéaire non triviale pour 1, `1 , . . . , `m qui peut être traitée avec le théorème 2.6. Mais on peut conclure également avec le théorème 2.2. Il existe f ≥ 0 minimal tel que les puissances pf -ièmes de c1 , . . . , cm sont définies sur une extension finie L de K contenue dans la clôture séparable K sep de K. La trace L → K se prolonge en L((1/x)) → K((1/x)) ; son image n’est pas nulle. On parvient donc en multipliant par un élément non nul de A et en calculant une trace, à une relation de dépendance linéaire non triviale f

f

p = b(x) b1 f1p + · · · + bm fm

avec b1 , . . . , bm ∈ A et b(x) ∈ U . Parmi toutes ces relations, celle qui a degré minimal en T montre que f = 0 (sinon, on dérive par rapport à T pour en trouver une de degré f encore plus petit, puisque dg p /dT = 0 si f > 0). On en déduit que b(x) ∈ K(x). En posant x = T , on parvient à la relation de dépendance linéaire non triviale b1 `1 + · · · + bm `m = b = b(T ) avec b ∈ K. L’exponentielle eCar du membre de gauche est algébrique. En particulier, eCar (b) est algébrique, et b = 0 d’après le théorème 2.2.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

217

Remarque 3.4. — Un atout potentiel de l’approche de Denis est la possibilité d’obtenir des mesures de transcendance et d’indépendance algébrique car ce genre d’information est souvent produite en méthode de Mahler classique (i.e. sur C).

4. INDÉPENDANCE ALGÉBRIQUE D’APRÈS ANDERSON, BROWNAWELL, PAPANIKOLAS Dans la suite de ce texte, je présente une autre approche à l’indépendance linéaire et à l’indépendance algébrique, suggérée par la notion de t-motif, avec deux résultats clés. Un critère d’indépendance linéaire pour certaines valeurs de solutions de systèmes linéaires aux σ-différences dû à Anderson, Brownawell et Papanikolas (inspiré du théorème de Siegel et Shidlovski) [5], et un théorème de Papanikolas qui donne des informations cruciales sur les groupes de Galois aux σ-différences des systèmes linéaires aux σ-différences provenant des t-motifs [54]. Ces deux résultats permettent à Papanikolas [54] d’en déduire une variante de la conjecture des périodes de Grothendieck pour les t-motifs, dont il déduit le théorème suivant, qui implique le théorème 3.1. Théorème 4.1. — Soient `1 , . . . , `m ∈ C tels que eCar (`i ) ∈ K (i = 1, . . . , m). Si `1 , . . . , `m sont linéairement indépendants sur K, alors ils sont aussi algébriquement indépendants. On se propose d’esquisser les idées générales et les outils derrière la preuve du théorème 4.1. 4.1. Arithmétique de valeurs de solutions de systèmes aux σ-différences P Si f = i ci ti ∈ L[[t]] avec L = K, K∞ , C et si m ∈ Z, alors on pose X qm f (m) := ci ti ∈ L[[t]]. i

On étend ces opérateurs aux matrices à coefficients dans L[[t]] en les faisant agir sur les coefficients. P Notons T le sous-anneau des séries formelles i ci ti ∈ K∞ [[t]] telles que |ci | → 0 (qui convergent donc pour |t| ≤ 1) ; f 7→ f (1) et f 7→ f (−1) en sont deux automorphismes. On sait que T est un anneau principal avec idéaux maximaux de la forme (t − a), a ∈ C et |a| ≤ 1 (cela résulte d’une variante appropriée du théorème de préparation de Weierstrass) ; on déduit de cette propriété que le sous-corps des éléments f de Frac(T) tels que f (−1) = f est égal à Fq (t), notre corps des constantes pour les équations linéaires aux σ-différences.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

218

F. PELLARIN

P 4.1.1. — Soit E ⊂ T l’anneau des séries formelles f (t) = n cn tn ∈ K[[t]] strictement entières, c’est-à-dire de rayon de convergence infini, telles que [K∞ (c0 , c1 , c2 , . . .) : K∞ ] < ∞, de telle sorte que, si t0 ∈ K∞ , alors f (t0 ) ∈ K∞ et f : K∞ → K∞ est surjective. Les applications τ, σ induisent des automorphismes de E. Anderson, Brownawell et Papanikolas démontrent [5, théorème 3.1.1] le critère d’indépendance linéaire suivant : Théorème 4.2. — On considère une matrice Φ ∈ Matl×l (K[t]) telle que det Φ = c(t − T )n pour n ∈ N et c ∈ K \ {0}. Soit ψ = ψ(t) ∈ Matl×1 ( E) une solution du système ψ (−1) = Φψ. Soit ρ ∈ Mat1×l (K) tel que ρψ(T ) = 0. Alors il existe P = P (t) ∈ Mat1×l (K[t]) tel que P (T ) = ρ et P ψ = 0. Ce résultat affirme que les relations de dépendance K-linéaire des valeurs en T des fonctions coordonnées de la matrice colonne ψ proviennent toujours de relations de dépendance K(t)-linéaire des fonctions elles-mêmes, via la spécialisation t = T . On peut montrer [5] que si Φ(0) est inversible, alors ψ ∈ Matl×1 (T) si et seulement si ψ ∈ Matl×1 ( E). La preuve du théorème 4.2 est décrite dans [5] ; elle le rapproche du théorème de Siegel-Shidlovski. Soit N un entier assez grand divisible par 2l. On construit par le biais d’un analogue du lemme de Thue et Siegel un élément non nul h ∈ Mat1×l (K[t]) satisfaisant aux propriétés (i), (ii), (iii) suivantes : (i) les degrés de ses coefficients h1 , . . . , hl en t sont < (1 − 1/2l)N ; (ii) pour tout i et tout coefficient c du polynôme hi , la taille kck (définie comme le maximum des valeurs absolues des conjugués de c dans K sur K) est majorée par une constante indépendante de N ; (iii) la fonction −(N +s) E := hψ, strictement entière, satisfait à E(T q ) = 0 pour s = 0, . . . , N − 1. Alors E satisfait à une équation aux σ-différences linéaire d’ordre ≤ l à coefficients algébriques. Le point important de la preuve est que l’on montre E = 0 pour N assez grand. Pour prouver cette propriété, on suppose le contraire et on étudie le coefficient directeur du développement d’Euler–Mc Laurin de E, qui est dans K \ {0} et on parvient à une contradiction pour N grand, grâce à l’équation aux σ-différences mentionnée ci-dessus et en comparant des estimations provenant de l’inégalité de Liouville et de la formule de Schwarz-Jensen pour les fonctions de E dans des boules de rayon |T | = q. Il n’est pas difficile alors de montrer que ρ est proportionnel à h(T ) avec facteur de proportionnalité dans K. Le théorème 4.2 est bien un critère d’indépendance algébrique, comme le théorème suivant le montre :

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

219

Théorème 4.3. — Sous les hypothèses du théorème 4.2, notons ψ1 , . . . , ψl les coordonnées de ψ et supposons-les algébriquement indépendantes sur K(t). Alors les nombres ψ1 (T ), . . . , ψl (T ) ∈ K ∞ sont algébriquement indépendants sur K. Admettons par l’absurde le contraire et supposons qu’il existe une relation de dépendance algébrique non triviale de degré ≤ d entre ψ1 (T ), . . . , ψl (T ). e à coefficients dans K[t] : On construit une matrice carrée diagonale par blocs Φ e = 1 ⊕ Φ ⊕ Sym2 (Φ) ⊕ · · · Symd (Φ) Φ (les symboles ⊕ définissent des matrices diagonales par blocs de la manière standard et les symboles Syms désignent des puissances symétriques de matrices). Clairement, e est proportionnel à une puissance de t − T . Ordonnons les monômes unitaires det Φ de degré = 0, . . . , d en ψ1 (t), . . . , ψl (t) afin de construire une matrice colonne ψe à e e Alors ψe(−1) = Φ e ψ. coefficients dans E en compatibilité avec la construction de Φ. Le théorème 4.2 fournit une relation de dépendance linéaire non triviale à coeffie c’est-à-dire une relation de dépendance cients dans K(t) entre les coefficients de ψ, algébrique non triviale de degré ≤ d pour ψ1 , . . . , ψl ; contradiction. 4.2. Interpolation des périodes 4.2.1. — Le critère d’indépendance linéaire mentionné plus haut est suggéré par la notion de t-motif dual dû à Anderson [4] qui a introduit les fonctions interpolant les périodes que nous allons décrire ci-dessous. Suivant [5], un t-motif dual est un K[σ, t]-module M qui est libre de rang fini sur K[t] et sur K[σ] tel que, pour tout n assez grand, on ait la propriété suivante. Si m ∈ M , alors (t − T )n m est dans σM (i.e. (t − T )n (M/σM ) = 0). À tout t-module abélien G = (Gla , φ) nous avons déjà associé le t-motif dual M ∗ (G). Si M est un t-motif dual, alors on vérifie [4] que le quotient de M par le sous-K[t, σ]-module engendré par les éléments de la forme σm − m avec m ∈ M est muni d’une action de A qui l’identifie à un t-module abélien. Si M est le t-motif dual associé à un t-module abélien, alors le t-module ainsi obtenu est isomorphe au t-module d’origine. Ce type de relation apparaît déjà dans l’article de Mumford [53] (voir aussi l’article de Reversat et van der Put [60]). Soit M un t-motif dual. On dit qu’il est rigide analytiquement trivial, ou plus simplement analytiquement trivial si, étant donnée une base b = (b1 , . . . , bl ) ∈ Matl×1 (M ) de M comme K[t]-module, de telle sorte que σb = Φb pour une matrice Φ ∈ Matl×l (K[t]) de déterminant c(t − T )n , il existe aussi une matrice Ψ ∈ GLl (T) telle que Ψ(−1) = ΦΨ. Anderson a démontré [4] que si G est un t-module abélien, alors il est uniformisable si et seulement si M ∗ (G) est analytiquement trivial. De plus, la catégorie des t-modules abéliens uniformisables est équivalente à la catégorie des t-motifs duaux analytiquement triviaux via le foncteur G 7→ M ∗ (G).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

220

F. PELLARIN

4.2.2. — Montrons comment on construit des trivialisations analytiques pour les t-motifs duaux associés aux modules de Drinfeld. On considère un module de Drinfeld de rang n : φ : T 7→ T τ 0 + l1 τ + · · · + ln τ n , de fonction exponentielle eφ (z) =

X

i

αi z q .

i

On vérifie que les zéros de eφ (périodes de φ) sont dans K∞ . Soit u un élément de K∞ ; posons : ∞ u X su (t) := ti . eφ i+1 T i=0 On vérifie facilement que su (t) ∈ T. Formellement, on a le développement : i ∞ X αi uq , su (t) = T qi − t i=0

donc su (t) est méromorphe sur C avec pôles simples en T, T q , . . . de résidus −u, −α1 uq , . . . et su (t) ∈ K∞ [[t]]. En particulier, su (t) − u/(T − t) se prolonge en une fonction holomorphe pour |t| < q q . Si t est dans le domaine de convergence de toutes les séries, alors : (n) l1 s(1) u (t) + · · · + ln su (t) = (φ(T ) − T )su (t)

(9)

(φ(T ) agit sur les coefficients). En particulier φ(T )eφ (u/T i+1 ) = eφ (u/T i ) et on trouve aussi φ(T )su (t) = eφ (u) + tsu (t). Donc, d’après (9), (n) l1 s(1) u (t) + · · · + ln su (t) = (t − T )su (t) + eφ (u).

(10) (m)

m

La série su (t) converge pour |t| < q q . Le résidu de su en t = T est −u. On en déduit que le terme de gauche dans (10) est bien défini en t = T et (11)

(n) l1 s(1) u (T ) + · · · + ln su (T ) = eφ (u) − u.

Supposons que u soit de plus une période de φ. De (10) on déduit l’équation linéaire aux τ -différences : (12)

(n) l1 s(1) u (t) + · · · + ln su (t) = (t − T )su (t),

tandis que de (11) on déduit la formule d’interpolation : (13)

ASTÉRISQUE 317

(n) l1 s(1) u (T ) + · · · + ln su (T ) = −u.

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

221

Si u1 , u2 sont deux périodes et a1 (T ), a2 (T ) deux éléments de A, alors sa1 u1 +a2 u2 = a1 (t)su1 + a2 (t)su2 . 4.2.3. Équations linéaires aux σ-différences. — Pour continuer, nous supposons par commodité que End(φ) = A. Soit Λ le réseau des périodes de φ ; écrivons Λ = Au1 + · · · + Aun . Pour i = 1, . . . , n, posons si = sui . Posons maintenant â

Θ=

0 .. .

1 .. .

···

0

0

···

1

(t − T )/ln

−l1 /ln

···

−ln−1 /ln

0 .. .

ì

â

,“ Ψ=

(0)

s2

(1)

s1

s1 .. .

(n−1)

s1

(0)

···

sn

s2 .. .

(1)

···

sn .. .

(n−1)

···

s2

(0)

ì

(1)

.

(n−1)

sn

Une adaptation à notre cas de figure du lemme du wronskien ou une application des déterminants de Moore (voir [40]) assure que “ Ψ est inversible ; en fait, pour tout “ t0 ∈ C tel que |t0 | < 1, det(Ψ(t0 )) 6= 0 et on peut trouver λ ∈ Fq (t) tel que λ“ Ψ(t0 ) soit inversible pour tout t0 tel que |t0 | ≤ 1. On a clairement (λ“ Ψ)(1) = Θλ“ Ψ ; soit Ψ la transposée de (λ“ Ψ(1) )−1 . Les coefficients de Ψ sont dans T et (14)

Ψ(−1) = ΦΨ,

où Φ est la transposée de Θ, de déterminant (−1)n+1 (t−T )/ln . De plus, Ψ(T ) est bien définie. On vérifie que nous avons construit une trivialisation analytique du t-motif dual M ∗ (φ). 4.2.4. — Dans [43], on peut trouver une discussion approfondie sur les bonnes notions des cohomologies de de Rham et Betti d’un t-module, d’après Anderson, Deligne, Gekeler, Jing Yu. Les quasi-périodes d’un t-module peuvent être définies car on dispose aussi d’un substitut de l’intégration sur les cycles (cet aspect a été développé par Gekeler pour les modules de Drinfeld [39, 38], grâce au formalisme des bi-dérivations de Jing Yu). Pour notre module de Drinfeld φ ci-dessus, la matrice n × n des périodes et quasipériodes se construit, tenant compte du travail et des notations de Gekeler (ou de Anderson), tout simplement à partir de la matrice “ Ψ(T ) de la manière suivante. La première ligne est donnée par les périodes choisies (u1 , . . . , un ) (résidus de −s1 , . . . , −sn en T ) ; reste à donner les n − 1 autres lignes ÇZ å Ç Z ∞ k u q k å X u1 q n i , . . . , eφ , k = 1, . . . , n−1 ηk , . . . , ηk := T eφ i+1 i+1 T T u1 un i=0 avec ηk bidérivation associant T à τ k . Ces lignes sont les lignes de “ Ψ(T ), de la deuxième à la dernière. En particulier, pour φ de rang 2, la deuxième ligne de la matrice “ Ψ(T ) est la matrice ligne (η1 , η2 ), η1 , η2 étant les quasi-périodes associées à u1 , u2 (comme dans [39]). La non-nullité du déterminant de Ψ(T ), que nous avons justifiée plus haut

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

222

F. PELLARIN

grâce au système aux σ-différences, peut se démontrer en suivant Gekeler, en reliant ce déterminant à une forme modulaire parabolique pour GL2 (A) non nulle sur C \K∞ (analogue de la forme de poids 12 de Jacobi). L’étude du facteur de proportionnalité permet alors de démontrer l’analogue de la relation de Legendre pour les modules de × Drinfeld de rang 2 (où µ ∈ K ) : u1 η2 − u2 η1 = µπ.

(15)

4.2.5. — Dans le cas φ = φCar du module de Carlitz, on peut prendre u = π : su (t) =

∞ X i=0

i

πq [i][i − 1]q · · · [1]qi−1 [0]qi (T qi − t)

(1) su (T )

(1)

et on trouve = −π. On a aussi (t − T )su (t) = su (t). Posons Ω(t) := (1) (su (t))−1 . On vérifie que cette fonction est strictement entière non constante ; elle 2 s’annule en T q , T q , . . . donc elle est transcendante. On montre qu’on peut choisir (−T )1/(q−1) de telle sorte que Ω(t) = (−T )−q/(q−1)

∞ Y

i

(1 − t/T q ),

i=1

produit convergeant pour tout t. De plus, Ω satisfait à l’équation aux σ-différences : (16)

Ω(−1) = (t − T )Ω,

et on démontre que le Fq (t)-espace vectoriel engendré par les solutions de cette équation qui sont dans Frac(T) est de dimension 1. Clairement Ω(T ) = −1/π, d’où l’on déduit la formule (5) dont nous avions promis une preuve. Comme Ω ∈ E, on en déduit, en appliquant le théorème 4.3, la transcendance de π. Revenons au cas d’un module de Drinfeld φ quelconque. L’étude de la fonction Ω ci-dessus nous permet d’obtenir un analogue de la formule de Legendre pour φ. On ‹ := det(Ψ) ∈ Frac(T) revient à la matrice Ψ du sous-paragraphe 4.2.3 ; on sait que ∆ (−1) n+1 ‹ ‹ et est bien définie en T . En choisissant un satisfait à ∆ = (−1) ((t − T )/ln )∆ (−1) n+1 ‹ satisfait élément d ∈ K tel que d/d = (−1) /ln , on voit que la fonction ∆ = d∆ × −1 (−1) × à∆ = (t − T )∆, donc ∆ ∈ Fq (t) Ω et on trouve det(Ψ(T )) ∈ K π . 4.3. Autour de la conjecture de Grothendieck, en suivant Papanikolas La conjecture des périodes de Grothendieck interprète le degré de transcendance sur Q du sous-corps de C engendré par Q et les périodes d’une variété projective lisse V définie sur un corps de nombres (ou d’un motif défini sur un corps de nombres) : cette conjecture affirme que ce degré est égal à la dimension du groupe de Galois motivique associé à V . Pour cette conjecture, pour des généralisations, et pour le lien avec les conjectures classiques citées dans l’introduction, voir le livre d’André [7]. Dans ce paragraphe, nous décrirons un résultat fondamental de Papanikolas [54], où

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

223

il démontre une variante de la conjecture de Grothendieck pour les t-motifs duaux analytiquement triviaux. On considère un t-motif dual analytiquement trivial M avec trivialisation analytique associée Ψ = (ψi,j )i,j ∈ Matl×l (T). Le corps K(t, ψi,j (t)) engendré par t et les coefficients ψi,j de la matrice Ψ est stable sous l’action de f 7→ f (−1) car il existe Φ ∈ Matl×l (K(t)) avec Ψ(−1) = ΦΨ. Soit Γ le groupe des automorphismes K(t)linéaires qui commutent à l’action de f 7→ f (−1) sur K(t, ψi,j (t)). Le théorème fondamental de Papanikolas dans [54] est le suivant. Théorème 4.4. — Le groupe Γ est l’ensemble des points Fq (t)-rationnels d’un sousschéma en groupes réduit GM de GLl défini sur Fq (t). De plus, le degré de transcendance de K(t, ψi,j (t)) sur K(t) est égal à la dimension de GM sur Fq (t). Expliquons comment Papanikolas construit GM . Un morphisme de t-motifs duaux est un morphisme de K[t, σ]-modules. Les t-motifs duaux forment donc une catégorie. On peut faire plusieurs opérations sur les t-motifs duaux qui enrichissent la structure de cette catégorie. Par exemple, Anderson a démontré que le produit tensoriel M1 ⊗M2 de deux t-motifs duaux est défini comme étant M1 ⊗K[t] M2 avec action diagonale de σ. Ceci est un t-motif dual et si à l’origine M1 , M2 sont analytiquement triviaux, il en est de même pour M1 ⊗ M2 . Papanikolas [54] démontre qu’une certaine catégorie contenant les t-motifs duaux analytiquement triviaux (à isogénie près et avec les opérations proprement définies de produit tensoriel, somme directe, et en ajoutant les duaux...) est une catégorie tannakienne neutre T sur Fq (t), notre corps de constantes. On appelle les objets de cette catégorie t-motifs duaux, même si c’est un abus de langage puisqu’en général, le dual d’un t-motif dual n’est pas un t-motif dual au sens d’Anderson(5). Par le formalisme usuel des catégories tannakiennes, on associe à tout t-motif dual analytiquement trivial M (avec trivialisation analytique Ψ ∈ Matl×l (T)) une souscatégorie T M de T . Par équivalence tannakienne, T M est équivalente à la catégorie des représentations sur Fq (t) d’un sous-schéma en groupes GM défini sur Fq (t) d’un groupe algébrique linéaire, le groupe de Galois de M . Le fait que GM soit réduit est l’un des aspects intéressants du travail de Papanikolas. En joignant le théorème 4.4 au théorème 4.2, Papanikolas obtient : Théorème 4.5. — Le degré de transcendance du corps K(ψi,j (T )) est égal à la dimension de GM sur Fq (t). (5) L’élément neutre de la catégorie, noté 1, est égal à K[t] avec σf = f (−1) pour f ∈ K[t]. Il est donc de rang infini sur K[σ] et n’est pas un t-motif dual au sens d’Anderson. Noter que End(1) = Fq (t). En d’autres termes, les seules solutions dans Frac(T) de f (−1) = f sont les éléments de Fq (t).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

224

F. PELLARIN

Pour M = M ∗ (φCar ), on a GM = Gm qui est le seul sous-groupe algébrique de dimension 1 de Gm (ceci est équivalent à la transcendance de Ω sur K(t), et à la transcendance de π). En d’autres termes, Gm (Fq (t)) est le groupe de Galois de l’extension de « σ-Picard-Vessiot » K(t) ⊂ K(t, Ω). Grâce à (16), on voit que le groupe Gm (Fq (t)) agit sur le Fq (t)-espace vectoriel engendré par 1/Ω par multiplication. 4.3.1. — Voici une esquisse de l’utilisation des théorèmes 4.2, 4.4 pour déduire le × théorème 4.1. On considère des nombres β1 , . . . , βm ∈ K et on suppose que |βi | < q q/(q−1) pour tout i. On écrit `0 = π et `i = logCar βi et on suppose que `0 , . . . , `m sont K-linéairement indépendants. On va démontrer qu’ils sont aussi algébriquement indépendants (on peut vérifier que ceci implique le théorème 4.1). Pour β ∈ K \ {0} tel que |β| < q q/(q−1) , nous posons, suivant Papanikolas dans [54] : i ∞ X (−1)i β q Lβ (t) := β + · (T q − t)(T q2 − t) · · · (T qi − t) i=1 Cette série formelle converge pour tout t ∈ C tel que |t| < q q et Lβ ∈ T. On vérifie, en utilisant les formules (6), que Lβ (T ) = logCar (β).

(17)

(−1)

L

β . On pose Li (z) = De plus, nous avons l’équation aux σ-différences Lβ = β (−1) + t−T −1 Lβi (z) (i = 1, . . . , m). On pose aussi L0 = −Ω . On a les équations aux σ-différences

(−1)

L0

(18)

=

L0 , t−T

(−1)

(−1)

Li

= βi

Li (T ) = `i ,

+

Li , t−T

i = 1, . . . , m,

i = 0, . . . , m.

Une remarque très utile dans la suite est que, pour tout i = 0, . . . , m et pour tout j j 2 j−1 j j ≥ 1, Li a un pôle simple en T q de résidu (logCar β)q /([j−1]q [j−2]q · · · [1]q [0]q ). Posons, toujours en suivant Papanikolas : â ì t−T 0 ··· 0 (−1)

β1

Φ=

(−1)

βm et

â Ψ=

ASTÉRISQUE 317

(t − T ) .. .

1 .. .

···

0 .. .

(t − T )

0

···

1

Ω

0

···

0

ΩL1 .. .

1 .. .

···

0 .. .

ΩLm

0

···

1

∈ Mat(m+1)×(m+1) (K[t]),

ì ∈ Mat(m+1)×(m+1) ( E).

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

225

On peut montrer que ces données déterminent, grâce à (18), une trivialisation analytique d’un t-motif dual M , extension de la somme directe de m copies du t-motif dual trivial 1 par M ∗ (φCar ) (noter que M n’est pas un t-motif au sens d’Anderson car il est de rang infini sur K[σ]). On a la proposition suivante. Proposition 4.6. — Si les fonctions L0 , L1 , . . . , Lm sont algébriquement dépendantes sur K(t), alors il existe des éléments c0 , c1 , . . . , cm ∈ Fq (t) non tous nuls, c ∈ K(t), tels que : c0 L0 + c1 L1 + · · · + cm Lm = c. Si `0 , `1 , . . . , `m sont algébriquement dépendants sur K, le théorème 4.3 implique que les fonctions L0 , . . . , Lm sont algébriquement dépendantes et la proposition nous donne une relation linéaire non triviale. Dans cette relation, c(t) est rationnelle et ne P peut pas avoir une infinité de pôles. Ainsi i ci Li est holomorphe et en se souvenant de la description des résidus aux pôles des Li , nous en déduisons une relation de dépendance K-linéaire entre `0 , `1 , . . . , `m . Dans [54], Papanikolas démontre la proposition 4.6 en calculant explicitement le groupe de Galois GM de M . En utilisant l’existence d’une surjection GM → Gm , Papanikolas obtient l’inclusion : ! ∗ 0 ⊂ GLm+1 , GM ⊆ ∗ Im avec égalité si et seulement si L0 , . . . , Lm sont algébriquement indépendantes sur K(t). 4.3.2. — On peut montrer la proposition 4.6 directement, en suivant un parcours tout à fait similaire à celui que nous avons suivi dans le paragraphe 3.1. En supposant le degré de transcendance de K(t)(L0 , . . . , Lm ) sur K(t) égal à m, on peut construire S n un élément c ∈ U := n≥0 K(t1/p ) et des éléments c0 , c1 , . . . , cm ∈ Fq (t) de telle P e sorte que A := c + m i=0 ci Xi satisfait à A = RA avec R ∈ U et X (−1) e := c(−1) + c0 (t − T )−1 X0 + A ci (βi + (t − T )−1 Xi ). i≥1

En étudiant les identités fonctionnelles obtenues pour X0 = · · · = Xm = 0 et en observant que le supremum kck des valeurs absolues des coefficients de c est ≤ q q/(q−1) , on démontre que A s’annule en (L0 , . . . , Lm ). Seule difficulté heureusement surmontable, le cas où kck = q q/(q−1) (qui correspond par ailleurs à la difficulté supplémentaire dans le paragraphe 3.1 que nous avons évitée en y supposant q > 2). Revenant à la méthode de Papanikolas, on peut voir le calcul du groupe GM cidessus (et donc la proposition 4.6) comme un analogue de la théorie de Kummer (voir [12] dans le cadre différentiel). Notant que ce calcul se ramène à celui de son

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

226

F. PELLARIN

radical unipotent, Charlotte Hardouin en a obtenu la version plus générale suivante, qui pourrait être aussi utilisée pour obtenir d’autres applications du théorème 4.4. On revient à notre catégorie tannakienne T et on note ω le foncteur de trivialisation analytique ω : T → Vect(Fq (t)), Vect(Fq (t)) étant la catégorie des espaces vectoriels de dimension finie sur Fq (t). On a alors [47] : Théorème 4.7. — Soit Y un objet de T de groupe de Galois isomorphe à Gm ; supposons que l’action de Gm sur ω(Y ) soit donnée par le caractère canonique ; soit R l’anneau des endomorphismes de Y et M1 , . . . , Mm des extensions de 1 par Y qui soient R-linéairement indépendantes dans Ext1T (1, Y ). Alors le radical unipotent du groupe de Galois de M1 ⊕ · · · ⊕ Mm est isomorphe à ω(Y )m . Pour tout i ≥ 1, soit Mi le t-motif extension de 1 par M ∗ (φCar ) qui admet pour trivialisation analytique ! Ω 0 , ΩLi 1 de telle sorte que GM = GM1 ⊕···⊕Mm . Le théorème 4.7 implique que la dimension de GM , égale à la dimension de GM1 ⊕···⊕Mm , est aussi égale à 1 + n où n est la dimension du Fq (t)-espace vectoriel engendré par M1 , . . . , Mm dans Ext1T (1, Y ) et Y = M ∗ (φCar ). On vérifie que n est aussi le plus grand entier s tel qu’aucune équation aux σ-différences (19)

(t − T )f (−1) − f = (t − T )

s X

(−1)

µi βi

,

µ1 , . . . , µs ∈ Fq (t) non tous nuls

i=1

n’ait de solution f ∈ K(t) (pour un calcul analogue dans le cas des équations aux q-différences, voir [46]). Pour un tel choix de s = n, considérons, suivant [54], une solution f de (19) dans K(t). Les arguments déjà décrits montrent que f est analytique en t = T . Il s’ensuit que f (T ) = 0. On suppose que `0 , . . . , `m sont K-linéairement indépendants. Observons que les solutions de (19) sont de la forme : f = µL0 +

s X

µi Li ,

µ ∈ Fq (t).

i=1

En posant t = T et si n < m, on trouve une relation de dépendance K-linéaire entre `0 , `1 , . . . , `s , ce qui implique une contradiction. Ainsi, n = m, d’où le théorème 4.1.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

227

4.3.3. — La connaissance explicite de la dimension du groupe de Galois associé au t-motif dual d’un module de Drinfeld permettrait de résoudre la conjecture suivante (voir [26]). Conjecture 4.8. — Soient φ un module de Drinfeld et λ1 , . . . , λl des périodes de φ qui sont End(φ)-linéairement indépendantes. Alors elles sont aussi algébriquement indépendantes sur K. Si φ est un module de Drinfeld de rang 2 à multiplications complexes (tel que End(φ) ) A), Thiéry [67] a démontré que le degré de transcendance du sous-corps de C engendré par K et les périodes et quasi-périodes de φ (qui est aussi le corps engendré par les coefficients de la matrice Ψ(T ) associée à φ, cf. paragraphe 4.2.4) est égal à 2 ; ceci est l’analogue du théorème de Chudnovski sur les périodes et quasipériodes de courbes elliptiques à multiplications complexes cité dans l’introduction. On considère à titre d’exemple le module de Drinfeld de rang 2 : φ = φCar,2 : T 7→ T τ 0 + τ 2 (le Fq2 [T ]-module de Carlitz vu comme A-module de rang 2). On voit facilement que End(φ) = Fq2 [T ], de rang 2 sur A, et que le réseau des périodes de φ est isomorphe à A + λA pour λ ∈ Fq2 \ Fq (φ est à multiplications complexes). ! u1 u2 En considérant une matrice fondamentale de périodes et quasi-périodes , η1 η2 on prouve (Thiéry [67]) que u1 , η1 , η2 sont K-linéairement dépendants. En utilisant la formule de Legendre (15) on voit que la clôture algébrique du sous-corps de C engendré par K, u1 , u2 , η1 , η2 est égal à la clôture algébrique de K(π, u2 ), qui est de degré de transcendance 2. On conjecture que le degré de transcendance de K(u1 , u2 , η1 , η2 ) vaut 4 au cas où End(φ) = A. Ceci suivrait du théorème 4.4 de Papanikolas si on pouvait démontrer que, dans ce cas, le groupe de Galois associé est égal à GL2 . Dans [26], Denis et David démontrent, par des méthodes proches de celle de Jing Yu, que si q n’est pas une puissance de 2, les périodes d’un module de Drinfeld φ de rang 2 défini sur K tel que End(φ) = A sont quadratiquement indépendantes. La question suivante reste donc légitime : peut-on déduire le théorème 4.1 aussi du théorème du sous-t-module de Jing Yu ? 4.4. Retour sur l’interpolation des périodes Terminons ce paragraphe en comparant les différentes manières d’interpoler les périodes des modules de Drinfeld, suivant Anderson, Brownawell et Papanikolas, ou Denis. Soit φ un module de Drinfeld avec φ(T ) = T τ 0 + l1 τ + · · · + ln τ n . Ici il convient de poser des conditions supplémentaires. On suppose que l1 , . . . , ln , u ∈ Fq ((1/T 1/e )),

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

228

F. PELLARIN

avec u période de φ, pour un certain entier e ≥ 1 (et pour un choix fixé de T 1/e ). P Soit v = i≥−i0 vi /T i/e ∈ Fq ((1/T 1/e )) (les vi sont dans Fq ). Soit x une nouvelle indéterminée indépendante. On pose X vi ∈ Fq ((1/x)), ve(x) = xi i≥−i0

de telle sorte que ve(T 1/e ) = v. En particulier, Te = xe . Considérons la série formelle : i ∞ ∞ u X X ‰ α ‹i (x)e u(x)q i zu (x) = eφ (x)T = . T i+1 xeqi − T i=0 i=0 P i i (j+1)eq i , on voit que zu (x) ∈ K((1/x)). En fait, Comme (xeq − T )−1 = ∞ j=0 T /x zu (x) définit une fonction holomorphe pour |x| > q 1/e , méromorphe pour |x| > 1 avec i e(x)/(xe − T ) se prolonge des pôles aux points T 1/(eq ) (i ≥ 0). La fonction zu (x) − u 1/eq en fonction holomorphe sur |x| > q . Voici le lien formel entre zu (x) et la série su (t) introduite au paragraphe 4.2 : su (t) est la série obtenue en faisant les substitutions (x, T ) 7→ (T 1/e , t) dans zu (x). Pour obtenir zu (x) de su (t), il suffira alors d’opérer les substitutions (T, t) 7→ (xe , T ). On trouve l’équation fonctionnelle linéaire : (20)

qn (xe − T )zu (x) + le1 (x)zu (xq ) + · · · + l‹ n (x)zu (x ) = 0,

et la relation d’interpolation (21)

n

l1 zu (xq ) + · · · + ln zu (xq )|x7→T 1/e = −u.

Bien entendu, il faut faire attention aux hypothèses que nous avons admises car elles ne sont pas remplies par tous les modules de Drinfeld. Elles sont satisfaites si φ = φCar est le module de Carlitz car π ∈ Fq (((−T )−1/(q−1) )).

5. VALEURS DE LA FONCTION ZÊTA DE CARLITZ-GOSS Posons A+ = {a ∈ A, a unitaire}. Dans [41], Goss introduit la fonction ζ, définie sur C × Zp et à valeurs dans C, telle que X 1 ∈ K∞ , n ≥ 1. ζ(T n , n) = an a∈A+

Dans la suite, j’écrirai ζ(n) pour ζ(T n , n). Dans [17], Carlitz avait déjà étudié certaines propriétés arithmétiques liées à ces nombres et dans ce paragraphe je présenterai plusieurs résultats de transcendance et d’indépendance algébrique les concernant.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

229

Q Pour un entier naturel n, posons Γarith (n) := si=0 Dini ∈ K, n0 + n1 q + · · · + ns q s i−1 étant l’écriture en base q de n − 1 et Di étant le polynôme [i][i − 1]q · · · [1]q (cette fonction est liée à la fonction factorielle de Carlitz dans [17]). On peut déduire des P∞ zn travaux de Carlitz que z/eCar (z) = n=0 Bn Γarith (n+1) pour certains Bn+1 ∈ K ((6)). En calculant la dérivée logarithmique du produit infini (1) définissant eCar , on parvient aux relations de Bernoulli-Carlitz : pour tout m ≥ 1, (22)

ζ(m(q − 1)) Bm = ∈ K. m(q−1) Γarith (m(q − 1) + 1) π

En particulier, π q−1

=

(T q − T )

X

a1−q ∈ K∞ ,

a∈A\{0}

P analogue de la formule d’Euler n n−2 = π 2 /6, d’où la transcendance de ζ(m(q − 1)) pour m ≥ 1 (le théorème 2.2 suffit). Une autre collection d’identités, essentiellement obtenues par Carlitz dans [16] (voir aussi [49]), est : (23)

ζ(s) = Lis (1),

s = 1, . . . , q − 1,

où Lin désigne le n-ième polylogarithme de Carlitz (n ≥ 1) : Lin (z) =

∞ X k=0

k

(−1)kn z q , ([k][k − 1] · · · [1][0])n

de telle sorte que Li1 (z) = logCar (z) (la série Lin (z) converge pour |z| < q nq/(q−1) ). 5.1. Puissances tensorielles du module de Carlitz C’est en partie dans le but d’étendre (23) aux entiers n ≥ q qu’Anderson et Thakur [6] ont étudié les périodes associées à certains t-modules qu’ils ont ensuite reliées aux valeurs de la fonction zêta de Carlitz (voir aussi [24]). En suivant ces auteurs, j’esquisse ci-après les modules en question. Soit n un entier ≥ 1 ; posons :     0 1 0 ··· 0 0 0 ··· 0      0 0 1 ··· 0   0 0 ··· 0       . . .  . . ..  ..      . . . . . Nn =  . . . .  , En =  . . .  ∈ Matn×n .      0 0 ··· 0   0 0 0 ··· 1      0 0 0 ··· 0 1 0 ··· 0 (6)

La seule raison pour laquelle nous ne pouvons pas dire que ceci a été démontré par Carlitz est qu’il étudiait le module T 7→ T τ0 − τ . Idem pour des autres propriétés.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

230

F. PELLARIN

Nous considérons le T -module de dimension n défini par : 0 0 n φ⊗n Car (T ) = T τ + Nn τ + En τ ∈ EndFq -lin (Ga /C),

qui est connu sous le nom de n-ième puissance tensorielle du module de Carlitz. La terminologie s’explique en passant par les t-motifs duaux. Ici, G = (Gna , φ⊗n Car ) ∗ ∗ ∗ est le t-module tel que M (G) = M (φCar ) ⊗ · · · ⊗ M (φCar ) (dans [45] on calcule explicitement les t-modules associés aux puissances tensorielles, symétriques, alternées d’un module de Drinfeld). On vérifie que, pour tout n ≥ 1, φ⊗n Car est abélien, uniformisable, simple, de dimension n et de rang 1. La première coordonnée de la fonction exponentielle de ce t-module est calculée explicitement au moyen d’une série à coefficients matriciels. On montre qu’elle satisfait à :  k â ì  P xq x k≥0 ([i][i−1]q ···[1]qk−1 )n     0   ∗ .  en = ..   . .   . .   0

∗

Pour n = 2, la série qui apparaît ci-dessus est liée à la fonction de Bessel J0 définie par Carlitz dans [19], voir aussi [25]. En ce qui concerne la fonction logn , nulle en (0, . . . , 0) et telle que logn ◦ en = en ◦logn = identité, Anderson et Thakur démontrent que : â ì â ì ∗ 0 .. .. . . (24) logn = . 0 ∗ x

Lin (x)

En vue d’un résultat de transcendance, le résultat principal d’Anderson et Thakur dans [6] est le suivant. Théorème 5.1. — Pour tout i ≤ nq/(q − 1), il existe hn,i ∈ A tel que si l’on pose â ì 0 .. X . ⊗n Pn := φCar (hn,i ) , 0 i Ti alors la dernière coordonnée de Pn est égale à Γarith (n)ζ(n). De plus il existe a ∈ A \ {0} avec φ⊗n Car (a)Pn = 0 si et seulement si q − 1 divise n.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

231

On en déduit que [nq/(q−1)]

Γarith (n)ζ(n) =

X

hn,i Lin (T i ).

i=0

Pour 1 ≤ n ≤ q − 1, on retrouve (23) ; Anderson et Thakur construisent de plus explicitement une série génératrice pour les nombres hn,i . 5.2. Transcendance et indépendance linéaire pour ζ (méthodes classiques) Les premiers résultats de transcendance concernant les valeurs de ζ semblent être ceux de la thèse de Thakur (1987), obtenus par une variante de la méthode de Wade. Par cette même méthode, de Mathan [51] a démontré la transcendance de certains produits de valeurs de ζ aux entiers (voir aussi [24, 63, 49]). Compte tenu des propriétés de φ⊗n Car , le théorème 5.1 et le théorème 2.5 impliquent le n

Théorème 5.2. — Si u = (u1 , . . . , un ) ∈ C n \ {0} et si eφ⊗n (u) ∈ K , alors un est Car

transcendant. En particulier, ζ(n) 6∈ K pour tout n ≥ 1. Le théorème 5.2 peut être généralisé en appliquant le théorème 2.4. Dans [83], Jing Yu démontre : Théorème 5.3. — Les seules relations de dépendance linéaire sur K liant les nombres 1, π, . . . , π m , . . . , ζ(1), . . . , ζ(n), . . . sont celles engendrées par les relations de Bernoulli-Carlitz (22). Noter que, par la méthode « automatique », Berthé [10] avait démontré la transcendance de ζ(n)/π n pour n = 1, . . . , q − 2. 5.3. Indépendance algébrique d’après Chieh-Yu Chang et Jing Yu Pour passer de l’étude des relations linéaires de valeurs de ζ à l’étude des relations algébriques, il faut aussi tenir compte des identités : (25)

k

ζ(pk n) = ζ(n)p ,

n, k ≥ 1.

Dans [35], Denis démontre l’indépendance algébrique de π, ζ(1), . . . , ζ(q − 2). Le résultat principal de cette partie est dû à Chang et Yu [20]. Théorème 5.4. — Les relations de dépendance algébrique liant les nombres π, ζ(1), ζ(2), . . . sont engendrées par les relations de Bernoulli-Carlitz (22) et les relations (25).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

232

F. PELLARIN

Comme nous l’avons dit dans l’introduction, on conjecture l’indépendance algébrique des nombres complexes π, ζ(3), . . .. Dans [7] André montre comment cette conjecture découle de la conjecture des périodes de Grothendieck jointe à la conjecture selon laquelle tout motif de Tate mixte sur Z provient du groupe fondamental de la droite projective moins trois points. En analogie avec cette conjecture, le théorème 5.4 affirme que π et les nombres ζ(s) avec s non divisible ni par q − 1 ni par p sont algébriquement indépendants. 5.3.1. — Ci-après, je donne quelques éléments de preuve du théorème 5.4. On montre facilement que le Fq (t)-espace vectoriel des solutions de l’équation aux σ-différences homogène y (−1) = (T − t)s y est de dimension 1 engendré par Ωs , ce qui donne une trivialisation analytique de M ∗ (φ⊗s Car ). On calcule aussi facilement le groupe de Galois de ce t-motif dual ; c’est Gm pour tout s. On considère β1 , . . . , βm ∈ K \ {0} tels que |βi | < q sq/(q−1) . Rappelons que le théorème 4.1 décrit les relations de dépendance algébrique entre π s , Lis (β1 ), . . . , Lis (βm ) par des relations de dépendance linéaire sur K dans le cas s = 1. Nous allons voir que ceci se généralise à tout s. Pour β1 , . . . , βm ∈ K \ {0} tels que |βi | < q qs/(q−1) , on pose (en suivant Chang et Yu) Li (z) = Lβi ,s (z) (i = 1, . . . , m), où Lβ,s (t) := β +

∞ X i=1

s

i

(−1)is β q . (T q − t)s (T q2 − t)s · · · (T qi − t)s

−s

On pose aussi L0 = (−1) Ω , de telle sorte que Li (T ) = Lis (βi ) pour tout i et L0 (T ) = π s . On a les équations aux σ-différences (−1)

L0

=

L0 , (t − T )s

En considérant : â (t − T )s (−1)

β1

Φs =

(−1)

βm

(−1)

Li

0

···

0

(t − T )s .. .

1 .. .

···

0 .. .

(t − T )s

0

···

1

(−1)

= βi

+

Li . (t − T )s

ì

â ,

ψs =

i = 1, . . . , m.

Ωs Ωs L1 .. .

ì ∈ Mat(m+1)×1 (T),

Ωs Lm

(−1)

on a ψs = Φs ψs et on construit facilement une trivialisation analytique Ψs d’un t-motif dual Ms,m au centre d’une suite exacte de K[t, σ]-modules 0 → M ∗ (φ⊗s Car ) → m Ms,m → 1 → 0. On peut calculer le groupe de Galois Gs,m := GMs,m de Ms,m d’une manière très proche de ce que nous avons esquissé au paragraphe 4.3. On trouve que Gs,m est un

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

∗

233

!

0

⊂ GLm+1 , et le théorème 4.4 ∗ Idm nous dit qu’on a égalité précisément quand les fonctions L0 , L1 , . . . , Lm sont algébriquement indépendantes, condition d’ailleurs équivalente à l’indépendance algébrique des nombres π, Lis (β1 ), . . . , Lis (βm ) d’après le théorème 4.3.

sous-groupe algébrique défini sur Fq (t) de

Remarque 5.5. — On a ζ(s) ∈ K∞ et π 6∈ K∞ si q ≥ 3. Si s n’est pas divisible par q − 1, ζ(s) et π s sont K-linéairement indépendants. Le théorème 5.1 et les arguments ci-dessus nous donnent l’indépendance algébrique de π et ζ(s). Chang et Yu généralisent cette remarque. Les arguments qu’ils développent permettent de démontrer le résultat suivant (qui implique le théorème 4.1), où U (r) désigne l’ensemble des entiers s avec 1 ≤ s ≤ r non divisibles par p, q − 1. On a ainsi [20] : Théorème 5.6. — Pour r ≥ 1, on considère un sous-ensemble I non vide de U (r) et, pour tout s ∈ I , on fixe un entier ns ≥ 1. On considère, pour tout s ∈ I , des nombres βs,1 , . . . , βs,ns ∈ K \ {0} tels que |βi,l | < q qi/(q−1) . Si les nombres π, Lis (βs,1 ), . . . , Lis (βs,ns ),

s∈ I

sont algébriquement dépendants, alors il existe s ∈ I tel que π s , Lis (βs,1 ), . . . , Lis (βs,ns ) soient K-linéairement dépendants. Pour tout s ∈ I , on note Ms le t-motif dual Ms,ns dont la construction a été esquissée plus haut, associé à (26)

(β1 , . . . , βm ) = (βs,1 , . . . , βs,ns ).

En raisonnant par l’absurde, on peut supposer que les nombres π, Lis (βs,1 ), . . . , Lis (βs,ns ) avec s parcourant I sont algébriquement dépendants mais que, pour tout s ∈ I , les ns + 1 nombres π, Lis (βs,1 ), . . . , Lis (βs,ns ) sont K-linéairement indépendants. Le théorème 4.4 et les remarques ci-dessus impliquent que Gs = Gs,ns est de dimension ns + 1, dans une suite exacte 0 → Gna s → Gs → Gm → 1. De cette suite exacte, on retient que, pour tout s, Gm agit sur Gna s : si µ ∈ Gm (Fq (t)) et v ∈ Gna s (Fq (t)), alors µ(v) = µs v. Chang et Yu, en comparant les différents poids s, en déduisent que le groupe de Galois GM du t-motif dual M = ⊕s∈ I Ms est s ns isomorphe à une extension de Gm par GΣ et le théorème de Papanikolas 4.4 a fournit la contradiction voulue. Pour déduire le théorème 5.4 du théorème 5.6, on applique le théorème 5.1 et on choisit I = U (r) et, pour tout s ∈ U (r) : (β1 , . . . , βns ) = (T i0 , . . . , T ims ),

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

234

F. PELLARIN

où les exposants 0 ≤ i0 < · · · < ims ≤ sq/(q − 1) sont choisis de sorte que ζ(s) ∈ Kπ s +KLis (1)+· · ·+KLis (T [sq/(q−1)] ) = Kπ s ⊕KLis (T i0 )⊕· · ·⊕KLis (T ims ). Remarque 5.7. — Dans [66], Thakur introduit des séries analogues des valeurs multizêta complexes : X 1 ζ(s1 , . . . , sk ) = , s1 , . . . , sk ≥ 1. ns11 · · · nskk ni ∈A+ ,|n1 |>···>|nk |

Il nous a annoncé avoir réussi, en collaboration avec Anderson et Papanikolas, à interpréter certains de ces nombres comme des logarithmes de points algébriques de t-modules qui sont des extensions itérées de puissances tensorielles du module de Carlitz : des nouvelles applications des théorèmes 4.2 et 4.4 deviennent donc envisageables dans un travail en cours par ces auteurs. Remarque 5.8. — On peut obtenir, essentiellement par la même méthode de démonstration du paragraphe 3.1, un énoncé plus général que le théorème 3.1 incluant l’indépendance algébrique des valeurs de la fonction zêta de Carlitz-Goss aux entiers ≥ 1 et le cas du théorème 5.6 correspondant aux βs,j dans K. Pour ce faire, on utilise, pour β ∈ K tel que |β| < q sq/(q−1) , les séries e β(x) +

∞ X i=1

i

e q (−1)is β(x) , (xq − T )s · · · (xqi − T )s

dont la valeur en x = T est Lis (β). On termine en appliquant le théorème 2.5 au lieu du théorème 2.2.

6. VALEURS DES FONCTIONS GAMMA Dans ce paragraphe, je présente les résultats de transcendance et indépendance algébrique concernant les fonctions gamma de la théorie drinfeldienne. Il y a essentiellement deux types de fonction gamma, liées à deux théories cyclotomiques : celle qui se focalise sur les racines de l’unité et celle qui étudie les exponentielles de Carlitz des éléments de l’ensemble πK. Dans [66], ces deux fonctions gamma (appelées respectivement arithmétique et géométrique) sont étudiées en profondeur et je me limiterai ici à un survol des résultats principaux. La fonction gamma arithmétique Γarith : Zp → K∞ a été introduite par Goss dans [42] pour interpoler p-adiquement la fonction Γarith de Carlitz introduite et définie au paragraphe 5. Dans sa thèse et dans [62], Thakur détermine les analogues pour Γarith des formules des compléments et de multiplication pour la fonction gamma d’Euler. Il démontre également que les nombres Γarith (1 − a/(q − 1)) sont transcendants pour

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

235

0 < a ≤ q − 1, en les reliant à des puissances de π en analogie avec la transcendance √ de la valeur de la fonction gamma d’Euler en 1/2, égale à π. En poursuivant les analogies avec la fonction gamma d’Euler, Thakur a démontré [62, 66] des analogues des formules de Chowla-Selberg pour Γarith . Si φ est le module de Drinfeld φ : T 7→ T τ 0 + τ 2 , alors son réseau de périodes est égal à Au1 + Au2 avec u2 /u1 ∈ Fq2 \ Fq et Å Å ãq2 −1 ãq2 −1 1 q q 1−q (27) Γarith 1 + = κπ u2 , Γarith 1 + = ν(πu2 )1−q 1 − q2 1 − q2 ×

pour κ, ν ∈ K . Le résultat de Thiéry mentionné dans le sous-paragraphe 4.3.3 implique alors que π, Γarith (1 + 1/(1 − q 2 )) sont algébriquement indépendants (de même pour π, Γarith (1+q/(1−q 2 ))), en analogie avec le résultat impliquant la transcendance de la fonction gamma d’Euler en 1/3, 1/4 dû à Chudnovski. Par la méthode automatique, Thakur [64] a obtenu la transcendance de Γarith (a/f ) pour tout dénominateur f mais avec certaines restrictions sur a non divisible par f , puis Allouche [3] a démontré que Γarith (r) est transcendant pour r rationnel non entier. Thakur a aussi démontré la transcendance de tous les monômes en les valeurs de Γarith en Q ∩ Zp dont il n’avait pas montré l’algébricité (dans sa thèse). Dans [52], Mendès France et Yao ont finalement étendu ce résultat à Zp \ N. La fonction gamma géométrique introduite par Thakur est la fonction déterminée par le produit : Y z −1 Γgeo (z) = z −1 , z ∈ C \ (−A+ ∪ {0}), 1+ a a∈A+

méromorphe sur C (d’inverse entière envoyant A sur A). Thakur [62, 66] a découvert plusieurs équations fonctionnelles pour Γgeo (analogues des identités de translation, des compléments et de multiplication de Gauss pour la fonction gamma d’Euler), qui seront appelées équations fonctionnelles standard. Ses travaux ont été suivis de résultats de transcendance et d’indépendance algébrique de grande importance, mais qui ne seront pas couverts par ce texte (on pourra consulter [5, 66]). Dans [61], Sinha a démontré la transcendance des nombres Γgeo (a/f ) avec a, f ∈ A+ , |a| < |f | premiers entre eux, en les identifiant à des coordonnées de périodes de t-modules à multiplications complexes Gf définis sur K et en appliquant un théorème (analogue de Gelfond-Schneider) de Jing Yu dans [81]. Cette idée est en quelque sorte analogue du fait que les valeurs des fonctions bêta classiques sont périodes d’intégrales abéliennes pour les jacobiennes des courbes de Fermat (voir [72]). Brownawell et Papanikolas [15] ont généralisé le travail de Sinha en arrivant à interpréter tous les nombres Γgeo (z) avec z ∈ K \ A+ comme des coordonnées de périodes de certains t-modules à « multiplications complexes » définis sur K et à en démontrer la transcendance, et les propriétés d’indépendance linéaire. À la base de

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

236

F. PELLARIN

ce travail, il y a d’une part un « critère du crochet » à la Anderson-Deligne-Thakur (voir [27, 62]) qui permet de déterminer les relations de dépendance K-linéaire entre deux monômes en des valeurs de Π, et d’autre part une application du théorème 2.4 à certaines extensions des t-modules Gf à multiplication complexes (qui sont décrits en détail aussi dans [66]), dont la partie délicate consiste à en déterminer tous les sous-t-modules propres. Ce travail a été ensuite généralisé et étendu car, dans [5], Anderson, Brownawell et Papanikolas, en appliquant leur théorème 4.2, ont démontré : Théorème 6.1. — Les équations fonctionnelles standard engendrent toutes les relations de dépendance algébrique des valeurs de Γgeo sur K \ (−A+ ∪ {0}). Remarque 6.2. — On ne connaît toujours pas de preuve automatique de la transcendance des valeurs de la fonction gamma géométrique autres que celles liées à π (par exemple, si q = 2 et si z ∈ K \ A, alors la formule des compléments de Thakur implique Γgeo (z) ∈ Kπ). Dans [42] (voir aussi [66]), Goss introduit une fonction gamma de deux variables, définie sur Zp × C, se spécialisant sur les deux fonctions gamma (arithmétique et géométrique). Ce serait intéressant d’étudier la transcendance de ses valeurs. Étant donnés des nombres complexes `1 , . . . , `m , la conjecture de Schanuel (voir [75, 76]) estime le degré de transcendance du sous-corps de C engendré par `1 , . . . , `m , e`1 , . . . , e`m et Q. Grâce à un théorème de Nesterenko utilisant certaines propriétés différentielles des formes modulaires pour SL2 (Z), on sait que π, eπ , Γ(1/4) sont algébriquement indépendants(7). Un analogue de la conjecture de Schanuel dans C est proposé par Denis dans [30]. Cette conjecture semble inabordable par les méthodes décrites dans ce texte. Denis démontre, pour q ≥ 4, l’indépendance algébrique de π et eCar ((T q − T )1/(q−1) π) (il existe un choix de (T q − T )1/(q−1) tel que (T q − T )1/(q−1) π ∈ K∞ ) et sa méthode s’adapte pour prouver l’indépendance algébrique de π et eCar (λπ) avec λ ∈ Fq2 \ Fq . Voir aussi [9, 58] pour l’analogue du théorème de Gelfond. Un analogue dans C du théorème de Nesterenko concernant les valeurs de formes modulaires de Drinfeld n’est toujours pas disponible à l’heure actuelle, mais il est raisonnable de conjecturer l’indépendance algébrique des trois nombres eCar (λπ), π, Γarith (1 + 1/(1 − q 2 )) pour tout λ ∈ Fq2 \ Fq au moins quand q ≥ 4. Cette conjecture ne semble pas non plus accessible avec les méthodes décrites dans ce texte (mais il n’est pas exclu qu’on puisse (7)

Le résultat de Nesterenko concerne plus généralement les valeurs des fonctions t, P (t), Q(t), R(t) avec P, Q, R les séries de Ramanujan.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

237

la démontrer par une variante de la méthode de Philippon [59], voir aussi [74]). Dans [13], on peut trouver une étude approfondie des propriétés différentielles des formes modulaires de Drinfeld pour GL2 (A) sous la contrainte q ≥ 4 où l’on remarque des fortes analogies avec les propriétés différentielles des formes modulaires pour SL2 (Z) utilisées par Nesterenko dans son théorème. L’auteur tient à remercier tous ceux qui l’ont aidé et soutenu pendant la rédaction de ce texte, et en particulier, tous les participants au « GdT différentiel » de l’Institut Mathématique de Jussieu, ainsi que B. Adamczewski, J.-P. Allouche, B. Anglès, V. Bosser, L. Denis, E.-U. Gekeler, D. Thakur, M. Waldschmidt. Il remercie également le centre E. de Giorgi de Pise pour les conditions très favorables dans lesquelles il a pu terminer ce travail.

RÉFÉRENCES [1] B. Adamczewski & J. Bell – Function fields in positive characteristic and Cobham’s theorem, J. Algebra 319 (2008), p. 2337–2350. [2] J.-P. Allouche – Sur la transcendance de la série formelle Π, Sém. Théor. Nombres Bordeaux 2 (1990), p. 103–117. [3]

, Transcendence of the Carlitz-Goss gamma function at rational arguments, J. Number Theory 60 (1996), p. 318–328.

[4] G. W. Anderson – t-motives, Duke Math. J. 53 (1986), p. 457–502. [5] G. W. Anderson, W. D. Brownawell & M. Papanikolas – Determination of the algebraic relations among special Γ-values in positive characteristic, Ann. of Math. 160 (2004), p. 237–313. [6] G. W. Anderson & D. S. Thakur – Tensor powers of the Carlitz module and zeta values, Ann. of Math. 132 (1990), p. 159–191. [7] Y. André – Une introduction aux motifs (motifs purs, motifs mixtes, périodes), Panoramas et Synthèses, vol. 17, Soc. Math. France, 2004. [8] R. M. Beals & D. S. Thakur – Computational classification of numbers and algebraic properties, Int. Math. Res. Not. 1998 (1998), p. 799–818. [9] P.-G. Becker, W. D. Brownawell & R. Tubbs – Gel0 fond’s theorem for Drinfel0 d modules, Michigan Math. J. 41 (1994), p. 219–233. [10] V. Berthé – Combinaisons linéaires de ζ(s)/Πs sur Fq (x), pour 1 ≤ s ≤ q − 2, J. Number Theory 53 (1995), p. 272–299. [11] D. Bertrand – Lemmes de zéros et nombres transcendants, Séminaire Bourbaki, vol. 1985/86, exp. no 652, Astérisque 145-146 (1987), p. 21–44.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

238

[12]

F. PELLARIN

, Un analogue différentiel de la théorie de Kummer, in Approximations diophantiennes et nombres transcendants (Luminy, 1990), de Gruyter, 1992, p. 39–49.

[13] V. Bosser & F. Pellarin – Hyperdifferential properties of Drinfeld quasimodular forms, article ID rnn032, 56 pages, doi:10.1093/imrn/rnn032, 2008. [14] W. D. Brownawell – Transcendence in positive characteristic, in Number theory (Tiruchirapalli, 1996), Contemp. Math., vol. 210, Amer. Math. Soc., 1998, p. 317–332. [15] W. D. Brownawell & M. Papanikolas – Linear independence of gamma values in positive characteristic, J. reine angew. Math. 549 (2002), p. 91–148. [16] L. Carlitz – On certain functions connected with polynomials in a Galois field, Duke Math. J. 1 (1935), p. 137–168. [17]

, An analogue of the von Staudt-Clausen theorem, Duke Math. J. 3 (1937), p. 503–517.

[18]

, A class of polynomials, Trans. Amer. Math. Soc. 43 (1938), p. 167–182. , Some special functions over GF(q, x), Duke Math. J. 27 (1960), p. 139–

[19] 158.

[20] C.-Y. Chang & J. Yu – Determination of algebraic relations among special zeta values in positive characteristic, Adv. Math. 216 (2007), p. 321–345. [21] G. Christol – Ensembles presque periodiques k-reconnaissables, Theoret. Comput. Sci. 9 (1979), p. 141–145. [22] G. Christol, T. Kamae, M. Mendès France & G. Rauzy – Suites algébriques, automates et substitutions, Bull. Soc. Math. France 108 (1980), p. 401– 419. [23] A. Cobham – Uniform tag sequences, Math. Systems Theory 6 (1972), p. 164– 192. [24] G. Damamme & Y. Hellegouarch – Transcendence of the values of the Carlitz zeta function by Wade’s method, J. Number Theory 39 (1991), p. 257–278. [25] S. David & L. Denis – Indépendance algébrique sur les T -modules, Compositio Math. 122 (2000), p. 1–22. [26]

, Périodes de modules de “l’indépendance quadratique en rang II”, J. Ramanujan Math. Soc. 17 (2002), p. 65–83.

[27] P. Deligne – Valeurs de fonctions L et périodes d’intégrales, in Automorphic forms, representations and L-functions (Oregon State Univ. 1977), Part 2, Proc. Sympos. Pure Math., XXXIII, Amer. Math. Soc., 1979, p. 313–346. [28] L. Denis – Théorème de Baker et modules de Drinfel0 d, J. Number Theory 43 (1993), p. 203–215.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

239

[29]

, Dérivées d’un module de Drinfel0 d et transcendance, Duke Math. J. 80 (1995), p. 1–13.

[30]

, Indépendance algébrique et exponentielle de Carlitz, Acta Arith. 69 (1995), p. 75–89.

[31]

, Lemmes de multiplicités et T -modules, Michigan Math. J. 43 (1996), p. 67–79.

[32]

, Un critère de transcendance en caractéristique finie, J. Algebra 182 (1996), p. 522–533.

[33]

, Indépendance algébrique de différents π, C. R. Acad. Sci. Paris Sér. I Math. 327 (1998), p. 711–714.

[34]

, Indépendance algébrique des dérivées d’une période du module de Carlitz, J. Austral. Math. Soc. Ser. A 69 (2000), p. 8–18.

[35]

, Indépendance algébrique de logarithmes en caractéristique p, Bull. Austral. Math. Soc. 74 (2006), p. 461–470.

[36] S. Dion – Théorème de Brownawell-Waldschmidt en caractéristique finie, Ann. Fac. Sci. Toulouse Math. 9 (2000), p. 71–90. [37] J. Fresnel & M. van der Put – Rigid analytic geometry and its applications, Progress in Math., vol. 218, Birkhäuser, 2004. [38] E.-U. Gekeler – On the de Rham isomorphism for Drinfel0 d modules, J. reine angew. Math. 401 (1989), p. 188–208. [39]

, Quasi-periodic functions and Drinfel0 d modular forms, Compositio Math. 69 (1989), p. 277–293.

[40] D. Goss – von Staudt for Fq [T ], Duke Math. J. 45 (1978), p. 885–910. [41]

, v-adic zeta functions, L-series and measures for function fields, Invent. Math. 55 (1979), p. 107–119.

[42]

, The Γ-function in the arithmetic of function fields, Duke Math. J. 56 (1988), p. 163–191.

[43]

, Drinfel0 d modules : cohomology and special functions, in Motives (Seattle, WA, 1991), Proc. Sympos. Pure Math., vol. 55, Amer. Math. Soc., 1994, p. 309–362.

[44]

, Basic structures of function field arithmetic, Ergebnisse Math. Grenzg.. 3. Folge, vol. 35, Springer, 1996.

[45] Y. Hamahata – Tensor products of Drinfel0 d modules and v-adic representations, Manuscripta Math. 79 (1993), p. 307–327. [46] C. Hardouin – Hypertranscendance des systèmes aux différences diagonaux, Compos. Math. 144 (2008), p. 565–581.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

240

[47]

[48] [49]

[50] [51] [52] [53]

[54] [55] [56] [57] [58]

[59] [60]

[61] [62]

F. PELLARIN

, Computation of the Galois groups attached to the Carlitz logarithms according to the method of M. Papanikolas, prépublication de l’I.W.R. (Heidelberg, avril 2006). D. R. Hayes – Explicit class field theory for rational function fields, Trans. Amer. Math. Soc. 189 (1974), p. 77–91. Y. Hellegouarch – Fonctions zêta en caractéristique positive et modules de Carlitz-Hayes, Séminaire Bourbaki, vol. 1997/98, exp. no 837, Astérisque 252 (1998), p. 57–79. K. S. Kedlaya – Finite automata and algebraic extensions of function fields, J. Théor. Nombres Bordeaux 18 (2006), p. 379–420. B. de Mathan – Irrationality measures and transcendence in positive characteristic, J. Number Theory 54 (1995), p. 93–112. M. Mendès France & J.-y. Yao – Transcendence and the Carlitz-Goss gamma function, J. Number Theory 63 (1997), p. 396–402. D. Mumford – An algebro-geometric construction of commuting operators and of solutions to the Toda lattice equation, Korteweg deVries equation and related nonlinear equation, in Proceedings of the International Symposium on Algebraic Geometry (Kyoto Univ., Kyoto, 1977), Kinokuniya Book Store, 1978, p. 115–153. M. Papanikolas – Tannakian duality for Anderson-Drinfeld motives and algebraic independence of Carlitz logarithms, Invent. Math. 171 (2008), p. 123–174. P. Philippon – Variétés abéliennes et indépendance algébrique. I, Invent. Math. 70 (1982/83), p. 289–318. , Lemmes de zéros dans les groupes algébriques commutatifs, Bull. Soc. Math. France 114 (1986), p. 355–383. , Critères pour l’indépendance algébrique dans les anneaux diophantiens, C. R. Acad. Sci. Paris Sér. I Math. 315 (1992), p. 511–515. , Une approche méthodique pour la transcendance et l’indépendance algébrique de valeurs de fonctions analytiques, J. Number Theory 64 (1997), p. 291– 338. , Indépendance algébrique et K-fonctions, J. reine angew. Math. 497 (1998), p. 1–15. M. van der Put & M. Reversat – Krichever modules for difference and differential equations, Astérisque 296 (2004), p. 207–225, Analyse complexe, systèmes dynamiques, sommabilité des séries divergentes et théories galoisiennes. I. S. K. Sinha – Periods of t-motives and transcendence, Duke Math. J. 88 (1997), p. 465–535. D. S. Thakur – Gamma functions for function fields and Drinfel0 d modules, Ann. of Math. 134 (1991), p. 25–64.

ASTÉRISQUE 317

(973)

INDÉPENDANCE ALGÉBRIQUE EN CARACTÉRISTIQUE NON NULLE

241

[63]

, Drinfel0 d modules and arithmetic in the function fields, Int. Math. Res. Not. 1992 (1992), p. 185–197.

[64]

, Transcendence of gamma values for Fq [T ], Ann. of Math. 144 (1996), p. 181–188.

[65]

, Automata and transcendence, in Number theory (Tiruchirapalli, 1996), Contemp. Math., vol. 210, Amer. Math. Soc., 1998, p. 387–399.

[66]

, Function field arithmetic, World Scientific Publishing Co. Inc., 2004.

[67] A. Thiéry – Indépendance algébrique des périodes et quasi-périodes d’un module de Drinfel0 d, in The arithmetic of function fields (Columbus, OH, 1991), Ohio State Univ. Math. Res. Inst. Publ., vol. 2, de Gruyter, 1992, p. 265–284. [68]

, Théorème de Lindemann-Weierstrass pour les modules de Drinfel0 d, Compositio Math. 95 (1995), p. 1–42.

[69] R. Tubbs – Analytic subgroups of t-modules, Trans. Amer. Math. Soc. 349 (1997), p. 2605–2617. [70] L. I. Wade – Certain quantities transcendental over GF (pn , x), Duke Math. J. 8 (1941), p. 701–720. [71] M. Waldschmidt – Nombres transcendants, Springer, 1974, Lecture Notes in Mathematics, Vol. 402. [72]

, Diophantine properties of the periods of the Fermat curve, in Number theory related to Fermat’s last theorem, Proc. Conf., Prog. Math., vol. 26, 1982, p. 79–88.

[73]

, Transcendence problems connected with Drinfel0 d modules, İstanbul Üniv. Fen Fak. Mat. Derg. 49 (1990), p. 57–75 (1993), International Symposium on Algebra and Number Theory (Silivri, 1990).

[74]

, Sur la nature arithmétique des valeurs de fonctions modulaires, Séminaire Bourbaki, vol. 1996/97, exp. no 824, Astérisque 245 (1997), p. 105–140.

[75]

, Diophantine approximation on linear algebraic groups, Grund. Math. Wiss., vol. 326, Springer, 2000, Transcendence properties of the exponential function in several variables.

[76]

, Un demi-siècle de transcendance, in Development of mathematics 1950– 2000, Birkhäuser, 2000, p. 1121–1186.

[77] G. Wüstholz – Algebraische Punkte auf analytischen Untergruppen algebraischer Gruppen, Ann. of Math. 129 (1989), p. 501–517. [78] J. Yu – Transcendental numbers arising from Drinfel0 d modules, Mathematika 30 (1983), p. 61–66. [79]

, A six exponentials theorem in finite characteristic, Math. Ann. 272 (1985), p. 91–98.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

242

F. PELLARIN

, Transcendence and Drinfel0 d modules, Invent. Math. 83 (1986), p. 507–

[80] 517. [81]

, Transcendence and Drinfeld modules : several variables, Duke Math. J. 58 (1989), p. 559–575.

[82]

, On periods and quasi-periods of Drinfel0 d modules, Compositio Math. 74 (1990), p. 235–245.

[83]

, Transcendence and special zeta values in characteristic p, Ann. of Math. 134 (1991), p. 1–23.

[84]

, Analytic homomorphisms into Drinfeld modules, Ann. of Math. 145 (1997), p. 215–233.

Federico PELLARIN Laboratoire LaMUSE Université de Saint-Étienne Département de Mathématiques 23, rue du Docteur Paul Michelon 42023 Saint-Étienne Cedex 2 E-mail : [email protected]

Note. — Récemment, Chieh-Yu Chang et Matt Papanikolas m’ont informé qu’ils avaient résolu, parmi d’autres problèmes, le cas de la conjecture 4.8 correspondant aux modules de Drinfeld de rang 2, définis sur Fq (T ), sans multiplications complexes, sous la contrainte 2 - q.

ASTÉRISQUE 317

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (974) Algebraization of codimension one Webs Jorge Vitório PEREIRA

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 974, p. 243 à 268

Mars 2007

ALGEBRAIZATION OF CODIMENSION ONE WEBS [after Trépreau, Hénaut, Pirio, Robert, ...] by Jorge Vitório PEREIRA

Jean-Marie Trépreau, extending previous results by Bol and Chern-Griffiths, proved recently that codimension one webs with sufficiently many abelian relations are after a change of coordinates projectively dual to algebraic curves when the ambient dimension is at least three. In sharp contrast, Luc Pirio and Gilles Robert, confirming a guess of Alain Hénaut, independently established that a certain planar 9-web is exceptional in the sense that it admits the maximal number of abelian relations and is non-algebraizable. After that a number of exceptional planar k-webs, for every k ≥ 5, have been found by Pirio and others. I will briefly review the subject history, sketch Trépreau’s proof, describe some of the “new” exceptional webs and discuss related recent works. Disclaimer. — This text does not pretend to survey all the literature on web geometry but to provide a bird’s-eye view over the results related to codimension one webs and their abelian relations. For instance I do not touch the interface between web geometry and loops, quasi-groups, Poisson structures, singular holomorphic foliations, complex dynamics, singularity theory, . . . For more information on these subjects the reader should consult [6, 2, 27] and references there within. Acknowledgements. — There are a number of works containing introductions to web geometry that I have freely used while writing this text. Here I recognize the influence of [4, 15, 30] and specially [40], which was my main source of historical references. I have also profited from discussions with C. Favre, H. Movasati, L. Pirio, F. Russo and P. Sad.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

244

J. V. PEREIRA

1. INTRODUCTION A germ of regular codimension one k-web W = F 1 · · · F k on (Cn , 0) is a collection of k germs of smooth codimension one holomorphic foliations subjected to the condition that for any number m of these foliations, m ≤ n, the corresponding tangent spaces at the origin have intersection of codimension m. Two webs W and W 0 are equivalent if there exists a germ of bihomolorphic map sending the foliations 0 defining W to the ones defining W . Similar definitions can be made for webs of arbitrary (and even mixed) codimensions. Although most of the magic can be (and has already been) spelled in the C ∞ R -category throughout I will restrict myself to the holomorphic category. 1.1. The origins According to the first lines of [6] web geometry had its birth at the beaches of Italy in the years of 1926-27 when Blaschke and Thomsen realized that the configuration of three foliations of the plane has local invariants, see Figure 1.

Figure 1. Following the leaves of foliations one obtains germs of diffeomorphisms in one variable whose equivalence class is a local invariant of the web. The web is called hexagonal if all the possible germs are the identity.

A more easily computable invariant was later introduced by Blaschke and Dubourdieu. If W = F 1 F 2 F 3 is a planar web and the foliations F i are defined by 1-forms ωi satisfying ω1 + ω2 + ω3 = 0 then a simple computation shows that there exists an unique 1-form γ such that dωi = γ ∧ ωi for i = 1, 2, 3. Albeit the 1-form γ does depend on the choice of the ωi its differential dγ is intrinsically attached to W , and is the so called curvature κ( W ) of W . Some early emblematic results of the theory developed by Blaschke and his collaborators are collected in the theorem below.

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

245

Theorem 1.1. — If W = F 1 F 2 F 3 is a 3-web on (C2 , 0) then are equivalent: 1. 2. 3. 4.

W is hexagonal; the 2-form κ( W ) vanishes identically; there exists closed 1-forms ηi defining F i , i = 1, 2, 3, such that η1 + η2 + η3 = 0 ; W is equivalent to the web defined by the level sets of the functions x, y and x − y.

Most of the results discussed in this text can be naïvely understood as attempts to generalize Theorem 1.1 to the broader context of arbitrary codimension one k-webs. 1.2. Abelian relations The condition (3) in Theorem 1.1 suggests the definition of the space of abelian relations A ( W ) for an arbitrary k-web W = F 1 · · · F k . If the foliations F i are induced by integrable 1-forms ωi then ( ) k X k 1 n k A ( W ) = ηi i=1 ∈ (Ω (C , 0)) ∀i dηi = 0 , ηi ∧ ωi = 0 and ηi = 0 . i=1

If ui : (Cn , 0) → (C, 0) are local submersions defining the foliations F i then, after integration, the abelian relations can be read as functional equations of the form Pk i=1 gi (ui ) = 0 for some germs of holomorphic functions gi : (C, 0) → (C, 0). Clearly A ( W ) is a vector space and its dimension is commonly called the rank of W , denoted by rk( W ). It is a theorem of Bol that the rank of a planar k-web is bounded from above by 21 (k − 1)(k − 2). This bound was later generalized by Chern in his thesis (under the direction of Blaschke) for codimension one k-webs on Cn and reads as (1)

rk( W ) ≤ π(n, k) =

∞ X

max(0, k − j(n − 1) − 1) .

j=1

A k-web W on (Cn , 0) is of maximal rank if rk( W ) = π(n, k). The integer π(n, k) is the well-known Castelnuovo’s bound for the arithmetic genus of irreducible and non-degenerated degree k curves in Pn . To establish these bounds first notice that A ( W ) admits a natural filtration

A( W ) = A0( W ) ⊇ A1( W ) ⊇ · · · ⊇ Aj ( W ) ⊇ · · · , where

® j

A ( W ) = ker A ( W ) −→

Å

Ω1 (Cn , 0) mj · Ω1 (Cn , 0)

ãk ´ ,

with m being the maximal ideal of C{x1 , . . . , xn }.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

246

J. V. PEREIRA

If the submersions ui defining F i have linear term `i , then (2)

dim

ä Ä Aj ( W ) j+1 j+1 C · ` + · · · + C · ` . ≤ k − dim 1 k A j+1 ( W )

Since the right-hand side is controlled by the inequality, cf. [49, Lemme 2.1], ä Ä + · · · + C · `j+1 ≤ max(0, k − (j + 1)(n − 1) − 1) k − dim C · `j+1 1 k the bound (1) follows at once. Note that this bound is attained if, and only if, the partial bounds (2) are also attained. In particular, (3)

dim A ( W ) = π(n, k) =⇒ dim

A0( W ) = 2k − 3n + 1. A2( W )

It will be clear at the end of the next section that the appearance of Castelnuovo’s bounds in web geometry is far from being a coincidence. 1.3. Algebraizable webs and Abel’s Theorem If C is a non-degenerated(1) reduced degree k algebraic curve on Pn then for every generic hyperplane H0 a germ of codimension one k-web W C is canonically defined on (Pˇn , H0 ) by projective duality. This is the web induced by the levels of the holomorphic maps pi : (Pˇn , H0 ) → C characterized by H · C = p1 (H) + p2 (H) + · · · + pk (H) for every H sufficiently close to H0 .

Figure 2. On the left W C is pictured for a reduced cubic curve C formed by a line and a conic. On the right W C is drawn for a rational quartic C. (1)

Throughout the term non-degenerated will be used in a stronger sense than usual in order to ensure that the dual web is smooth. It means that any collection of points in the intersection of C with a generic hyperplane, but not spanning the hyperplane, is formed by linearly independent points.

ASTÉRISQUE 317

(974)

247

ALGEBRAIZATION OF CODIMENSION ONE WEBS

Abel’s addition Theorem says that for every p0 ∈ C and every holomorphic(2) 1-form ω ∈ H0 (C, ωC ) the sum Z p2 (H) Z pk (H) Z p1 (H) ω+ ω + ··· + ω p0

p0

p0

does not depend of H. One can reformulate this statement as k X

p∗i ω = 0 .

i=1

It follows that the 1-forms on C can be interpreted as abelian relations of W C . In particular dim A ( W C ) ≥ h0 (C, ωC ) and if C is an extremal curve — a non-degenerated reduced curve attaining Castelnuovo’s bound — then W C has maximal rank. The key question dealt with in the works reviewed here is the characterization of the algebraizable codimension one webs. These are the webs equivalent to W C for a suitable projective curve C. 1.4. A converse to Abel’s Theorem The ubiquitous tool for the algebraization of k-webs is the following theorem. Theorem 1.2. — Let C1 , . . . , Ck be germs of curves on Pn all of them intersecting transversely a given hyperplane H0 and write pi (H) = H ∩ Ci for a hyperplane H sufficiently close to H0 . Let also ωi be germs of non-identically zero 1-forms on the curves Ci and assume that the trace k X

p∗i ωi

i=1

vanishes identically. Then there exist a degree k reduced curve C ⊂ Pn and a holomorphic 1-form ω on C such that Ci ⊂ C and ω|Ci = ωi for all i ranging from 1 to k. Theorem 1.2 in the case of plane quartics was obtained by Lie in his investigations concerning double translation surfaces, cf. Figure 3. The general case follows from Darboux proof (following ideas of Poincaré) of Lie’s Theorem. The result has been generalized to germs of arbitrary varieties carrying holomorphic forms of the maximum degree by Griffiths, cf. [24]. More recently Henkin and Henkin-Passare generalized the result even further by showing, in particular, that the rationality of the trace is sufficient to ensure the algebraicity of the data, see [34] and references therein. (2)

If C is singular then the holomorphicity of ωÄmeans that it is an 1-form of first kind ä with respect

R p1 (H)

R p2 (H)

Rp

(H)

k to system of hyperplanes, i.e., the expression ω+ ω + ··· + ω , seen as a p0 p0 p0 n ˇ holomorphic function of H ∈ P , has no singularities. It turns out that the holomorphic 1-forms on C are precisely the sections of the dualizing sheaf ωC .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

248

J. V. PEREIRA

Figure 3. A double translation surface is a surface S ⊂ R3 that admits two independent parameterizations of the form (x, y) 7→ f (x) + g(y). S carries a natural 4-web W . The lines tangent to leaves of W cut the hyperplane at infinity along 4 germs of curves. Lie’s Theorem says that these 4 curves are contained in a degree 4 algebraic curve. This result was later generalized [50] to arbitrary double translation hypersurfaces.

The relevance of Theorem 1.2 to our subject is evident once one translates it — as Blaschke-Howe (n = 2) and Bol (n ≥ 3) did — to the dual projective space. We recall that a linear web is a web whose leaves are pieces of hyperplanes. Theorem 1.3. — A linear k-web W on (Cn , 0) carrying an abelian relation that is not an abelian relation of any subweb extends to a global (but singular) web W C on Pn . With Theorem 1.3 at hand the algebraization of 2n-webs on (Cn , 0) with n + 1 abelian relations follows from a beautiful argument of Blaschke — inspired in Poincaré’s works on double translation surfaces — that goes as follows. 1.5. A first algebraization result If W is a k-web on (Cn , 0) of maximal rank r then — mimicking the construction of the canonical map for algebraic curves — one defines, for i = 1, . . . , k, the maps Zi : (Cn , 0) −→ x

7→

Pr−1 [ηi1 (x) : . . . : ηir (x)]

with (η1λ , . . . , ηkλ ) λ=1,...,r being a basis for A ( W ). Although the ηiλ ’s are 1-forms the maps Zi ’s are well-defined since, for a fixed i, any two of these forms differ by the multiplication of a meromorphic function constant along the leaves of F i . It is an immediate consequence that the image of each Zi is a germ of curve. Note that the equivalence class under Aut(Pr ) of these germs is an analytic invariant of W .

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

249

Since W has maximal rank then dim A0 ( W )/ A 1 ( W ) = k − n. Therefore the points Z1 (x), . . . , Zk (x) span a projective space Pk−n−1 ⊂ Pr−1 . One can thus define the Poincaré map P : (Cn , 0) −→ Gk−n−1 (Pr−1 ) by setting P (x) = Span(Z1 (x), . . . , Zk (x)). It is a simple matter to prove that P is an immersion. If k = 2n then the Poincaré map takes values in Gn−1 (Pn ) = Pˇn . The image of the ˇ n determined by Zi (x). leaf through x of the foliation F i lies on the hyperplane of P Thus P ∗ W is a linear web and its algebraicity follows from Theorem 1.3. 1.6. Bol’s Algebraization Theorem and further developments Most of the material so far exposed can be found in [6]. This outstanding volume summarizes most of the works of the Blaschke School written during the period 19271938. One of its deepest result is Bol’s Hauptsatz für Flächengewebe (main theorem for webs by surfaces) presented in §32–35 and originally published in [7]. It says that for k 6= 5, every codimension one k-web on (C3 , 0) of maximal rank is algebraizable. For k ≤ 4 the result is an easy exercise and the case k = 6 has just been treated in §1.5. Every 5-web on (C3 , 0) of the form W (x, y, z, x + y + z, f (x) + g(y) + h(z))(3) has maximal rank but for almost every choice of the functions f, g, h it is not algebraizable, see for instance [4, 49]. In the remaining cases, k ≥ 2n + 1, Bol’s proof explores an analogy between the equations satisfied by the defining 1-forms of maximal rank webs and geodesics on semi-riemannian manifolds. Latter in [15] Chern and Griffiths attempted to generalize Bol’s result to arbitrary dimensions. Their strategy consisted in defining a path geometry in which the leaves of the web turn out to be totally geodesic hypersurfaces. The linearization follows from the flatness of such path geometry. Unfortunately there was a gap in the proof, cf. [17], that forced the authors to include an ad-hoc hypothesis on the web to ensure its algebraization.

2. ALGEBRAIZATION OF CODIMENSION ONE WEBS ON (Cn , 0), n ≥ 3 The purpose of this section is to sketch Trépreau’s Algebraization Theorem stated below. An immediate corollary is the algebraization of maximal rank k-webs on dimension at least three for k ≥ 2n. One has just to combine Trépreau’s result with the displayed equation (3). In particular the ad-hoc hypothesis in Chern-Griffiths Theorem is not necessary. (3)

W (u1 , . . . , uk ) is the k-web induced by the levels of the functions u1 , . . . , uk .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

250

J. V. PEREIRA

Theorem 2.1 ([49]). — Let n ≥ 3 and k ≥ 2n or k ≤ n + 1. If W is a k-web on (Cn , 0) satisfying A0( W ) dim 2 = 2k − 3n + 1 A (W) then W is algebraizable. Like Bol’s Theorem the result is true for k ≤ n + 1 and false for n + 1 < k < 2n thanks to fairly elementary reasons. Trépreau pointed out [49] that the general strategy has a high order of contact with Bol’s proof and that [6, §35.3] suggests that the result should hold true for webs by surfaces on (C3 , 0). It has also to be remarked that Theorem 2.1 does not completely characterize the algebraizable webs on (Cn , 0), n ≥ 3. In contrast with the planar case — where all the algebraic webs have maximal rank — the algebraic webs on higher dimensions satisfying the hypothesis of Theorem 2.1 are dual to rather special curves. One distinguished feature of these curves is that they are contained in surfaces of minimal degree. For instance, in the simplest case where the curve is an union of lines through a certain point x ∈ Pn the dual web satisfies the hypothesis if, and only if, the corresponding points in P(Tx Pn ) lie on a rational normal curve of degree n − 1. Since Trépreau’s argument is fairly detailed and self-contained I will avoid the technicalities to focus on the general lines of the proof. 2.1. A field of rational normal curves on PT∗ (Cn , 0) When k = 2n the hypothesis of Theorem 2.1 implies that W has maximal rank. The argument presented in §1.5 suffices to prove the theorem in this particular case. Until the end of the proof it will be assumed that k ≥ 2n + 1. Lemma 2.2. — If W = F 1 . . . F k is a k-web on (Cn , 0), n ≥ 2 and k ≥ 2n + 1 such that dim A 0 ( W )/ A 2 ( W ) = 2k − 3n + 1 then there exists a basis ω0 , . . . , ωn−1 of the O-module Ω1(Cn ,0) such that the defining submersions u1 , . . . , uk of W satisfy P µ n duα = kα n−1 µ=0 (θα ) ωµ for suitable functions kα , θα : (C , 0) → C. Geometrically speaking the lemma says that for every x ∈ (Cn , 0) the points on PTx∗ (Cn , 0) determined by Tx F 1 , . . . , îTx F k lie on a degree (n − 1) rational normal Pn−1 n−i i ó curve C(x) parameterized as [s : t] 7→ s t ω . The basis ω0 , . . . , ωn−1 as in i i=0 the statement of Lemma 2.2 is called an adapted basis for W . The details are in [49, Lemme 3.1] or [15, p. 61-62]. Here I will just remark that once one realizes that dim

ASTÉRISQUE 317

A0( W ) A1( W ) = 2k − 3n + 1 =⇒ dim = k − 2n + 1 A2( W ) A2( W )

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

251

and that the latter equality implies that the space of quadrics on PT∗x (Cn , 0) containing Tx F 1 , . . . , Tx F k has codimension (2n − 1) then the proof of the lemma follows immediately from the Lemma of Castelnuovo: If k ≥ 2(n − 1) + 3 points in general position on Pn−1 impose just 2(n − 1) + 1 conditions on the space of quadrics then these points belong to a rational normal curve of degree (n − 1).

2.2. Rational normal curves on P2k−3n Let W be a k-web on (Cn , 0) satisfying the hypothesis of Lemma 2.2. Fix local submersions u1 , . . . , uk : (Cn , 0) → (C, 0) defining W and (η1λ , . . . , ηkλ ), λ = 1, . . . , 2k − 3n + 1, elements in A ( W ) with classes generating A 0 ( W )/ A 2 ( W ). If z λ (x) = (z1λ (x), . . . , zkλ (x)) are vector functions for which η λ (x) = z λ (x) · (du1 (x), . . . , duk (x))T then the maps Zi : (Cn , 0) → P2k−3n — natural variant of the maps under the same label defined in §1.5 — can be explicitly written as the projectivization of the maps Zei : (Cn , 0) x

−→ 7→

C2k−3n+1

(i = 1, . . . , k)

(zi1 (x), zi2 (x), . . . , zi2k−3n+1 (x)) .

For a fixed x ∈ (Cn , 0), like in §1.5, the span of Z1 (x), . . . , Zk (x) has dimension k − n − 1. It will be denoted by Pk−n−1 (x). Using the notation of Lemma 2.2 one can introduce the map Ze∗ : (Cn , 0) × C

→ C2k−3n+1 Ñ é d X Y ej (x) (x, t) 7→ (t − θj (x)) kj (x)Z i=1

j6=i

and its projectivization Z∗ : (Cn , 0) × P1 → P2k−3n . Expanding the entries of Z∗ (x, t) as polynomials on t one verifies that these have degree (k − n − 1). Thus the points Z1 (x), . . . , Zk (x) lie on a unique degree (k − n − 1) rational normal curve C(x) contained in Pk−n−1 (x), see [49, Lemme 4.3]. It can also be shown that the Poincaré map x 7→ Pk−n−1 (x) is an immersion. Moreover, if x and x0 are distinct points then Pk−n−1 (x) and Pk−n−1 (x0 ) intersect along a projective space Pn−2 (x, x0 ). Since any number of distinct points on a degree (n − 1) rational normal curve contained in Pn−1 are in general position it follows that the curves C(x) and C(x0 ) intersect in at most (n − 1) points, cf. [49, Lemme 4.2].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

252

J. V. PEREIRA

2.3. The rational normal curves C(x) define an algebraic surface S ⊂ P2k−3n The main novelty of Trépreau’s argument is his elementary proof that, when n ≥ 3, Z∗ : (Cn , 0) × P1 → P2k−3n has rank two for every (x, t) ∈ (Cn , 0) × P1 . Besides ingenuity the key ingredient is [49, Lemme 3.2] stated below. It is deduced from a careful analysis of second order differential conditions imposed by the maximality of the dimension of A 0 ( W )/ A 2 ( W ). P Lemma 2.3. — If we write a 1-form α as α = (α)µ ωµ and use the same hypothesis and notations of Lemma 2.2 then for every µ ∈ {0, . . . , n − 2} there exist holomorphic P λ functions mµ0 , . . . , mµ(n−1) satisfying (d(kα θα ))µ − (dkα )µ+1 = kα n−1 λ=0 mµλ (θα ) . Pn Moreover, if n ≥ 3 then θα (dθα )µ − (dθα )µ+1 = λ=0 nµλ (θα )λ for suitable functions nµ0 , . . . , nµn . Only in the proof of this lemma the hypothesis on the dimension of the ambient space is used. In particular the algebraization of maximal rank planar webs for which the conclusion of the lemma holds will also follow. For every x ∈ (Cn , 0) the map t 7→ Z∗ (x, t) is an isomorphism from P1 to C(x). Combining this with the fact that Z∗ has rank two everywhere it follows that the image of Z∗ is a smooth analytic open surface S0 ⊂ P2k−3n . If x and x0 are distinct points laying on the same leaf of (n − 1) foliations defining W then C(x) and C(x0 ) will intersect in exactly n − 1 points. This is sufficient to ensure that the curve C(0) has self-intersection (in the surface S0 ) equal to n − 1. To prove that S0 is an open subset of an (eventually singular) algebraic surface S ⊂ P2k−3n consider the subset X of Mork−n−1 (P1 , P2k−3n )(4) consisting of morphisms φ with image contained in S0 and φ(0 : 1) = x0 . It follows that X is algebraic — just expand fi (φ(t : 1)) for every defining equations fi of S0 in a suitable neighborhood of x0 . To conclude one has just to notice that the Zariski closure of the natural projection to P2k−3n — the evaluation morphism — sends X to an algebraic surface S of P2k−3n containing S0 . 2.4. The curves C(x) belong to a linear system of projective dimension n The proof presented in [49] is based on a classical Theorem of Enriques [20] concerning the linearity of families of divisors. For a modern proof and generalizations of Enriques Theorem, see [18, Theorem 5.10]. Here an alternative approach, following [17, p. 82], is presented. This is just the set of morphisms from P1 to Pn of degreek − n − 1 which can be naturally identified with a Zariski open subset of P Ck−n−1 [s, t]2k−3n+1 .

(4)

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

253

Since S0 ⊂ S is smooth we can replace S by one of its desingularizations in such a way that S0 will still be an open subset. Moreover being the curves C(x) pairwise homologous in S0 the same will hold true for their strict transforms. Summarizing, for all that matters, we can assume that S is itself a smooth surface. Because S is covered by rational curves of positive self-intersection it is a rational surface. Therefore H1 (S, OS ) = 0 and homologous curves are linearly equivalent. Consequently if we set C = C(0) then all the curves C(x) belong to PH0 (S, OS (C)). The exact sequence 0 → OS → OS (C) → NC → 0 immediately implies that h0 (S, OS (C)) = 1 + h0 (C, NC ) = 1 + h0 (P1 , OP1 (C 2 )) = n + 1. Consequently dim PH0 (S, OS (C)) = n. 2.5. The algebraization map The map x 7→ C(x) takes values on the projective space Pn = PH0 (S, OS (C)). It is a holomorphic map and the leaf through x of one of the defining foliations F i is mapped to the hyperplane contained in PH0 (S, OS (C)) corresponding to the divisors through Zi (x) ∈ S. The common intersection of the hyperplanes corresponding to the leaves of W through 0 reduces to the point corresponding to C. Otherwise there would be an element in PH0 (S, OS (C)) intersecting C in at least n points contradicting C 2 = n−1. Therefore the map is an immersion and the image of W is a linear web. Trépreau’s Algebraization Theorem follows from Theorem 1.3.

3. EXCEPTIONAL PLANAR WEBS I: THE HISTORY The webs of maximal rank that are not algebraizable are usually called exceptional webs. Trépreau’s Theorem says that on dimension n ≥ 3 there are no exceptional codimension one k-webs for k ≥ 2n. The next three sections, including this one, discuss the planar case. On the first I will draw the general plot of the quest for exceptional webs on (C2 , 0) — as I have learned from [40, Chapitre 8] and references therein. The second will survey the methods to prove that a given web is exceptional while the third will be completely devoted to examples. 3.1. Blaschke’s approach to the algebraization of planar 5-webs In the five pages paper [5] the proof that all 5-webs on (C2 , 0) of maximal rank are algebraizable is sketched. Although wrong Blaschke’s paper turned out to be a rather influential piece of mathematics. For instance, the starting point of Bol’s proof of the Hauptsatz für Flächengewebe can be found there.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

254

J. V. PEREIRA

For a 5-web of maximal rank Blaschke defines a variation of the Poincaré map — the Poincaré-Blaschke map — as follows

PB : (C2 , 0) −→ G4 (P5 ) = Pˇ5 x

7→

Span Z1 (x), . . . , Z5 (x), Z1 0 (x), . . . , Z5 0 (x) ,

where Zi is defined as in §1.5 and Zi 0 makes sense since the image of the map Zi has dimension one. The fact that the spanned projective subspace has dimension 4 follows from a reasoning similar to the one presented in §1.5. The main mistake in loc. cit. is Satz 2 that, combined with a result of Darboux, implies that the image of PB is contained in a Veronese surface. If this is the case then it is indeed true that the 5-web is algebraizable. For a detailed proof of the latter statement, see [40, Proposition 8.4.6]. 3.2. Bol’s counter-example and Blaschke-Segre surfaces on P5 Blaschke’s mistake was pointed out by Bol in [8]. There he provided a counterexample by proving that the 5-web B5 had rank 6, see Figure 4. Besides 5 linearly independent obvious abelian relations coming from ä the hexagonal 3-subwebs he found P5 Ä log 1−ti log ti another one of the form i=1 + 1−ti dti = 0 , where t1 = xy , t2 = x+y−1 , ti y x(1−x) 1−y t3 = x−y 1−y , t4 = x and t5 = y(1−y) are rational functions defining B5 . The integration of this expression leads to Abel’s functional equation 5 X

Li2 (ti ) + Li2 (1 − ti ) = 0 ,

i=1

for Euler’s dilogarithm Li2 (z) =

X zn . n2

n≥1

Bol studies the image of the Poincaré-Blaschke map for B5 and shows that it is a germ of (transcendental) surface with the remarkable property: it is non-degenerated and has five families of curves such that the tangent spaces of S along each of these curves lie on a hyperplane of P5 that depends just on the curve. To make the further reference easier let us adopt the (non-standard) terminology Blaschke-Segre surfaces to describe the surfaces with this property. The choice of terminology follows from the fact that the tangents of the curves in the five families must coincide with Segre’s principal directions of S. We recall that at a point p ∈ S (S non-degenerated and not contained in a Veronese surface) these are the five directions (multiplicities taken into account) determined by the tangent cones of the intersection of S with one of the five hyperplanes that intersects S in a tacnode (or worst singularity) at p. The relation between exceptional 5-webs and Blaschke-Segre surfaces was noticed by Bol. In his own words: “Im übrigen sieht man, daß die Bestimmung von allen

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

255

Figure 4. Bol’s Exceptional 5-web B5 is the web induced by four pencils of lines with base points in general position and a pencil of conics through these four base points. It is the unique non-linearizable web for which all its 3-subwebs are hexagonal. For almost 70 years it remained the only known example of non-algebraizable 5-web of maximal rank.

Fünfgeweben höchsten Ranges hinausläuft auf die Angabe aller Flächen mit Segreschen Kurvenscharen, und umgekehrt; ( . . . ) ”, in [8, pp. 392–393] The beautiful underlying geometry of the Blaschke-Segre surfaces caught the eyes of some Italian geometers including Bompiani, Buzano and Terracini. In the first lines of [9] it is remarked that the exceptional 5-webs give rise to Blaschke-Segre surfaces echoing the above quote by Bol. Buzano and Terracini pursued the task of determining/classifying other germs of Blaschke-Segre surfaces in [48, 10]. Their approach was mainly analytic and quickly led to the study of certain non-linear system of PDEs. They were able to classify, under rather strong geometric assumptions on the families of curves, some classes of Blaschke-Segre surfaces. At the end they obtained a small number of previously unknown examples. Apparently, the determination of the rank of the naturally associated 5-webs was not pursued at that time, cf. [6, page 261]. Buzano pointed out that two of his Blaschke-Segre surfaces induced quite remarkable 5-webs: both are of the form W (x, y, x + y, x − y, f (x, y)) and, moreover, the 3-subwebs W (x, y, f (x, y)) and W (x + y, x − y, f (x, y)) are hexagonal. The complete classification of 5-webs with these properties is carried out in [11]. Nevertheless he did not wonder whether the obtained 5-webs come from Blaschke-Segre surfaces or if they are of maximal rank. After the 1940’s the study of webs of maximal rank seemed to be forgotten until the late seventies when Chern and Griffiths — apparently motivated by Griffiths’ project aiming at the understanding of rational equivalence of cycles in algebraic varieties — pursued the task of extending Bol’s Theorem for dimensions greater than three, cf. §1.6.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

256

J. V. PEREIRA

In a number of different opportunities Chern emphasized that a better understanding of the exceptional planar 5-webs, or more generally of the exceptional webs, should be pursued. For instance, after a quick browsing of the papers by Chern on web geometry and Blaschke’s work one collects the following quotes (see also [12, Unsolved Problems], [14, Problem 6]): – “At this low-dimensional level an important unsolved problem is whether there are other 5-webs of rank 6, besides algebraic ones and Bol’s example.”, [13]. – “In general, the determination of all webs of maximum rank will remain a fundamental problem in web geometry and the non-algebraic ones, if there are any, will be most interesting.”, [14]. – “ ( . . . ) we cannot refrain from mentioning what we consider to be the fundamental problem on the subject, which is to determine the maximum rank nonlinearizable webs. The strong conditions must imply that there are not many. It may not be unreasonable to compare the situation with the exceptional simple Lie groups.”, [17]. Chern’s insistence can be easily justified. The exceptional planar webs are, in a certain sense, generalizations of algebraic plane curves and a better understanding of these objects is highly desirable. The questions of Chern had to wait around 20 years to receive a first answer. In [30], Hénaut recognizes that 9-web induced by the rational functions figuring in Spence-Kummer 9-terms functional equation for the trilogarithm as a good candidate for exceptionality. In 2002, Pirio and Robert independently settled that this 9-web is indeed exceptional. In [25] Griffiths suggests that exceptionality is in strict relation with the polylogarithms. In particular he asks if all the exceptional webs are somehow related to functional equations for polylogarithms. In view of all these questions, it was a surprise when Pirio showed that

W (x, y, x + y, x − y, x2 + y2 ) is an exceptional 5-web and its space of abelian relations is generated by the elementary polynomial identities (cf. [41] and also [40]) (x2 + y 2 ) 2

2 2

= x2 + y 2 4

0 4

4

4

4x + 4y + (x + y) + (x − y)

6(x + y )

=

10(x2 + y 2 )3

= 8x6 + 8y 6 + (x + y)6 − (x − y)6

= x − y − (x − y)

0 = 0

(x − y)2 + (x + y)2 − 2x2 − 2y 2

= x + y − (x + y).

In loc. cit. other exceptional webs are determined, e.g. W (x, y, x + y, x − y, xy) and W (x, y, x + y, x − y, x2 + y2 , xy). In section §5 most of the exceptional webs found by Pirio, Robert and others are described.

ASTÉRISQUE 317

(974)

257

ALGEBRAIZATION OF CODIMENSION ONE WEBS

Figure 5. Three of the new examples of exceptional webs found by Pirio. The 6-web in the middle is the superposition of the other two 5-webs.

4. EXCEPTIONAL PLANAR WEBS II: THE METHODS To put in evidence the exceptionality of a k-web on (C2 , 0) one has to check that the web is non-linearizable and that it has maximal rank. Here I will briefly survey some of the methods to deal with both problems. 4.1. Linearization conditions for planar webs If W = F 1 · · · F k is a k-web on (C2 , 0) and the foliations F i are induced by ∂ ∂ + pi (x, y) ∂y then there exists an unique polynomial vector fields Xi = ∂x P W (x, y, p) = l1 (x, y)pk−1 + l2 (x, y)pk−2 + · · · + lk (x, y) in C{x, y}[p] of degree at most (k − 1) such that Xi (pi ) = P W (x, y, pi (x, y)) for every i ∈ {1, . . . , k}.

∂pi ∂x

i + pi ∂p = ∂y

One can verify that the leaves of the web W can be presented as the graphs of the solutions of y 00 = P W (x, y, y 0 ) . In [28] (see also [6, §29]) it is proven that a k-web W is linearizable if, and only if, there exists a local change of the coordinates (x, y) that simultaneously linearizes all the solutions of the second order differential equation above. A classical result of Liouville says that this is the case if, and only if, (a) degp P W ≤ 3; and (b) the coefficients (lk , lk−1 , lk−2 , lk−3 ) satisfy a certain (explicit) system of differential equations, cf. [28] for details. Notice that all the computations involved can be explicitly carried out. Moreover, if the web is given in implicit form F (x, y, y 0 ) then the polynomial P W can also be explicitly computed from the coefficients of F , see [45, Chapitre 2]. For our purposes, a particularly useful consequence of this criterium is the following corollary [28], [6, p. 247]: If W is a k-web on (C2 , 0) with k ≥ 4 then, modulo projective transformations, W admits at most one linearization.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

258

J. V. PEREIRA

As a side remark we mention a related result due to Nakai [38, Theorem 2.1.3]: if W C and W C 0 are two algebraic webs associated to irreducible curves on Pn of degree at least n + 2 then every orientation preserving homeomorphisms of Pˇn conjugating W C and W C 0 is an automorphism of Pn . An amusing corollary is in Nakai’s own words: “the complex structure of a line bundle L → C on a Riemann surface is determined by the topological structure of a net of effective divisors determining L.” There are other criteria for linearizability of d-webs, d ≥ 4, cf. [3]. Concerning the linearization of planar 3-webs there is Gronwall’s conjecture: a non-algebraizable 3-web on (C2 , 0) admits at most one linearization. Bol proved that the number of linearizations is at most 16. In [26] an approach suggested by Akivis to obtain relative differential invariants characterizing the linearization of 3-webs is followed. The authors succeeded in reducing Bol’s bound to 15. Similar results have been recently reobtained in [23]. 4.2. Detecting the maximality of the rank The methods to check the maximality of the rank can be naturally divided into two types. The ones of the first type — Methods 1, 2 and 3 below — aim at the determination of the space of abelian relations. Methods 4, 5 and 6 do not determine the abelian relations explicitly but in turn characterize the webs of maximal rank by the vanishing of certain algebraic functions on the data (and their derivatives) defining it. These characterizations can be interpreted as generalizations of the equivalence (2) ⇐⇒ (3) in Theorem 1.1. 4.2.1. Method 1: differential elimination (Abel’s method). — If a k-web W = W (u1 , . . . , uk ) is defined by germs of submersions ui : (C2 , 0) → (C, 0) then the determination of A ( W ) is equivalent to finding the germs of functions f1 , . . . , fk : (C, 0) → (C, 0) satisfying f1 (u1 ) + f2 (u2 ) + · · · + fk (uk ) = 0. Abel, in his first published paper — Méthode générale pour trouver des fonctions d’une seule quantité variable lorsqu’une propriété de ces fonctions est exprimée par une équation entre deux variables [1] — furnished an algorithmic solution to it. The key idea consists in eliminating the dependence in the functions u2 , . . . , uk by means of successive differentiations in order to obtain a linear differential equation of the form (l)

(l−1)

f1 (u1 ) + cl−1 (u1 )f1

(u1 ) + · · · + c0 (u1 )f1 (u1 ) = 0

satisfied by the f1 . The coefficients ci are expressed as rational functions of u1 , u2 , . . . , uk and their derivatives. After solving this linear differential equation

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

259

and the similar ones for f2 , . . . , fk the determination of the abelian relations reduces to plain linear algebra. Abel’s method has been revisited by Pirio — cf. [40, Chapitre 2], [42] — and after implementing it he was able to determine the rank of a number of planar webs including the ones induced by the Blaschke-Segre surfaces found by Buzano and Terracini. They all turned out to be exceptional. Notice that the computations involved tend to be rather lengthy and this, perhaps, explains why the use of such method to determine new exceptional webs had to wait until 2002. 4.2.2. Method 2: polylogarithmic functional relations. — Another approach to determine some of the abelian relations of a given particular web was proposed by Robert in [47]. Instead of looking for all possible abelian relations he aims at the ones involving polylogarithms. He uses a variant of a criterium due to Zagier [51] that reduces the problem to linear algebra. In contrast with Abel’s method this one has a narrower scope but tends to be more efficient since it bypasses the solution of differential equations. More precisely, if u1 , . . . , uk ∈ C(x, y) are rational functions on C2 and U ⊂ C2 is a suitably chosen open subset then the existence of abelian relations of the form k X

λi Lir (ui ) +

i=1

k X r−1 X

Pi,l (log ui )Lir−l (ui ) = 0 ,

i=1 l=1

with Pi,j ∈ C[x, y] and λi ∈ C, is equivalent to the symmetry of the tensor k X i=1

in

r O

ÇÅ λi

dui ui

ã⊗k−1

dui ⊗ 1 − ui

å .

Ω1 (U ), cf. [47, Théorème 1.3].

C

4.2.3. Method 3: Abelian relations in the presence of automorphisms. — Let W = F 1 · · · F k denote a k-web in (C2 , 0) which admits an infinitesimal automorphism X, regular and transverse to the foliations F i in a neighborhood of the origin. Clearly the Lie derivative of LX acts on A ( W ) and an analysis of such action allows one to infer that the abelian relations of W can be written in the form, cf. [36, Proposition 3.1], P1 (u1 ) eλi u1 du1 + · · · + Pk (uk ) eλi uk duk = 0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

260

J. V. PEREIRA

where P1 , . . . , Pk are polynomials of degree less than or equal to the size of the i-th R i . Jordan block of LX : A ( W ) , λi are the eigenvalues and ui = ωiω(X) The rank of the web W F X obtained from W by superposing the foliation induced by X is related to the rank of W [36, Theorem 1] by the formula rk( W F X ) = rk( W ) + (k − 1) . In particular, W is of maximal rank if, and only if, W F X is also of maximal rank. Once one realizes that the Lie derivative LX induces linear operators on A ( W ) and A ( W F X ) then the proof of this result boils down to linear algebra. 4.2.4. Method 4: Pantazi’s Method. — In [39], Pantazi explains a method to determine the rank of a k-web defined by k holomorphic 1-forms ω1 , . . . , ωk . He introduced N = (k − 1)(k − 2)/2 expressions — algebraically and explicitly constructed from the coefficients of the ωi and their derivatives — which are identically zero if, and only if, the web is of maximal rank. Building on Pantazi’s method Mihăileanu obtains in [37] a necessary condition for the maximality of the rank: the sum of the curvatures of all 3-subwebs of W must vanish. 4.2.5. Method 5: the implicit approach (Hénaut’s Method [32]). — If W is a regular k-web defined on (C2 , 0) by an implicit differential equation f (x, y, y 0 ) of degree k on y 0 then the contact 1-form dy − pdx on (C2 , 0) × C defines a foliation F W on the surface S cut out by f (x, y, p) such that π∗ F = W , with π : S → (C2 , 0) being the natural projection. On this implicit framework the abelian relations of W can be interpreted as 1-forms η = b3 pd−3 + · · · + bd · dy−pdx ∈ π∗ Ω0S which are closed. It follows that there exists ∂f ∂p

a linear system of differential equations M W with space of solutions isomorphic to A ( W ). The system M W is completely determined by f . Using Cartan-Spencer theory, Hénaut builds a rank N = (k − 1)(k − 2)/2 vector k−2 bundle E contained in the jet bundle Jk−2 ( O ) and a holomorphic connection ∇ : E → E ⊗ Ω1 such that the local system of solutions of ∇ is naturally isomorphic to M W . It follows that W has maximal rank if, and only if, the curvature form of ∇ is identically zero. Although not explicit in principle, this construction has been untangled by Ripoll, who implemented in a symbolic computation system the curvature matrix determination for 3, 4 and 5-webs, cf. [45]. An interpretation for the induced connection (det E, det ∇) is provided by [45, Théorème 5.2] when k ≤ 6 and in [33, p. 281],[46] for arbitrary k. After multiplying

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

261

f by a suitable unit there exists a connection isomorphism Ö (det E, det ∇) '

(d3) O k=1

Lk ,

(d3) O

è ∇k

k=1

where (Lk , ∇k ) are (suitably chosen) connections of all 3-subwebs of W . As a corollary they reobtain Mihăileanu necessary condition for the rank maximality. An extensive study of the connection ∇ and its invariants remains to be done. For a number of interesting questions and perspectives, see [33]. Here I will just point out that due to their complementary nature it would be interesting to clarify the relation between Pantazi’s and Hénaut’s method. 4.2.6. Method 6: Goldberg-Lychagin’s Method. — A variant of the previous two methods has been proposed in [22]. The equations imposing the maximality of the rank are expressed in terms of relative differential invariants of the web.

5. EXCEPTIONAL PLANAR WEBS III: THE EXAMPLES In this section, I will briefly describe new exceptional webs that have come to light since 2002. The list below is not extensive. To the best of my knowledge all the other new examples available in the literature can be found in [40] and [36]. The non-linearizability of all the examples below can be inferred from the fact they are non-linear webs but contain a linear k-subweb with k ≥ 4, see §4.1.

5.1. Polylogarithmics webs If Li3 (z) = for it is

P zn n3

is the trilogarithm then the Spence-Kummer functional equation

Å ã Å ã Å ã x 1−x x(1 − y) 2Li3 (x) + 2Li3 (y) − Li3 + 2Li3 + 2Li3 y 1−y y(1 − x) Å ã Å ã Å ã x(1 − y) 1−y x(1 − y)2 − Li3 (xy) + 2Li3 − + 2Li3 − − Li3 (1 − x) y(1 − x) y(1 − x)2 Å ã 2 1−y π 1 = 2Li3 (1) − log(y)2 log + log(y) + log(y)3 . 1−x 3 3

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

262

J. V. PEREIRA

The naturally associated 9-web, after the change (x, y) 7→ 

Ä

1+x 1+y x , y

ä , is 

  B6   }| { z    x 1+x x 1 + x y(1 + x) (1 + x)(1 + y) x(1 + x)    , W SK = W  , , x, y, , , , . 1 + y y y 1 + y x(1 + y) xy y(1 + y)    | {z }   B5   {z } | B7

W SK was recognized as a good candidate for exceptionality in [30]. It was later shown to be exceptional by two different methods. Robert apparently developed method 2 for this purpose and Pirio used Abel’s method. The subweb B5 is clearly an isomorphic copy of Bol’s 5-web. The subwebs B6 and B7 (see displayed equation) are also exceptional. Notice that B5 ⊂ B6 ⊂ B7 ⊂ W SK . Due to the rich automorphism group of W SK one can easily recognize other subwebs isomorphic to B5 , B6 and B7 contained in W SK . Besides these there are one exceptional 5-subweb ([40, Théorème 7.2.5]) and one exceptional 6-subweb ([40, Théorème 7.2.5], [47, §3.2]) of W SK that are non-isomorphic to B5 and B6 respectively. Robert has also determined an exceptional 8-web B8 containing B7 but not isomorphic to any 8-subweb of W SK . It is obtained from B7 by adding the pencil of lines 2x−1 2y−1 , [47, Théorème 3.1].

Figure 6. The configuration in the left naturally induces W induces a 1-parameter family of exceptional webs.

SK

while the one in the middle

W SK admits a description analogous to Bol’s 5-web. If one considers the configuration of six points on P2 schematically represented in the left of Figure 6 then W SK is formed by the six pencils of lines through the points and three pencils of conics through any four of the six points that are in general position. If one considers exactly the same construction using the other two configurations of five points represented in Figure 6 then the configuration in the middle induces a 1-parameter family of 8-webs while the one in the right induces a 2-parameters family of 10-webs. The first turns

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

263

out to be a family of exceptional 8-webs, cf. [40, Théorème 7.3.1]. The second remains a good candidate for a family of exceptional 10-webs since all the members satisfy Mihăileanu necessary condition for the rank maximality. All the other possible configurations of five points on P2 induce exceptional webs. On the other hand, see [40, p. 182], the web associated to a generic configuration of 6 points on P2 does not satisfy Mihăileanu condition and therefore is not exceptional. Webs naturally associated to Kummer’s equations for the tetralogarithm and the pentalogarithm have also been studied in [40, Chapitre 7]. They do not satisfy Mihăileanu condition and therefore are not exceptional. Nevertheless they do contain some previously unknown exceptional 5 and 6-subwebs. 5.2. Quasi-parallel webs In [41] a number of 5-webs on (C2 , 0) have been determined with the help of Abel’s method. They are all of the form W (x, y, x + y, x − y, u(x, y)) for some germ of holomorphic function u(x, y) = v(x) + w(y). Later in [43] the classification of the 5-webs of this particular form was pursued. At the end they obtained that all 5-webs on (C2 , 0) of the form W [v(x) + w(y)] = W (x, y, z + y, x − y, v(x) + w(y)) are equivalent to one of the following (a) (d) (f )k

W [log(sin(x) sin(y))] (b) W [x2 − y 2 ] (c) W [x2 + y 2 ] W [log(tanh(x) tanh(y))] (e) W [exp(x) + exp(y)] W [log(snk (x)snk (y))]

with snk being the Jacobi’s elliptic functions of module k ∈ C \ {−1, 0, 1}. The webs (a), (b), (c), (d) and (e) can all be interpreted as limits of the webs (f )k under suitable renormalizations. The abelian relations are either polynomial ones or follow from well-known identities involving theta functions and classical functions. Notice that all 3-webs of the form W (x, y, v(x)+w(y)) are hexagonal. In the course of the classification it is proved that the maximality of the rank of W [v(x) + w(y)] implies that the 3-subweb W (x + y, x − y, v(x) + w(y)) is hexagonal. Coincidentally this reduces the problem to the one considered in [11]. 5.3. Webs admitting infinitesimal automorphisms Method 3 implies that every reduced degree k curve C ⊂ P2 left invariant by a C∗ -action induces, on the dual projective plane, an exceptional (k + 1)-web formed by the superposition of W C and the orbits of the dual C∗ -action [36].

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

264

J. V. PEREIRA

If one considers the curves cut out by polynomials of the form bk/2c

Y

xy − λi z 2 ,

λi 6= λj ∈ C∗ ,

i=1

then it follows that for every k ≥ 5 there exists a family of dimension at least bk/2c−1 of pairwise non-equivalent exceptional global k-webs on P2 .

6. WEBS OF ARBITRARY CODIMENSION There are a number of works dealing with webs of arbitrary codimension and their abelian relations. In the next few lines I will try to briefly review some of the most recent advances. Although, even more than in the previous paragraphs, I do not aim at completeness and, probably, a number of important omissions are made. A k-web W = F 1 · · · F k of codimension r on (Cn , 0) is a collection of k foliations of codimension r such that the tangent spaces T0 F 1 , . . . , T0 F k are in general position, i.e., the intersection of any number m of these subspaces has the minimal possible dimension while the union has the maximal possible dimension. For every non-negative integer ` ≤ r one can define the space of degree ` abelian relations of W in terms of closed `-forms vanishing along the leaves of the defining foliations. If V is a reduced non-degenerated(5) subvariety of Pn+r−1 of degree k and dimension r and Π is a generic (n − 1)-plan then, analogously to the case of curves, V induces a k-web W V on (Gn−1 (Pn+r−1 ), Π), where Gn−1 (Pn+r−1 ) is the Grassmanian of (n − 1) planes on Pn+r−1 . Using a natural affine chart around Π one sees that (Gn−1 (Pn+r−1 ), Π) ∼ = (Cnr , 0) and that W V is equivalent to a k-web of codimension r on (Cnr , 0) with linear leaves. The k-webs of codimension r on (Cnr , 0) are denoted by W k (n, r). In [16] bounds for the dimension of the space of degree r abelian relations for webs W k (n, r) are obtained. These bounds are attained by webs W V where V is an extremal subvariety of Pn+r−1 in the sense that the dimension of H0 (V, ωV ) is maximal among the non-degenerated varieties of same degree and codimension. Recently Hénaut provided sharp bounds for the `-rank of webs W k (n, r) for every ` ≤ r, cf. [31]. In view of the algebraization results for codimension one webs one is naturally led to wonder if the W k (n, r) of maximal rank are algebraizable when k is sufficiently (5)

In a similar sense to the one used for curves, cf. §1.3.

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

265

large. Algebraization results for the W k (2, r) of maximal r-rank have been obtained by [21] (r = 2) and [29] (every r ≥ 2). For ` < r or r ≥ 2 and n ≥ 3, the characterization of the W k (n, r) of maximal `-rank seems to be open. The study of webs which have codimension not dividing the dimension of the ambient space also leads to beautiful geometry. A prototypal result in this direction is Blaschke-Walberer Theorem [6, §35–36] for 3-webs by curves on (C3 , 0) of maximum 1-rank (proven by Blaschke to be 5). It says that these 3-webs can be obtained from cubic hypersurfaces on P4 by means of an algebraic correspondence. Concerning webs by curves there are also some interesting results by Damiano. He provided a bound for the (n − 1)-rank of a web by curves on (Cn , 0) [19, Proposition 2.4], found generalizations of Bol’s exceptional web B5 to non-linearizable (n+3)-webs by curves on Cn of maximum (n − 1)-rank [19, Theorem 5.5] and linked the abelian relations of these webs to the Gabrielov-Gelfand-Losik work on the first Pontrjagin class of a manifold, cf. [35]. I cannot find a better way to close this survey than recalling a few more words of Chern [12] about web geometry: ( . . . ) the subject is a wide generalization of the geometry of projective algebraic varieties. Just as intrinsic algebraic varieties are generalized to Kähler manifolds and complex manifolds, such a generalization to web geometry seems justifiable.

REFERENCES [1] N. Abel – “Méthode générale pour trouver des fonctions d’une seule quantité variable lorsqu’une propriété de ces fonctions est exprimée par une équation entre deux variables”, in Œuvres complètes de N. H. Abel, tome 1, Grøndhal & Son, 1981, p. 1–10. [2] M. A. Akivis & V. Goldberg – “Differential geometry of webs”, in Handbook of differential geometry, Vol. I, North-Holland, 2000, p. 1–152. [3] M. A. Akivis, V. Goldberg & V. Lychagin – “Linearizability of d-webs, d ≥ 4, on two-dimensional manifolds”, Selecta Math. (N.S.) 10 (2004), p. 431– 451. [4] A. Beauville – “Géométrie des tissus [d’après S. S. Chern et P. A. Griffiths]”, in Séminaire Bourbaki (1978/79), exp. no 531, Lecture Notes in Math., vol. 770, Springer, 1980, p. 103–119. [5] W. Blaschke – “Über die Tangenten einer ebenen Kurve fünfter Klasse”, Abh. Math. Semin. Hamb. Univ. 9 (1933), p. 313–317.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

266

J. V. PEREIRA

[6] W. Blaschke & G. Bol – “Geometrie der Gewebe”, Die Grundlehren der Math., vol. 49, Springer, 1938. [7] G. Bol – “Flächengewebe im dreidimensionalen Raum”, Abh. Math. Semin. Hamb. Univ. 10 (1934), p. 119–133. [8] , “Über ein bemerkenswertes Fünfgewebe in der Ebene”, Abh. Math. Semin. Hamb. Univ. 11 (1936), p. 387–393. [9] E. Bompiani & E. di Bortolotti – “Ricerche sulle superficie dello spazio a cinque dimensioni e nuove caratterizzazioni della superficie di Veronese”, Math. Z. 42 (1937), p. 411–429. [10] P. Buzano – “Determinazione e studio di superficie di S5 le cui linee principali presentano una notevole particolarità”, Ann. Mat. Pura Appl. 18 (1939), p. 51– 76. [11] , “Tipi notevoli di 5-tessuti di curve piane”, Boll. Unione Mat. Ital. 1 (1939), p. 7–11. [12] S. S. Chern – “Web geometry”, Bull. Amer. Math. Soc. (N.S.) 6 (1982), p. 1–8. [13] , “Geometrie der gewebe”, in Wilhelm Blaschke Gesammelte Werke. Band 5, Thales-Verlag, 1985, p. 25–27. [14] , “The mathematical works of Wilhelm Blaschke — an update”, in Wilhelm Blaschke Gesammelte Werke. Band 5, Thales-Verlag, 1985, p. 21–23. [15] S. S. Chern & P. Griffiths – “Abel’s theorem and webs”, Jahresber. Deutsch. Math.-Verein. 80 (1978), p. 13–110. , “An inequality for the rank of a web and webs of maximum rank”, Ann. [16] Scuola Norm. Sup. Pisa Cl. Sci. 5 (1978), p. 539–557. , “Corrections and addenda to our paper: “Abel’s theorem and webs””, [17] Jahresber. Deutsch. Math.-Verein. 83 (1981), p. 78–83. [18] L. Chiantini & C. Ciliberto – “Weakly defective varieties”, Trans. Amer. Math. Soc. 354 (2002), p. 151–178. [19] D. B. Damiano – “Webs and characteristic forms of Grassmann manifolds”, Amer. J. Math. 105 (1983), p. 1325–1345. [20] F. Enriques – “Una questione sulla linearità dei sistemi di curve appartenenti ad una superficie algebrica”, Rend. Acc. Lincei (1893), p. 3–8. [21] V. Goldberg – “Rank problems for webs W (d, 2, r)”, in Differential geometry and its applications (Eger, 1989), Colloq. Math. Soc. János Bolyai, vol. 56, NorthHolland, 1992, p. 317–357. [22] V. Goldberg & V. Lychagin – “Abelian equations and rank problems for planar webs”, preprint arXiv:math.DG/0605124, 2006. , “On the Blaschke conjecture for 3-webs”, J. Geom. Anal. 16 (2006), [23] p. 69–115.

ASTÉRISQUE 317

(974)

ALGEBRAIZATION OF CODIMENSION ONE WEBS

267

[24] P. Griffiths – “Variations on a theorem of Abel”, Invent. Math. 35 (1976), p. 321–390. [25]

, “The legacy of Abel in algebraic geometry”, in The legacy of Niels Henrik Abel, Springer, 2004, p. 179–205.

[26] J. Grifone, Z. Muzsnay & J. Saab – “On the linearizability of 3-webs”, in Proceedings of the Third World Congress of Nonlinear Analysts, Part 4 (Catania, 2000), vol. 47, 2001, p. 2643–2654. [27] J. Grifone & E. Salem (eds.) – Web theory and related topics, World Scientific Publishing Co. Inc., 2001, papers from the Conference on Webs held in Toulouse, December 1996. [28] A. Hénaut – “Sur la linéarisation des tissus de C2 ”, Topology 32 (1993), p. 531– 542. [29]

, “Sur l’algébrisation des tissus de codimension n de C2n ”, Ann. Sci. École Norm. Sup. 31 (1998), p. 131–143.

[30]

, “Analytic web geometry”, in Web theory and related topics (Toulouse, 1996), World Sci. Publ., River Edge, NJ, 2001, p. 6–47.

[31]

, “Formes différentielles abéliennes, bornes de Castelnuovo et géométrie des tissus”, Comment. Math. Helv. 79 (2004), p. 25–57.

[32]

, “On planar web geometry through abelian relations and connections”, Ann. of Math. 159 (2004), p. 425–445.

[33]

, “Planar web geometry through abelian relations and singularities”, in Inspired by S. S. Chern, Nankai Tracts Math., vol. 11, World Sci. Publ., Hackensack, NJ, 2006, p. 269–295.

[34] G. Henkin & M. Passare – “Abelian differentials on singular varieties and variations on a theorem of Lie-Griffiths”, Invent. Math. 135 (1999), p. 297–328. [35] R. MacPherson – “The combinatorial formula of Gabrielov, Gel0 fand and Losik for the first Pontrjagin class”, in Séminaire Bourbaki (1976/77), exp. no 497, Lecture Notes in Math., vol. 677, Springer, 1978, p. 105–124. [36] D. Marín, J. V. Pereira & L. Pirio – “On planar webs with infinitesimal automorphisms”, in Inspired by S. S. Chern, Nankai Tracts Math., vol. 11, World Sci. Publ., Hackensack, NJ, 2006, p. 351–364. [37] N. N. Mihăileanu – “Sur les tissus plans de première espèce”, Bull. Math. Soc. Roumaine Sci. 43 (1941), p. 23–26. [38] I. Nakai – “Topology of complex webs of codimension one and geometry of projective space curves”, Topology 26 (1987), p. 475–504. [39] A. Pantazi – “Sur la détermination du rang d’un tissu plan”, C. R. Acad. Sc. Roumanie 4 (1940), p. 108–111.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

268

J. V. PEREIRA

[40] L. Pirio – “Équations fonctionnelles abéliennes et géométrie des tissus”, Ph.D. Thesis, Université Paris VI, 2004. [41]

, “Sur les tissus plans de rang maximal et le problème de Chern”, C. R. Math. Acad. Sci. Paris 339 (2004), p. 131–136.

[42]

, “Abelian functional equations, planar web geometry and polylogarithms”, Selecta Math. (N.S.) 11 (2005), p. 453–489.

[43] L. Pirio & J.-M. Trépreau – “Tissus plans exceptionnels et fonctions thêta”, Ann. Inst. Fourier (Grenoble) 55 (2005), p. 2209–2237. [44] O. Ripoll – “Détermination du rang des tissus du plan et autres invariants géométriques”, C. R. Math. Acad. Sci. Paris 341 (2005), p. 247–252. [45]

, “Géométrie des tissus du plan et équations différentielles”, Ph.D. Thesis, Université de Bordeaux I, 2005.

[46]

, “Properties of the connection associated with planar webs and applications”, preprint arXiv:math.DG/0702321, 2007.

[47] G. Robert – “Relations fonctionnelles polylogarithmiques et tissus plans”, 2002, preprint 146, Université de Bordeaux I. [48] A. Terracini – “Su una possibile particolarità delle linee principali di una superficie. I i II”, Atti Accad. Naz. Lincei 26 (1937), p. 84–91, 153–158. [49] J.-M. Trépreau – “Algébrisation des tissus de codimension 1. La généralisation d’un théorème de Bol”, in Inspired by S. S. Chern, Nankai Tracts Math., vol. 11, World Sci. Publ., Hackensack, NJ, 2006, p. 399–433. [50] W. Wirtinger – “Lies Translationsmannigfaltigkeiten und Abelsche Integrale”, Monatsh. Math. Phys. 46 (1938), p. 384–431. [51] D. Zagier – “Polylogarithms, Dedekind zeta functions and the algebraic Ktheory of fields”, in Arithmetic algebraic geometry (Texel, 1989), Progr. Math., vol. 89, Birkhäuser, 1991, p. 391–430.

Jorge Vitório PEREIRA IMPA Instituto de Matemática Pura e Aplicada Estrada Dona Castorina, 110 – Jardim Botânico 22460-320 Rio de Janeiro RJ Brasil E-mail : [email protected]

ASTÉRISQUE 317

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 (975) Propriétés qualitatives des solutions des équations de Hamilton-Jacobi Jean-Michel ROQUEJOFFRE

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 975, p. 269 à 293

Mars 2007

PROPRIÉTÉS QUALITATIVES DES SOLUTIONS DES ÉQUATIONS DE HAMILTON-JACOBI [d’après A. Fathi, A. Siconolfi, P. Bernard] par Jean-Michel ROQUEJOFFRE

Soit TN = RN /ZN le tore unité de RN , et soit (x, p) ∈ TN × RN 7→ H(x, p) ∈ R une fonction de classe C ∞ , uniformément strictement convexe en sa seconde variable, i.e. il existe α > 0 tel que l’inégalité suivante (1)

Hpp (x, p) ≥ αI

soit vraie au sens des formes quadratiques. Cette fonction H sera dans tout l’exposé désignée sous le nom de « hamiltonien ». Considérons l’équation de Hamilton-Jacobi (2)

ut + H(x, Du) = 0 (t > 0, x ∈ TN )

où Du = (∂x1 u, ..., ∂xN u). On s’intéresse d’abord au problème de Cauchy pour (2), c’est-à-dire qu’on complète (2) par la donnée initiale (3)

u(0, x) = u0 (x)

où u0 est continue sur TN . On s’intéresse ensuite à une version stationnaire de (2), à savoir l’équation (4)

H(x, Du) = c,

x ∈ TN .

Il est bien connu que, pour une donnée initiale u0 régulière sur TN , le problème de Cauchy (2)-(3) admet une solution régulière locale, à savoir qu’il existe t(u0 ) > 0 tel que l’équation (2) admette une solution u(t, x) de classe C 1 sur [0, t(u0 )]×TN vérifiant u(0, .) = u0 . Toutefois, cette solution n’est pas globale : il est en général impossible de la prolonger jusqu’à t = +∞. D’autre part, si nous relâchons la contrainte : u de classe C 1 sur R+ × TN , pour la remplacer par : u lipschitzienne sur R+ × TN – et donc (2)-(3) a lieu presque partout, il y a en général plusieurs solutions globales. Voir par exemple [18] pour ces questions. Une question naturelle est donc de savoir si un critère supplémentaire moins contraignant que la régularité C 1 , mais plus fort que la régularité Lipschitz, permet de sélectionner une unique solution globale au problème de Cauchy.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

270

J.-M. ROQUEJOFFRE

Ces considérations ont motivé l’introduction par Crandall et Lions [10], au début des années 1980, des solutions de viscosité. Cette notion permet de sélectionner, parmi toutes les solutions de (2), « celle qui a un sens physique » – avec toutes les ambiguïtés que peut comporter un tel vocable ! La théorie des solutions de viscosité a par la suite connu des développements spectaculaires, dépassant très largement le cadre des équations de Hamilton-Jacobi du type (2) : citons, sans prétendre à l’exhaustivité, les équations de Hamilton-Jacobi-Bellman du premier ordre avec leurs applications en contrôle optimal et en finance, les équations elliptiques et paraboliques du second ordre, les équations géométriques (eikonales, courbure moyenne...), l’homogénéisation ; en parallèle avec ces développements théoriques, des méthodes nouvelles d’approximation numérique pour ces problèmes sont apparues, liées aux applications. Faire ici un panorama exhaustif de tous ces développements serait absolument vain ; c’est pourquoi nous nous contentons de mentionner les ouvrages de Barles [1] et Lions [18] pour les équations du premier ordre, la monographie de Caffarelli-Cabré [7] pour les équations elliptiques du second ordre, et l’article de revue de Crandall-Ishii-Lions [9] pour un exposé des résultats principaux de la théorie des solutions de viscosité pour les équations du second ordre dégénérées. Revenons aux équations (2)-(3) et (4). La motivation de cet exposé est l’étude des propriétés qualitatives, principalement de régularité et d’unicité, des solutions de (2)(4) et (4). En effet, la théorie générale dit que les solutions de viscosité de (2)-(3) sont lipschitziennes, et il serait intéressant de connaître la régularité maximale, ou bien si la solution est plus régulière en certains endroits. D’autre part, si le problème de Cauchy admet une solution unique – c’est l’un des premiers résultats de la théorie de Crandall-Lions – le problème stationnaire n’a aucune raison d’admettre une solution unique ; on souhaite donc compter et classifier les solutions de (4). La solution de (2)-(3) admet une expression – presque – explicite (formule de LaxOleinik). A la fin des années 1990, A. Fathi, dans quatre notes aux Comptes Rendus de l’Académie des Sciences [12], [11], [13], [14], a montré comment l’exploitation systématique de cette formule, combinée à des idées empruntées à la théorie de Mather – voir, par exemple, [20] – pouvait jeter un éclairage nouveau sur les propriétés qualitatives de (2)-(3) et (4). Les idées présentes dans ces quatre notes ont été développées dans [15], et aboutissent à l’important théorème d’existence de sous-solutions critiques C 1 , présenté dans Fathi-Siconolfi [16]. Ce résultat permet de comprendre comment s’organisent les solutions de (4), et a des conséquences sur la dynamique des solutions du système hamiltonien sous-jacent. Les travaux de Fathi ont eu d’importantes applications à une classe de problèmes d’optimisation appelée « transport optimal ». Utilisant les idées de Fathi, B. Buffoni et P. Bernard [6], [5] ont donné une solution générale du problème de Monge, généralisant des travaux antérieurs de Evans-Gangbo, Caffarelli-Feldman-McCann,

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

271

Ambrosio... Toutefois, pour éviter que le texte ne prenne des proportions démesurées, ni ces applications, ni la théorie de Mather ne seront discutées ici. Cet exposé se veut une introduction, à peu près auto-contenue, au théorème de Fathi-Siconolfi et à son impact sur les propriétés qualitatives des équations de Hamilton-Jacobi. La première section de ce texte est une introduction aux solutions de viscosité, aboutissant à un théorème d’existence (Lions, Papanicolaou, Varardhan) pour (4). La deuxième section introduit la formule de Lax-Oleinik comme solution explicite du problème de Cauchy pour (2)-(3), et en dégage les principales propriétés. Ces deux premières sections ne sont en aucun cas originales ; leur seul mérite est de synthétiser en quelques pages deux types de résultats différents pour (2)-(3). La courte section 3 présente de façon très simple des propriétés de régularité C 1,1 , cruciales pour la suite. La section 4 analyse le théorème de Fathi-Siconolfi, et la section 5 en présente plusieurs applications et compléments : ensembles d’unicité pour l’équation stationnaire (4), existence de régions invariantes pour le système hamiltonien sous-jacent, régularité additionnelle. Remarque 0.1. — Dans tout l’exposé, on pourrait remplacer le tore TN par une variété riemanienne compacte sans bord. Toutefois ceci n’apporterait rien à la compréhension du texte et ne ferait qu’alourdir les calculs présentés. Je souhaite remercier ici P. Bernard, A. Fathi et A. Siconolfi pour de nombreuses discussions et leur patience vis-à-vis de mes diverses questions à la limite de la naïveté. Je tiens à adresser une mention spéciale à G. Barles, qui est à l’origine d’une grande partie de ce que je sais de la théorie des solutions de viscosité.

1. SOLUTIONS DE VISCOSITÉ Nous donnons dans cette section les notions de base sur les solutions de viscosité d’équations de Hamilton-Jacobi du premier ordre, et démontrons un résutat d’unicité typique de la théorie. Ce dernier permet d’arriver rapidement à la démonstration du théorème d’existence de solutions stationnaires de Lions-Papanicolaou-Varadhan, et des questions d’unicité qu’il soulève. 1.1. Généralités Nous commençons avec des équations plus générales que (2) ; nous restreindrons les hypothèses au fur et à mesure. Considérons le problème de Cauchy (5)

ut + F (x, u, Du) = 0 (t > 0, x ∈ TN ),

u(0, x) = u0 (x),

où F ∈ C(TN × R × RN , R), et où la donnée initiale u0 est continue sur TN .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

272

J.-M. ROQUEJOFFRE

Définition 1.1. — Nous dirons que u(t, x) ∈ C(R+ , TN ) est sous-solution de viscosité pour (5) si, pour toute fonction φ ∈ C 1 ((0, +∞) × TN ) et pour tout couple (t0 , x0 ) ∈ (0, +∞) × TN tel que (t0 , x0 ) soit un point de maximum pour u − φ, on a : (6)

φt (t0 , x0 ) + F (x0 , u(t0 , x0 ), Dφ(t0 , x0 )) ≤ 0.

Nous dirons que u(t, x) est sur-solution de viscosité pour (5) si, pour toute fonction φ ∈ C 1 ((0, +∞) × TN ) et pour tout couple (t0 , x0 ) ∈ (0, +∞) × TN tel que (t0 , x0 ) soit un point de minimum pour u − φ, on a : (7)

φt (t0 , x0 ) + F (x0 , u(t0 , x0 ), Dφ(t0 , x0 )) ≥ 0.

Nous dirons enfin que u(t, x) est solution de viscosité pour (5) si elle est à la fois sous- et sur-solution de viscosité pour (5). Remarque 1.2. — Une solution C 1 de (5) est solution de viscosité. Le maximum de deux sous-solutions de viscosité est solution de viscosité, le minimum de deux sursolutions de viscosité est sur-solution de viscosité. La définition 1.1 s’étend trivialement aux équations stationnaires du type F (x, u, Du) = 0 sur TN . Le lecteur peut à juste titre se demander si une définition apparemment aussi faible a un quelconque pouvoir sélectif. Il se trouve que oui, et nous donnons ci-après, sans démonstration, la liste des principales propriétés des solutions de viscosité de (5). 1. (Stabilité) Soit (Fn )n une suite de C(TN × R × RN , R), convergeant localement uniformément vers F ∈ C(TN × R × RN , R). Soit un une solution de viscosité de (5) avec F = Fn ; supposons la suite (un )n localement uniformément convergente vers u ∈ C(R+ , TN ). Alors u est solution de viscosité de (5). 2. Soit u une solution de viscosité de (5) localement lipschitzienne. Alors elle vérifie (5) presque partout. 3. (Principe du maximum) Supposons que le hamiltonien F (x, u, p) soit de la forme H(x, p), où H ∈ C(TN × RN ) vérifie la propriété suivante (dite de coercivité) : (8)

lim

|p|→+∞

H(x, p) = +∞,

uniformément en x ∈ TN .

Soient u10 ≤ u20 deux données initiales continues pour (5), et supposons que u10 (resp. u20 ) génère au moins une solution de viscosité u1 (resp. u2 ) pour (5). Alors u1 ≤ u2 . Ce principe du maximum est vrai pour des hamiltoniens plus généraux, mais c’est hors du propos de ces notes. 4. (Contraction faible) Toujours si le hamiltonien est de la forme F (x, u, p) = H(x, p) et sous l’hypothèse de coercivité (8), soient u10 ≤ u20 deux données initiales continues pour (5). Supposons que u10 (resp. u20 ) génère au moins une solution de viscosité u1 (resp. u2 ) pour (5). Alors ku1 (t, .) − u2 (t, .)k∞ ≤ ku10 − u20 k∞ .

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

273

La définition 1.1 a été introduite par Crandall et Lions dans leur article fondamental [10]. Nous notons au passage l’intérêt de la notion étudiée ici : la propriété (1) assure que l’on peut « passer à la limite » dans l’équation (5) dès lors que l’on dispose d’estimations uniformes sur le module de continuité des solutions (ce qui toutefois peut se révéler extrêmement difficile, voire parfois simplement impossible !) ; la propriété (3) assure l’unicité – à défaut d’assurer l’existence – au problème de Cauchy. Pourquoi l’appellation « solution de viscosité » ? Elle vient justement de cette préoccupation d’assurer la sélection d’une solution « physique » à (5). Une idée naturelle est de régulariser (5) par un terme du second ordre, de résoudre le problème d’apparence plus compliquée : (9)

ut + F (x, u, Du) = ε∆u (t > 0, x ∈ TN ),

u(0, x) = u0 (x),

et de chercher à passer à la limite ε → 0. Cette entreprise peut être menée à bien quand le hamiltonien F (x, u, p) est par exemple de la forme H(x, p), et on peut montrer que cette notion de solution assure une propriété d’unicité analogue à la propriété (3) ; voir [18] pour un historique. La notion (9) n’est toutefois pas intrinsèque – elle peut dépendre de la régularisation choisie – et il faut donc lui préférer la définition 1.1. Jusqu’à la fin de l’exposé, une « solution » de (2) ou (4) sera toujours entendue au sens de viscosité. Une problématique centrale de la théorie est celle de l’unicité. Donnons donc, pour terminer ce rapide tour d’horizon, le résultat d’unicité le plus simple, suivi de sa démonstration par la méthode du dédoublement de variables. Cette idée se retrouve dans pratiquement toutes les preuves d’unicité, bien entendu sous des formes plus ou moins élaborées. Proposition 1.3. — Supposons que le hamiltonien H soit continu en toutes ses variables, et vérifie la seule hypothèse de coercivité (8). Considérons l’équation (10)

H(x, Du) + u = 0

(x ∈ TN )

Soit u (resp. u) une sous- (resp. sur-) solution de viscosité pour (2). Alors u ≤ u. Preuve. — Supposons un instant u et u de classe C 1 . Si x0 est un minimum de u − u, nous avons, utilisant l’équation (10) en x0 : (u − u)(x0 ) ≥ 0, d’où le résultat. Malheureusement, u et u ne sont que continues, ce qui rend vaine toute tentative de donner un sens ponctuel à Du ou Du. Définissons donc, pour tout ε > 0, la pénalisation |x − y|2 uε (x, y) = u(x) − u(y) + 2ε2 et soit (xε , yε ) un point de minimum de uε . On se persuade facilement que 2 limε→0 |x−y| = 0, et que la famille (xε , yε )ε converge, à une sous-suite près, vers 2ε2

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

274

J.-M. ROQUEJOFFRE

(x0 , x0 ) où x0 est un minimum de u − u. Appliquant la définition (6) (sous-solution) 2 à la fonction-test x 7→ φx (y) = u(y) + |x−y| 2ε2 , nous obtenons y −x ε ε + u(yε ) ≤ 0 ; (11) H yε , ε2 2

appliquant la définition (7) (sur-solution) à la fonction-test x 7→ φy (x) = u(y)− |x−y| 2ε2 , nous obtenons yε − xε (12) H xε , + u(xε ) ≥ 0. ε2 ε| La coercivité du hamiltonien et (12) impliquent que |xεε−y est bornée. Nous avons 2 yε −xε yε −xε alors H(yε , ε2 ) = H(xε , ε2 ) + o(1) ; soustrayant (12) de (11) nous obtenons u(xε ) − u(yε ) ≥ o(1) ce qui, à la limite ε → 0, donne l’inégalité (u − u)(x0 ) ≥ 0.

Ce résultat prouve automatiquement que (10) a au plus une solution. Il admet l’extension suivante, donnée sans preuve : Proposition 1.4. — Soit u (resp. u) une sous-solution de viscosité semi-continue supérieurement (s.c.s.) et u sur-solution de viscosité semi-continue inférieurement (s.c.i.) de (10). Alors u ≤ u. 1.2. Solutions stationnaires Stricto sensu, une solution stationnaire de (2) est une solution ne dépendant pas de t, i.e. une solution de H(x, Du) = 0. Bien évidemment, une telle équation a toutes les chances de n’avoir pas de solution : il suffit de supposer H ≥ 1 sur TN ×RN , un cas de figure qui entre parfaitement dans nos hypothèses. Il est donc nécessaire d’étendre un peu la catégorie de solutions particulières recherchées, et l’idée la plus naturelle est de chercher des solutions de la forme −ct + u(x). La fonction u est alors solution de (4). Le résultat principal de cette section est le suivant (Lions, Papanicolaou, Varadhan [19]) : Théorème 1.5. — Supposons (x, p) 7→ H(x, p) continu, et la condition de coercivité (8) vraie. Il existe un unique c ∈ R pour lequel (4) admet des solutions. Une démonstration possible consiste à résoudre le problème doublement approché suivant : (13)

− δ∆u + H(x, Du) + εu = 0,

x ∈ TN ,

avec δ > 0 et ε > 0. Pour tout δ > 0 et pour tout ε > 0, le problème (13) admet une ∞ kH(.,0)k∞ , ]. Ceci se voit grâce au principe du maximum solution uε,δ ∈ [− kH(.,0)k ε ε pour les équations elliptiques, et des arguments élémentaires non détaillés ici. La preuve du théorème consiste à passer à la limite δ → 0, puis ε → 0. La limite δ → 0 est gérée par le lemme de Barles-Perthame [2], énoncé ci-après.

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

275

Lemme 1.6. — Fixons ε > 0 et considérons uε (x) = lim sup uε,δ (y),

uε (x) = lim inf uε,δ (y).

y→x,δ→0

y→x,δ→0

Alors uε (resp. uε ) est une sur-solution de viscosité s.c.i. (resp. sous-solution de viscosité s.c.s.) de H(x, Du) + εu = 0

(14)

(x ∈ TN ).

Nous avons trivialement uε ≥ uε , soit uε = uε par la proposition 1.4. Notons uε cette valeur commune ; c’est une solution de viscosité de (14). Nous avons encore besoin d’un lemme, dont nous explicitons la démonstration pour familiariser le lecteur au maniement des fonctions-tests. Lemme 1.7. — Il existe C > 0 indépendant de ε tel que kDuε k∞ ≤ C. Preuve. — Soit x ∈ TN et, pour K > 0, soit la fonction y 7→ uε (y) − uε (x) − K|y − x| ; soit x ˆ un point de maximum de cette fonction ; supposons x ˆ 6= x. Alors ε y 7→ u (x) − K|y − x| est, au voisinage de x ˆ, une fonction-test admissible ; la condition de sous-solution (6) en y = x ˆ donne : H(ˆ x, K

x ˆ−x ) + εuε (ˆ x) ≤ 0. |ˆ x − x|

Rappelons que la quantité εkuε k∞ est bornée indépendamment de ε. La condition de coercivité (8) implique alors l’existence de C > 0 indépendant de ε, tel que K ≤ C ; soit, en particulier : u(y) − u(x) − C|y − x| ≤ 0. Les points x et y étant quelconques, ceci termine la démonstration. Preuve du théorème 1.5. — Notons huε i la moyenne de uε sur T N , et v ε = uε − huε i. Grâce au lemme 1.7, la suite (v ε )ε converge uniformément – à extraction d’une soussuite près – vers une fonction v ∈ C(TN ). Notons que la famille (εhuε i)ε est bornée ; nous pouvons donc supposer qu’elle converge vers une constante notée −c. Par le résultat de stabilité 1, v est solution de viscosité de (4). Montrons l’unicité du c. Supposons l’existence de c1 < c2 tels que (4) ait des solutions pour c = c1 et c = c2 ; soient u1 et u2 de telles solutions. Soit K > 0 tel que u1 − K ≤ u2 ≤ u2 + K ; les fonctions −c1 t + u1 ± K et −c2 t + u2 sont solutions du problème de Cauchy (2) avec les données respectives u1 ± K et u2 . Par la propriété 3, ce sont les seules, et nous avons (principe du maximum) : ∀t > 0,

−c1 t + u1 − K ≤ −c2 t + u2 ≤ −c1 t + u1 + K.

Ceci n’est possible que si c1 = c2 .

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

276

J.-M. ROQUEJOFFRE

Quid, maintenant, de l’unicité d’une solution au problème (4), une fois que le c correct est identifié ? Clairement, si u est solution, u + q est solution pour toute constante q. On pourrait se demander si le quotient par les constantes assure l’unicité, il n’en est malheureusement rien : considérons l’exemple très simple |u0 | = f (x), x ∈ T1 où f ∈ C 1 (T1 ) vérifie f (0) = f 21 = f (1) = 0, et f > 0 en dehors de ces trois

(15)

points, f 12 -périodique, et f symétrique par rapport à 14 . Définissons les deux fonctions périodiques u1 et u2 par leurs valeurs sur [0, 1] :  Rx  ( Rx f (y) dy 0 ≤ x ≤ 41  0  1 f (y) dy 0 ≤ x ≤ R 1/2 2 u1 (x) = u2 (x) = f (y) dy 14 ≤ x ≤ 12 R01 x 1  f (y) dy ≤ x ≤ 1   2 x u2 21 -périodique. Ce sont deux solutions de viscosité de (15), et u2 ne se déduit pas de u1 par l’addition d’une constante. Un mécanisme plus subtil est donc à l’œuvre, et une des contributions de Fathi est la compréhension générale de celui-ci. Notons que, dans le cas particulier du hamiltonien H(x, p) = |p|2 − f (x) f ≥ 0 et {f = 0} non vide, nous avons c = 0 et les solutions de (4) sont classifiées dans Lions [18].

2. REPRÉSENTATION LAGRANGIENNE Nous terminons dans cette section la résolution du problème de Cauchy (2)-(3), amorcée dans la section 1. Nous savons déjà qu’il y a au plus une solution ; nous allons ici donner une solution « explicite » pour ce problème et nous aurons donc construit une unique solution globale. Dans la section précédente, nous avions supposé assez peu sur le hamiltonien H : seulement un peu de coercivité et de continuité. Jusqu’à la fin de l’exposé, nous supposons vérifiées les conditions de stricte convexité et de régularité données en introduction. Nous associons à H le lagrangien (x, v) ∈ TN ×RN 7→ L(x, v) donné par la formule : (16)

L(x, v) = sup (p.v − H(x, p)). p∈RN

Les propriétés vérifiées par L, et dont nous aurons besoin par la suite, sont indiquées ci-après. – L est de classe C ∞ en x et v, et est uniformément strictement convexe en sa deuxième variable. – Nous avons H(x, p) = supv∈RN (p.v − L(x, v)). – Pour tout x ∈ RN l’application v 7→ Lv (x, v) est un C ∞ -difféomorphisme, et nous avons (Lv )−1 = Hp .

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

277

Voir par exemple [21] pour cette définition et ces propriétés. Définissons, pour tout triplet (t, x, y) ∈ R+ × TN × TN , la quantité : Z t (17) ht (x, y) = inf L(γ, γ) ˙ ds γ(0)=x,γ(t)=y

0

où γ parcourt l’ensemble des chemins tracés sur TN , C 1 par morceaux. Ce problème de minimisation d’action lagrangienne est classique et admet le résultat suivant (théorème de Tonelli) : Proposition 2.1. — Soit (t, x, y) ∈ R∗+ × TN × TN . Il existe au moins un chemin γ(s) ∈ C 2 ([0, t], TN ), tel que Z t ht (x, y) = L(γ, γ) ˙ ds. 0

De plus, il existe C(t, |x − y|) > 0 tel que kγk ˙ L∞ ([0,t]) + k¨ γ kL∞ ([0,t]) ≤ C(t, |x − y|). La fonction C tend vers +∞ quand t → 0 — à |x − y| fixé. De plus γ est solution de l’équation d’Euler-Lagrange (18)

d Lv (γ, γ) ˙ − Lx (γ, γ) ˙ = 0. ds

Une telle courbe γ sera désormais appelée une extrémale. Soit u0 ∈ C(TN ) ; définissons la fonction (19)

T (t)u0 (x) = infN (u0 (y) + ht (y, x)). y∈T

Notons que cet inf est en fait un min. Notons aussi que ( T (t))t>0 est un semi-groupe : on montre en effet facilement que T (t + s)u0 = T (t) T (s), et T (0) = I ; ce semigroupe est maintenant connu sous le nom de semi-groupe de Lax-Oleinik. Le lien avec la section 1 est fait grâce au théorème suivant, dont la preuve (là encore très classique) illustre bien les interactions entre cette section et la précédente. Théorème 2.2. — La fonction (t, x) ∈ R+ × TN 7→ u(t, x) := T (t)u0 (x) est la solution du problème de Cauchy (2)-(3). Preuve. — Montrons d’abord la propriété de sur-solution : soient (t0 , x0 ) ∈ R∗+ × TN et φ une fonction-test telle que (t0 , x0 ) soit un point de minimum de u − φ, que nous pouvons supposer nul – simplement en retranchant une constante à φ. Soient y0 tel que u(t0 , x0 ) = u0 (y0 )+ht0 (y0 , x0 ), et γ une extrémale de l’action entre 0 et t0 , reliant y0 à x0 . Nous avons, pour tout t ≤ t0 : Z t φ(t, γ(t)) ≤ u(t, γ(t)) ≤ u0 (y0 ) + L(γ, γ) ˙ ds, 0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

278

J.-M. ROQUEJOFFRE

le deuxième ≤ se transformant en égalité pour t = t0 . Nous avons donc Z t Å ã d u0 (y0 ) + L(γ, γ) ˙ ds − φ(t, γ(t)) ≤ 0, dt 0 t=t0 soit φt (t0 , x0 ) + Dφ(t0 , x0 ).γ(t ˙ 0 ) − L(γ(t0 ), γ(t ˙ 0 )) ≥ 0. Ce qui implique, via la formule (16) : φt (t0 , x0 ) + H(x0 , Dφ(t0 , x0 )) ≥ 0. Pour montrer la propriété de sous-solution, considérons (t0 , x0 ) ∈ R∗+ × T N réalisant le maximum de u − φ, où φ est toujours une fonction-test. Soit v ∈ RN ; définissons γv (s) = x0 + (t0 − s)v. Puisque ( T (t))t est un semi-groupe, nous avons, pour tout t ≤ t0 : u(t0 , x0 ) ≤ u(t, x0 − (t0 − t)v) + ht0 −t (x0 − (t0 − v), x0 ) Rt ≤ φ(t, x0 − (t0 − t)v) + t00−t L(γv , γ˙ v ) ds , le deuxième ≤ devenant un = en t = t0 , et la même opération que plus haut donne φt (t0 , x0 ) + Dφ(t0 , x0 ).v − L(x, v) ≤ 0. Ceci implique φt (t0 , x0 ) + H(x0 , Dφ(t0 , x0 )) ≤ 0 par la formule (16), puisque v est quelconque. À titre d’exemple, remarquons que, si H(x, p) = |p|2 , nous avons L(x, v) = nous retrouvons la formule bien connue : ã Å |x − y|2 T (t)u0 (x) = infN u0 (y) + . 4t y∈R

|v|2 4

et

Terminons cette section par un résultat de régularisation instantanée : si u0 est continue sur TN , T (t)u0 devient instantanément lipschitzienne. Il s’agit d’un résultat remarquable, dû au caractère strictement convexe de H. Tel n’est en effet pas le cas pour une équation eikonale ; il suffit pour s’en convaincre d’examiner la solution de ut + |ux | = 0,

u(0, x) = u0 (x),

x ∈ T1

dont l’unique solution de viscosité est donnée par u(t, x) = inf |x−y|≤t u0 (y). Théorème 2.3. — Soit u(t, x) = T (t)u0 (x) l’unique solution du problème de Cauchy (2)-(3), avec u0 ∈ C(TN ). Pour tout t > 0, il existe Ct > 0 tel que u est Ct -lipschitzienne sur [t, +∞) × TN . Nous avons limt→0 Ct = +∞.

ASTÉRISQUE 317

(975)

279

ÉQUATIONS DE HAMILTON-JACOBI

Preuve. — Notons qu’il suffit de prendre t ≤ 1. En effet, par le principe du maximum, si c est l’unique nombre tel que (4) ait des solutions, la fonction u(t, .) + ct est bornée sur R+ × TN . Il suffit donc de raisonner de proche en proche sur des intervalles temporels de longueur 1. Soit alors t ∈ (0, 1] ; soient x et γ une extrémale telle que Z t u(t, x) = u0 (γ(0)) + L(γ, γ) ˙ ds. 0

Soit h ∈ TN ; on peut toujours faire en sorte que x + h ∈ TN . Soit γ˜ (s) = γ(s) + st h ; nous avons γ˜ (0) = γ(0) et γ˜ (t) = x + h. De plus, nous avons Rt 0

(L(˜ γ , γ˜˙ − L(γ, γ)) ˙ ds = ≤

Rt

L(γ + st h, γ˙ + 1t h) ds 0 Å ã Rt 1 sLx (γ, γ) ˙ + Lv (γ, γ).h ˙ 0 t

ds + Ct |h|2

= Lv (γ(t), γ(t)).h ˙ + Ct |h|2 la dernière égalité venant de l’équation d’Euler-Lagrange (18). Il suffit maintenant d’écrire, au vu de la formule (19) pour T (t)u0 : Z t Z t ˙ u(t, x + h) = u(t, γ˜ (t)) ≤ u(γ(0)) + L(˜ γ , γ˜ ) ds = u(t, x) + (L(˜ γ , γ˜˙ ) − L(γ, γ)) ˙ ds. 0

0

Nous obtenons (20)

u(t, x + h) − u(t, x) ≤ Lv (γ(t), γ(t)).h ˙ + K|h|2 ,

ce qui prouve la régularité Lipschitz en espace, les quantités γ et γ˙ étant bornées. Pour montrer la régularité Lipschitz en temps, nous examinons une petite variation t de t, notée t + τ avec t + τ > 0. Perturbant l’extrémale γ en γ˜ (s) = γ( t+τ s), nous avons toujours γ˜ (0) = γ(0), γ˜ (t + τ ) = γ(t) = x. Le même calcul que plus haut donne u(t + τ, x) − u(t, x) ≤ Ct |τ |, d’où le résultat. Remarque 2.4. — (i) La fonction u(t, x) = T (t)u0 (x) est, de par la propriété 2 de la section 1, presque partout différentiable. (ii) Soient t > 0 et γ une extrémale telle que u soit différentiable en x := γ(t). Nous avons alors Du(t, x) = Du(t, γ(t)) = Lv (x, γ(t)). ˙ L’équation de Hamilton-Jacobi donne alors ut (t, γ(t)) = −H(x, Du(t, x)) = −H(γ(t), Du(t, γ(t)). La régularisation instantanée est un phénomène remarqué depuis longtemps, en particulier par Lions [18]. Toutefois, la preuve donnée ici, inspirée de Fathi [15], est fondée sur un calcul contenant des idées cruciales pour la suite.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

280

J.-M. ROQUEJOFFRE

3. SEMI-CONCAVITÉ ET RÉGULARITÉ C 1,1 Poursuivant l’étude des propriétés qualitatives des solutions de (2), nous cherchons une régularité supplémentaire. Une notion utile est celle de semi-concavité et de semiconvexité : si une fonction est semi-concave et semi-convexe, elle est de classe C 1,1 . Ce résultat est bien connu en analyse convexe et en contrôle optimal ; voir [8] et les références bibliographiques attenantes. L’exploitation qu’en fait Fathi, et l’idée d’introduire le semi-groupe conjugué est toutefois totalement originale. Cette section est inspirée de [15] et de discussions avec P. Bernard. Définition 3.1. — Si B est une boule ouverte de RN , F un fermé de B et K une constante strictement positive, nous dirons que u ∈ C(B) est K-semi-concave sur F si et seulement si : pour tout x ∈ F , il existe lx ∈ RN tel que : pour tout h ∈ RN tel que x + h ∈ B, on ait : u(x + h) ≤ u(x) + lx .h + K|h|2 .

(21)

La fonction u sera dite K-semi-convexe sur F si −u est K-semi-concave sur F . Le théorème suivant conditionne toute la suite. Si u est continue sur une boule ouverte B de RN , et si F est un fermé de B, disons que u ∈ C 1,1 (F ) si u est différentiable en tout point de F et Du est lipschitzienne sur F . Théorème 3.2. — Soient B une boule ouverte de RN et F un fermé de B. Supposons que u ∈ C(B) soit K-semi-concave et semi-convexe sur F . Alors u ∈ C 1,1 (F ). Démonstration. — Il existe, pour tout x ∈ F , deux vecteurs lx et mx tels que : ∀h ∈ RN ,

u(x + h) ≤ u(x) + lx .h + K|h|2 u(x + h) ≥ u(x) + mx .h − K|h|2

ce qui donne, par soustraction : (lx − mx ).h ≤ 2K|h|2 , ce qui implique en retour que lx = mx et que, donc, u est différentiable en x. Considérons alors (x, y, h) ∈ F × F × RN ; les inégalités de semi-concavité et de semi-convexité deviennent, écrites respectivement entre x + h et x, x et y, x + h et y : |u(x + h) − u(x) − Du(x).h| ≤ K|h|2 |u(x) − u(y) − Du(y).(x − y)| ≤ K|x − y|2 |u(y) − u(x + h) + Du(y).(x + h − y)| ≤ K|x + h − y|2 . Nous obtenons (22)

ASTÉRISQUE 317

|(Du(x) − Du(y)).h| ≤ 3K(|h|2 + |x − y|2 ) .

(975)

ÉQUATIONS DE HAMILTON-JACOBI

281

Du(x)−Du(y) ; (22) devient |(Du(x) − Du(y))| ≤ 3K|x − y| , ce Prenons h = |x − y| |Du(x)−Du(y)| qui est l’inégalité cherchée.

Revenons à notre solution u(t, x) = T (t)u0 de (2)-(3). Soient (t, x) ∈ R∗+ × TN et γ une extrémale telle que Z t u(t, x = γ(t)) = u0 (γ(0)) + L(γ, γ) ˙ ds. 0

D’autre part nous avons, pour tout s ∈ (0, t) : s

Z u(s, γ(s)) ≤ u0 (γ(0)) +

L(γ, γ) ˙ dσ. 0

Nous avons alors, pour tout (s, s0 ) ∈ [0, t]2 avec s ≤ s0 – combiner les deux formules précédentes : Z s0 0 0 (23) u(s , γ(s )) = u(s, γ(s)) + L(γ, γ) ˙ dσ. s

Définition 3.3. — On dit que la courbe γ : [0, t] → TN est calibrée par u. Définissons le semi-groupe conjugué du semi-groupe de Lax-Oleinik par : ∀u0 ∈ C(TN ),

(24)

T˜ (t)u0 (x) = sup (u0 (y) − ht (x, y)). y∈TN

La démonstration du lemme suivant est analogue à celle du théorème 2.3 : Lemme 3.4. — Si u0 ∈ C(TN ) et σ > 0, il existe K(σ) > 0 telle que T˜ (σ)u0 soit K(σ)-semi-convexe ; la constante K(σ) explose quand σ → 0. Corollaire 3.5. — Soit u(t, x) = T (t)u0 (x) ; soit γ : [0, t] → TN une extrémale calibrée par u. Soit Λ un intervalle compact de (0, t) ; pour tout s ∈ Λ définissons l’ensemble Γs par : Γs = {γ(s), γ : Λ → TN calibrée par u}.

(25) Alors u ∈ C 1,1 (

S

s∈Λ ({s}

× Γs )).

Preuve. — Nous sommes dans les hypothèses du théorème 2.3 ; il existe donc K > 0 dépendant de inf Λ tel que l’inégalité (20) soit vraie – il suffit juste de remplacer t par s. La fonction u(s, .) est alors K-semi-concave sur Γs pour tout s ∈ Λ. La relation de calibration (23) implique, pour tout (s, s0 ) ∈ Λ2 avec s < s0 : u(s, γ(s)) = sup (u(s0 , y) − hs0 −s (γ(s), y)) = T˜ (s0 − s)u(s0 , .)(γ(s)). y∈TN

˜ dépendant de sup Λ − inf Λ telle Il existe donc, par le lemme 3.4, une constante K ˜ que u(s, .) soit K-semi-convexe sur Γs . D’après le théorème 3.2, la fonction u(s, .) est 1,1 de classe C sur Γs . La démonstration se conclut via la remarque 2.4.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

282

J.-M. ROQUEJOFFRE

4. SOUS-SOLUTIONS CRITIQUES Quittons dans cette partie le problème de Cauchy (2)-(3) pour nous intéresser aux solutions de (4), qui est donc l’équation sur laquelle nous voulons nous concentrer juqu’à la fin de l’exposé. Notons immédiatement qu’on peut supposer, sans perte de généralité, que c = 0 ; il suffit pour cela de changer le hamiltonien. Nous étudions donc l’équation H(x, Du) = 0,

(26)

x ∈ TN ,

et nous supposons donc, dans toute cette section, que (26) a des solutions. Une solution u de (26) est solution du problème de Cauchy (2) avec donnée initiale elle-même ; donc u(x) = T (t)u(x) pour tout t ≥ 0. Ceci implique que u est semiconvexe ; de plus, si Λ est un intervalle compact de R et, pour s ∈ Λ, Γs donné par S (25), alors u est de classe C 1,1 sur s∈Λ Γs . Le critère suivant sera utile pour savoir si une fonction donnée est sous-solution ou solution de (26). Proposition 4.1. — (i) Une fonction u ∈ C(TN ) est sous-solution de (26) si et seulement si – rappelons que ht (y, x) est le minimum de l’action entre y et x, et est donnée par (17) : (27)

∀(x, y) ∈ TN × TN ,

u(x) − u(y) ≤ ht (y, x).

(ii) Une sous-solution de (26) en est une seulement si : pour tout x ∈ U , il existe tx calibrée par u, telle que γ(tx ) = x. (iii) Pour toute solution u de (26), pour γ : (−∞, 0] → TN , telle que γ(0) = x et telle ∀t > 0,

solution sur un ouvert U de TN si et > 0 et une extrémale γ : [0, tx ] → TN

tout x ∈ TN , il existe une extrémale que : Z 0 φ(x) − φ(γ(−t)) = L(γ, γ) ˙ ds. −t

Les points (i) et (ii) se déduisent aisément du théorème 2.2. Pour le point (iii), il suffit de considérer, pour tout T > 0, une extrémale γT : [−T, 0] → TN calibrant u et telle que γT (0) = x. La famille (γT )T est relativement compacte dans la topologie 1 1 Cloc – proposition 2.1 ; il suffit d’en extraire une suite convergeant dans Cloc (R− ). Définition 4.2. — Une sous-solution de (26) est appelée sous-solution critique. Une sous-solution critique u est dite stricte au point x ∈ TN s’il existe Ux voisinage ouvert de x et cx < 0 tel que u vérifie H(x, Du) ≤ cx dans U , au sens de viscosité. Une soussolution critique est dite stricte sur un ouvert U de TN si elle est stricte en chaque point de U .

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

283

Cette section comprend trois parties. Dans la première, nous introduisons les acteurs : le potentiel de Mañé et la barrière de Peierls ; nous donnons leurs premières propriétés. Dans la deuxième partie, nous introduisons l’ensemble d’Aubry ; puis nous énonçons le théorème d’existence et expliquons pourquoi il s’agit d’un résultat non trivial. La troisième partie est consacrée à sa démonstration. 4.1. Mañé, Peierls Considérons successivement les deux quantités suivantes : (28)

φ(x, y) = inf ht (x, y), t>0

h(x, y) = lim inf ht (x, y). t→+∞

La fonction φ est connue sous le nom de Potentiel de Mañé, la fonction h sous le nom de Barrière de Peierls. Notons tout de suite que ce sont deux quantités finies : l’action entre x et y est en effet trivialement bornée supérieurement par une fonction localement bornée de x−y ; de plus, si u est une solution de (26), l’inégalité (27) donne une borne inférieure uniforme pour ht (x, y). Une conséquence de cette remarque est le jeu d’inégalités (29)

∀(t, x, y, z) ∈ R × (TN )3 ,

φ(x, z) − φ(x, y) ≤ ht (y, z) h(x, z) − h(x, y) ≤ ht (y, z)

ce qui entraîne que les fonctions φx : y ∈ TN 7→ φ(x, y) et hx (y) : y ∈ TN 7→ h(x, y) sont des sous-solutions lipschitziennes de (26). En fait, on a bien plus : Proposition 4.3. — Pour tout x ∈ TN , la fonction hx est solution de (26) sur TN . La fonction φx est solution de (26) sur TN \{x}. Preuve. — Dans les deux cas, on utilise la proposition 4.1. Pour obtenir la propriété sur hx , considérons y ∈ TN et une suite (tn )n tendant vers +∞ telle que htn (x, y) tende vers h(x, y) = hx (y)). Soit une suite d’extrémales (γn )n réalisant le minimum de l’action entre x et y telles que γn (tn ) = y ; soit finalement t > 0. Notant γ˜n (s) = γn (tn + s), nous avons Z 0 Z −t htn (x, y) = L(˜ γn , γ˜˙n ) ds, htn (x, γ˜n (−t)) ≤ L(˜ γn , γ˜˙n ) ds . −tn

−tn

1 Utilisant (i) la relative compacité de la suite (˜ γn )n dans la topologie Cloc et (ii) le fait que h est une limite inférieure, nous obtenons, en soustrayant les deux (in)égalités précédentes membre à membre : h(x, y) ≥ h(x, γ(−t)) + ht (γ(−t), y), où γ est la limite locale uniforme de la suite (˜ γn )n . Comme hx est sous-solution critique, on obtient hx (y) = hx (γ(−t)) + ht (γ(−t), y). Pour montrer la propriété sur φ, considérons là encore y ∈ TN ; il suffit de supposer que l’inf dans la formule (28) est atteint à un instant t0 fini : sinon, φx (y) = hx (y) ; la fonction φ0 est donc une limite inférieure et la proposition 4.1 s’applique. Nous

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

284

J.-M. ROQUEJOFFRE

avons alors φx (y) < hx (y) ; puisque φx et hx sont lipschitziennes, cette inégalité reste vraie pour tout z assez proche de y. Considérons un tel z ; il existe alors t1 tel que φx (z) = ht1 (x, z) et nous avons : Z 0 Z t0 L(γ1 , γ˙ 1 ) ds, L(γ0 , γ˙ 0 ) ds + φx (y) − φx (z) = 0

−t1

où γ0 et γ1 sont les extrémales correspondantes. Ces deux extrémales ont un point commun : x ; il suffit de les coller en ce point et de les reparamétrer pour obtenir φx (y) − φx (z) = ht0 +t1 (y, z). Terminons cette rapide présentation des quantités φ et h par les formules suivantes, qui sont là encore des conséquences simples de (28), (29), et de la relation (27) pour l’une quelconque des solutions de l’équation stationnaire (26) : (30)

∀(x, y) ∈ TN × TN ,

h(x, y) + h(y, x) ≥ 0, h(x, x) ≥ 0, φ(x, x) = 0.

Nous voyons en particulier que, grâce aux inégalités (29) et (30), la symétrisée de h peut s’interpréter comme une semi-distance sur TN . 4.2. Le théorème de Fathi et Siconolfi Définissons l’ensemble d’Aubry par (31)

A = {x ∈ TN : h(x, x) = 0}.

Remarquons que A est fermé car h est lipschitzienne. Le résultat principal de Fathi et Siconolfi sur les sous-solutions critiques régulières [16] peut s’énoncer ainsi. Théorème 4.4. — Il existe une sous-solution critique φ de (26), de classe C 1 sur TN , qui est stricte sur TN \ A . De plus, φ est de classe C 1,1 sur A . À titre d’exemple, voyons ce qui se passe pour le hamiltonien H(x, p) = |p|2 − f (x), où f est positive avec un ensemble d’annulation non vide. Il est alors bien connu que 2 (26) admet des solutions – et donc c = 0. Le lagrangien est L(x, v) = |v|4 + f (x), et nous avons Z tÅ 2 ã |γ| ˙ h(x, y) = lim inf inf + f (γ) ds. t→+∞ γ 4 0 Nous voyons immédiatement que h(x, x) = 0 si et seulement si f (x) = 0 : en effet, toutes les quantités dans l’intégrale sont positives. D’autre part, de par la proposition 2.1, la vitesse d’une extrémale est bornée ; donc h(x, x) > 0 dès que f (x) > 0. Nous voyons d’autre part qu’une famille de sous-solutions critiques régulières est donnée par les constantes. Dans le cas général, la situation est bien moins évidente. Il existe toutefois une classe de sous-solutions régulières aisément accessibles ; ce sont celles de l’équation

ASTÉRISQUE 317

(975)

285

ÉQUATIONS DE HAMILTON-JACOBI

H(x, Du) = c avec c > 0. En effet, si ρε est une approximation de l’identité, nous avons Z H(x, ρε ∗ u) = H(x, ρε (y)Du(x − y) dy) TN Z ρε (y)H(x, Du(x − y)) dy (par Jensen) ≤ TN Z ρε (x − y)H(x − y, Du(x − y)) dy = O(ε) . ≤ O(ε) + TN

Cet argument ne permet toutefois pas d’arriver au niveau c = 0 ; toutefois il réapparaîtra dans le cours de la démonstration. 4.3. Éléments de preuve du théorème 4.4 L’idée de la démonstration est de choisir comme sous-solution critique une combinaison linéaire convexe infinie de sous-solutions de la forme X φx n φ= , 2n+1 n∈N

les points de base xn étant choisis en dehors de A . Ceci définit une sous-solution stricte, qui est de classe C 1,1 sur A . Une régularisation de φ en dehors de A assure que φ est globalement C 1 . Il s’agit d’un processus non trivial, mais qui ne demande pas plus d’outils que ceux déjà introduits. Nous donnons ci-après un compte rendu (presque) complet de la démonstration, renvoyant le lecteur à [16] pour des démonstrations plus détaillées. De nombreux compléments, non abordés ici, sont également disponibles dans [16]. Étape 1 : comportement des φx sur A . Si u est une sous-solution critique, définissons I (u) l’ensemble des points de TN par lesquels passe une extrémale γ : R → TN calibrée par u. Le résultat principal de cette étape est le Lemme 4.5. — Soit y ∈ A . Il existe γ : R → TN telle que γ(0) = y, qui est calibrée par toute sous-solution critique. Preuve. — Construisons d’abord l’extrémale en question, à l’aide de la fonction h. Nous allons construire γ : R → TN , telle que γ(0) = x et Z t Z 0 (32) ∀t > 0, h(γ(t), x) = − L(γ, γ) ˙ ds, h(x, γ(−t)) = − L(γ, γ) ˙ ds. −t

0

Partons, pour ce faire, d’une suite d’extrémales (γn )n , avec γn : [0, tn ] → TN et γn (0) = γn (tn ) = x, telle que Z tn (33) lim L(γn , γ˙ n ) ds = 0. n→+∞

0

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

286

J.-M. ROQUEJOFFRE

Nous pouvons supposer que la suite (γn )n converge, ainsi que ses dérivées, localement uniformément. Soit γ cette limite locale uniforme ; soit dn = |γ(t) − γn (t)|. Soit µn : [0, dn ] → TN une extrémale de l’action entre γ(t) et γn (tn ) ; le raccord de µn et γn , convenablement reparamétrées, donne une courbe lipschitzienne notée γ˜ : [t − dn , tn ] → TN . Nous avons Z t Z tn Z tn Z tn ˙ L(γn , γ˙ n ) ds. L(γn , γ˙ n ) − L(γn , γ˙ n ) ds = Cdn + L(˜ γ , γ˜ ) ds ≤ Cdn + t−dn

0

0

t

Il en résulte, par minimisation du membre de gauche sur tous les chemins allant de γ(t) à x : Z tn Z t htn −t+dn (γ(t), x) ≤ Cdn + L(γn , γ˙ n ) − L(γn , γ˙ n ) ds. 0

0

Ceci, grâce à (33) et à la définition de h comme limite inférieure, implique la première partie de (32). La deuxième partie s’obtient de manière analogue. Soit maintenant u une sous-solution critique ; nous avons, pour l’extrémale γ consRt truite et x ∈ A : u(γ(t)) − u(x) ≤ 0 L(γ, γ) ˙ ds par définition. Mais nous avons aussi, pour tout s : u(x) − u(γ(t)) ≤ hs (γ(t), x), soit, en passant à la limite inférieure : u(x) − u(γ(t)) ≤ h(γ(t), x). La première partie de (32) dit que cette dernière quantité Rt vaut − 0 L(γ, γ) ˙ ds, et donc nous avons Z t u(γ(t)) − u(x) = L(γ, γ) ˙ ds. 0

La courbe γ est donc calibrée par u sur [0, +∞), et un raisonnement analogue implique la calibration sur (−∞, 0]. Une conséquence importante est que, pour tout x ∈ T N , φx est C 1,1 sur A . De plus, la constante de Lipschitz de Dφx sur A ne dépend que du hamiltonien, tout point de A appartenant à une extrémale calibrée par φx . Étape 2 : construction d’une sous-solution stricte en dehors de A . L’ingrédient clé est cette fois-ci le Lemme 4.6. — Si x ∈ TN \ A , alors φx n’est pas solution de viscosité sur TN . Preuve. — Supposons que φx soit solution de (26) sur tout TN . Nous pouvons alors trouver une extrémale γ : R− → TN telle que γ(0) = x et telle que, pour tout t > 0 : Z 0 (34) φx (x) − φx (γ(−t)) = L(γ, γ) ˙ ds = −φx (γ(−t)). −t

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

287

Fixons t > 0. Soit ε > 0 ; la définition de φx implique l’existence de tε > 0 et d’une extrémale γε : [0, tε ] → TN telle que γε (0) = x, γε (tε ) = γ(−t), et telle que Z tε L(γε , γ˙ ε ) ds ≤ φx (γ(tε )) + ε = φx (γ(−t)) + ε. 0

Définissons alors la courbe (lipschitzienne) γ˜ε (s) = γε (s) pour s ≤ tε , et γ˜ε (s) = γ(s − tε ) pour tε ≤ s ≤ t + tε . En combinant (31) à l’inégalité précédente, nous obtenons : Z t+tε L(˜ γ , γ˜˙ε ) ds ≤ ε. 0

Il est alors loisible de passer à la limite inférieure t → +∞ pour obtenir h(x, x) ≤ ε soit, in fine, x ∈ A . La combinaison des lemmes 4.6 et 4.5 donne que φx est une solution de viscosité sur TN si et seulement si x ∈ A . La construction d’une sous-solution critique se déroule maintenant ainsi. Pour tout x ∈ U := TN \ A , φx n’est pas une sur-solution de viscosité en x ; il existe donc un voisinage ouvert Ux de x, une fonction θx ∈ C 1 (Ux ) et un réel cx < 0 tels que φx > θx – on peut toujours modifier θx par une fonction parabolique – sur Ux \{x}, φx (x) = θx (x) et H(y, Dθx ) ≤ cx sur Ux . Il existe de plus εx > 0 et Ωx voisinage ouvert de x inclus dans Ux tels que φx ≥ θx + εx dans Ωx , φx = θx + εx sur ∂Ωx . Notons alors ( θx (y) + εx si y ∈ Ωx ux (y) = φx (y) si y ∈ / Ωx . La fonction ux est encore sous-solution critique sur TN , comme maximum de sousS solutions, mais elle est maintenant stricte sur Ωx . Extrayons de U = x∈U Ωx un S recouvrement dénombrable U = n∈N Ωxn . De par la convexité de H, la fonction X ux n (35) φ= 2n+1 n∈N

est encore sous-solution critique. Elle est bien de classe C 1,1 sur A , de par la convergence normale de la série des dérivées sur A . On vérifie enfin qu’elle est stricte sur TN \ A . Étape 3 : Régularisation. Il s’agit ici de lisser la sous-solution φ construite dans l’étape 2 sur U := TN \ A , en gardant son caractère strict sur TN \ A , et en conservant ses valeurs sur A . Ce qui va servir ici est que φ est lipschitzienne, ainsi que le calcul (32). La démonstration de [16] se place dans un cadre assez général ; voici comment les choses se passent dans le cas précis de l’équation (26). Soit (Bn )n un recouvrement de U par des boules ouvertes telles que Bn ⊂ U pour tout n ; soit rn le rayon de

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

288

J.-M. ROQUEJOFFRE

Bn . Soit (ψn )n une partition de l’unité relative à la famille (Bn )n , c’est-à-dire que : (i) la famille des supports des ψn est localement finie ; (ii) la somme des ψn vaut 1 dans Ω. Pour tout n ∈ N , soit N (n) le cardinal de l’ensemble des indices k tels que suppψn ∩ suppψk soit non vide ; nous avons N (n) < +∞ ; de plus, nous pouvons toujours choisir les ψn pour avoir kDψn k∞ ≤ r2n . P Définissons alors la fonction φ par φ = n∈N ψn ρεn ∗ φ sur U , et φ = φ(x) sur A , la fonction ρε = ε1N ρ( xε ) étant l’approximation de l’identité classique. Rappelons l’existence de cn > 0 tel que H(x, Dφ) ≤ −cn sur Bn ; nous choisissons la suite (εn )n décroissante, et vérifiant εn ≤

(36)

10−10 min min(ck , rk , d(∂Bk , A )2 ). |N (n)| k∈N (n)

Notons d’abord que la fonction φ est de classe C ∞ sur U . Pour montrer qu’elle est sous-solution critique stricte sur U , rappelons que, puisque φ est lipschitzienne, il existe C > 0 tel que kρεn ∗ φ − φk∞ ≤ Cεn pour tout n. Soit x ∈ U et soit n le plus P petit indice k tel que x ∈ Bk ; puisque n Dψn (x) = 0, nous avons Ñ é X X H(x, Dφ(x)) = H x, ψk (x)ρεk ∗ φ(x) + Dψk (x)(ρεk ∗ φ − φ)(x) k∈N (n)

≤

X

k∈N (n)

ψk (x)H(x, ρεk ∗ φ(x)) + C

k∈N (n)

X εk rk

k∈N (n)

X εk ≤ −cn + εn + C rk k∈N (n)

la dernière inégalité venant du calcul (32). Nous avons donc H(x, Dφ(x)) ≤ − c2n ; ceci revient à dire, par (36), que φ est sous-solution stricte au voisinage de x. Pour montrer que φ est de classe C 1 sur TN , il suffit de montrer que cette fonction et son gradient se raccordent bien à l’interface ∂ A ; pour ce faire reprenons x ∈ U et n le plus petit indice k tel que x ∈ Bk . Par un calcul analogue au précédent, nous avons

X ψk (x)(ρεk ∗ φ − φ)(x) |φ(x) − φ(x)| = k∈N (n) X ≤C εk ≤ C min d(∂Bk , A )2 ≤ Cd(x, A )2 k∈N (n)

k∈N (n)

Ceci assure bien le raccord de φ et de ses dérivées.

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

289

5. APPLICATIONS ET COMPLÉMENTS 5.1. Ensembles d’unicité Disons qu’un ensemble fermé B de TN est un ensemble d’unicité si le problème de Dirichlet (37)

H(x, Du) = 0,

x ∈ TN \B,

u imposée sur B.

admet au plus une solution. Compter les solutions d’une équation aux dérivée partielles étant un des problèmes de base de la théorie, on conçoit l’importance d’un tel renseignement. Le lemme suivant, tiré de Ishii [17], donne un critère pour qu’un ensemble B soit un ensemble d’unicité. Lemme 5.1. — Supposons l’existence d’un fermé B de TN et d’une sous-solution C 1 stricte de (37) sur TN \B. Alors B est un ensemble d’unicité forte pour l’équation stationnaire (26), i.e. : si u (resp. u) est une sous-solution s.c.s (resp. une sur-solution s.c.i) de (37), avec u ≤ u sur B, alors u ≤ u. On obtient donc un principe de comparaison encore plus fort qu’un résultat d’unicité. L’application du théorème 4.4 montre que l’ensemble A est un ensemble d’unicité forte pour (26). Étudier plus en détail les propriétés qualitatives de A ainsi que la caractérisation des valeurs admissibles des solutions de (26) sur A est une question importante non encore complètement résolue. Ce dernier point est traité en détail dans Lions [18], pour le hamiltonien (x, p) 7→ |p|2 − f (x). 5.2. Ensembles invariants Commençons par rappeler que, si x ∈ A , alors x ∈ I (φ). Il vient le Théorème 5.2. — Soient x ∈ A et γ : R → TN calibrée par φ, telle que γ(0) = x. Alors γ est tracée sur A . Preuve. — Soit t ∈ R ; d’après le lemme 4.5, l’extrémale γt : s 7→ γ(t + s) est calibrée par toute sous-solution critique, donc en particulier par la sous-solution φ de FathiSiconolfi. Si γ(t) était hors de A , φ serait sous-solution stricte en ce point. Interprétons ce résultat. Énonçons d’abord une conséquence du théorème 4.4 : Théorème 5.3. — Soit φ la sous-solution critique construite sur A . Alors Du = Dφ sur A , pour toute sous-solution critique u de (26). Preuve. — Si x ∈ A est u est une solution critique, soit γ : R → TN une extrémale calibrée par toutes les sous-solutions critiques ; de par la remarque 2.4 nous avons Dφ(γ(t)) = Lv (γ(t), γ(t)) ˙ = Du(γ(t)).

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

290

J.-M. ROQUEJOFFRE

En se souvenant que Hp = (Lv )−1 nous avons : (38)

γ(t) ˙ = Hp (γ(t), Dφ(γ(t)).

Comme Dφ est lipschitzienne sur A , l’équation différentielle (38) définit un flot sur A , et A est invariant pour ce flot. Notant P (t) = Lv (γ(t), γ(t)) ˙ = Dφ(γ(t)) nous avons, ˙ par l’équation d’Euler-Lagrange pour γ : P (t) = Lx (γ(t), γ(t)) ˙ = −Hx (γ(t), P (t)), la dernière égalité se déduisant de la dualité de Legendre. Il en résulte le Théorème 5.4. — L’ensemble {(x, Dφ(x)), x ∈ A } est un compact invariant pour le système hamiltonien ( X˙ = Hp (X, P ) (39) P˙ = −Hx (X, P ) . C’est ce type de propriété, hors de tout contexte perturbatif, qui est à l’origine du vocable « théorie KAM faible » pour les solutions de viscosité de Hamilton-Jacobi. 5.3. Régularité supplémentaire On peut se demander si les sous-solutions construites ne bénéficient pas d’une meilleure régularité : rappelons que la solution de Fathi-Siconolfi est C 1 sur TN , C 1,1 sur A et C ∞ sur TN \ A . Peut-on construire des sous-solutions C ∞ ? Le mot de la fin de cet exposé revient à P. Bernard. Essentiellement : il existe des sous-solutions de classe C 1,1 , et cette régularité est optimale en général. Voici un compte rendu un peu plus détaillé du premier point, traité dans [3]. Le théorème 4.4 y est redémontré de façon auto-contenue, avec une preuve directe l’existence de sous-solutions critiques C 1,1 . L’idée de départ est que, si u est sous-solution critique, alors, pour tout t > 0 et pour tout s > 0 assez petit : T (s) T˜ (t)u est semi-convexe ; de plus c’est une sous-solution critique car les semi-groupes ( T (t))t>0 et ( T˜ (t))t>0 conservent les sous-solutions. Comme T (s) T˜ (t)u est une fonction semi-concave, elle est C 1,1 . La pierre angulaire de ce résultat est la régularisation suivante : Lemme 5.5. — Si v ∈ C(TN ) est semi-convexe, alors T (s)v est semi-convexe pour s > 0 assez petit. Preuve (esquisse). — Si v est semi-convexe, il existe un sous-ensemble F borné de C 2 (TN ) tel que : d’une part, pour tout x ∈ TN et tout élément p du sous-différentiel de v en x, nous pouvons trouver f ∈ F tel que Df (x) = p ; d’autre part, nous avons : ∀x ∈ TN ,

v(x) = max f (x). f ∈F

Il existe alors s0 assez petit tel que, pour tout f ∈ F et pour tout s ∈ [0, s0 ], la quantité T (s)f soit de classe C 2 ; ce fait repose sur la résolution classique, locale en

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

291

temps, du problème de Cauchy pour Hamilton-Jacobi. Quitte à restreindre s0 , nous avons alors : ∀s ∈ [0, s0 ],

T (s)v(x) = max T (s)f (x). f ∈F

Cette propriété se démontre par observation de la formule de Lax-Oleinik et par utilisation de la remarque 2.4. Une fois construite une sous-solution critique C 1,1 , Bernard considère l’ensemble

A = {x ∈ TN : (26) n’a pas de sous-solution C 1 stricte en x.}. Le point non trivial à démontrer est que A est non vide ; ceci se fait par des considérations analogues à celles de l’étape 2 de la section 4.3. Il est par contre immédiat, une fois ce point acquis, de vérifier que toutes les sous-solutions critiques C 1 ont le même 2 gradient sur A : si u1 et u2 sont deux telles solutions, alors u1 +u est sous-solution 2 critique C 1 ; la stricte convexité de H implique qu’elle est stricte en x, contredisant le fait que x ∈ A si Du1 (x) 6= Du2 (x). Bernard introduit alors l’ensemble ˜A = {(x, Du(x)),

x ∈ A} ,

où u est n’importe quelle sous-solution critique C 1,1 . Il montre alors que ˜A est invariant par le système hamiltonien (39), et retrouve une par une les propriétés de Fathi-Siconolfi, pour arriver au fait que A est bien donné par l’équation cartésienne (31). La régularité C 1,1 est optimale, et la limitation est atteinte sur A . Choisissons N = 1, et considérons le hamilonien suivant, tiré de [3] : HP (x, p) =

1 (p + P )2 − sin2 (πx). 2

On vérifie alors que – si P ∈ [− π2 , π2 ], on a c = 0 (on rappelle que c est l’unique valeur, donnée par le théorème de Lions-Papanicolaou-Varadhan, pour laquelle (4) a des solutions), – si P 6= π2 , alors A = {0} ; – si P = π2 , alors A = T1 . De plus, pour P = π2 , il existe une seule – aux constantes près – solution critique, qui est une primitive de x 7→ sin(πx) − π2 . Cette solution n’est pas plus régulière que C 1,1 . Il est donc impossible d’obtenir de la régularité supplémentaire sans hypothèse additionnelle. Un résultat là encore dû à P. Bernard [4] affirme que, si A est réunion finie d’orbites périodiques de (39) vérifiant en plus une propriété d’hyperbolicité, alors il existe des sous-solutions aussi régulières que les données.

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

292

J.-M. ROQUEJOFFRE

RÉFÉRENCES [1] G. Barles – Solutions de viscosité des équations de Hamilton-Jacobi, Mathématiques & Applications (Berlin), vol. 17, Springer, 1994. [2] G. Barles & B. Perthame – Discontinuous solutions of deterministic optimal stopping time problems, RAIRO Modél. Math. Anal. Numér. 21 (1987), p. 557– 579. [3] P. Bernard – Existence of C 1,1 critical sub-solutions of the Hamilton-Jacobi equation on compact manifolds, Ann. Scient. Éc. Norm. Sup. 40 (2007), p. 445– 452. [4]

, Smooth critical sub-solutions of the hamilton-jacobi equation, à paraître dans Math. Research Letters.

[5] P. Bernard & B. Buffoni – The Monge problem for supercritical Mañé potentials on compact manifolds, Adv. Math. 207 (2006), p. 691–706. [6]

, Optimal mass transportation and Mather theory, à paraître dans J. European Math. Society.

[7] L. A. Caffarelli & X. Cabré – Fully nonlinear elliptic equations, American Mathematical Society Colloquium Publications, vol. 43, Amer. Math. Soc., 1995. [8] P. Cannarsa & C. Sinestrari – Semiconcave functions, Hamilton-Jacobi equations, and optimal control, Progress in Nonlinear Differential Equations and their Applications, 58, Birkhäuser, 2004. [9] M. G. Crandall, H. Ishii & P.-L. Lions – User’s guide to viscosity solutions of second order partial differential equations, Bull. Amer. Math. Soc. (N.S.) 27 (1992), p. 1–67. [10] M. G. Crandall & P.-L. Lions – Viscosity solutions of Hamilton-Jacobi equations, Trans. Amer. Math. Soc. 277 (1983), p. 1–42. [11] A. Fathi – Solutions KAM faibles conjuguées et barrières de Peierls, C. R. Acad. Sci. Paris Sér. I Math. 325 (1997), p. 649–652. [12]

, Théorème KAM faible et théorie de Mather sur les systèmes lagrangiens, C. R. Acad. Sci. Paris Sér. I Math. 324 (1997), p. 1043–1046.

[13]

, Orbites hétéroclines et ensemble de Peierls, C. R. Acad. Sci. Paris Sér. I Math. 326 (1998), p. 1213–1216.

[14]

, Sur la convergence du semi-groupe de Lax-Oleinik, C. R. Acad. Sci. Paris Sér. I Math. 327 (1998), p. 267–270.

[15]

, Weak KAM theory, Cambridge University Press, à paraître.

[16] A. Fathi & A. Siconolfi – Existence of C 1 critical subsolutions of the Hamilton-Jacobi equation, Invent. Math. 155 (2004), p. 363–388.

ASTÉRISQUE 317

(975)

ÉQUATIONS DE HAMILTON-JACOBI

293

[17] H. Ishii – A simple, direct proof of uniqueness for solutions of the HamiltonJacobi equations of eikonal type, Proc. Amer. Math. Soc. 100 (1987), p. 247–251. [18] P.-L. Lions – Generalized solutions of Hamilton-Jacobi equations, Research Notes in Math., vol. 69, Pitman (Advanced Publishing Program), 1982. [19] P.-L. Lions, G. Papanicolaou & S. Varadhan – Homogenization of Hamilton-Jacobi equations, prépublication. [20] J. N. Mather – Variational construction of connecting orbits, Ann. Inst. Fourier (Grenoble) 43 (1993), p. 1349–1386. [21] R. T. Rockafellar – Convex analysis, Princeton Landmarks in Mathematics, Princeton Univ. Press, 1997, Reprint of the 1970 original, Princeton Paperbacks.

Jean-Michel ROQUEJOFFRE Université Paul Sabatier et IUF Institut de Mathématiques (UMR CNRS 5219) 118 route de Narbonne F–31062 Toulouse E-mail : [email protected]

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

311

ASTÉRISQUE

28 avr il

200 8

2008

E´p reu ve SM F

´ MINAIRE BOURBAKI SE VOLUME 2006/2007 ´ S 967-981 EXPOSE

(976) Vari´et´es carquois de Nakajima Olivier SCHIFFMANN

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Mars 2007

200 8

S´eminaire BOURBAKI 59e ann´ee, 2006-2007, no 976, p. 295 `a 344

´ ES ´ CARQUOIS DE NAKAJIMA VARIET [d’apr` es Nakajima, Lusztig, Varagnolo, Vasserot, Crawley-Boevey, ...]

1. INTRODUCTION

28 avr il

par Olivier SCHIFFMANN

E´p reu ve SM F

Les vari´et´es de Nakajima trouvent leurs origines au d´ebut des ann´ees 90 dans la construction d’espaces de modules de connexions anti-autoduales – les espaces de modules d’instantons – sur certaines classes de vari´et´es r´eelles hyperk¨ahl´eriennes de dimension quatre – les espaces ALE – cf. [1], [40], [41]. Pour un bon choix de structure complexe dans la famille hyperk¨ahl´erienne, ces espaces s’identifient `a des espaces de · 2 // Γ des singularit´es de modules de fibr´es holomorphes sur les r´esolutions minimales C Klein (ou plutˆ ot sur leur compactification naturelle). Via la correspondance de McKay [19], elle-mˆeme bas´ee sur une observation remarquable de McKay, ces derniers espaces de modules admettent une description explicite comme quotient hyperk¨ahl´erien d’un (1) (1) (1) certain espace de repr´esentations d’un carquois de type affine (An , Dn ou E6,7,8 ). Ce mod`ele explicite a permis a` Nakajima de construire, sur l’homologie de ces « vari´et´es de carquois », une action de l’alg`ebre de Kac-Moody affine b g – de mˆeme type (1) (1) (1) An , Dn ou E6,7,8 – par convolution par certaines correspondances bien choisies. On obtient ainsi une repr´esentation int´egrable de plus haut poids deg. Ce pont entre la g´eom´etrie des espaces de modules d’instantons d’un cˆot´e et la th´eorie des repr´esentations des alg`ebres de Kac-Moody affines de l’autre est tr`es utile pour les deux parties prenantes : il permet de relier les nombres de Betti `a certains caract`eres de repr´esentations de b g, de construire des sym´etries relevant, au niveau des espaces de modules, l’action du groupe de Weyl, etc. ; il permet aussi de r´ealiser g´eom´etriquement certains invariants fins des repr´esentations de b g, comme le cristal de Kashiwara (cf. Section 6.). La d´efinition de ces « vari´et´es de carquois de Nakajima » se g´en´eralise sans difficult´e ` a n’importe quel carquois Q. On obtient ainsi une famille de triplets (M(v, w), M0 (v, w), π) o` u M(v, w) est une vari´et´e alg´ebrique symplectique lisse, M0 (v, w) est une vari´et´e affine (en g´en´eral singuli`ere) et o` u π : M(v, w) → M0 (v, w)

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

296

Olivier SCHIFFMANN

E´p reu ve SM F

28 avr il

200 8

est un morphisme propre (cf. [60]). Ici v, w sont deux vecteurs de dimensions (arbitraires) pour Q. Les constructions g´eom´etriques de repr´esentations mentionn´ees plus haut s’´etendent aussi ` a ce cadre g´en´eral [62] et on obtient ainsi des repr´esentations d’alg`ebres de Kac-Moody (sym´etriques) arbitraires. Mˆeme si, comme expliqu´e plus haut, la motivation initiale est d’ordre purement g´eom´etrique (voire mˆeme de g´eom´etrie diff´erentielle), ce travail trouve naturellement sa place dans la continuit´e de ceux de Ringel [71] et Lusztig [45] sur les groupes quantiques et les carquois. Il apparaˆıt tr`es clairement que le triplet (M(w), M0 (w), π) (o` u on a pos´e M(w) = F S esingularisation de v M(v, w) et M0 (w) = v M0 (v, w)) est un analogue de la d´ Springer T ∗ B → N du cˆ one nilpotent d’une alg`ebre de Lie simple C par le fibr´e cotangent de sa vari´et´e drapeaux B. La construction de Nakajima de repr´esentations int´egrables d’alg`ebres de Kac-Moody s’apparente ainsi `a la construction de Springer de repr´esentations de groupes de Weyl dans l’homologie des fibres de Springer. Un th´eor`eme fameux de Kazhdan-Lusztig [38] et, ind´ependamment, Ginzburg [16] r´ealise la correspondance de Deligne-Langlands en construisant toutes les repr´esentations irr´eductibles de dimension finie d’une alg`ebre de Hecke affine dans la K-th´eorie des fibres de Springer ; Nakajima a obtenu dans [64] un r´esultat similaire : les repr´esentations irr´eductibles des alg`ebres affines quantiques se r´ealisent dans la K-th´eorie des fibres de l’application π : M(w) → M0 (w). On en d´eduit une formule de caract`ere pour ces repr´esentations irr´eductibles faisant intervenir une nouvelle classe de polynˆomes, quelque peu semblables aux polynˆomes de Kazhdan-Lusztig. Il existe n´eanmoins quelques diff´erences notables avec la d´esingularisation de Springer. Par exemple, les vari´et´es M(w) ont plusieurs composantes connexes (celles-ci sont reli´ees entre elles par la structure de cristal de Kashiwara). De plus, les vari´et´es carquois sont d´efinies pour toutes les alg`ebres de Kac-Moody alors que les constructions de vari´et´e drapeaux et de r´esolutions de Springer pour les groupes de Kac-Moody sont beaucoup plus d´elicates. Notons enfin qu’il existe un autre mod`ele g´eom´etrique pour les repr´esentations d’une alg`ebre de Lie simple g, bas´e, lui, sur la grassmanienne affine Gr de g (cf. e.g. [54]). Le probl`eme, qui nous paraˆıt important, de comprendre le lien unissant ce mod`ele avec celui des vari´et´es de Nakajima est encore largement ouvert (cf. [55] en type A). Le plan de cet expos´e est le suivant. Les sections 2 et 3 sont consacr´ees au sch´ema de Hilbert de points sur C2 et aux espaces de modules de fibr´es ´equivariants sur P2 , qui (1) sont des exemples concrets de vari´et´es de Nakajima (associ´ees au carquois de type A0 et aux carquois affines respectivement) et dans lesquels la plupart des ph´enom`enes sont d´eja pr´esents. Les vari´et´es de Nakajima (pour un carquois g´en´eral) sont d´efinies dans la section 4. Les constructions de Nakajima de repr´esentations en homologie et en K-th´eorie sont le sujet des sections 5 et 7 respectivement. La section 6 est d´edi´ee aux propri´et´es de fibrations des vari´et´es carquois et `a la structure de cristal de

´ ASTERISQUE

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

297

200 8

Kashiwara dont on peut munir l’ensemble des composantes irr´eductibles. La derni`ere section se veut un pointeur vers quelques-uns des d´eveloppements plus r´ecents ; le lecteur int´eress´e trouvera plus de d´etails dans les nombreux autres survols du sujet [65], [59],...

28 avr il

Remerciements.— L’auteur remercie chaleureusement P. Baumann, D. Hernandez, ´ Vasserot pour leur aide dans la pr´eparation de cet expos´e. H. Nakajima et E.

´ 2. SCHEMA DE HILBERT DE POINTS DE C2 2.1. D´ efinition

Soit n ≥ 1 un entier et soit (C2 )[n] le sch´ema de Hilbert param´etrant les sous` un tel sous-sch´ema Z ⊂ C2 , on sch´emas de dimension z´ero et de longueur n de C2 . A peut associer son anneau de fonctions r´eguli`eres AZ et son id´eal de d´efinition IZ 0

/ IZ

/ C[x, y]

/ AZ

/0

E´p reu ve SM F

et, ensemblistement, on a

(C2 )[n] = I id´eal de C[x, y] | dim C[x, y]/I = n .

On sait depuis Grothendieck que (C2 )[n] peut ˆetre muni d’une structure de vari´et´e alg´ebrique. De plus, (C2 )[n] est lisse (car C2 est une surface, [13]), irr´eductible, de dimension 2n, et l’application de Hilbert-Chow π : (C2 )[n] → S n C2

qui associe ` a un sous-sch´ema Z son support (compt´e avec multiplicit´e) est une r´esolution de singularit´es. En d’autres termes, π est un morphisme propre qui se restreint en un isomorphisme ∼

n 2 n 2 π : π −1 (S(1 n ) C ) → S(1n ) C

o` u

n 2 S(1 (z1 , . . . , zn ) ∈ S n C2 | zi 6= zj pour i 6= j n)C = [n]

est le lieu lisse de S n C2 . La fibre exceptionnelle la plus int´eressante est (C2 )0 π −1 ((0, 0, . . . , 0)), appel´ee sch´ema de Hilbert ponctuel.

:=

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

298

Olivier SCHIFFMANN

2.2. Description de (C2 )[n] ` a l’aide de carquois

V = C[x, y]/I, v = 1 ∈ V, B1 ∈ End(V ), u 7→ xu,

200 8

Nous allons donner une interpr´etation alg´ebrique du triplet (C2 )[n] , S n C2 , π en ` un id´eal termes d’espaces de modules de repr´esentation d’un carquois tr`es simple. A I de C[x, y] de codimension n, associons le quadruplet (V, B1 , B2 , v) avec

On voit ais´ement que i) [B1 , B2 ] = 0,

28 avr il

B2 ∈ End(V ), u 7→ yu.

ii) le vecteur v engendre tout V sous l’action de B1 et B2 .

Inversement, tout quadruplet (V, B1 , B2 , v) avec dim V = n satisfaisant `a i) et ii) provient d’un unique id´eal I ⊂ C[x, y] d´efini par I = f (x, y) ∈ C[x, y] | f (B1 , B2 ) · v = 0 .

E´p reu ve SM F

Enfin, deux quadruplets (V, B1 , B2 , v) et (V 0 , B10 , B20 , v 0 ) d´eterminent le mˆeme id´eal ∼ I si et seulement si il existe g : V → V 0 pour lequel gv = v 0 , gB1 g −1 = B10 et gB2 g −1 = B20 . En d’autres termes, et toujours ensemblistement, (C2 )[n] s’identifie au quotient ® ´ [B1 , B2 ] = 0 n 2 n (2.1) (B1 , B2 , v) ∈ (End C ) × C /GLn (C). v engendre Cn sous B1 , B2 Exemple 2.1. Voyons comment la structure de (C2 )[n] se refl`ete dans le mod`ele (2.1). ´ Etant donn´e que B1 et B2 commutent, il sont simultan´ement trigonalisables. Soit E = (e1 , . . . , en ) une base de trigonalisation ; notons λ1 , . . . , λn , resp. µ1 , . . . , µn , les coefficients diagonaux de B1 et B2 dans E. Si (λi , µi ) 6= (λj , µj ) pour i 6= j, on voit facilement que B1 et B2 sont simultan´ement diagonalisables. Ceci correspond aux points de l’ouvert {Z = {z1 , · · · , zn } | zi 6= zj pour i 6= j} ⊂ (C2 )[n] .

En g´en´eral, le morphisme de Hilbert-Chow associe `a la GLn (C)-orbite du triplet (B1 , B2 , v) le point π (GLn (C) · (B1 , B2 , v)) = ((λ1 , µ1 ), . . . , (λn , µn )) ∈ S n C2 .

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

299

Pour voir un exemple de ph´enom`ene qui apparaˆıt lorsque B1 ou B2 ne sont pas diagonalisables, prenons n = 2, et Ç å Ç å λ α µ β B1 = , B2 = , (α, β) = 6 (0, 0). 0 λ 0 µ Comme v engendre C2 sous l’action de B1 et B2 , on peut, `a conjugaison pr`es, supposer λ,µ que v = e2 . Dans ce cas, l’id´eal correspondant Iα,β de C[x, y] est engendr´e par les ´el´ements α(y − µ) − β(x − λ), (x − λ)2 , (y − µ)2 . λ,µ Notons que Iα,β ne d´epend que de (λ, µ) et du point (α : β) ∈ P1 . On voit ainsi que, pour n = 2, le sch´ema de Hilbert (C2 )[2] est isomorphe `a l’´eclat´e de S 2 C2 le long de la diagonale.

La th´eorie des repr´esentations des carquois fournit le bon cadre `a l’´etude de vari´et´es telles que celle d´efinie par (2.1). Rappelons bri`evement qu’un carquois n’est rien d’autre qu’un graphe orient´e fini Q = (I, Ω), o` u I d´esigne l’ensemble des sommets, Ω celui des arˆetes orient´ees et o` u Ω est muni d’applications s : Ω → I (source) et t : Ω → I (but, « target »). Une repr´esentation V = (Vi , xσ )i,σ de Q sur un corps k est la donn´ee de k-espaces vectoriels de dimension finie Vi , i ∈ I et d’applications k-lin´eaires xσ : Vs(σ) → Vt(σ) , σ ∈ Ω. Les repr´esentations de Q sur k forment une cat´egorie ab´elienne Repk Q. On note d(V ) = (dim Vi )i ∈ NI le vecteur de dimension de V . Ainsi, la vari´et´e d´efinie par (2.1) avant le quotient par GLn (C) s’identifie-t-elle `a l’espace des repr´esentations du carquois 1

T0 =

1

2 3 2

avec V1 = Cn , V2 = C, qui v´erifient de plus i) [x1 , x2 ] = 0. ii) Tout sous-espace S ⊆ V contenant Im x3 et stable par x1 , x2 est ´egal `a V . La mˆeme vari´et´e d´efinie par (2.1) prise apr`es le quotient par GLn (C) s’identifie `a l’espace des repr´esentations V de T0 de vecteur de dimension d = (n, 1) et v´erifiant i) et ii), mais ` a isomorphisme pr`es.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 300

Olivier SCHIFFMANN

La th´eorie g´eom´etrique des invariants de Mumford [58] permet pr´ecis´ement de construire de tels espaces de modules. Rappelons-en rapidement les grandes lignes. Soit G un groupe alg´ebrique r´eductif complexe et soit M une G-vari´et´e. Pour faire le quotient de M par G au sens de Mumford, consid´erons le fibr´e en droites trivial M × C muni de la G-lin´earisation g · (x, z) = (g · x, χ(g)−1 z), o` u χ : G → C∗ est un caract`ere. Par d´efinition, un point x ∈ M est dit semi-stable si, pour tout z 6= 0, l’adh´erence de l’orbite G · (x, z) n’intersecte pas M × {0}. Notons M ss ⊂ M la sous-vari´et´e form´ee des points semi-stables. Un point x ∈ M est dit stable si, pour tout z 6= 0, l’orbite G · (x, z) est une sous-vari´et´e ferm´ee de M × C, et si le stabilisateur de x dans G est fini. On note M s ⊂ M la sous-vari´et´e form´ee des points stables. La th´eorie de Mumford nous dit que M ss est un ouvert (´eventuellement vide) et qu’il existe un quotient g´eom´etrique M /χ G := M ss // G. En termes d’anneaux de fonctions r´eguli`eres, on a Ñ é M l M ss // G = Proj AG,χ , l≥0

o` u A = C[M ] et o` u, pour l ≥ 0, l AG,χ := f ∈ A | g · f = χ(g)l f pour tout g ∈ G 0

est l’espace des semi-invariants relatifs au caract`ere χl . L’inclusion AG = AG,χ ⊂ L G,χl induit un morphisme propre π 0 : M /χ G → M // G. Enfin, l’ouvert de l≥0 A M /χ correspondant aux points stables est lisse. Appliquons cette technique `a la sous-vari´et´e alg´ebrique ferm´ee M(n,1) de Hom(C, Cn ) × End(Cn )2 form´ee des repr´esentations (x1 , x2 , x3 ) de T0 v´erifiant i). Le groupe G = GLn (C) op`ere naturellement sur M(n,1) . Proposition 2.1. — Pour χ = det, il existe des isomorphismes canoniques M(n,1) /χ G ' (C2 )[n] ,

M(n,1) // G ' S n C2

ss et l’application π 0 s’identifie au morphisme de Hilbert-Chow π. De plus, M(n,1) = s M(n,1) , i.e. tout point semi-stable est stable.

Preuve. — On doit montrer que x = (x1 , x2 , x3 ) est un point semi-stable de M(n,1) si et seulement si il v´erifie la condition ii). Supposons que x ne satisfasse pas `a ii) ; soit S 0 un suppl´ementaire au sous-espace strict S ⊂ Cn engendr´e par Im x3 sous l’action de x1 , x2 . En consid´erant l’action sur un point (x, z) ∈ M(n,1) × C∗ du sous-groupe a un param`etre λ : C∗ → GLn (C), t 7→ IdS ⊕ t−1 IdS 0 on voit ais´ement (en faisant `

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

301

tendre t 7→ 0) que x n’est pas semi-stable. Inversement, supposons que x = (x1 , x2 , x3 ) v´erifie la condition ii). On va montrer que x est alors semi-stable, et mˆeme stable. Soit g ∈ GLn (C) un ´el´ement du stabilisateur de x. Alors le noyau de g − Id contient Im x3 et est stable par x1 , x2 . On en d´eduit que g = Id et donc que x est de stabilisateur trivial. Maintenant, si x n’est pas stable, alors il existe un z 6= 0 pour lequel l’orbite GLn (C)·(x, z) n’est pas ferm´ee. D’apr`es le crit`ere de Hilbert-Mumford, on peut trouver un sous-groupe λ : C∗ → GLn (C) pour lequel lim λ(t) · (x, z) existe et n’appartient t7→0

´ pas ` a GLn (C) · (x, z). Ecrivons la d´ecomposition de Cn comme λ-module Cn =

M

Vm ,

λ(t)|Vm = tm Id.

m∈Z

L L Comme lim λ(t) · (x, z) existe, on a xi (Vm ) ⊂ l≥m Vl et Im x3 ⊂ l≥0 Vl . De la t7→0 L condition ii) on d´eduit donc que C n = m≥0 Vm . Mais en particulier det λ(t) = tN pour un N > 0, ce qui contredit la convergence de λ(t) · (x, z) = (λ(t) · x, t−N z). Donc x est stable et la premi`ere ´egalit´e de l’´enonc´e est d´emontr´ee. Noter qu’on a par la s ss mˆeme occasion d´emontr´e que M(n,1) = M(n,1) . L’identification M(n,1) // G ' S n C2 ainsi que l’assertion concernant le morphisme de Hilbert-Chow sont ´evidentes (cf. Exemple 2.1).

En d’autres termes, on a r´ealis´e (C2 )[n] et S n C2 de mani`ere pr´ecise comme des espaces de modules de repr´esentations du carquois T0 de dimension d = (n, 1), v´erifiant la condition i). On va voir au paragraphe suivant que cette condition est elle-mˆeme ` l’aide de la proposition 2.1, les propri´et´es du morphisme π (protr`es naturelle. A pret´e, d´esingularisation, ...) peuvent se voir comme des cons´equences de la th´eorie g´eom´etrique des invariants.

2.3. Structure symplectique de (C2 )[n] Par un th´eor`eme de Fujiki, le sch´ema de Hilbert X [n] de n points sur une surface symplectique complexe (X, ω) est lui aussi muni d’une forme symplectique ω [n] (ob[n] tenue par extension de la forme ω n d´efinie sur l’ouvert X(1n ) = {(z1 , . . . , zn ) | zi 6= zj pour i 6= j}). Comme on va le voir, lorsque X = C2 , cette structure symplectique admet elle aussi une interpr´etation naturelle en termes d’espaces de modules de repr´esentations de carquois. Pour cela, consid´erons le carquois

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 302

Olivier SCHIFFMANN

1

T =

2

et notons E(n,1) = End(Cn ) ⊕ Hom(C, Cn ) l’espace des repr´esentations de dimension (n, 1). Le groupe G = GLn (C) op`ere naturellement sur E(n,1) . On peut donner un sens ` a l’espace de module E(n,1) = E(n,1) /G mais l’objet qui nous int´eresse ici est plutˆ ot le « fibr´e cotangent » T ∗ E(n,1) de E(n,1) . Pour le d´efinir, on consid`ere le quotient symplectique, ou quotient de Marsden-Weinstein deT ∗ E(n,1) par G, construit de la mani`ere suivante. L’espace E (n,1) = End(Cn )2 ⊕ Hom(C, Cn ) ⊕ Hom(Cn , C) des repr´esentations de dimension (n, 1) du carquois T double de T : 1

T =

2

dont nous noterons les ´el´ements (B1 , B2 , i, j) s’identifie, via la fonction trace (B1 , B2 , i, j) 7→ T r(B1 B2 + ij), a T ∗ E(n,1) et la forme symplectique canonique ω s’y ´ecrit ` (2.2)

ω ((B1 , B2 , i, j), (B10 , B20 , i0 , j 0 )) = T r (B1 B20 − B2 B10 + ij 0 − i0 j) .

L’application moment relative ` a l’action de G sur T ∗ E(1,n) se calcule facilement : µ : E (n,1) → g∗ = gln (C)∗ ' gln (C) (B1 , B2 , i, j) 7→ [B1 , B2 ] + ij. Par d´efinition, le quotient symplectique de E (n,1) par G est le quotient de µ−1 (0) par G. L` a encore, on peut effectuer un tel quotient de deux mani`eres : « `a la Mumford » µ−1 (0) /χ G en choisissant un caract`ere χ : G → C∗ , ou de mani`ere « alg´ebrog´eom´etrique » brutale µ−1 (0) // G.

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

303

Proposition 2.2. — Pour χ = det, on a canoniquement : µ−1 (0) /χ G ' M(n,1) /χ G ' (C2 )[n] , µ−1 (0) // G ' M(n,1) // G ' S n C2 et le morphisme naturel µ−1 (0)/χ G µ−1 (0) // G est ´egal au morphisme de HilbertChow π. Preuve. — En utilisant la proposition 2.1, il suffit de montrer que, pour tout (B1 , B2 , i, j) stable et v´erifiant [B1 , B2 ] + ij = 0, on a j = 0. Ceci r´esulte d’un calcul direct (voir [63], Prop. 2.8.). Ainsi, on peut interpr´eter (C2 )[n] comme ´etant le fibr´e cotangent `a l’espace des modules des repr´esentations du carquois T de dimension (n, 1) (sans relations). Corollaire 2.3. — Le sch´ema de Hilbert (C2 )[n] , ´equip´e de la forme (2.2), est une vari´et´e symplectique. On v´erifie sans peine en utilisant la forme explicite (2.2) de ω que le sch´ema de [n] Hilbert ponctuel (C2 )0 est une sous-vari´et´e coisotrope de (C2 )[n] . De fait, π −1 (∆x ) ' [n] (C2 )0 × C (o` u ∆x = (z, . . . , z) | z ∈ C ⊂ C2 est la diagonale de S n C ⊂ S n C2 ) est une sous-vari´et´e lagrangienne de (C2 )[n] . 2.4. Cohomologie de (C2 )[n] La (co)homologie de (C2 )[n] est connue depuis les travaux d’Ellingsrud et Strømme [12]. Soit Πn l’ensemble des partitions de l’entier n. La longueur d’une partition λ est not´ee l(λ). ´ore `me 2.4 ([12]). — On a, pour tout 0 ≤ i ≤ n The (2.3) (2.4)

dim H 2i ((C2 )[n] , Q) = #{λ ∈ Πn | l(λ) = n − i}, dim H 2i+1 ((C2 )[n] , Q) = 0.

Preuve (esquisse). — Consid´erons l’action du tore T = (C∗ )2 sur C2 d´efinie par (t1 , t2 ) · (x, y) = (t1 x, t2 y) ; soit ρ : T × (C2 )[n] → (C2 )[n] l’action induite sur le sch´ema de Hilbert. Les points fixes de ρ correspondent aux id´eaux I ⊂ C[x, y] de codimension n qui sont engendr´es par des monˆomes. On montre que de tels id´eaux sont en bijection naturelle avec les partitions λ de n via la correspondance

λ = (λ1 , . . . , λr ) 7→ ξλ = y λ1 , xy λ2 , . . . , xr−1 y λr , xr .

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 304

Olivier SCHIFFMANN

Ces points fixes ´etant isol´es, on en d´eduit une d´ecomposition cellulaire « `a la Bialynicki-Birula » de (C2 )[n] : G (2.5) (C2 )[n] = Cλ , λ∈Πn

(2.6)

n o Cλ = ξ ∈ (C2 )[n] | lim z · ξ = ξλ . z7→0

La relation (2.4) s’ensuit. Pour obtenir (2.3), il reste `a voir que Cλ ' Cn+λ1 = 0 Cn+l(λ ) , ce qui d´ecoule d’un calcul pr´ecis de l’action de T sur l’espace tangent Tξλ (C2 )[n] . P En particulier, si on note Pt (X) = l≥0 dimH l (X, Q)tl le polynˆome de Poincar´e d’une vari´et´e alg´ebrique X, on a X Pt ((C2 )[n] ) = t2(n−l(λ)) λ∈Πn

et en formant la s´erie g´en´eratrice, on obtient ∞ X

q n Pt ((C2 )[n] ) =

n=0

∞ Y l=1

1 . 1 − t2l−2 q l

En d’autres termes, il existe un isomorphisme d’espaces vectoriels bigradu´es MM ∼ (2.7) Ψ: H 2i ((C2 )[n] , Q) → C[p1 , p2 , . . . ], n≥0 i≤n

o` u on a pos´e deg(pi ) = (2(i − 1), i). L’espace de droite de (2.7) apparaˆıt souvent en physique, notamment en th´eorie conforme des champs, sous le nom d’espace de Fock bosonique. Il est naturellement muni d’une action de l’alg`ebre de Heisenberg H := C[p±1 , p±2 , . . . ]/ h[pi , pj ] = iδi+j,0 , i, j ∈ Z∗ i (cf. [31]). Nakajima [63] (voir aussi [21]) a construit g´eom´etriquement, `a l’aide de L L correspondances bien choisies, une action de H dans n≥0 i≤n H 2i ((C2 )[n] , Q), et en particulier a d´efini un isomorphisme canonique Ψ comme dans (2.7), respectant les structures de H-modules. Plus remarquable encore, et r´epondant `a une question de Vaffa et Witten [75], Nakajima a ´etendu ce r´esultat ` a une surface quasiprojective lisse X arbitraire : l’espace L L [n] H (X , Q) s’identifie alors `a l’espace de Fock de l’alg`ebre de Cliffordn≥0 i≤n 2i Heisenberg model´ee sur le super-espace vectoriel H∗ (X, Q) (voir [61]). Les nombres de Betti de X [n] avaient ´et´e pr´ec´edemment d´etermin´es par G¨ottsche ([20]). La th´eorie des vari´et´es carquois de Nakajima, dont (C2 )[n] peut ˆetre consid´er´e comme un exemple quelque peu d´eg´en´er´e, fournit de nombreuses autres constructions de telles repr´esentations int´eressantes d’origine g´eom´etrique. Avant de voir, dans la prochaine section, une autre classe d’exemples de vari´et´es de carquois li´ees cette fois

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

305

aux espaces de modules de faisceaux sans torsion sur P2 , terminons par quelques remarques : Remarque 2.5. — i) Il existe un autre moyen, applicable lui aussi `a toute surface quasiprojective lisse X, de calculer la cohomologie de X [n] , qui se base sur des techniques de cohomologie d’intersection et sur le fait remarquable suivant : le morphisme de Hilbert-Chow π : X [n] → S n X est « semi-small » au sens de Goresky-Macpherson. ii) La structure multiplicative de H ∗ ((C2 )[n] , Q) s’exprime elle aussi de mani`ere agr´eable via l’isomorphisme Ψ de (2.7) (voir [82], [43]). iii) La (co)homologie du sch´ema de Hilbert ponctuel est ´egalement bien comprise : (C2 )[n] est irr´eductible ([5]) et admet une d´ecomposition cellulaire similaire `a (2.5). [n] De fait, (C2 )0 est une r´etraction par d´eformation de (C2 )[n] .

3. ESPACE DE MODULES DE FAISCEAUX SANS TORSION SUR P2 Il y a (au moins) deux directions dans lesquelles on peut g´en´eraliser le probl`eme de modules duquel (C2 )[n] est la solution. D’une part, on peut interpr´eter (C2 )[n] comme l’espace des modules des faisceaux coh´erents de torsion sur C2 , et consid´erer de mani`ere plus g´en´erale les faisceaux coh´erents de rang r. D’autre part, pour tout [n] sous-groupe fini Γ ⊂ SL(2, C), on peut s’int´eresser au sch´ema de Hilbert (C2 )Γ 2 param´etrant les sous-sch´emas de longueur n de C qui sont Γ-invariants, ou plus g´en´eralement aux faisceaux coh´erents de rang r sur C2 munis d’une Γ-structure. Comme on va le voir, il existe, dans ces deux situations aussi, une description de l’espace de module en question en termes de repr´esentations de carquois. 3.1. Faisceaux sans torsion de rang sup´ erieur Plutˆ ot que des faisceaux coh´erents de rang r sur C2 , il est pr´ef´erable, du point de vue des espaces de modules, de consid´erer les faisceaux coh´erents de rang r sur P2 munis d’une trivialisation le long de la droite P1∞ ⊂ P2 `a l’infini. ´ore `me 3.1 ([70]). — L’espace des modules M(n, r) param´etrant les faisceaux The sans torsion F sur P2 de rang r, v´erifiant c2 (F) = n et munis d’une trivialisation φ : F|P1∞ ' OP⊕r est isomorphe au quotient de l’espace des quadruplets 1 ∞

(B1 , B2 , i, j) ∈ End(Cn )2 ⊕ Hom(Cr , Cn ) ⊕ Hom(Cn , Cr ) v´erifiant i) [B1 , B2 ] + ij = 0, ii) Im i engendre Cn sous l’action de B1 et B2 ,

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 306

Olivier SCHIFFMANN

par l’action naturelle du groupe GLn (C). Preuve (esquisse). — On utilise la r´esolution (de Koszul) du faisceau structural de la diagonale ∆ ⊂ P2 × P2 (3.1) / OP2 ×P 2 / Λ2 (OP2 (−1) Q) / OP2 (−1) Q / O∆ /0, 0 o` u Q est le « faisceau d’Euler » d´efini par la suite exacte canonique / O⊕3 P2

/ OP2 (−1)

0

/Q

/0.

Tout faisceau coh´erent F s’´ecrit F = (p1 )∗ (p∗2 F ⊗ O∆ )

(3.2)

o` u p1 , p2 d´esignent les deux projections P2 × P2 → P2 . On peut d´evelopper (3.2) en tenant compte de (3.1) ` a l’aide d’une suite spectrale. Lorsque F est sans torsion, cette suite spectrale d´eg´en`ere au rang deux et le rang un se r´eduit `a (3.3) OP2 (−1) ⊗ H 1 (F(−2))

a

/ OP2 ⊗ H 1 (F(−1) ⊗ Q)

b

/ OP2 (1) ⊗ H 1 (F(−1))

avec donc Ker a = Coker b = 0 et Ker b/Im a ' F. Le complexe (3.3) est appel´e monade de Beilinson associ´ee ` a F. Posons V = H 1 (F(−2)), V 0 = H 1 (F(−1)) et 1 W = H (F(−1) ⊗ Q). De c1 (F) = 0, c2 (F) = n, on d´eduit en utilisant RiemannRoch que dim V = dim V 0 = n et dim W = 2n + r. En prenant z0 , z1 , z2 comme coordonn´ees homog`enes sur P2 , on peut ´ecrire a = a0 z0 + a1 z1 + a2 z2 ,

b = b0 z0 + b1 z1 + b2 z2

` l’aide de l’isomorphisme φ : F|P1 ' O⊕r avec ai ∈ Hom(V, W ) et bi ∈ Hom(W, V ). A P1 ∞ 0

∞

∼

on montre par une ´etude pr´ecise que b1 a2 : V → V 0 permet d’identifier V etV 0 , et que la suite Äb ä 1 a a ( 1 2) b2 / V ⊕V / V ⊕V W a V ⊕ V ⊕ W o` u W = Ker b1 ∩ Ker b2 et dim W = r. On peut permet d’identifier W ` ainsi se ramener, grˆ ace ` a la relation ab = 0, `a Ö è Ö è 1V 0 Ä ä Ä ä a1 = , a2 = −1V , b1 = 0 1V 0 , b2 = 1V 0 0 , 0 0 0 Ö

et a0 =

´ ASTERISQUE

B1 B2 j

è ,

Ä b0 = −B2

B1

ä i

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

307

avec Bi ∈ End(V ), i ∈ Hom(W, V ) et j ∈ Hom(V, W ). De la relation a0 b0 = 0 on tire la relation i) : [B1 , B2 ] + ij = 0. Enfin, on montre que l’injectivit´e de a et la surjectivit´e de b sont ´equivalentes `a la condition ii) de l’´enonc´e du th´eor`eme. De cette mani`ere, on associe ` a (F, φ) un quadruplet (B1 , B2 , i, j) d´efini `a conjugaison pr`es et v´erifiant i) et ii). Il reste `a remarquer que cette op´eration est inversible, et fonctorielle. Remarque 3.2. — i) On retrouve, pour r = 1, la description de (C2 )[n] de la section 2.1. En effet, si F est un faisceau sans torsion de rang un, alors F ∗∗ est localement libre, trivial car c1 (F ∗∗ ) = 0, et le quotient F ∗∗ /F est de torsion. On obtient ainsi un isomorphisme ∼

(F, φ) 7→ F ∗∗ /F.

M(n, 1) → (C2 )[n] ,

ii) Il existe, pour r > 1, un analogue du morphisme de Hilbert-Chow. Soit l’espace des modules des faisceaux localement libres F sur P2 , v´erifiant c2 (F) = n et munis d’une trivialisation φ : F|P1∞ ' OP⊕r 1 . Posons ∞ G reg M0 (n, r) = M0 (n − k, r) × S k (C2 ).

Mreg 0 (n, r)

0≤k≤n

L’application de Hilbert-Chow s’´ecrit alors (au niveau des points) π : M(n, r) → M0 (n, r),

(F, φ) 7→ (F ∗∗ , φ, supp(F ∗∗ /F)).

C’est un morphisme propre (voir le th´eor`eme 3.5 pour une description de M0 (n, r) et π en termes de carquois). 3.2. Faisceaux coh´ erents Γ-´ equivariants Fixons ` a pr´esent un sous-groupe fini Γ ⊂ SL(2, C), et consid´erons l’extension du th´eor`eme 3.1 au cadre Γ-´equivariant. Il nous faut d’abord introduire quelques notations relatives ` a Γ. Soit {Si | i ∈ I} l’ensemble des repr´esentations simples de Γ, et soit L la repr´esentation naturelle de Γ dans C2 . Pour a ∈ I on a une d´ecomposition M ⊕ρ Sa ⊗ L ' Sb ab . b∈I

Comme Γ ⊂ SL(2, C) = SP (2, C), L est autoduale d’o` u ρab = ρba . Le graphe de McKay de Γ est le graphe GΓ d’ensemble de sommets I et dans lequel les sommets a et b sont reli´es par ρab arˆetes (non orient´ees). McKay a fait l’observation remarquable suivante : l’application Γ 7→ GΓ ´etablit une bijection entre les sous-groupes finis non triviaux de SL(2, C) (pris ` a conjugaison pr`es) et les diagrammes de Dynkin affines simplement lac´es :

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 308

Olivier SCHIFFMANN

Groupe Γ

Graphe GΓ

Type

Cyclique Cn+1

A(1) n

Di´edral D2n

Dn(1)

T´etra´edral

E6

Octa´edral

E7

Icosa´edral

E8

(1)

(1)

(1)

On peut rajouter ` a ce tableau une ligne correspondant au cas d´eg´en´er´e de Γ = {Id} :

(1)

Trivial

A0

Consid´erons le carquois T Γ dont l’ensemble des sommets est I 0 = I × {0, 1}, dans lequel ρab arˆetes orient´ees relient le sommet (a, 1) au sommet (b, 1) et dans lequel les sommets (a, 1) et (a, 0) sont reli´es par une paire d’arˆetes d’orientation oppos´ee. On notera Ω l’ensemble des arˆetes reliant des sommets (a, 0), (b, 0) pour a, b ∈ I. L’inversion du sens des fl`eches d´efinit une involution (sans points fixes) h 7→ h de Ω.

(1)

Exemple 3.1. Si Γ est de type D5 , alors T Γ est ´egal `a :

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

309

0

Soit (v, w) ∈ NI × NI = NI un vecteur de dimension de T Γ , avec v = (va )a∈I , w = (wa )a∈I . Posons Va = Cva et Wa = Cwa . L’espace des repr´esentations de T Γ de dimension (v, w) est M M M Hom(Va , Wa ). Hom(Wa , Va ) ⊕ E v,w = Hom(Vs(h) , Vt(h) ) ⊕ a∈I

a∈I

h∈Ω

Les ´el´ements de E v,w seront not´es (Bh , ia , ja )h,a . Les groupes Gv = Q Gw = a∈I GL(Wa ) op`erent par conjugaison sur E v,w .

Q

a∈I

GL(Va ) et

Pour finir, on choisit une fonction : Ω → {±1} v´erifiant (h) + (h) = 0. ´ore `me 3.3 (Nakajima). — Soient V, W deux repr´esentations de Γ de dimenThe sion finie. Posons v = (va )a∈I , w = (wa )a∈I avec va = dim Hom(Sa , V),

wa = dim Hom(Sa , W).

L’espace des modules MΓ (v, w) param´etrant les faisceaux sans torsion Γ-´equivariants F sur P2 satisfaisant H 1 (F(−1)) ' V, et munis d’une trivialisation Γ-´equivariante φ : F|P1∞ ' OP1∞ ⊗ W, est isomorphe au quotient de l’espace des repr´esentations (Bh , ia , ja )h,a ∈ E v,w de T Γ v´erifiant i) ∀ a ∈ I, X

(h)Bh Bh + ia ja = 0,

h∈Ω s(h)=a

ii)

L

a

Im ia engendre

L

a

Va sous l’action des op´erateurs Bh (h ∈ Ω),

par l’action du groupe Gv .

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 310

Olivier SCHIFFMANN

Preuve (esquisse). — La preuve, que l’on trouvera ´ecrite dans [77], se base sur une version Γ-´equivariante de la description de Beilinson de faisceaux coh´erents sur P2 en termes de monades (cf. preuve du th´eor`eme 3.1).

Remarque 3.4. — La version Γ-´equivariante du morphisme de Hilbert-Chow est la suivante. Soit MΓ,reg (v, w) ⊂ MΓ (v, w) la sous-vari´et´e param´etrant les faisceaux F 0 localement libres ; posons MΓ0 (v, w) =

G

0

(v0 , w) × (S l(v,v ) (C2 ))Γ , MΓ,reg 0

0≤k≤n

avec l(v, v0 ) =

P

a (va

− va0 )dim Sa . L’application de Hilbert-Chow s’´ecrit alors

π : MΓ (v, w) → MΓ0 (v, w),

(F, φ) 7→ (F ∗∗ , φ, supp(F ∗∗ /F)).

C’est un morphisme propre (ici aussi, une description de MΓ0 (v, w) et π en termes de carquois est donn´ee dans le th´eor`eme 3.5).

3.3. Structure symplectique Tout comme (C2 )[n] , les espaces M(n, r) et MΓ (v, w) poss`edent une structure symplectique naturelle, h´erit´ee de celle de P2 . Et comme pour (C2 )[n] , on peut interpr´eter les constructions de M(n, r) et MΓ (v, w) donn´ees au paragraphe pr´ec´edent comme des quotients symplectiques. Par simplicit´e, nous traiterons les cas Γ = {Id} et Γ 6= {Id} de mani`ere simultan´ee (1) en consid´erant que le graphe de McKay de {Id} est le carquois de type A0 . Fixons donc un sous-groupe Γ de SL(2, C). Soit TΓ un carquois obtenu `a partir du graphe GΓ en orientant de mani`ere arbitraire les arˆetes, en rajoutant pour chaque sommet de GΓ un autre sommet ainsi qu’une arˆete orient´ee du nouveau sommet vers l’ancien. (1) Un exemple rendra la construction plus claire : si Γ est de type D5 on peut prendre TΓ comme suit :

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

311

Notons qu’il existe plusieurs choix pour TΓ , et que le carquois T Γ peut se voir comme le « double » (au niveau des arˆetes) de TΓ . Comme au paragraphe pr´ec´edent, on notera I 0 = I × {0, 1} les sommets de TΓ et Ω les arˆetes de TΓ qui proviennent de GΓ , de sorte que Ω soit le double de Ω. Pour tout vecteur de dimension (v, w) de TΓ , on pose Va = Cva , Wa = Cwa et on note Ev,w =

M

Hom(Vs(h) , Vt(h) ) ⊕

M

Hom(Wa , Va )

a∈I

h∈Ω

l’espace des repr´esentations de TΓ de dimension (v, w). Comme toujours, les groupes Q Q Gv = a GL(Va ) et Gw = a GL(Wa ) op`erent sur Ev,w . Conform´ement aux notations du paragraphe pr´ec´edent nous ´ecrirons (Bh , ia )h,a les ´el´ements de Ev,w . Enfin, on choisit l’application : Ω → {±1} de telle sorte que (h) = 1 si h ∈ Ω. Identifions T ∗ Ev,w ` a E v,w via l’accouplement Ä ä (Bh , ia )h,a , (Bh0 , ja0 )h,a = T r

! X

(h)Bh Bh0

+

X

i a ja

.

a

h∈Ω

La forme symplectique induite sur E v,w s’´ecrit Ñ ω : ((Bh , ia , ja )h,a , (Bh0 , i0a , ja0 )h,a ) = T r

é X

h∈Ω

(h)Bh Bh0 +

X

(ia ja0 − i0a ja )

.

a

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 312

Olivier SCHIFFMANN

L’action de Gv sur E v,w est symplectique, d’application moment µ : E v,w → g∗v ' gv Ü (Bh , ia , ja )h,a 7→

ê

X

X

a

h∈Ω s(h)=a

(h)Bh Bh + ia ja

.

En particulier, la condition i) du th´eor`eme 3.3 n’est rien d’autre que l’´equation de moment µ((Bh , ia , ja )h,a ) = 0. Le quotient symplectique de l’action de Gv sur E v,w est par d´efinition le quotient de µ−1 (0) par Gv , quotient que l’on peut effectuer de deux mani`eres : ´ore `me 3.5. — Pour χ = det : Gv → C∗ , (ga )a 7→ The

Q

a

det(ga ), on a

µ−1 (0)/χ Gv ' MΓ (v, w), µ−1 (0) // Gv ' MΓ0 (v, w), et le morphisme naturel µ−1 (0)/χ Gv → µ−1 (0) // Gv co¨ıncide avec le morphisme de Hilbert-Chow. Preuve (esquisse). — Pour montrer la premi`ere assertion, il faut v´erifier que la condition de stabilit´e pour χ = det co¨ıncide avec la condition ii) du th´eor`eme 3.3. La d´emonstration est essentiellement la mˆeme que celle de la proposition 2.1. Pour les autres assertions, voir [77]. Corollaire 3.6. — Pour tout sous-groupe fini Γ ⊂ SL(2, C), MΓ (v, w) est une vari´et´e symplectique. 3.4. R´ esolutions de singularit´ es de Klein Ceci correspond au cas r = 1 et Γ non trivial. ´ore `me 3.7 (Kronheimer, Ginzburg-Kapranov, Ito-Nakamura) The Soit Γ un sous-groupe non trivial de SL(2, C), soit V la repr´esentation r´eguli`ere de Γ et W = C la repr´esentation triviale. On pose v = (va )a∈I , w = (wa )a∈I o` u va = dim Hom(Sa , V),

wa = dim Hom(Sa , W).

Alors (3.4)

MΓ0 (v, w) ' C2 // Γ

et π : MΓ (v, w) → MΓ0 (v, w) est la r´esolution minimale des singularit´es.

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

313

Preuve (esquisse). — Posons n = |Γ|. Il est facile de voir, en comparant les alg`ebres de {Id} fonctions, que (S n C2 )Γ ' C2 //Γ. D’apr`es la proposition 2.2, on a S n C2 ' M0 (n, 1). {Id} L’action d’un ´el´ement γ = ac db de Γ sur ' M0 (n, 1) s’´ecrivant γ · (B1 , B2 , i, j) = (aγB1 γ −1 + cγB2 γ −1 , bγB1 γ −1 + dγB2 γ −1 , γiγ −1 , γjγ −1 ) o` u Γ op`ere sur Cn par la repr´esentation r´eguli`ere et sur C par la repr´esentation {Id} triviale, on montre que (M0 (n, 1))Γ ' MΓ0 (v, w), d’o` u (3.4). Un raisonnement 2 [n] Γ {Id} Γ Γ similaire montre que ((C ) ) = (M (n, 1)) ' M (v, w). Comme (C2 )[n] est lisse, il en va de mˆeme pour sa sous-vari´et´e de points fixes sous l’action du groupe fini Γ, et MΓ (v, w) est lisse. Comme toute Γ-orbite de C2 diff´erente de {0} est libre, n 2 ´ on a (S n C2 )Γ ∩ S(1 = (S n C2 )Γ \{n · 0}. Etant donn´e que π : (C2 )[n] → S n C2 n)C ∼

n 2 n 2 −1 se restreint en un isomorphisme π −1 (S(1 (MΓ0 (v, w)\ n ) C ) → S(1n ) C , on a π : π ∼

{n · 0}) → MΓ0 (v, w)\{n · 0}. Soit X la composante connexe de MΓ (v, w) contenant π −1 (MΓ0 (v, w)\{n · 0}). D’apr`es ce qui pr´ec`ede, π : X → MΓ0 (v, w) est une r´esolution des singularit´es. Comme X est symplectique par le corollaire 3.6, KX = 0 et donc π est une (la) r´esolution minimale. Pour conclure, il reste juste `a d´emontrer que X = MΓ (v, w), i.e. que M(v, w) est connexe. Mais si X 0 est une autre composante connexe, on a forc´ement X 0 ⊂ π −1 (n · 0) donc X 0 est coisotrope. Ceci contredit le fait que MΓ (v, w) est symplectique.

Remarque 3.8. — i) Cette description des r´esolutions des singularit´es kleiniennes en termes de carquois est essentiellement due `a Kronheimer [40] (red´ecouverte de fa¸con ind´ependante plus tard par Ginzburg-Kapranov [17], et Ito-Nakamura [28]), et a en grande partie motiv´e le travail de Nakajima. Une interpr´etation des vari´et´es MΓ (v, w) pour d’autres valeurs de v, w est donn´ee dans [41] : on obtient ainsi des espaces de modules de fibr´es vectoriels sur les r´esolutions minimales de singularit´es kleiniennes (les « espaces ALE »). ii) Comme mentionn´e dans l’introduction, les vari´et´es de carquois fournissent des morphismes π : M(v, w) → M0 (v, w) tr`es similaires `a la r´esolution de Springer T ∗ B → N du cˆ one nilpotent d’une alg`ebre de Lie semi-simple complexe. Le th´eor`eme 3.7 illustre bien ce principe : un th´eor`eme fameux de Slodowy [74] dit que les singularit´es kleiniennes ainsi que leurs r´esolutions minimales se plongent dans la r´esolution de Springer. Il existe mˆeme, en type A, des isomorphismes explicites entre les vari´et´es carquois M (v, w) et M0 (v, w) et les « slices » de Slodowy et leur d´esingularisation (cf. [60] et [52]).

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 314

Olivier SCHIFFMANN

´ ´ ES ´ CARQUOIS 4. DEFINITION DES VARIET Dans cette section, nous donnons la d´efinition des vari´et´es carquois de Nakajima en g´en´eral ainsi que leurs premi`eres propri´et´es g´eom´etriques. 4.1. D´ efinition Soit Q = (I, Ω) un carquois fini, dont nous supposerons pour simplifier qu’il ne contient pas de lacets, c’est-` a-dire de sommet reli´e `a lui-mˆeme par une arˆete, et qu’il ne contient, plus g´en´eralement, pas de cycles orient´es. Pour toute arˆete orient´ee h, nous noterons h l’arˆete orient´ee oppos´ee. Consid´erons le carquois double Q = (I, Ω) o` u Ω = {h | h ∈ Ω} t {h | h ∈ Ω}. On d´efinit une fonction : Ω → {±1} par (h) = 1 si h ∈ Ω et (h) = −1 si h ∈ Ω. Enfin, soit T le carquois d’ensemble de sommets I 0 = I × {0, 1} obtenu en d´edoublant les sommets de Q et en rajoutant une paire d’arˆetes d’orientation oppos´ee reliant chaque sommet de Q ` a son double. Voici un exemple :

Q=

Q=

T =

Soit (v, w) ∈ NI ×NI , v = (va )a∈I , w = (wa )a∈I un vecteur de dimension de T . Posons Va = Cva , Wa = Cwa . Comme pr´ec´edemment, nous noterons (Bh , ia , ja )h∈Ω,a∈I les ´el´ements de l’espace des repr´esentations M M M E v,w = Hom(Vs(h) , Vt(h) ) ⊕ Hom(Wa , Va ) ⊕ Hom(Wa , Va ) h∈Ω

a

de T de dimension (v, w). Les groupes Gv = sur E v,w .

´ ASTERISQUE

a

Q

a

GL(Va ) et Gw =

Q

a

GL(Wa ) op`erent

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

315

Comme ` a la section pr´ec´edente, E v,w est naturellement muni d’une forme symplectique : Ñ é X X ω : ((Bh , ia , ja )h,a , (Bh0 , i0a , ja0 )h,a ) = T r (h)Bh Bh0 + (ia ja0 − i0a ja ) , a

h∈Ω

et l’action de Gv sur E v,w est symplectique, d’application moment µ : E v,w → g∗v ' gv Ü (Bh , ia , ja )h,a 7→

ê

X

X

a

h∈Ω s(h)=a

(h)Bh Bh + ia ja

.

Les vari´et´es carquois associ´ees `a Q et aux vecteurs de dimension v, w sont obtenues par quotient symplectique de E v,w par Gv : ´finition 4.1. — Soient χ = det−1 : Gv → C∗ , (ga ) 7→ De

Q

det(ga )−1 . On pose

M(v, w) = MQ (v, w) := µ−1 (0) /χ Gv , −1 M0 (v, w) = MQ (0) // Gv , 0 (v, w) := µ

et on note π : M(v, w) → M0 (v, w) le morphisme projectif naturel. Proposition 4.2. — Un point (Bh , ia , ja ) de µ−1 (0) est stable pour χ = det−1 si et L seulement si la condition suivante est satisfaite : tout sous-espace S ⊂ a Va contenu L dans Ker erateurs Bh (pour h ∈ Ω) est trivial. a ja et invariant par les op´ Preuve. — Identique ` a celle de la proposition 2.1 Remarque 4.3. — i) On a choisi, dans la d´efinition de M(v, w), le caract`ere χ = det−1 inverse ` a celui qui apparaˆıt naturellement dans les sections 2 et 3. En particulier, les vari´et´es MΓ (v, w) sont diff´erentes des vari´et´es de carquois MQ (v, w) associ´ees `a un carquois affine. N´eanmoins, ici, le choix de la condition de stabilit´e n’a pas d’influence sur la topologie du quotient symplectique µ−1 (0)/Gv : les vari´et´es MΓ (v, w) et MQ (v, w) correspondent ` a deux structures complexes diff´erentes sur le mˆeme espace (cf. Section 8). ii) Par d´efinition, M0 (v, w) param`etre les Gv -orbites ferm´ees dans µ−1 (0). L’application « de Hilbert-Chow » π associe `a une Gv -orbite stable l’unique Gv -orbite ferm´ee contenue dans son adh´erence de Zariski. On trouvera dans [62] une caract´erisation explicite de cette Gv -orbite ferm´ee.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 316

Olivier SCHIFFMANN

4.2. Propri´ et´ es g´ eom´ etriques de M(v, w) Pour a, b ∈ I, a 6= b, notons ρab le nombre d’arˆetes reliant a `a b dans Q. Soit C = (cab )a,b∈I la matrice sym´etrique I × I d´efinie par cab = 2δa,b − ρab − ρba . P Si z = (za ) ∈ NI et y = (ya ) ∈ NI , on pose hz, yi = a za ya . (4.1)

´ore `me 4.4. — M(v, w) est une vari´et´e symplectique lisse connexe et de dimenThe sion hv, 2w − C · vi. Preuve. — Commen¸cons par remarquer que toute Gv -orbite de µ−1 (0)s est r´eguli`ere : L en effet, si (ga )a ∈ StabGv (Bh , ia , ja )h,a , alors le sous-espace a Im (ga − Id) est Bh L invariant et contenu dans Ker a ja , donc trivial, et donc ga = Id pour tout a. Montrons maintenant que µ−1 (0)s est lisse (alors que µ−1 (0) ne l’est pas en g´en´eral). Ceci est une cons´equence du fait que la restriction de l’application moment µ `a µ−1 (0)s est une submersion : si ξ ∈ gv est orthogonal `a Im dµ(Bh ,ia ,ja ) , alors Im ξ est Bh L invariant et contenu dans Ker a ja , donc ξ = 0. Enfin, on a dim M(v, w) = dim µ−1 (0)s − dim Gv = dim E v,w − 2dim Gv , d’o` u l’on d´eduit la formule de dimension. La d´emonstration de la connexit´e (voir [8]) est beaucoup plus subtile et repose (entre autre) sur l’existence de foncteurs de r´eflexion (cf. Section 8.2). La vari´et´e affine M0 (v, w) est en g´en´eral singuli`ere (par exemple, si le carquois Q est un diagramme de Dynkin affine comme dans la section 2, M0 (v, w) est diff´eomorphe ` a un quotient C2 //Γ). Le th´eor`eme 4.4 montre que lorsque celle-ci est non vide, M(v, w) est une d´esingularisation (cr´epante) de π(M(v, w)) ⊆ M0 (v, w). Un peu plus pr´ecis´ement, notons Mreg eventuellement vide) 0 (v, w) ⊂ M0 (v, w) l’ouvert (´ form´e des Gv -orbites ferm´ees r´eguli`eres (i.e. de stabilisateur trivial). Alors, de telles orbites sont toujours stables (cf. [60], Prop. 3.24.) et le morphisme π induit un isoreg morphisme π −1 (Mreg 0 (v, w)) ' M0 (v, w). On sait en outre que M0 (v, w) est une vari´et´e irr´eductible normale (cf. [9]). La vari´et´e M0 (v, w) contient toujours un point 0 correspondant `a Bh = ja = ia = 0 pour tout h ∈ Ω et a ∈ I. La fibre sp´eciale L(v, w) := π −1 (0) joue un rˆole crucial dans la th´eorie. Par construction, c’est une sous-vari´et´e projective coisotrope de M(v, w). Bien plus est vrai : ´ore `me 4.5 ([60], Th. 5.8). — L(v, w) est une sous-vari´et´e lagrangienne de The M(v, w), homotope ` a M(v, w). Preuve. — La d´emonstration du fait que L(v, w) est lagrangienne sera esquiss´ee dans la section 6.4. En ce qui concerne la seconde assertion, voir [60], Section 5.4.

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

317

Il existe sur M(v, w) et M0 (v, w) une action alg´ebrique de C∗ , analogue `a celle d´efinie sur le sch´ema de Hilbert (C2 )[n] (voir Section 2.4.). Elle est simplement donn´ee par (4.2)

z · (Bh , ia , ja )h,a = (z (1−(h))/2 Bh , ia , zja ). ∗

∗

Posons F(v, w) = M(v, w)C . Il est facile de voir que M0 (v, w)C = {0}. Le morphisme π ´etant C∗ -´equivariant, on a F(v, w) ⊂ L(v, w). La vari´et´e lisse F(v, w) n’est en g´en´eral pas de dimension z´ero. N´eanmoins, il existe une d´ecomposition « `a la Bialynicki-Birula » o [n L(v, w) = x ∈ M(v, w) | lim z · x ∈ Fi z7→∞

i

o` u {Fi }i d´esignent les composantes connexes de F(v, w). Terminons cette section sur les propri´et´es g´en´erales des vari´et´es carquois par le cas le plus simple, celui des diagrammes de Dynkin de type fini. Pour v0 ≤ v (i.e. va0 ≤ va pour tout a), il existe un plongement canonique M0 (v0 , w) ,→ M0 (v, w) induit par 0 l’inclusion Va0 = Cva ,→ Cva = Va . ´ore `me 4.6 ([62], Cor. 10.11.). — Soit Q un diagramme de Dynkin de type fini. The Pour tout v, w ∈ NI , on a [ 0 M0 (v, w) = Mreg 0 (v , w), v0 ≤v

et l’application π : M(v, w) → M0 (v, w) est une r´esolution des singularit´es « semismall » au sens de Goresky-MacPherson. 4.3. Vari´ et´ e des triplets et correspondances de Hecke Soit c ∈ I et soient v1 , v2 , w des vecteurs de dimension satisfaisant v2 − v1 = ec (on note (ea )a la base canonique de ZI ). Consid´erons la sous-vari´et´e ferm´ee B+ ee des paires (Bh1 , i1a , ja1 )h,a , c (v1 , v2 , w) ⊂ M(v1 , w) × M(v2 , w) constitu´ (Bh2 , i2a , ja2 )h,a pour lesquelles il existe ξa : Va1 ' Va2 pour a 6= c et ξc : Vc1 ,→ Vc2 satisfaisant Bh2 ξa = ξa Bh1 ,

ξa i1a = i2a ,

ja1 = ja2 ξa

pour tout a ∈ I et h ∈ Ω. Intuitivement, B+ etrise les paires de c (v1 , v2 , w) param´ repr´esentations les « plus proches » l’une de l’autre, i.e. reli´ees par une modification ´el´ementaire. C’est l’analogue direct des correspondances de Hecke dans la th´eorie des formes automorphes sur les corps de fonctions. Munissons M(v1 , w) × M(v2 , w) de la forme symplectique (ω1 , −ω2 ), o` u ω1 et ω2 sont les formes symplectiques canoniques de M(v1 , w) et M(v2 , w).

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 318

Olivier SCHIFFMANN

Proposition 4.7 ([62], Thm. 5.7.). — La correspondance de Hecke B+ c (v1 , v2 , w) est une sous-vari´et´e lagrangienne lisse de M(v1 , w) × M(v2 , w). Lorsque v1 − v2 = ec , on d´efinit − Bc (v1 , v2 , w) ⊂ M(v1 , w) × M(v2 , w).

de mˆeme la correspondance de Hecke

Soient ` a pr´esent v1 , v2 , w des vecteurs de dimension arbitraires. La vari´et´e des triplets (ou vari´et´e de Steinberg) est le produit fibr´e (4.3)

Z(v1 , v2 , w) := M(v1 , w)

×

M(v2 , w).

M0 (w)

Noter que M0 (v0 , w) ,→ M0 (v, w) si v0 ≤ v ; donc on peut consid´erer la limite S inductive M0 (w) = v M0 (v, w) et (4.3) a bien un sens. On pose G Z(w) = Z(v1 , v2 , w). v1 ,v2

S reg Soit Mreg es le th´eor`eme 4.4 v M0 (v, w). Si Q est de type fini, alors d’apr` 0 (w) = reg reg on a M0 (w) = M0 (w) mais en g´en´eral M0 (w) est un ouvert strict de M0 (w). On pose Zreg (v1 , v2 , w) = M(v1 , w)

×

Mreg (w) 0

M(v2 , w).

´ore `me 4.8. — La sous-vari´et´e Z(v1 , v2 , w) est lagrangienne. The Preuve. — Elle sera esquiss´ee dans la section 6.4. Noter que lorsque v2 − v1 = ±ec la correspondance de Hecke B± c (v1 , v2 , w) est reg une composante irr´eductible de Z (v1 , v2 , w).

` ` 5. ALGEBRE DE CONVOLUTION ET ALGEBRES DE KAC-MOODY Dans cette section, nous d´ecrivons le r´esultat principal de [62] : la r´ealisation dans la cohomologie des fibres du morphisme π : M(v, w) → M0 (v, w) de repr´esentations int´egrables d’alg`ebres de Kac-Moody. On se fixe une fois pour toutes un carquois arbitraire Q. Commen¸cons par un bref rappel concernant les alg`ebres de Kac-Moody (voir [30]).

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

319

5.1. Alg` ebres de Kac-Moody et repr´ esentations int´ egrables La matrice C associ´ee ` a Q par (4.1) est une matrice de Cartan g´en´eralis´ee (sym´e` une telle donn´ee trique), i.e. on a caa = 2 pour tout a ∈ I et cab ∈ Z≤0 si a 6= b. A correspond une alg`ebre de Lie g = gC (de Kac-Moody) d´efinie par g´en´erateurs et relations. ´finition 5.1. — i) Soit C = (cab )a,b∈I une matrice de Cartan g´en´eralis´ee. Une De r´ealisation de C est une paire d’espaces vectoriels h, h∗ en dualit´e munis d’ensemble de vecteurs lin´eairement ind´ependants Π = {αa | a ∈ I} ⊂ h∗ , Π∨ = {αa∨ | a ∈ I} ⊂ h tels que dim h = 2|I| − rang(C) et satisfaisant hαa∨ , αb i = cab pour tout a, b. ii) L’alg`ebre de Kac-Moody g est la C-alg`ebre de Lie engendr´ee par des ´el´ements {ea , fa | a ∈ I}, h ∈ h soumis aux relations suivantes : [h, h0 ] = 0 [h, eb ] = αb (h)eb [h, fb ] = −αb (h)fb (5.1)

[ea , fb ] = δab ha ad1−cab (ea )(eb ) = 0 ad1−cab (fa )(fb ) = 0

pour tout a, b ∈ I et h, h0 ∈ h. Lorsque C est une matrice de Cartan usuelle, on retrouve la pr´esentation de Serre des alg`ebres de Lie simples complexes ; dans tous les autres cas, g est de dimension infinie. Si C est associ´e ` a un diagrame de Dynkin affine de type X (1) (cf. Tableau section 3.2.), g est isomorphe ` a l’alg`ebre affine gbX ' gX ⊗ C[t, t−1 ] ⊕ Cc. La structure des alg`ebres de Kac-Moody poss`ede beaucoup de points communs avec celle des alg`ebres de Lie simples complexes. En particulier, g se d´ecompose en espaces radiciels pour l’action adjointe de h M g=h⊕ gα α∈∆

o` u h = a Cha , et o` u α parcourt le syst`eme de racines ∆ ⊂ h∗ de g. Une repr´esentation V de g est dite int´egrable si, pour tout a ∈ I, les op´erateurs ea et fa sont localement nilpotents dans V . Les repr´esentations de g qui sont int´egrables et de plus haut poids sont bien connues. Posons L

P + = {λ ∈ h∗ | hλ, αa∨ i ∈ N≥0 pour tout a ∈ I}. Pour λ ∈ h∗ , notons M (λ) = U (g) ⊗U (b) Cλ le module de Verma de plus haut poids λ ; soit L(λ) son unique quotient irr´eductible. Alors L(λ) est int´egrable si et seulement si λ ∈ P + , et toute repr´esentation int´egrable de plus haut poids se d´ecompose comme

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 320

Olivier SCHIFFMANN

une somme directe de modules L(λ). De plus, le caract`ere de L(λ) pour λ ∈ P + est donn´e par la formule de caract`ere de Weyl-Kac : P w·λ w∈W (w)e , (5.2) ch(Lλ ) = Q −α )dim gα α∈∆+ (1 − e o` u W est le groupe de Weyl de g et ∆+ est l’ensemble des racines positives. Il est commode d’introduire les poids fondamentaux Λa ∈ P + , d´etermin´es par les relations hΛa , αb∨ i = δab . Ceux-ci sont reli´es aux racines simples par la matrice de Cartan : P αa = b cab Λb . Enfin, on note g0 = [g, g] l’alg`ebre d´eriv´ee de g ; c’est la sous-alg`ebre engendr´ee par les ´el´ements ea , fa , et ha = [ea , fa ] pour tout a ∈ I. 5.2. Alg` ebre de convolution en homologie Pour X un espace topologique localement compact, on note Hi (X) = HiBM (X) le i-i`eme groupe d’homologie de Borel-Moore (i.e. l’homologie singuli`ere des chaˆınes localement finies) ` a coefficients rationnels. Rappelons que H• (X) poss`ede les propri´et´es suivantes : – Si f : X → Y est une application continue propre, il existe une image directe f∗ : H• (X) → H• (Y ). – Si X, Y sont des vari´et´es alg´ebriques complexes et si f : X → Y est un morphisme lisse de dimension n, il existe une image inverse f ∗ : H• (X) → H•+2n (Y ). – Si X et Y sont deux sous-vari´et´es ferm´ees d’une vari´et´e alg´ebrique complexe M de dimension n, il existe un produit d’intersection (d´ependant de M ) ∩ : Hi (X) ⊗ Hj (Y ) → Hi+j−2n (X ∩ Y ). Enfin, citons une propri´et´e essentielle qui distingue l’homologie de Borel-Moore de sa singuli`ere cousine : – Si X est une vari´et´e alg´ebrique complexe de dimension n, alors M Htop (X) := H2n (X) = [Xi ], i

o` u X1 , . . . , Xr sont les composantes irr´eductibles de X de dimension n, et o` u [Xi ] d´esigne la classe fondamentale de Xi . Les propri´et´es de H• (X) ´enonc´ees ci-dessus permettent de d´efinir, `a la mani`ere de Ginzburg (cf. [7]), une structure d’alg`ebre associative sur M Htop (Z(w)) := Htop (Z(v1 , v2 , w)); v1 ,v2

pour v1 , v2 , v3 , w des vecteurs de dimension, on consid`ere le produit M = M(v1 , w) × M(v2 , w) × M(v3 , w)

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

321

muni des projections pij : M → M(vi , w) × M(vj , w) et on pose ∗ : Htop (Z(v1 , v2 , w)) ⊗ Htop (Z(v2 , v3 , w)) → Htop (Z(v1 , v3 , w)) c ⊗ c0 7→ (p13 )∗ (p∗12 c ∩ p∗23 c0 ) . 5.3. R´ ealisation g´ eom´ etrique de U (g0 ) Pour a ∈ I, consid´erons les ´el´ements X Ea (w) = [B+ a (v1 , v1 + ea , w)], v1

Fa (w) =

X

(−1)r(v1 ,w) [B− a (v1 + ea , v1 , w))],

v1 1 2

(dim M(v1 , w) − dim M(v1 + ea , w)). Enfin, d´esignons par o` u r(v1 , w) := [∆(v, w)] la classe fondamentale de la diagonale de Z(v, v, w) dans Htop (Z(v, v, w)), et posons pour a ∈ I X Ha = hea , w − C · vi[∆(v, w)]. v

Noter que les ´el´ements Ea , Fa , Ha appartiennent `a la compl´etion “top (Z(w)) = H

! M

Y

v∈ZI

v1 −v2 =v

Htop (Z(v1 , v2 , w))

de Htop (Z(w)), mais que la structure d’alg`ebre sur Htop (Z(w)) se prolonge `a “top (Z(w)). H Le r´esultat principal de [62] s’´enonce comme suit : ´ore `me 5.2 ([62], Thm. 9.4.). — Pour tout w ∈ NI , il existe un morphisme d’alThe g`ebre “top (Z(w)) Φ : U (g0 ) → H tel que Φ(ea ) = Ea , Φ(fa ) = Fa et Φ(ha ) = Ha . Preuve (esquisse). — Il faut v´erifier que Ea , Fa , Ha satisfont aux relations de la pr´esentation de Serre (5.1). Les trois premi`ere relations de (5.1) sont cons´equences des identit´es faciles [∆(v, w)] ∗ [∆(v0 , w)] = δv,v0 [∆(v, w)], Ea ∗ [∆(v, w)] = [∆(v − ea , w)] ∗ Ea , Fa ∗ [∆(v, w)] = [∆(v + ea , w)] ∗ Fa . Les deux derni`eres relations de (5.1) proviennent du fait que l’action adjointe des Ea et Fa est localement nilpotente (cf. [62], Lemma 9.3.). La principale difficult´e dans la d´emonstration du th´eor`eme r´eside dans le calcul de [Ea , Fa ], qui requiert une analyse fine des questions de transversalit´e pour certaines intersections dans les

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 322

Olivier SCHIFFMANN

produits triples M(v1 , w) × M(v2 , w) × M(v3 , w) (cf. [62], Lemma 9.8 et Appendix).

5.4. R´ ealisation g´ eom´ etrique des repr´ esentations Il est maintenant facile de construire des repr´esentations de U (g0 ) : pour tout x ∈ M0 (w), l’alg`ebre Htop (Z(w)) op`ere, toujours par convolution, sur l’espace L Htop (M(w)x ) := v Htop (M(v, w)x ) o` u on a pos´e M(v, w)x := π −1 (x) ⊂ M(v, w). “top (Z(w)) et se rel`eve donc en une action de U (g0 ). Cette action s’´etend ` aH 0 ´ore `me 5.3 ([62], Thm. 10.2). — Soit x ∈ Mreg The 0 (v0 , w). En tant que U (g )P P module, Htop (M(w)x ) est isomorphe ` a L(λv0 ) o` u λv0 := a wa Λa − a v0,a αa .

L ` l’aide d’un argument de Preuve (esquisse). — Posons Mx = v Htop (M(v, w)x ). A stabilit´e, on v´erifie que l’action de Ea et Fa dans Mx est localement nilpotente pour tout a ∈ I, et donc que Mx est un U (g0 )-module int´egrable. De plus, M(v0 , w)x = {pt} par d´efinition et M(v, w)x = ∅ pour v < v0 , donc [M(v0 , w)x ] est un vecteur de plus haut poids de Mx , de poids λv0 . Tout U (g0 )-module int´egrable de plus haut poids λv0 ´etant isomorphe ` a L(λv0 ), il ne reste plus qu’`a voir que Mx est engendr´e par [M(v0 , w)x ]. La d´emonstration de ce dernier point sera donn´ee dans la section suivante. En particulier, le nombre de composantes irr´eductibles de dimension maximale de M(v, w)x peut se d´eduire de la formule de caract`ere (5.2). Notons que M(v, w)0 n’est rien d’autre que la sous-vari´et´e lagrangienne L(v, w) introduite au paragraphe pr´ec´edent, et on a ainsi Ç å M X Htop (L(v, w)) ' L wa Λa . v

Notons aussi que

Mreg 0 (v0 , w)

a

= ∅ si λv0 6∈ P + (cf. [62]).

Remarque 5.4. — Les classes fondamentales des composantes irr´eductibles de [M (v, w)x ] fournissent une base du module Mx , et donc une base de L(λv0 ). Cette base s’apparente aux bases « canoniques » et « semi-canoniques » d´efinies par Lusztig dans [45], [51], mais le lien pr´ecis (s’il existe), entre toutes ces bases n’est pas encore compris. Concluons cette section par un r´esultat qui donne la structure exacte de l’alg`ebre Htop (Zreg (w)), et qui montre que le noyau de l’application Φ = Φw devient de plus en plus petit ` a mesure que w grossit :

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

323

´ore `me 5.5 ([62], Thm. 10.15). — Il existe un isomorphisme d’alg`ebres The M Htop (Zreg (w)) ' EndC (L(λv0 )) v0

o` u v0 parcourt l’ensemble des vecteurs pour lesquels Mreg 0 (v0 , w) est non vide.

6. STRUCTURE DE CRISTAL DE KASHIWARA 6.1. Fibrations ´ el´ ementaires Un trait caract´eristique et essentiel des vari´et´es M(v, w), ou plutˆot des fibres de l’application de Hilbert-Chow π : M(v, w) → M0 (v, w), est l’existence d’un « d´evissage » par des fibrations en grassmaniennes. Soit (v, w) un vecteur de dimension et soit c ∈ I un sommet de Q. Consid´erons le fibr´e vectoriel tautologique de rang vc sur M(v, w) d´efini par V c = µ−1 (0)s × Vc Gv

−1

s

(Gv op`ere librement sur µ (0) ). Consid´erons aussi le complexe de fibr´es vectoriels tautologiques P P L Bh +jc (h)Bh +jc V ⊕ W c / / Vc . t(h) Vc s(h)=c Notons Qc (v, w) l’homologie du milieu du complexe ci-dessus (c’est un faisceau coh´erent) Ñ é Ñ é X X Qc (v, w) = Ker (h)Bh + ic /Im Bh + jc . t(h)=c

s(h)=c

Par construction, Qc (v, w) se restreint en un fibr´e vectoriel sur chacune des sousvari´et´es localement ferm´ees   Ñ é   X Mc;r (v, w) := (Bh , ia , ja ) | codimVc Im Bh + Im ic = r   t(h)=c

de rang ´egal ` a dim Ker

Ñ

é X

t(h)=c

(h)Bh + ic

− dim Vc = r − 2vc + wc +

X

vt(h)

s(h)=c

= hec , w − C · vi + r. Bien sˆ ur, si r + hec , w − C · vi < 0, on a Mc;r (v, w) = ∅. Soit p : Mc;r (v, w) → Mc;0 (v − rec , w) l’application naturelle qui consiste `a remP placer Vc par Im( t(h)=c Bh + ic ). D’apr`es ce qui pr´ec`ede, Qc (v − rec , w) se restreint

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 324

Olivier SCHIFFMANN

en un fibr´e vectoriel de rang hec , w − C · vi + 2r sur Mc;0 (v − rec , w). On a un morphisme surjectif naturel de corang r de fibr´es vectoriels sur Mc;r (v, w) uc : p∗ Qc (v − rec , w) Qc (v, w). Le r´esultat suivant, dont on peut tracer l’origine (sous une forme un peu diff´erente) aux travaux de Lusztig [46], est ` a la base de nombreux arguments par r´ecurrence dans la th´eorie des vari´et´es carquois : Proposition 6.1. — Si r < −hec , w − C · vi, alors Mc;r (v, w) est vide. Sinon l’application p : Mc;r (v, w) Mc;0 (v − rec , w) s’identifie ` a la fibration Grr Qc (v − rec , w) en grassmanienne de r-plans dans Qc (v − rec , w). Preuve (esquisse). — L’identification Mc;r (v, w) → Grr Qc (v − rec , w) est simplement obtenue en associant ` a un point x de Mc;r (v, w) le noyau de uc dans la fibre de ∗ p Qc (v − rec , w) au point x. Inversement, un point de Grr Qc (v − rec , w) d´etermine, P via son graphe, une unique application injective s(h)=c Bh + jc . On v´erifie que le point (Bh , ia , ja ) de E v,w correspondant est stable et que µ((Bh , ia , ja )) = 0. ‹c , F ‹c 6.2. Op´ erateurs E On va maintenant utiliser les fibrations ´el´ementaires introduites au dernier paragraphe pour construire des applications entre les ensembles de composantes irr´eductibles de M(v, w) pour diff´erentes valeurs de v. −1 Soit x ∈ Mreg (x) ⊂ M(v, w). 0 (v0 , w) ; notons, pour tout v ≥ v0 , M(v, w)x = π Fixons v ; soit X une composante irr´eductible de M(v, w)x . Pour c ∈ I, posons Ñ é X (6.1) c (X) = MinX codimVc Im Bh + Im ic , t(h)=c

o` u (Bh , ia , ja )h,a parcourt X. Comme la fonction de gauche de (6.1) est semi-continue inf´erieurement, l’´egalit´e dans (6.1) est atteinte sur une partie ouverte non vide de X. En d’autres termes, c (X) est ´egal `a l’unique entier r pour lequel X ∩ Mc;r (v, w) est un ouvert non vide de X. D’apr`es la proposition 6.1, il existe une fibration en grassmaniennes p : Mc;r (v, w) → Mc;0 (v − rec , w). Il est facile de voir que π ◦ p = π. On en d´eduit que p(X ∩ Mc;r (v, w)) est une composante irr´eductible de Mc;0 (v − rec , w), et donc que p(X ∩ Mc;r (v, w)) est une composante irr´eductible de M(v − rec , w) (car Mc;0 (v − rec , w) est ouvert dans M(v − rec , w)). On peut r´esumer ceci par le lemme suivant : Lemme 6.2. — Lorsque r ≥ −hec , w − C · vi, l’application X 7→ p(X ∩ Mc;r (v, w)) induit une bijection Ψcr entre l’ensemble des composantes irr´eductibles X de M(v, w)x

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

325

pour lesquelles c (X) = r et les composantes irr´eductibles X 0 de M(v − rec , w)x pour lesquelles c (X 0 ) = 0. On peut maintenant d´efinir des op´erateurs

‹c : X 7→ E ‹c : X 7→ F

(

Ψcr−1 ◦ (Ψcr )−1 (X)

∅ ( Ψcr+1 ◦ (Ψcr )−1 (X)

si r := c (X) > 0 sinon si r := c (X) > −hec , w − C · vi sinon.

∅

‹c (X)) = c (X) − 1 et c (F ‹c (X)) = c (X) + 1. De plus, F ‹c (X) = X 0 si et On a c (E ‹c (X 0 ) = X. seulement si E ‹c (resp. F ‹c ) l’endomorphisme de Htop (M(w)x ) d´efini par On d´esignera encore par E ‹ ‹ [X] 7→ [Ec (X)] (resp. [X] 7→ [Fc (X)]). ‹c est une approximation « combinatoire » de Fc La propri´et´e suivante montre que F ‹c . (` a un facteur de renormalisation pr`es). Bien sˆ ur, la mˆeme chose vaut pour E Lemme 6.3. — i) En posant r = c (X), on a ‹c ([X]) + Fc · [X] ∈ ±(r + 1)F

M c

C[X 0 ].

(X 0 )>r+1

ii) Si c (X) = r > 0, on a ‹c [X] ∈ ±r[x] + Fc E

M

C[X 0 ].

c (X 0 )>r

Preuve (esquisse). — Les d´emonstrations des deux ´enonc´es ´etant similaires, nous donnons juste la premi`ere. L’inclusion ouverte [ i : Mc;≤r (v, w) := Mc;r (v, w) ,→ M(v, w) r 0 ≤r

induit un morphisme de restriction i∗ : Htop (M(v, w)x ) → Htop (M(v, w)x ∩ ‹c ([X])). Par d´efiniMc;≤r (v, w)), et il faut montrer que i∗ (Fc ([X])) = ±(r + 1)i∗ (F tion, on a −1 Fc ([X]) = (p1 )∗ [B− c (v + ec , v, w)] ∩ [p2 (X)] o` u p1 , p2 d´esignent les deux projections de M(v + ec , w) × M(v, w). En utilisant la ‹c , on voit que la restriction de p1 `a proposition 6.1 et la d´efinition de F −1 − p−1 1 (Mc;≤r+1 (v + ec , w)) ∩ Bc (v + ec , v, w) ∩ p2 (X) ‹c (X) ∩ Mc;≤r+1 (v + ec , w). La relation i) est une fibration en Pr ` a support sur F s’ensuit (cf. [62], Lemma 10.1, pour le calcul explicite du signe).

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 326

Olivier SCHIFFMANN

6.3. Cristaux de Kashiwara Motiv´e par ses travaux sur les base cristallines des repr´esentations des alg`ebres enveloppantes quantiques, Kashiwara a introduit la notion remarquable de cristal abstrait pour une alg`ebre de Kac-Moody g, et introduit plusieurs cat´egories int´eressantes de cristaux (de plus haut poids, int´egrables, extr´emaux, etc.), qui sont autant de pendants « combinatoires » aux cat´egories correspondantes de repr´esentations de g. Rappelons-en succinctement la d´efinition. Le lecteur int´eress´e est invit´e `a consulter [27], [34] pour un traitement approfondi. ´finition 6.4. — Un g-cristal est la donn´ee d’un ensemble B muni d’applications De wt : B → P, o` uP =

L

c

εc : B → Z,

ϕc : B → Z,

(c ∈ I)

ZΛc d´esigne le r´eseau des poids de g, et e˜c : B → B t {0},

f˜c : B → B t {0},

(c ∈ I)

satisfaisant aux axiomes suivants : i) ϕc (b) = εc (b) + hhc , wt(b)i, ii) Si b ∈ B et e˜c (b) ∈ B, alors wt(˜ ec (b)) = wt(b) + αc , εc (˜ ec (b)) = εc (b) − 1 et ϕc (˜ ec (b)) = ϕc (b) + 1, iii) Si b ∈ B et f˜c (b) ∈ B, alors wt(f˜c (b)) = wt(b) − αc , εc (f˜c (b)) = εc (b) + 1 et ϕc (f˜c (b)) = ϕc (b) − 1, iv) Si b, b0 ∈ B, on a e˜c (b) = b0 si et seulement si f˜c (b0 ) = b. Un cristal est dit de plus haut poids si il est engendr´e (sous l’action des op´erateurs e˜c , f˜c ) par des sommets b1 , . . . , br satisfaisant e˜c (bi ) = 0 pour tout i et tout c ∈ I. On d´efinit la notion de morphisme entre deux g-cristaux, et on peut consid´erer la cat´egorie des g-cristaux de plus haut poids. On d´efinit aussi la notion de produit tensoriel de deux cristaux. Notons qu’il existe plusieurs cristaux non isomorphes (et mˆeme int´egrables en un sens ´evident) ayant le mˆeme plus haut poids. N´eanmoins, Joseph a montr´e le th´eor`eme d’unicit´e remarquable suivant : on dira qu’une famille {B(λ) | λ ∈ P + } est close si elle est munie d’inclusions de cristaux iλ,µ : B(λ + µ) → B(λ) ⊗ B(µ). ´ore `me 6.5 (Joseph, [29]). — Il existe une unique famille close {B(λ) |λ ∈ P + } The de g-cristaux. Le cristal B(λ) peut se construire `a partir d’une base cristalline pour la repr´esentation Lq (λ) de l’alg`ebre enveloppante quantique Uq (g). Il « code » une information tr`es fine sur L(λ) (bien plus fine, par exemple, que le simple caract`ere ch(L(λ)). Nous en venons au r´esultat principal de cette section :

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

327

´ore `me 6.6 (Saito [72]). — Soit x ∈ Mreg The 0 (v0 , w). L’ensemble G B := Irr(M (v, w)x ) v≥v0

des composantes irr´eductibles de M(v, w)x pour tout v, muni des applications X X wt : X ∈ Irr(M(v, w)x ) 7→ wc Λc − vc αc , εc (X) = c (X), c

c

ϕc (X) = hec , w − C · vi − c (X) pour X ∈ Irr(M(v, w)x ) ˜ ‹ ‹ et e˜c (X) = Ec (X), fc (X) = Fc (X), est isomorphe au g-cristal B(λ). Ce th´eor`eme remarquable donne un contenu g´eom´etrique `a la notion de cristal. Un r´esultat similaire donnant une r´ealisation g´eom´etrique du cristal B(∞), bas´e sur des id´ees de Lusztig ([46]), avait ´et´e auparavant ´etabli par Kashiwara-Saito [37]. Remarque. Il existe une autre r´ealisation g´eom´etrique des cristaux B(λ), due `a Bravermann et Gaitsgory en termes de la g´eom´etrie des cycles de Mirkovic-Vilonen dans la grassmanienne affine (cf. [4], [54], [32]). Le lien unissant ces deux constructions l’une ` a l’autre, ainsi qu’` a la troisi`eme r´ealisation du mˆeme cristal `a l’aide de la th´eorie des chemins de Littelmann [44] reste encore largement myst´erieux. Pour couronner le tout, Nakajima a d´ecouvert une quatri`eme ( !) r´ealisation des mˆemes cristaux en termes de mod`ele de monˆ omes, motiv´ee elle aussi (mais de mani`ere quelque peu diff´erente) par la g´eom´etrie des vari´et´es de carquois (cf. [68], [36], [26]). 6.4. Quelques esquisses de d´ emonstration Pour finir cette section, illustrons l’utilit´e des fibrations ´el´ementaires p : Mc;r (v, w) → Mc;0 (v − rec , w) en donnant les d´emonstrations des th´eor`emes 4.8 et 5.3. Th´eor`eme 4.8. Commen¸cons par montrer que dim(Z(v1 , v2 , w)) = 21 (dim(M(v1 , w))+ dim(M(v2 , w))). Il suffit de voir que la mˆeme chose est vraie pour l’ouvert Zreg (v1 , v2 , w). Pour cela, on fixe x ∈ Mreg ecur0 (v0 , w) et on va montrer par r´ −1 rence sur v que la fibre M(v, w)x := π (x) ⊂ M(v, w) est pure de dimension 1 (dim(M(v, w)) − dim(M(v0 , w))). 2 Soit X une composante irr´eductible de M(v, w)x . Si v = v0 , alors (6.2) est trivialement vraie. Sinon, les points de X correspondent `a des orbites contenant l’orbite de x dans leur adh´erence, et de v > v0 on d´eduit que c (X) > 0 pour au moins un c ∈ I (cf. [62], Prop. 7.2). Mais alors X ∩ Mc;c (X) (v, w) est une fibration en grass‹cc (X) (X) de M(v − c (X)ec , w)x . maniennes sur la composante irr´eductible X 0 = E

(6.2)

dim(M(v, w)x ) =

Par hypoth`ese de r´ecurrence, dim(X 0 ) est donn´ee par (6.2) ; un calcul direct permet maintenant de v´erifier que (6.2) est vraie aussi pour X.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 328

Olivier SCHIFFMANN

Enfin, pour montrer que Z(v1 , v2 , w) est lagrangienne, on observe que la restriction de la forme symplectique ω ` a une composante irr´eductible X ∩Mc;c (X) (v, w) satisfait ω(u, v) = ω(p∗ u, p∗ v) et on raisonne comme plus haut par r´ecurrence. Noter que la d´emonstration ci-dessus s’adapte ais´ement au cas (plus facile) de la sous-vari´et´e L(v, w) (Th´eor`eme 4.5.). Th´eor`eme 5.3 (suite et fin). – Il reste `a voir que Mx est engendr´e par [M(v0 , w)x ]. Notons provisoirement M 0 le sous-module de Mx engendr´e par [M(v0 , w)x ]. Pour toute composante irr´eductible Y de M(v, w)x et tout c ∈ I, on a c (Y ) ≤ hec , v − v0 i. On va raisonner encore par r´ecurrence. Soit X une composante irr´eductible de M(v, w)x et supposons que [Y ] ∈ M 0 pour toute composante Y ⊂ M(v0 , w)x avec v0 < v ou v0 = v et c (Y ) > c (X) > 0. D’apr`es le lemme 6.3. ii), on a M ‹c (X)] + ±c (X)[X] ∈ Fc [E C[Y ] c (Y )>c (X) 0

d’o` u on tire finalement [X] ∈ M comme voulu.

` ` 7. ALGEBRE DE CONVOLUTION ET ALGEBRE AFFINE QUANTIQUE Nous en arrivons ` a pr´esent a` la partie la plus difficile et la plus spectaculaire du travail de Nakajima sur les vari´et´es carquois : la construction des alg`ebres affines quantiques et de leurs repr´esentations de dimension finie dans la K-th´eorie des vari´et´es M(v, w) ([64]). Mˆeme si certains des r´esultats pr´esent´es ci-dessous (mais pas tous) sont valables pour un carquois arbitraire, nous fixons pour simplifier une fois pour toutes un carquois de type fini Q = (I, Ω). 7.1. Alg` ebres affines quantiques Soit C = (cab )a,b∈I la matrice de Cartan associ´ee, par (4.1), au carquois Q. Soit g l’alg`ebre de Lie simple complexe correspondante (qui est donc de type A, D ou E). Drinfeld et Jimbo ont d´efini, pour toute alg`ebre de Kac-Moody t, une alg`ebre enveloppante quantique Uq (t), d´eformation de l’alg`ebre de Hopf U (t). On s’int´eresse ici a` l’alg`ebre affine quantique (de niveau z´ero) Uq (Lg) o` u Lg = g ⊗ C[t, t−1 ]. La d´efinition de Uq (Lg) dans la pr´esentation dite « de Drinfeld » est la suivante : ´finition 7.1. — Uq (Lg) est la C(q)-alg`ebre engendr´ee par des ´el´ements ea,r , fa,r De (a ∈ I, r ∈ Z), q h (h ∈ P ∗ ) et ha,m (a ∈ I, m ∈ Z\{0}), soumis aux relations suivantes : 0

0

q h q h = q h+h ,

´ ASTERISQUE

[q h , ha,m ] = 0,

[ha,m , hb,n ] = 0,

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

q h ea,r q −h = q hh,αa i ea,r ,

329

q h fa,r q −h = q −hh,αa i fa,r ,

cab s (z − q ±cab w)ψbs (z)x± z − w)x± (s ∈ {+, −}), a (w) = (q a (w)ψb (z), n o w δab z − [x+ δ( )ψa+ (w) − δ( )ψa− (z) , a (z), xb (w)] = −1 q−q z w ± ± cab ± cab (z − q w)xa (z)xb (w) = (q z − w)xb (w)x± a (z), ñ ô X 1−c Xab 1 − cab ± ± ± ± (−1)k x± a (zσ(1) ) · · · xa (zσ(k) )xb (w)xa (zσ(k+1) ) · · · xa (zσ(r) ) k σ k=0 q ñ ô r o` u, dans la derni`ere relation, est le coefficient q-binomial usuel et la somme porte s q sur toutes les permutations σ dans le groupe sym´etrique S1−cab , et o` u on a utilis´e les fonctions g´en´eratrices suivantes : ∞ ∞ ∞ X X X δ(z) = zr , x+ ea,r z −r , x− fa,r z −r , a (z) = a (z) = r=−∞

r=−∞

ψa± (z) = q ±ha exp ±(q − q −1 )

r=−∞ ∞ X

! hk,±m z ∓m

.

m=1

Il est important de pouvoir sp´ecialiser le param`etre de d´eformation q en une valeur ∈ C∗ . Pour cela, on consid`ere la sous-C[q, q −1 ]-alg`ebre UZ (Lg) de Uq (Lg) engendr´ee par les puissances divis´ees n fa,r ena,r (n) , f := , e(n) := a,r a,r [n]q ! [n]q ! pour a ∈ I, r ∈ Z et par les ´el´ements q h pour h ∈ P ∗ . C’est une forme enti`ere de Uq (Lg), i.e. on a Uq (Lg) = UZ (Lg) ⊗ C(q). Pour tout ∈ C∗ , on peut maintenant poser U (Lg) := UZ (Lg) ⊗ C o` u C est un C[q, q −1 ]-module via q 7→ . − + Notons Uq (Lg) (resp. Uq (Lg), resp. Uq0 (Lg)) la sous-alg`ebre engendr´ee par les ea,r (resp. les fa,r , resp. les q h et ha,m ). On a la d´ecomposition triangulaire : (7.1)

Uq (Lg) = Uq− (Lg) ⊗ Uq0 (Lg) ⊗ Uq+ (Lg).

Un Uq (Lg)-module M est dit de l-plus haut poids (Λ, (Ψ± a (z))a ), avec Λ ∈ P , ∓ I (Ψ± (z)) ∈ C[[z ]] si il existe un vecteur v ∈ M tel que Uq+ (Lg) · v = 0, a a − Uq (Lg) · v = M et q h · v = q hΛ,hi v,

ψa± (z) · v = Ψ± a (z)v

(a ∈ I, h ∈ P ∗ ).

En utilisant la d´ecomposition (7.1), on montre par des arguments standard qu’il existe, pour toute paire P = (Λ, (Ψ± educible a (z))a ), un unique Uq (Lg)-module irr´ L(P) de l-plus haut poids ´egal `a P. Notons qu’une repr´esentation de l-plus haut poids, n’est pas en g´en´eral de plus haut poids au sens classique des alg`ebres de KacMoody.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 330

Olivier SCHIFFMANN

Il existe, comme pour les repr´esentations des alg`ebres de Lie simples, un crit`ere pour d´eterminer lesquels des L(P) sont de dimension finie. ´ore `me 7.2 (Drinfeld [11], Chari-Pressley [6]). — Soit P = (Λ, (Ψ± The a (z))a ) un l-poids. Le module simple L(P) est de dimension finie si et seulement si Λ ∈ P + et il existe des polynˆ omes Pa (u) ∈ C[u] (a ∈ I) satisfaisant Pa (u) = 1 et tels que Å ã± Pa (q −1 /z) ± deg Pa , Ψa (z) = q Pa (q/z) o` u ( )± d´esigne le d´eveloppement en s´erie en z −1 et z respectivement. De plus, tout Uq (Lg)-module simple de dimension finie est conjugu´e (par un automorphisme de Uq (Lg)) ` a un unique L(P). Les polynˆ omes Pa (u) ci-dessus s’appellent les polynˆ omes de Drinfeld de la repr´esentation L(P). Les repr´esentations fondamentales L(Λa0 )s sont celles dont les polynˆomes de Drinfeld sont de la forme ( 1 si a 6= a0 Pa (u) = 1 − su si a = a0 pour un a0 ∈ I et un z ∈ C∗ . Il y a une version identique du th´eor`eme ci-dessus pour l’alg`ebre U (Lg). Il existe de nombreuses conjectures concernant les caract`eres des repr´esentations L(P), le plus souvent inspir´ees par des probl`emes de physique statistique ([22], [42], [39]...). De fait, l’alg`ebre affine quantique Uq (Lg) joue un rˆole pr´epond´erant dans de nombreux domaines de la physique (comme aussi la th´eorie conforme des champs,...). La th´eorie des repr´esentations de dimension finie de Uq (Lg) est particuli`erement riche (encore plus si q est sp´ecialis´e ` a une racine de l’unit´e), et distincte de la th´eorie des repr´esentations de dimension finie de l’alg`ebre non d´eform´ee U (Lg). Elle concentre, depuis une quinzaine d’ann´ees, de nombreuses recherches (cf. [39], [6], [35], [25], [14],...). 7.2. Alg` ebre de convolution en K-th´ eorie ´ equivariante Soit X une vari´et´e alg´ebrique complexe quasi-projective sur laquelle op`ere un groupe r´eductif G. On note K G (X) le groupe de Grothendieck de la cat´egorie des faisceaux coh´erents G-´equivariants sur X. Si X = {pt}, on a K G (X) = R(G) l’anneau des repr´esentations de G. En g´en´eral, K G (X) est naturellement un R(G)-module. Les groupes K G (X) jouissent des propri´et´es de fonctorialit´e suivantes : – Si X est une G-vari´et´e lisse, et si X 0 ⊂ X est une sous-vari´et´e ferm´ee, alors le groupe de Grothendieck K G (X : X 0 ) des G-faisceaux coh´erents sur X `a support dans X 0 est isomorphe ` a K G (X 0 ).

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

331

– Si f : X → Y est un morphisme propre G-´equivariant, il existe une image directe f∗ : K G (X) → K G (Y ). – Si f˜ : X → Y est un morphisme lisse G-´equivariant entre deux G-vari´et´es lisses, si X 0 et Y 0 sont des sous-vari´et´es ferm´ees de X et Y (´eventuellement singuli`eres) et f : X 0 → Y 0 une application telle que le diagramme XO X0

f˜

/Y O

f

/ Y0

soit cart´esien, alors il existe une image inverse f˜∗ : K G (Y ) → K G (X) qui se restreint en f ∗ : K G (X 0 ) ' K G (X : X 0 ) → K G (Y : Y 0 ) ' K G (Y 0 ). Appliquons ces propri´et´es ` a la situation pr´esente des vari´et´es carquois. Pour v, w ∈ NI , l’action du groupe Gw sur E v,w induit une action de Gw sur M(v, w) et M0 (v, w). On d´efinit une action de C∗ sur M(v, w) et M0 (v, w) (diff´erente de (4.2)) par la formule suivante : z · (Bh , ia , ja )h,a = (zBh , zia , zja )h,a . L’action de Gw × C∗ sur M(v, w) s’´etend de fa¸con ´evidente `a Z(v1 , v2 , w). Posons Y ∗ ∗ K Gw ×C (Z(w)) = K Gw ×C (Z(v1 , v2 , w)). v1 ,v2

On munit cet espace du produit associatif ∗

∗

∗

K Gw ×C (Z(v1 , v2 , w)) ⊗ K Gw ×C (Z(v2 , v3 , w)) → K Gw ×C (Z(v1 , v3 , w)) Å ã L [F] ⊗ [G] 7→ (p13 )∗ p∗12 ([F]) ⊗ p∗23 ([G]) o` u le produit tensoriel est pris dans le produit triple M(v1 , w)×M(v2 , w)×M(v3 , w). Noter que p13 ((Z(v1 , v2 , w) × M(v3 , w)) ∩ (M(v1 , w) × Z(v2, v3 , w))) = Z(v1 , v3 , w) et que la d´efinition ci-dessus a donc bien un sens. La projection Gw × C∗ → C∗ induit une inclusion R(C∗ ) ,→ R(Gw ×C∗ ). On identifie l’anneau R(C∗ ) `a C[q, q −1 ] en notant ∗ q n la classe du caract`ere Ln : z 7→ z n . De cette mani`ere, K Gw ×C (Z(w)) est muni d’une structure de C[q, q −1 ]-module.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 332

Olivier SCHIFFMANN

7.3. R´ ealisation g´ eom´ etrique de Uq (Lg) Dans [64], Nakajima a construit un morphisme d’alg`ebre ∗

Ψ : Uq (Lg) → K Gw ×C (Z(w)) ⊗C[q,q−1 ] C(q). De mani`ere impr´ecise, Ψ envoie les g´en´erateurs q h , ha,m de la partie « Cartan » de Uq (Lg) sur les classes de faisceaux structuraux des diagonales ∆(M(v, w)) ⊂ Z(v, v, w) ; les g´en´erateurs ec,r et fc,r sont envoy´es sur les classes de certains fibr´es en droite tautologiques sur les correspondances de Hecke B± a (v ∓ ec , v, w). Avant de pouvoir ˆetre plus pr´ecis, il nous faut introduire quelques notations suppl´ementaires. Si E est un fibr´e vectoriel et u une variable formelle, on pose rang(E)

[Λu E] =

X

ui [Λi E].

i=0

Pour tout v, w et c ∈ I, le complexe tautologique Ç å P P Bh +jc (h)Bh +ic L • / L−1 ⊗ / Vc V t(h) ⊕ Wc Cc (v, w) : L−2 ⊗ V c s(h)=c

∗

est Gw × C -´equivariant. Dans le complexe ci-dessus, posons X • • C0 c (v, w) = Coker ( Bh + jc ), C00 c (v, w) = V c [−1] ∗

•

•

de sorte que, dans K Gw ×C (M(v, w)), on ait C•c (v, w) = C0 c (v, w) + C00 c (v, w). On d´efinit les matrices C ± = (c± ab )a,b∈I par c+ ab = δab − ρab ,

c− ab = δab − ρba .

e en droites tautologique V 2,c /V 1,c , et sur Enfin, il existe sur B+ c (v1 , v2 , w) un fibr´ (v , v , w) un fibr´ e en droites tautologique V 1,c /V 2,c . B− 1 2 c h On peut ` a pr´esent d´efinir les images de q , hc,m , ec,r et fc,r via les formules suivantes : q h 7→ ψc± (z)

7→

X

q

v

X

q hh,w−C·vi [O∆(v,w) ],

v

Ç

rang(C• c (v,w))

∆∗

Λ−1/qz C•c (v, w) Λ−q/z C•c (v, w)

å± ,

o` u ∆ : M(v, w) → M(v, w) × M(v, w) est la diagonale, î ó X − • ec,r 7→ (−1)hec ,C ·v2 i (q −1 V 2,c /V 1,c )⊗r−hec ,v2 i ⊗ det C0 c (v2 , w)∗ , v2

fc,r 7→

X

(−1)hec ,w−C

+

·v2 i

î

ó • (q −1 V 1,c /V 2,c )⊗r+hec ,w−v2 −C·v2 i ⊗ det C00 c (v2 , w)∗ ,

v2

qui sont des faisceaux support´es sur B± c (v2 ∓ ec , v2 , w).

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

333

´ore `me 7.3 ([64], Thm. 9.4.1.). — Les formules ci-dessus d´efinissent un morThe phisme d’alg`ebre ∗

Ψ : Uq (Lg) → K Gw ×C (Z(w)) ⊗C[q,q−1 ] C(q). La d´emonstration (difficile) de ce th´eor`eme n´ecessite une analyse fine et tr`es pr´ecise de la g´eom´etrie des correspondances de Hecke et de leur produit de convolution. Un r´esultat similaire, donnant une r´ealisation des alg`ebres affines quantiques, mais uniquement en type A, dans la K-th´eorie des vari´et´es de Steinberg g´en´eralis´ees de GL(n), avait ´et´e d´emontr´e auparavant par Ginzburg et Vasserot [18], [81]. Notons que Ψ n’est ni injectif, ni surjectif en g´en´eral. ∗ ∗ Par abus de notations, on ´ecrira K Gw ×C (Z(w)) pour l’image de K Gw ×C (Z(w)) ∗ dans K Gw ×C (Z(w)) ⊗ C(q) – en d’autres termes, on ignorera, pour simplifier, les questions li´ees ` a la torsion dans les groupes de K-th´eorie. Avec cette convention, on a ´ore `me 7.4 ([64], Thm. 12.2.1). — Le morphisme Ψ se restreint en un morThe phisme ∗

UZ (Lg) → K Gw ×C (Z(w)). 7.4. R´ ealisation de U (Lg)-modules de dimension finie Int´eressons-nous maintenant aux Uq (Lg)-modules. Bien sˆ ur, dans un Uq (Lg)module irr´eductible de dimension finie, le centre op`ere par un caract`ere. Dans la r´ealisation K-th´eorique, ce centre est facile `a d´eterminer : l’application X [O∆(Z(v,w)) ] ρ 7→ ρ · v ∗

∗

d´efinit un morphisme R(Gw × C ) ,→ Z(K Gw ×C (Z(w))). Un caract`ere χ : R(Gw ×C∗ ) → C est donn´e par l’´evaluation sur un ´el´ement semi-simple a = (s, ) de Gw × C∗ . Pour un tel a, on notera χa le caract`ere correspondant, et Ca le R(Gw × C∗ )-module de dimension un associ´e. Enfin, soit A = {an | n ∈ Z} le sous-groupe ab´elien ferm´e de ∗ Gw × C∗ engendr´e par a. G´eom´etriquement, la sp´ecialisation de K Gw ×C (Z(w)) au caract`ere central χa peut se faire en deux ´etapes : ∗

K Gw ×C (Z(w)) → K A (Z(w)) → K A (Z(w)) ⊗R(A) Ca . Choisissons maintenant un point x ∈ Mreg 0 (v0 , w) fixe sous l’action de A. On pose M K A (M(w)x ) = K A (M(v, w)x ), Mx,a = K A (M(w)x ) ⊗R(A) Ca . v

L’alg`ebre de convolution K A (Z(w)) op`ere sur K A (M(w)x ), l’alg`ebre K A (Z(w)) ⊗ Ca op`ere sur Mx,a et on en tire, via Ψ, une action de UZ (Lg) sur Mx,a . Comme l’´el´ement central q op`ere dans Mx,a par , cette derni`ere action se factorise par U (Lg). Le

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 334

Olivier SCHIFFMANN

module Mx,a est appel´e module standard. Enfin, M(v, w)x n’´etant non vide que pour un nombre fini de valeurs de v, Mx,a est un U (Lg)-module de dimension finie. ´ore `me 7.5 ([64], Prop.13.3.1). — Mx,a est un U (Lg)-module de plus haut poids The ´egal ` a Px,a := (λv0 , (Ψ± u a (z))a ) o` X X λv0 = wa Λa − va αa , a

a

Å Ψ± a (z)

=

hea ,λv0 i

Pa (−1 /z) Pa (/z)

ã±

avec Pa (u) = χa (Λ−u C•a|{x} ). Le vecteur de plus haut poids de Mx,a est simplement [OM(v0 ,w)x ] = [O{pt} ]. Comme corollaire imm´ediat, on voit que Mx,a admet le module simple L(Px,a ) comme (unique) quotient simple. On v´erifie aussi que toute collection de polynˆomes de Drinfeld peut s’obtenir comme Px,a pour un certain choix de x, a (on peut mˆeme prendre x = 0). L’analogie avec les modules de Verma n’aura certainement pas ´echapp´e au lecteur avis´e. Faisant suite ` a [64], Varagnolo et Vasserot ont d´ecrit pr´ecis´ement les modules standard, lorsque n’est pas une racine de l’unit´e. De telles repr´esentations sont ´egales ` a des produits tensoriels de U (Lg)-modules fondamentaux Mx,a = L(Λi1 )s1 ⊗ · · · ⊗ L(Λin )sn (les valeurs de ij , sj se d´eduisent de a et x par des formules explicites). Nous renvoyons le lecteur ` a [78] pour un ´enonc´e pr´ecis. En particulier, ceci d´etermine le caract`ere de Mx,a . Les modules Mx,a ne sont pas tous distincts. Notons ρz ⊂ Gv le stabilisateur de la Gv -orbite associ´e ` a un point z ∈ M0 (v, w) (ρz est d´efini `a conjugaison pr`es). L’espace M0 (v, w) entier se stratifie suivant ce stabilisateur [ (7.2) M0 (v, w) = M0 (v, w)(ρ). ρ

Par exemple, M0 (v, w)(1) = Mreg efinition. Les applications π : 0 (v, w) par d´ M(v, w) → M0 (v, w) sont topologiquement stratifi´ees par rapport `a (7.2) (i.e. la fibration est localement triviale le long de chaque strate). Ceci implique que Mx,a et My,a sont isomorphes si x, y appartiennent `a la mˆeme strate (c’est en fait une condition n´ecessaire et suffisante, cf. [64], Thm. 14.3.2.).

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

335

7.5. Polynˆ omes de Nakajima et formules de multiplicit´ es Les vari´et´es Z(w) permettent de construire les modules standard de U (Lg). Qu’en est-il des U (Lg)-modules simples ? Comme on l’a vu au paragraphe pr´ec´edent, tout module simple L(P) peut s’obtenir comme quotient irr´eductible d’un certain module standard Mx,a . On se trouve donc face au probl`eme de calculer les multiplicit´es [Mx,a : L(P)]. La construction K-th´eorique de U (Lg) permet justement de calculer ces multiplicit´es, via un yoga g´eom´etrique dˆ u `a Ginzburg [7], Chap.8 (voir aussi [38]) dont nous ´enon¸cons les grandes lignes. On fixe le couple x, a une fois pour toutes. On commence par se ramener `a des alg`ebres de convolution en homologie (de Borel-Moore) via un caract`ere de Chern, de la fa¸con suivante. La premi`ere ´etape est une localisation aux points fixes en K-th´eorie ; le th´eor`eme de concentration de Thomason fournit un isomorphisme ∼

i∗ : K A (Z(w))a → K A (Z(w)A )a eduit un o` u ( )a d´esigne la localisation par rapport `a χ−1 a (0) dans R(A). On en d´ isomorphisme ∼ i∗ : K A (Z(w)) ⊗ Ca → K A (Z(w)A ) ⊗ Ca . Comme A op`ere trivialement sur Z(w)A , on a K A (Z(w)A ) ' K(Z(w)A ) ⊗ R(A) d’o` u on tire l’identification ∼

ev : K A (Z(w)A ) ⊗ Ca → K(Z(w)A ) ⊗ C. Enfin, on consid`ere l’application de Riemann-Roch RR = (1 TdM(w)A ) ∪ ch : K(Z(w)A ) ⊗ C → H• (Z(w)A , C) o` u Td d´esigne la classe de Todd et o` u ch est le caract`ere de Chern (cf. [7], Chap. 5.11). L’application RR est un morphisme d’alg`ebres de convolution (cf. [7], Thm. 5.11.11). La composition de toutes ces applications fournit finalement un morphisme d’alg`ebre U (Lg) → H• (Z(w)A , C). Il existe une suite similaire d’applications ∼

∼

ch

A A Mx,a := K A (M(w)x ) ⊗ Ca → K A (M(w)A x ) ⊗ Ca → K(M(w)x ) ⊗ C → H• (M(w)x , C).

Dans ce cas, l’application ch est un isomorphisme (ceci est loin d’ˆetre ´evident, voir [64], Section 7). Finalement, comme le caract`ere de Chern commute `a la convolution, on a le diagramme commutatif suivant : U (Lg)

/ End(Mx,a )

H• (Z(w)A , C)

/ End(H• (M(w)A , C)). x

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 336

Olivier SCHIFFMANN

On est maintenant amen´e ` a ´etudier la d´ecomposition en facteurs simples du A H• (Z(w) , C)-module H• (M(w)A a encore un r´esultat g´en´eral de x , C). On utilise l` Ginzburg ([7], Thm. 8.6.7) qui fournit un isomorphisme d’alg`ebres (non gradu´ees) H• (Z(w)A , C) ' Ext•Db (M0 (w)A ) (π! CM0 (w)A , π! CM0 (w)A ). Le th´eor`eme de d´ecomposition de Beilinson-Bernstein-Deligne nous permet d’´ecrire M (7.3) π! CM0 (w)A = Lφ,k ⊗ Pφ [k], φ,k

pour un certain ensemble {Pφ } de faisceaux pervers simples sur M0 (w). On a donc, L en posant Lφ = k Lφ,k M (7.4) H• (Z(w)A , C) = Hom(Lφ , Lϕ ) ⊗ Extk (Pφ , Pϕ ). k,φ,ϕ

Comme on a suppos´e les Pφ pervers et simples, on a Ext0,φ,ϕ l

Comme Ext (Pφ , Pϕ ) · Ext (Pϕ , Pτ ) ⊂ Extk+l (Pφ , Pτ ), le radical de H• (Z(w)A , C) L k est ´egal ` a k>0,φ,ϕ Hom(Lφ , Lϕ ) ⊗ Ext (Pφ , Pϕ ), et il s’ensuit que {Lφ }φ est une collection compl`ete de modules simples pour H• (Z(w)A , C). Notons i : {x} → M0 (w) l’inclusion. En appliquant le foncteur H • (i! −) `a (7.3) on obtient M k Lφ ⊗ H|x (Pφ ). H • (i! π! CM(w)A ) = H• (M(w)A x , C) ' φ,k

Cette ´egalit´e d’espaces vectoriels reste valable dans le groupe de Grothendieck des H• (Z(w)A , C)-modules ([7], Section 8.6). Le th´eor`eme suivant de Nakajima apporte la derni`ere pierre `a l’´edifice : ´ore `me 7.6 ([64], Thm. 14.3.2). — Supposons que ne soit pas une racine de The l’unit´e. Alors i) Les faisceaux pervers simples Pφ apparaissant dans π! CM(w)A sont exactement les complexes de cohomologie d’intersection IC(S, C) o` u S parcourt l’ensemble A A (w) (ρ) de M (w) . des strates Mreg 0 0 ii) Pour Pφ = IC(S, C), on a Lφ = L(Px,a ) pour tout x ∈ S. En particulier, le H• (Z(w)A , C)-module simple Lφ reste simple en tant que U (Lg)-module. Les polynˆ omes de Drinfeld Px,a associ´es `a un point x de M0 (w)A sont d´efinis dans le th´eor`eme 7.5. Comme corollaire imm´ediat, on a

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

337

Corollaire 7.7. — Supposons que ne soit pas une racine de l’unit´e. Alors X k (IC(Sy , C)) (7.5) [Mx,a : L(Py,a )] = dim H|x k

o` u Sy ⊂ M0 (w)A est la strate contenant y. Ce r´esultat est bien sˆ ur ` a mettre en parall`ele avec ceux obtenus par Ginzburg et Kazhdan-Lusztig pour les alg`ebres de Hecke affines [16], [38]. Les « polynˆomes de P k Nakajima » k dim H|x (IC(Sy , C))tk apparaissant dans (7.5) s’apparentent aux polynˆ omes de Kazhdan-Lusztig. Il existe, comme pour ces derniers, un algorithme de calcul ([69]) et donc un algorithme permettant de d´eterminer les caract`eres de tous les U (Lg)-modules simples (toujours lorsque n’est pas une racine de l’unit´e). On trouvera dans [24] une extension, purement alg´ebrique, de la construction des polynˆomes de Nakajima au cas g´en´eral (g non simplement lac´e). Enfin, notons que Varagnolo a obtenu, en rempla¸cant dans les constructions ci-dessus la K-th´eorie ´equivariante par la cohomologie ´equivariante, une approche g´eom´etrique `a la th´eorie des repr´esentations des Yangiens [76].

´ 8. DEVELOPPEMENTS Dans cette ultime section, nous mentionnons (trop) bri`evement quelques autres aspects des vari´et´es carquois de Nakajima, ainsi que quelques d´eveloppements plus r´ecents. 8.1. Structure hyperk¨ ahl´erienne.— Les vari´et´es carquois M(v, w) s’inscrivent naturellement dans une famille hyperk¨ ahl´erienne de vari´et´es complexes Mξ (v, w) pour Q I I ξ ∈ R ⊕ C , obtenues par r´eduction hyperk¨ahl´erienne de l’action de Uv = i U (vi ) sur l’espace E v,w o` u les espaces V, W sont maintenant munis d’une structure hermitienne. Les vari´et´es Mξ (v, w) sont lisses pour des valeurs g´en´eriques de ξ. Ce point de vue est essentiel dans les d´emonstrations de plusieurs propri´et´es fines des vari´et´es M(v, w). Lorsque le carquois est de type affine, les vari´et´es Mξ (v, w) ont, comme M(v, w), des interpr´etations en g´eom´etrie (espaces de connexions anti-autoduales sur les espaces ALE [41], [1]), ou en g´eom´etrie non commutative (espaces de modules de faisceaux coh´erents sur des plans projectifs non commutatifs [2], [15]). 8.2. Foncteurs de r´eflexion et repr´esentation du groupe de Weyl.— En s’inspirant des foncteurs de r´eflexion de Bernstein-Gelfand-Ponomarev dans la th´eorie des repr´esentations des carquois, Nakajima a construit dans [67] pour des valeurs g´en´eriques du param`etre ξ des isom´etries hyperk¨ahl´eriennes (8.1)

∼

Sc : Mξ (v, w) → MSc ·ξ (Sc ? v, w)

(c ∈ I),

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 338

Olivier SCHIFFMANN

P P P P o` u Sc ? v est d´efini afin que sc · ( wa Λa − va αa ) = wa Λa − (Sa ? v)a αa , et o` u sa est la r´eflexion simple du groupe de Weyl W du carquois Q. Il a de plus montr´e que ces isom´etries engendrent une action de W sur l’ensemble des vari´et´es carquois Mξ (v, w) (noter que cette action transforme le param`etre ξ correspondant a la structure hyperk¨ ` ahl´erienne). En cons´equence, on obtient par monodromie dans l’espace des param`etres g´en´eriques ξ une repr´esentation de W `a valeur dans l’hoP P mologie H• (M(v, w)) lorsque wa Λa − va αa = 0 (pour n’importe quelle valeur g´en´erique de ξ). C’est un analogue de la construction des repr´esentations de Springer des groupes de Weyl due ` a Slodowy [74]. Une version ´equivalente des transformations (8.1) a ´et´e donn´ee par Lusztig [49], voir aussi [10]. Le lecteur trouvera dans [15] une interpr´etation de (8.1) en termes d’´equivalence de cat´egories d´eriv´ees. 8.3. Nombres de Betti des vari´et´e carquois.— Les r´esultats de la section 5 donnent les dimensions des espaces Htop (L(v, w)) = Hmid (M(v, w)) pour tout carquois Q et tous vecteurs v, w. Nakajima a donn´e dans [69] un algorithme r´ecursif (bas´e sur la r´eduction aux points fixes sous l’action d’un tore) pour calculer les nombres de Betti de M(v, w) et M(v, w)A . Cet algorithme fait simultan´ement intervenir les vari´et´es carquois pour beaucoup de carquois diff´erents et est difficile `a mettre en pratique. Tamasz Hausel a r´ecemment obtenu une formule pour les nombres de Betti des M(v, w), bas´ee sur un comptage de points sur les corps finis et sur le fait que la structure de Hodge mixte est pure. Ceci fournit, dans le cas d’un carquois arbitraire, une formule close (mais assez complexe) pour le polynˆome de Poincar´e des vari´et´es M(v, w) ([23]). On trouvera dans [57] un r´esultat similaire obtenu par une autre approche, purement alg´ebrique. Pour un carquois de type fini, Lusztig a aussi donn´e une expression conjecturale des nombres de Betti de L(v, w) (cf. [48]), inspir´ee des formules « fermioniques » de la th´eorie des repr´esentations des alg`ebres affines quantiques. Un r´esultat proche de cette conjecture a ´et´e r´ecemment d´emontr´e (pour un carquois arbitraire) par Mozgovoy [56]. La structure d’alg`ebre (donn´ee par le cup produit) sur H • (M(v, w) est, quant `a elle, encore largement m´econnue. 8.4. Produit tensoriel.— Nakajima [66], Malkin [53] et Varagnolo-Vasserot [80] ont (simultan´ement ( !)) d´efini une sous-vari´et´e lagrangienne L(w1 , w2 , . . . , wr ) de P P M( i wi ) contenant L( i wi ) et satisfaisant Htop (L(w1 , w2 , . . . , wr )) ' L(λw1 ) ⊗ · · · ⊗ L(Λwr ), P o` u on a pos´e Λw = a wa Λa . La mˆeme chose reste vraie au niveau des cristaux de Kashiwara et, lorsque Q est de type fini, on a aussi un r´esultat similaire pour les groupes de K-th´eorie. Une cons´equence int´eressante de ces constructions est l’existence d’une « vari´et´e de multiplicit´es », dont l’homologie est donn´ee par les coefficients de Littlewood-Richardson g´en´eralis´es (voir [53]).

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

339

8.5. Bases canoniques en K-th´eorie.— On suppose ici le carquois Q de type fini. Lusztig [50] a conjectur´e, et Varagnolo-Vasserot [79] ont d´emontr´e, l’existence de certaines ∗ ∗ bases « canoniques » dans les groupes de K-th´eorie K Tw ×C (L(w)) et K Tw ×C (M(w)). Ces bases sont d´etermin´ees par une propri´et´e m´etrique et une propri´et´e d’invariance par rapport ` a une certaine involution, propri´et´es semblables `a celles qui caract´erisent les (traces des) faisceaux pervers parmi les faisceaux constructibles. La motivation principale provient ici de l’analogie avec le cas des alg`ebres de Hecke ∗ ∗ affines : Lusztig a d´efini dans les groupes K T ×C (B) et K T ×C (T ∗ B) des bases canoniques dont les coefficients matriciaux (les « polynˆomes de Kazhdan-Lusztig p´eriodiques ») jouent un rˆ ole crucial dans la th´eorie des repr´esentations des alg`ebres de Lie r´eductives sur un corps alg´ebriquement clos de caract´eristique positive (voir [47], [3]). 8.6. Analogue global des vari´et´es de carquois.— Les cat´egories Repk Q sont des exemples de cat´egories ab´eliennes de dimension homologique ´egale `a un. Une autre grande classe de telles cat´egories est fournie par les cat´egories Cohpar (X) de faisceaux coh´erents (´eventuellement paraboliques) sur une courbe projective lisse X. Un analogue naturel, dans ce cadre global, des vari´et´es M(v, w) est l’espace des modules des fibr´es de Higgs paraboliques HiggsX ; l’analogue correspondant du morphisme π : M(v, w) → M0 (v, w) est donn´e par la fibration de Hitchin µ : HiggsX → L 0 ⊗i et´e lagrangienne L(v, w) = π −1 (0) est `a i H (K (−i · D)). En particulier, la vari´ relier au cˆ one global nilpotent Λ = µ−1 (0). Les constructions g´eom´etriques des sections 5, 6 et 7 n’ont, pour l’instant, pas d’analogue global, bien que [33], [73] sugg`erent (au moins pour X = P1 ) un lien avec des alg`ebres de lacets d’alg`ebres de Kac-Moody.

´ ERENCES ´ REF [1] M. F. Atiyah, N. J. Hitchin, V. G. Drinfel0 d & Y. I. Manin – Construction of instantons, Phys. Lett. A 65 (1978), p. 185–187. [2] V. Baranovsky, V. Ginzburg & A. Kuznetsov – Quiver varieties and a noncommutative P2 , Compositio Math. 134 (2002), p. 283–318. ´ & D. Rumynin – Localization of modules for [3] R. Bezrukavnikov, I. Mirkovic a semisimple Lie algebra in prime characteristic, `a paraˆıtre dans Ann. of Math. [4] A. Braverman & D. Gaitsgory – Crystals via the affine Grassmannian, Duke Math. J. 107 (2001), p. 561–575. [5] J. Brian¸ con – Description de Hilbn C{x, y}, Invent. Math. 41 (1977), p. 45–89. [6] V. Chari & A. Pressley – Quantum affine algebras and their representations, in Representations of groups (Banff, AB, 1994), CMS Conf. Proc., vol. 16, Amer. Math. Soc., 1995, p. 59–78.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 340

Olivier SCHIFFMANN

[7] N. Chriss & V. Ginzburg – Representation theory and complex geometry, Birkh¨ auser Boston Inc., 1997. [8] W. Crawley-Boevey – Geometry of the moment map for representations of quivers, Compositio Math. 126 (2001), p. 257–293. [9]

, Normality of Marsden-Weinstein reductions for representations of quivers, Math. Ann. 325 (2003), p. 55–79.

[10] W. Crawley-Boevey & M. P. Holland – Noncommutative deformations of Kleinian singularities, Duke Math. J. 92 (1998), p. 605–635. [11] V. G. Drinfel0 d – A new realization of Yangians and of quantum affine algebras, Dokl. Akad. Nauk SSSR 296 (1987), p. 13–17. [12] G. Ellingsrud & S. A. Strømme – On the homology of the Hilbert scheme of points in the plane, Invent. Math. 87 (1987), p. 343–352. [13] J. Fogarty – Algebraic families on an algebraic surface, Amer. J. Math 90 (1968), p. 511–521. [14] E. Frenkel & N. Reshetikhin – The q-characters of representations of quantum affine algebras and deformations of W -algebras, in Recent developments in quantum affine algebras and related topics (Raleigh, NC, 1998), Contemp. Math., vol. 248, Amer. Math. Soc., 1999, p. 163–205. [15] I. Frenkel, M. Khovanov & O. Schiffmann – Homological realization of Nakajima varieties and Weyl group actions, Compos. Math. 141 (2005), p. 1479– 1503. [16] V. Ginzburg – Deligne-Langlands conjecture and representations of affine Hecke algebras, pr´epublication Moscow Univ., 1985. [17] V. Ginzburg & M. Kapranov – Hilbert schemes and Nakajima’s quiver varieties, non publi´e, 1995. ´ Vasserot – Langlands reciprocity for affine quantum groups [18] V. Ginzburg & E. of type An , Internat. Math. Res. Notices (1993), p. 67–85. [19] G. Gonzalez-Sprinberg & J.-L. Verdier – Construction g´eom´etrique de la ´ correspondance de McKay, Ann. Sci. Ecole Norm. Sup. (4) 16 (1983), p. 409–449 (1984). [20] L. G¨ ottsche – The Betti numbers of the Hilbert scheme of points on a smooth projective surface, Math. Ann. 286 (1990), p. 193–207. [21] I. Grojnowski – Instantons and affine algebras. I. The Hilbert scheme and vertex operators, Math. Res. Lett. 3 (1996), p. 275–291. [22] G. Hatayama, A. Kuniba, M. Okado, T. Takagi & Z. Tsuboi – Paths, crystals and fermionic formulae, in MathPhys odyssey, 2001, Prog. Math. Phys., vol. 23, Birkh¨ auser Boston, 2002, p. 205–272.

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

341

[23] T. Hausel – Betti numbers of holomorphic symplectic quotients via arithmetic Fourier transform, Proc. Natl. Acad. Sci. USA 103 (2006), p. 6120–6124. [24] D. Hernandez – Algebraic approach to q, t-characters, Adv. Math. 187 (2004), p. 1–52. [25]

, The Kirillov-Reshetikhin conjecture and solutions of T -systems, J. reine angew. Math. 596 (2006), p. 63–87.

[26] D. Hernandez & H. Nakajima – Level 0 monomial crystals, Nagoya Math. J. 184 (2006), p. 85–153. [27] J. Hong & S.-J. Kang – Introduction to quantum groups and crystal bases, Graduate Studies in Mathematics, vol. 42, American Mathematical Society, 2002. [28] Y. Ito & I. Nakamura – McKay correspondence and Hilbert schemes, Proc. Japan Acad. Ser. A Math. Sci. 72 (1996), p. 135–138. [29] A. Joseph – Quantum groups and their primitive ideals, Ergebnisse der Mathematik und ihrer Grenzgebiete, 3. Folge, vol. 29, Springer, 1995. [30] V. Kac – Infinite-dimensional Lie algebras, third ´ed., Cambridge University Press, 1990. [31] V. Kac & A. K. Raina – Bombay lectures on highest weight representations of infinite-dimensional Lie algebras, Advanced Series in Mathematical Physics, vol. 2, World Scientific Publishing Co. Inc., 1987. [32] J. Kamnitzer – Crystal structures on Mirkovi´c-Vilonen polytopes, pr´epublication arXiv:math.QA/0505398, 2005. [33] M. Kapranov – Eisenstein series and quantum affine algebras, J. Math. Sci. (New York) 84 (1997), p. 1311–1360, Algebraic geometry, 7. [34] M. Kashiwara – Bases cristallines des groupes quantiques, Cours Sp´ecialis´es, vol. 9, Soci´et´e Math´ematique de France, 2002, Edited by Charles Cochet. [35]

, On level-zero representations of quantized affine algebras, Duke Math. J. 112 (2002), p. 117–175.

[36]

, Realizations of crystals, in Combinatorial and geometric representation theory (Seoul, 2001), Contemp. Math., vol. 325, Amer. Math. Soc., 2003, p. 133– 139.

[37] M. Kashiwara & Y. Saito – Geometric construction of crystal bases, Duke Math. J. 89 (1997), p. 9–36. [38] D. Kazhdan & G. Lusztig – Proof of the Deligne-Langlands conjecture for Hecke algebras, Invent. Math. 87 (1987), p. 153–215.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 342

Olivier SCHIFFMANN

[39] A. N. Kirillov & N. Reshetikhin – Representations of Yangians and multiplicities of the inclusion of the irreducible components of the tensor product of representations of simple Lie algebras, Zap. Nauchn. Sem. Leningrad. Otdel. Mat. Inst. Steklov. (LOMI) 160 (1987), p. 211–221, 301. [40] P. Kronheimer – The construction of ALE spaces as hyper-K¨ahler quotients, J. Differential Geom. 29 (1989), p. 665–683. [41] P. Kronheimer & H. Nakajima – Yang-Mills instantons on ALE gravitational instantons, Math. Ann. 288 (1990), p. 263–307. [42] A. Kuniba, T. Nakanishi & J. Suzuki – Functional relations in solvable lattice models. I. Functional relations and representation theory, Internat. J. Modern Phys. A 9 (1994), p. 5215–5266. [43] M. Lehn & C. Sorger – Symmetric groups and the cup product on the cohomology of Hilbert schemes, Duke Math. J. 110 (2001), p. 345–357. [44] P. Littelmann – Paths and root operators in representation theory, Ann. of Math. (2) 142 (1995), p. 499–525. [45] G. Lusztig – Quivers, perverse sheaves, and quantized enveloping algebras, J. Amer. Math. Soc. 4 (1991), p. 365–421. [46]

, Affine quivers and canonical bases, Publ. Math. I.H.E.S. (1992), p. 111– 163.

[47]

, Bases in equivariant K-theory, Represent. Theory 2 (1998), p. 298–369.

[48]

, Fermionic forms arXiv:math.QA/0005010, 2000.

[49]

, Quiver varieties and Weyl group actions, Ann. Inst. Fourier (Grenoble) 50 (2000), p. 461–489.

[50] [51]

and

Betti

numbers,

pr´epublication

, Remarks on quiver varieties, Duke Math. J. 105 (2000), p. 239–265. , Semicanonical bases arising from enveloping algebras, Adv. Math. 151 (2000), p. 129–139.

[52] A. Maffei – Quiver varieties of type A, Comment. Math. Helv. 80 (2005), p. 1– 27. [53] A. Malkin – Tensor product varieties and crystals : the ADE case, Duke Math. J. 116 (2003), p. 477–524. ´ & K. Vilonen – Perverse sheaves on affine Grassmannians and [54] I. Mirkovic Langlands duality, Math. Res. Lett. 7 (2000), p. 13–24. ´ & M. Vybornov – On quiver varieties and affine Grassmannians [55] I. Mirkovic of type A, C. R. Math. Acad. Sci. Paris 336 (2003), p. 207–212.

´ ASTERISQUE

SM F

(976)

´ ES ´ CARQUOIS DE NAKAJIMA VARIET

343

[56] S. Mozgovoy – Fermionic forms and quiver varieties, pr´epublication arXiv:math.QA/0610084, 2006. [57]

, On the multiplicities of the irreducible highest weight modules over KacMoody algebras, pr´epublication arXiv:math.RT/0609349, 2006.

[58] D. Mumford, J. Fogarty & F. Kirwan – Geometric invariant theory, third ´ed., Ergebnisse der Mathematik und ihrer Grenzgebiete, 2. Folge, vol. 34, Springer, 1994. [59] H. Nakajima – A geometric construction of algebras, Lectures at the University of Hong Kong http://www.math.kyoto-u.ac.jp/~nakajima/bibli.html. [60]

, Instantons on ALE spaces, quiver varieties, and Kac-Moody algebras, Duke Math. J. 76 (1994), p. 365–416.

[61]

, Heisenberg algebra and Hilbert schemes of points on projective surfaces, Ann. of Math. (2) 145 (1997), p. 379–388.

[62]

, Quiver varieties and Kac-Moody algebras, Duke Math. J. 91 (1998), p. 515–560.

[63]

, Lectures on Hilbert schemes of points on surfaces, University Lecture Series, vol. 18, American Mathematical Society, 1999.

[64]

, Quiver varieties and finite-dimensional representations of quantum affine algebras, J. Amer. Math. Soc. 14 (2001), p. 145–238.

[65]

, Quiver varieties and McKay correspondence, Lectures at Hokkaido University http://www.math.kyoto-u.ac.jp/~nakajima/bibli.html, 2001. , Quiver varieties and tensor products, Invent. Math. 146 (2001), p. 399–

[66] 449. [67]

, Reflection functors for quiver varieties and Weyl group actions, Math. Ann. 327 (2003), p. 671–721.

[68]

, t-analogs of q-characters of quantum affine algebras of type An , Dn , in Combinatorial and geometric representation theory (Seoul, 2001), Contemp. Math., vol. 325, Amer. Math. Soc., 2003, p. 141–160.

[69]

, Quiver varieties and t-analogs of q-characters of quantum affine algebras, Ann. of Math. (2) 160 (2004), p. 1057–1097.

[70] C. Okonek, M. Schneider & H. Spindler – Vector bundles on complex projective spaces, Progress in Mathematics, vol. 3, Birkh¨auser Boston, 1980. [71] C. M. Ringel – Hall algebras and quantum groups, Invent. Math. 101 (1990), p. 583–591. [72] Y. Saito – Crystal bases and quiver varieties, Math. Ann. 324 (2002), p. 675– 688.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 2008

SM F 344

Olivier SCHIFFMANN

[73] O. Schiffmann – Noncommutative projective curves and quantum loop algebras, Duke Math. J. 121 (2004), p. 113–168. [74] P. Slodowy – Simple singularities and simple algebraic groups, Lecture Notes in Mathematics, vol. 815, Springer, 1980. [75] C. Vafa & E. Witten – A strong coupling test of S-duality, Nuclear Phys. B 431 (1994), p. 3–77. [76] M. Varagnolo – Quiver varieties and Yangians, Lett. Math. Phys. 53 (2000), p. 273–283. ´ Vasserot – On the K-theory of the cyclic quiver variety, [77] M. Varagnolo & E. Internat. Math. Res. Notices (1999), p. 1005–1028. [78]

, Standard modules of quantum affine algebras, Duke Math. J. 111 (2002), p. 509–533.

[79]

, Canonical bases and quiver varieties, Represent. Theory 7 (2003), p. 227– 258.

[80]

, Perverse sheaves and quantum Grothendieck rings, in Studies in memory of Issai Schur (Chevaleret/Rehovot, 2000), Progr. Math., vol. 210, Birkh¨auser Boston, 2003, p. 345–365. ´ Vasserot – Affine quantum groups and equivariant K-theory, Transform. [81] E. Groups 3 (1998), p. 269–299. [82]

, Sur l’anneau de cohomologie du sch´ema de Hilbert de C2 , C. R. Acad. Sci. Paris S´er. I Math. 332 (2001), p. 7–12.

Olivier SCHIFFMANN ´ Ecole normale sup´erieure D´epartement de Math´ematiques et Applications UMR 8553 du CNRS 45, rue d’Ulm F–75230 Paris Cedex 05 E-mail : [email protected]

´ ASTERISQUE

317

ASTÉRISQUE 2008

SÉMINAIRE BOURBAKI VOLUME 2006/2007 EXPOSÉS 967-981 La conjecture de Sato-Tate Henri CARAYOL

SOCIÉTÉ MATHÉMATIQUE DE FRANCE Publié avec le concours du CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE

Séminaire BOURBAKI 59e année, 2006-2007, no 977, p. 345 à 391

Juin 2007

LA CONJECTURE DE SATO-TATE [d’après Clozel, Harris, Shepherd-Barron, Taylor] par Henri CARAYOL

INTRODUCTION 0.1. — Soit E une courbe elliptique définie sur Q. Pour p un nombre premier de bonne réduction, autrement dit lorsque p ne divise pas le conducteur N de la courbe, écrivons comme d’habitude 1 + p − ap le cardinal de E(Fp ). On sait depuis Hasse que √ ap est de valeur absolue inférieure où égale à 2 p, de sorte que l’on peut définir un angle θp par : √ ap = 2 p cos θp ; θp ∈ [0, π]. Les valeurs propres de l’endomorphisme de Frobenius géométrique Fp (agissant sur √ √ la cohomologie `-adique de notre courbe) sont alors p eiθp et p e−iθp . La conjecture de Sato-Tate, qui remonte à la première moitié des années 60, prédit comment doivent être répartis les θp dans l’intervalle [0, π], dans le cas où E n’a pas de « multiplication complexe » : c’est-à-dire que E n’a pas d’autres endomorphismes sur C que ceux, évidents, qui constituent un anneau isomorphe à Z. Conjecture 0.1. — On suppose E sans multiplication complexe. Alors les θp sont équirépartis sur [0, π] relativement à la mesure µ = π2 sin2 θ dθ. Par définition, l’équirépartition prédite par cette conjecture consiste en la propriété suivante : notant P n l’ensemble des nombres premiers ≤ n et non diviseurs de N , la P moyenne ] 1P n p∈ P n δθp des mesures de Dirac aux points θp converge vaguement vers µ, autrement dit pour chaque fonction continue f sur [0, π], on doit avoir : 1 X lim f (θp ) = µ(f ) . n→+∞ ] P n p∈ P n

Lorsque E a de la multiplication complexe, ses endomorphismes constituent un ordre dans l’anneau des entiers d’un corps quadratique imaginaire. Il n’est pas difficile

SOCIÉTÉ MATHÉMATIQUE DE FRANCE 2015

346

H. CARAYOL

1 dθ. Plus alors de voir que les θp sont équirépartis relativement à la mesure 12 δ π2 + 2π précisément, pour les p inertes, on a ap = 0 et donc θp = π/2, tandis que, pour les p décomposés, les valeurs propres de Frobenius sont égales (ou conjuguées) à celles données par un Grössencharakter du corps quadratique ; or on sait depuis Hecke que les angles associés sont équirépartis sur le cercle (pour la mesure habituelle). On formule de façon évidente une généralisation de la conjecture au cas d’une courbe elliptique (sans multiplication complexe) définie sur un quelconque corps de nombres F : en chaque place finie (idéal premier) v de bonne réduction, notant qv le cardinal du corps résiduel correspondant, on pose : √ av = 1 + qv − ] E(Fqv ) = 2 q v cos θv (θv ∈ [0, π])

et l’on définit l’équirépartition des θv comme ci-dessus, en considérant la moyenne des δθv sur l’ensemble des v de norme ≤ n. L’objet de cet exposé est d’expliquer comment cette conjecture est maintenant démontrée sous certaines hypothèses additionnelles : Théorème 0.2. — Soit E une courbe elliptique définie sur un corps totalement réel F . On suppose que E admet une réduction multiplicative en au moins une place finie. Alors les nombres θv sont équirépartis sur [0, π] relativement à la mesure µ définie ci-dessus (dite « de Sato-Tate »). Remarque 0.3. — L’hypothèse que E admette quelque part une réduction multiplicative équivaut à dire que son invariant j( E) n’est pas un entier de F , et elle entraîne que E ne possède pas de multiplication complexe. C’est une hypothèse qui pourra être levée le jour où l’on disposera de résultats suffisants sur la stabilisation de la formule des traces d’Arthur-Selberg, résultats qui semblent accessibles dans l’état d’avancement actuel de la théorie automorphe. Mentionnons également que Harris ([14]) a récemment prouvé, en admettant de telles avancées, des résultats conditionnels : en particulier un analogue de la conjecture de Sato-Tate pour le produit de deux courbes elliptiques (non isogènes). 0.2. — L’application de SU(2) dans [0, π] qui, à une matrice unitaire u, associe iθ arccos 21 tr(u) est surjective de section θ → e e−iθ et elle identifie l’intervalle [0, π] à l’ensemble des classes de conjugaison de SU(2). Il est facile de voir que la mesure de Sato-Tate n’est autre que l’image directe par cette application de la mesure de Haar normalisée de SU(2). Par suite la conjecture revient à prédire que les classes iθp de conjugaison des e e−iθp sont équiréparties dans SU(2). Dès la fin des années 60, Serre savait ramener cette conjecture à une question sur les fonctions L, ainsi qu’il l’a expliqué précisément dans son livre [26]. Noter que vers la même époque Tate avait également conscience de cette relation. Serre généralise

ASTÉRISQUE 317

(977)

CONJECTURE DE SATO-TATE

347

la méthode de Hadamard–de la Vallée Poussin afin d’énoncer un résultat qui couvre de nombreux cas connus ou conjecturaux d’équirépartition, et dont le prototype est l’équirépartition des nombres premiers dans les différentes classes de congruence de (Z/N Z)∗ : Soient K un groupe compact, F un corps de nombres et supposons donnée, pour chaque place finie v (à l’exception d’un nombre fini) de F , une classe de conjugaison Θv dans K. Notant qv le cardinal du corps résiduel correspondant, on forme, pour chaque représentation irréductible (unitaire) non triviale r de K, la fonction L suivante, qui converge pour 1 : Y L∗ (r, s) = det(1 − qv−s r(Θv ))−1 . v

Proposition 0.4 ([26]). — On suppose que, pour chaque r irréductible non triviale, cette fonction se prolonge analytiquement à un ouvert contenant le demi-plan fermé