Formalisme thermodynamique et systèmes dynamiques holomorphes 2856290515, 9782856290514

L'objet de la thermodynamique et de la physique statistique est de comprendre l'équilibre d'un gaz ou des

199 114 703KB

French Pages 96 [102]

Report DMCA / Copyright

DOWNLOAD PDF FILE

Recommend Papers

Formalisme thermodynamique et systèmes dynamiques holomorphes
 2856290515, 9782856290514

  • 0 0 0
  • Like this paper and download? You can publish your own PDF file online for free in a few minutes! Sign Up
File loading please wait...
Citation preview

` PANORAMAS ET SYNTHESES 4

FORMALISME THERMODYNAMIQUE ET ` SYSTEMES DYNAMIQUES HOLOMORPHES Michel Zinsmeister

Soci´et´e Math´ematique de France 1996

FORMALISME THERMODYNAMIQUE ` ET SYSTEMES DYNAMIQUES HOLOMORPHES Michel Zinsmeister

L’objet de la thermodynamique et de la physique statistique est de comprendre l’´equilibre d’un gaz ou des diff´erents ´etats de la mati`ere. L’un des buts de la th´eorie des syst`emes dynamiques holomorphes est de comprendre les ´etranges objets fractals qui apparaissent dans l’it´eration d’un polynˆome quadratique. Or un lien singulier r´eunit ces deux th´eories : il se trouve que des lois physiques de la thermodynamique sont un outil extrˆemement efficace pour comprendre les objets de la dynamique holomorphe. Un formalisme thermodynamique s’est d´evelopp´e, mettant en parall`ele des notions n’ayant a priori rien de commun. Si l’explication profonde de ce parall´elisme reste une ´enigme, le but de cet ouvrage est de d´ecrire ce formalisme du point de vue physique et math´ematique afin d’en d´egager les rouages fondamentaux et d’en montrer quelques applications. Cet ouvrage ne pr´etend `a aucune exhaustivit´e, que ce soit pour l’aspect physique ou math´ematique. Son objectif sera atteint si le lecteur ´eprouve du plaisir `a comprendre les articulations de cette belle machine.

To understand the equilibrium of a gas or the different states of matter is the purpose of thermodynamics or statistical physics. To understand the strange fractal sets appearing when one iterates a quadratic polynomial is one of the goals of the theory of holomorphic dynamical systems. Oddly enough, those two theorems are strongly linked: The laws of thermodynamics happen to be an extremely powerful tool to understand the objects of holomorphic dynamical systems. A “Thermodynamic Formalism” has been developped bringing in the same light notions that are a priori unrelated. If the deep reasons of this parallelism are unknown, the goal of this book is to describe this formalism both from the physical and mathematical point of view in order to understand how it works and how useful it can be. This book is by no means exhaustive neither from the physical nor from the mathematical point of view. Its objective will be attained if the reader feels pleased in understanding this beautifull machinery. Classification AMS : 28D, 30, 80, 82B.

` TABLE DES MATIERES

INTRODUCTION

1

` 1. L’HYPOTHESE ERGODIQUE

7

1. 2. 3. 4.

M´ecanique statistique des syst`emes continus Transformations pr´eservant la mesure Ergodicit´e Interpr´etation g´eom´etrique de l’ergodicit´e

7 9 11 14

2. LA NOTION D’ENTROPIE

17

1. Un peu de thermodynamique classique : l’entropie de Clausius 2. L’entropie en th´eorie de l’information : l’entropie de Shannon 3. L’entropie de Boltzmann

17 20 25

´ 3. L’ENTROPIE EN THEORIE ERGODIQUE

29

1. 2. 3. 4.

29 32 36 38

Le cadre physique : la thermodynamique des r´eseaux Entropie d’une mesure invariante Entropie et pression topologique Sous-d´ecalages

´ ` 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

41

´ 1. Enonc´ e et d´emonstration du th´eor`eme 2. Mesures de Gibbs et ´etats d’´equilibre 3. L’op´erateur de Ruelle complexe

41 47 51

vi

` TABLE DES MATIERES

´ 5. LES REPULSEURS CONFORMES

55

1. D´efinition et propri´et´es g´en´erales 2. Exemples 2. Calcul de la dimension de Hausdorff de J

55 58 61

´ ˆ 6. ITERATION DES POLYNOMES QUADRATIQUES

65

1. 2. 3. 4. 5.

65 68 72 73

Quelques notions d’it´eration La cardio¨ıde principale Applications num´eriques La formule de Manning Les ensembles de Julia de z 2 + c sont de dimension > 1 si c = 0 dans la cardio¨ıde principale 6. D´eveloppement `a l’ordre 2 en 0 de la dimension de Hausdorff de l’ensemble de Julia de z 2 + c

77

7. TRANSITIONS DE PHASE

83

1. Les transitions de phase comme ph´enom`enes naturels 2. Interpr´etation th´eorique des transitions de phase 3. Transition de phase parabolique

83 86 87

APPENDICE : DIMENSION ET MESURES DE HAUSDORFF

91

1. Rappels admis sur la th´eorie de la mesure 2. Mesures de Hausdorff 3. Dimension de Hausdorff

91 91 93

BIBLIOGRAPHIE

95

` PANORAMAS ET SYNTHESES 4

75

INTRODUCTION

Ainsi c’est chose sˆ ure : nul repos n’est accord´e aux atomes dans leur course ` a travers le vide. Bien au contraire, les uns, c´edant `a un mouvement perp´etuel et vari´e sont renvoy´es, en se choquant, `a de grandes distances ; les autres, sous le coup, se rapprochent et se nouent. Ceux qui dans une ´etroite union, rassembl´es `a des intervalles inappr´eciables, se lient entre eux, en confondant intimement leurs formes, ceux-l` a constituent les corps solides, tels les rochers, le fer, et un petit nombre d’autres substances. Pour ceux qui errent dans l’immensit´e du vide et, rapides, courent au loin s´epar´es l’un de l’autre par de grands intervalles, c’est ` a eux que nous devons l’air transparent et la splendide lumi`ere du soleil. ` , De la Nature des Choses, Chant II, −98 −55 A.J.C. LUCRECE

Les math´ematiques sont le langage des sciences physiques, et les caract`eres de ce langage sont les triangles, cercles et autres figures g´eom´etriques. Ce point de vue de Galil´ee constitue depuis le XVIIe si`ecle l’approche philosophique dominante du couple math´ematiques-physique. Le formalisme math´ematique est ind´eniablement un outil puissant et universel pour ´enoncer les lois de la nature. Ainsi la g´eom´etrie a ´et´e d´evelopp´ee pour comprendre le mouvement des astres ou encore l’optique tandis que le calcul infinit´esimal se d´eveloppait pour formaliser la m´ecanique. Ces branches se sont ensuite d´evelopp´ees consid´erablement suivant des lois proprement math´ematiques et selon une logique d’o` u les pr´eoccupations physiques ont eu tendance `a disparaˆıtre. Le couple math´ematiques-physique est donc historiquement indissociable, les math´ematiques servant `a mod´eliser la r´ealit´e physique pour la comprendre rationnellement et en d´egager les lois. Naturellement un tel point de vue doit, sitˆot ´enonc´e, ˆetre corrig´e comme trop sch´ematique ; le lien math´ematiques-physique est plus complexe que cela. Les grecs de l’Acad´emie de Platon ´etudiaient la g´eom´etrie pour elle-mˆeme, sans souci d’une quelconque application, comme un pur jeu de l’esprit ; comme l’a observ´e Dieudonn´e, Apollonius connaissait les coniques bien avant qu’elles servent `a d´ecrire les trajectoires des plan`etes et de plus en plus les physiciens utilisent des r´esultats math´ematiques r´eput´es abstraits et en tous cas d´evelopp´es per se pour ´elaborer leurs mod`eles. Mˆeme corrig´e, ce point de vue reste orient´e ; il accr´edite l’id´ee d’une dissym´etrie importante dans le rapport entre math´ematiques et physique. Imaginons une plan`ete

2

INTRODUCTION

habit´ee par des cr´eatures pensantes faisant des math´ematiques tr`es diff´eremment de nous : le point de vue pr´ec´edent nous force `a conclure que leur physique est n´ecessairement tr`es diff´erente. Dissipons tout de suite un malentendu ; le constat de cette dissym´etrie ne pr´esuppose aucun jugement de valeur : s’il est clair que la physique est tributaire des math´ematiques, le contraire n’en est pas moins vrai : sans la physique, les math´ematiques ne seraient qu’une coquille vide, une production de tautologies inconsistantes. Un exemple frappant est celui de la th´eorie du potentiel. C’est pour comprendre les lois de l’´electromagn´etisme qu’en deux si`ecles ont ´et´e fa¸conn´es les outils les plus puissants de l’analyse moderne : th´eorie de la mesure, analyse harmonique, distributions, etc. La diff´erence provient du fait que les physiciens ne peuvent se passer du mod`ele math´ematique alors que les math´ematiciens ont oubli´e l’origine physique des concepts ; la th´eorie moderne de la mesure est une th´eorie compl`etement autonome et son origine physique ne joue plus qu’un rˆole historique. Un des objets du pr´esent travail est de d´evelopper une th`ese due `a Ruelle [Ru1] tendant `a infirmer cette position r´epandue : le rapport physique-math´ematiques est plus sym´etrique qu’on le croit. Nous allons montrer en effet que des r´esultats purement math´ematiques ont ´et´e obtenus comme corollaires de r´esultats (lois) de la physique, en l’occurrence de la thermodynamique. Ici le probl`eme math´ematique n’est pas issu de la physique et sa r´esolution utilise toute la force d’un formalisme qui a ´et´e fa¸conn´e en un si`ecle pour comprendre un ph´enom`ene naturel, `a savoir l’´equilibre d’un gaz. C’est cet exemple qui fait dire `a Ruelle [Ru1] que nos math´ematiques sont naturelles. En d’autre termes nous voulons montrer un exemple o` u les math´ematiciens ont utilis´e un mod`ele physique pour r´esoudre un probl`eme math´ematique, inversant par l`a-mˆeme le rapport commun´ement suppos´e entre les deux sciences. La thermodynamique fait maintenant partie de la m´ecanique statistique, science qui a ´et´e cr´e´ee au si`ecle dernier par (entre autres) Clausius, Boltzmann, Carnot, Kelvin, Maxwell, Gibbs. Son acte de naissance ´epist´emologique est un constat d’´echec ; les lois de la m´ecanique classique, applicables au niveau microscopique pour l’´etude d’un fluide sont totalement inop´erantes au niveau macroscopiques vu le nombre ´enorme de particules interagissant. Les quantit´es `a mesurer ne peuvent donc ˆetre que des moyennes et le mouvement des particules per¸cu comme al´eatoire et par l`a seulement ´etudiable statistiquement. Le d´ebut de cette science commence comme une illustration d’´ecole du point de vue expos´e plus haut et que l’on veut pr´ecis´ement corriger. Cette science (physique) enfante de la th´eorie (math´ematique) des syst`emes dynamiques qui verra ses premiers succ`es avec Poincar´e puis Birkhoff et son fameux th´eor`eme identifiant moyennes spatiales et temporelles. Enfin Kolmogorov et Sinai prendront `a leur compte la notion d’entropie (invent´ee par Clausius et Boltzmann) pour l’utiliser comme un invariant fondamental en th´eorie ergodique. On reste ici dans le sch´ema classique : une nouvelle science physique invente de nouveaux concepts comme l’entropie qui sont emprunt´es (vol´es ?) par les math´ematiciens qui, en les formalisant, en font des outils math´ematiques dont l’origine physique a ´et´e compl`etement ´evacu´ee. ` PANORAMAS ET SYNTHESES 4

INTRODUCTION

3

L’histoire math´ematique que nous allons raconter pour illustrer la th`ese de Ruelle a pour origine une remarque de Poincar´e dans son M´emoire sur les groupes Klein´eens [Po1]. Soit G un groupe Fuchsien, c’est-`a-dire un groupe de transformations homographiques fixant le disque unit´e D dont un syst`eme g´en´erateur identifie par paires les cˆotes d’un polygone (pour la g´eom´etrie hyperbolique) inclus dans D et tel que les images de ce polygone par le groupe forment un pavage de D. Ce groupe agit sym´etriquement sur le compl´ementaire de D et le cercle ∂D apparaˆıt comme un ensemble invariant remarquable de G agissant sur la sph`ere de Riemann. Imaginons maintenant que nous perturbons le syst`eme g´en´erateur pr´ec´edent en un syst`eme d’homographies de la sph`ere de sorte que le polygone associ´e et ses images par le nouveau groupe forment encore un pavage d’un domaine de Jordan ∆ (cela revient alg´ebriquement `a perturber continˆ ument les g´en´erateurs de fa¸con `a pr´eserver les relations). La courbe ∂∆ est alors l’ensemble invariant remarquable pour le groupe Klein´een perturb´e (l’ensemble limite analogue de l’ensemble de Julia en it´eration). Poincar´e remarque donc que ∂∆, si ce n’est pas un cercle, doit ˆetre une courbe tr`es irr´eguli`ere : remarquable intuition qui pr´efigure entre autres le th´eor`eme de rigidit´e de Mostow et un champ de recherches consid´erable ! Cette intuition est confirm´ee rigoureusement par Fricke et Klein quelques ann´ees plus tard ; ces auteurs d´emontrent que la courbe en question, si ce n’est un cercle, est localement non rectifiable (la mesure de Hausdorff 1-dimensionnelle n’est pas σ-finie). Notons au passage que c’est le premier exemple historique d’une telle courbe (la courbe de Van Koch viendra 10 ans plus tard) (cette observation provient de [Po2]). Il faudra attendre Mostow [Mo] pour comprendre mieux le ph´enom`ene et enfin Bowen [Bo1] utilisera Mostow et le formalisme thermodynamique pour montrer que si ce n’est pas un cercle, la dimension de Hausdorff de la courbe est > 1 et calculable selon une formule que nous allons maintenant expliquer. Bowen g´en´eralise tout d’abord le probl`eme au cadre g´en´eral des r´epulseurs conformes. Vu sous cet angle, on peut mod´eliser l’action du groupe sur ∂∆ comme l’action d’un d´ecalage sur un ensemble de mots infinis sur un alphabet fini (penser `a la multiplication par 10 mod 1 sur l’intervalle [0, 1] cod´e par le d´eveloppement d´ecimal), soit AN ; on interpr`ete alors cet ensemble comme l’ensemble des configurations en r´eseau d’un gaz unidimensionnel ; la mesure de Hausdorff dans la dimension apparaˆıt alors comme un ´etat de Gibbs du syst`eme associ´ee `a une interaction ϕ d´ependant de la g´eom´etrie et `a une temp´erature T telle que l’´etat d’´equilibre µ associ´e minimise l’´energie libre U − TS o` u U est l’´energie potentielle associ´ee `a ϕ, S l’entropie de µ, la temp´erature T ´etant telle que l’´energie libre soit nulle. La dimension vaut alors k −1 T (o` u k est la constante de Boltzmann). Ce r´esultat est en tout point remarquable ; les grandeurs thermodynamiques s’appliquent parfaitement au probl`eme alors qu’aucun sens physique ne peut lui ˆetre donn´e. Le probl`eme math´ematique a ici ´et´e mod´elis´e par la physique alors mˆeme qu’il n’a lui-mˆeme aucune origine naturelle. C’est la situation exactement ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

4

INTRODUCTION

sym´etrique de celle que l’on a coutume d’observer : les physiciens utilisant des r´esultats math´ematiques abstraits `a la grande surprise de leur cr´eateur pour mod´eliser des situations exp´erimentales. Ici ce sont les math´ematiciens qui plaquent sur leur probl`eme le mod`ele de la thermodynamique. Il ne s’agit pas seulement ici d’intuition ou d’emprunt de concept, mais de l’utilisation pleine et enti`ere d’un mod`ele physique. Le but de ce survol est de tenter d’expliquer cette th´eorie sous ses deux angles physiques et math´ematiques. En ce qui concerne la physique nous tenterons d’expliquer (aussi bien qu’un non physicien peut le faire) les notions thermodynamiques n´ecessaires `a la compr´ehension de la preuve. Nous essayerons autant que possible d’accompagner cette introduction de remarques historiques afin de mieux comprendre l’´evolution des id´ees. C’est ainsi que nous commen¸cons par un chapitre o` u nous tentons d’expliquer l’origine physique de la notion d’ergodicit´e avant d’exposer rigoureusement les bases de la th´eorie ergodique et la d´emonstration du th´eor`eme de Birkhoff. Dans le chapitre suivant nous d´eveloppons les diff´erentes notions d’entropie telles qu’elles sont apparues (presque) chronologiquement. Nous nous attarderons sur la th´eorie de l’information car il nous semble que c’est p´edagogiquement le bon cadre pour aborder cette notion complexe. Le chapitre se termine par un mod`ele jouet de thermodynamique o` u l’on peut d´efinir facilement toutes les fonctions thermodynamiques et comprendre les liens fondamentaux qui les unissent et qui constituent le cœur de ce qui va suivre. Les chapitres suivants d´eveloppent de fa¸con rigoureuse la thermodynamique des r´eseaux, le th´eor`eme de Perron-Frobenius-Ruelle qui est la cl´e de voˆ ute de tout ce travail, et toutes ses cons´equences thermodynamiques. On insistera sur les notions d’´etat de Gibbs et d’´etat d’´equilibre, deux notions ´eminemment physiques qui sont mises `a contribution math´ematique. Ce qui vient d’ˆetre d´ecrit constitue ce qui est commun´ement appel´e le formalisme thermodynamique ; le reste de l’ouvrage est consacr´e aux applications de ce concept. Le terme d’illustration semble mieux convenir, tant le formalisme est pr´esent dans ces applications. Nous commen¸cons par une ´etude g´en´erale des r´epulseurs conformes, th´eorie qui englobe le th´eor`eme de Bowen dont nous avons d´ej`a parl´e `a propos du probl`eme de Poincar´e. Le formalisme thermodynamique permet de relier la dimension de Hausdorff de l’ensemble limite au rayon spectral d’un op´erateur de Ruelle. Ce fait nous permet d’une part de d´eduire des propri´et´es de cette dimension mais aussi d’´etudier la variation de cette dimension suivant la variation d’un param`etre dont d´epend le r´epulseur conforme. Dans le cas du probl`eme de Poincar´e, cela revient `a consid´erer l’espace de toutes les perturbations possibles d’un groupe Fuchsien qui n’est autre que l’espace de Teichm¨ uller du groupe et qui est muni d’une structure complexe finie-dimensionnelle naturelle. La question qui se pose alors est celle de la r´egularit´e des fonctions thermodynamiques intervenant comme fonction sur l’espace de Teichm¨ uller. Tout cela a ´et´e ´etudi´e mais le nombre de param`etres intervenant et les techniques sp´ecifiques de th´eorie de Teichm¨ uller font que cette ´etude n’a pas sa place ici. ` PANORAMAS ET SYNTHESES 4

INTRODUCTION

5

Nous abandonnons donc le probl`eme de Poincar´e ´evoqu´e plus haut pour fixer notre attention sur le cas de l’it´eration des polynˆomes quadratiques (z → z 2 + c). Pour les valeurs de c dans la cardio¨ıde principale de l’ensemble de Mandelbrot, l’ensemble de Julia est une courbe de Jordan sur laquelle le polynˆome agit comme un r´epulseur conforme, ce qui rend toute la th´eorie applicable. La complexit´e est ici att´enu´ee par le fait que l’espace de Teichm¨ uller associ´e (l’ensemble des valeurs de c) est de dimension1. Concr`etement, nous nous proposons de d´emontrer rigoureusement les trois r´esultats suivants qui illustrent la force du formalisme thermodynamique : 1) La dimension de Hausdorff de l’ensemble de Julia de z → z 2 + c, soit d(c) varie de fa¸con r´eelle analytique avec c dans la cardio¨ıde principale. 2) Dans cette mˆeme cardio¨ıde, d(c) > 1 sauf si c = 0. 3) Au voisinage de 0, on a le d´eveloppement limit´e d(c) = 1 +

  |c|2 + o |c|2 . 4 log 2

Notons que les r´esultats 1) et 3) sont dˆ us `a Ruelle [Ru2] tandis que le deuxi`eme doit ˆetre cr´edit´e `a Bowen [Bo1] ; nous donnons ici une d´emonstration diff´erente de 3). Celle de Ruelle est, de son propre aveu, heuristique ; la nˆotre est rigoureuse et c’est peut-ˆetre l`a l’une des seules nouveaut´es de cette monographie, une autre ´etant, nous l’esp´erons, de combler un vide dans la litt´erature et de rendre service `a tous les analystes qui veulent ´etudier des questions de dimension de Hausdorff d’ensembles limites de groupes ou de semi-groupes et, pourquoi pas, aux physiciens int´eress´es `a l’aspect analytique du sujet. Dans un dernier chapitre, nous abordons le probl`eme de la transition de phase. Il s’agit d’un probl`eme rendu fascinant par le paradoxe qu’il v´ehicule : c’est un probl`eme ´eminemment concret, palpable mˆeme, alors que la th´eorie cens´ee l’expliquer est difficile et encore largement incompl`ete. Apr`es un pr´eliminaire rappelant les r´esultats physiques bien connus, nous montrons tout d’abord que le formalisme thermodynamique se g´en´eralise au cas des polynˆomes dont l’ensemble de Julia ne contient pas de point critique ; c’est la th´eorie de Denker Urbanski [DU1]. Nous montrons alors que dans le cas de l’existence d’un point fixe indiff´erent rationnel il apparait une transition de phase `a la temp´erature correspondant `a la dimension de Hausdorff. Nous utilisons alors ces r´esultats pour montrer que la fonction d|R est continue `a gauche en 14 (voir [BZ]). Nous concluons cette introduction en confessant que le travail qui suit n’est pas `a 100 % autosuffisant ; nous admettons en effet en cours de route le th´eor`eme de Koebe dont la d´emonstration figure dans tout bon ouvrage sur la variable complexe (par exemple [Pom1]) et le th´eor`eme r´ecent de Slodkowski dont la d´emonstration n´ecessiterait un autre ouvrage de la mˆeme taille et pour laquelle nous renvoyons `a [Sl], [AM]. Nous admettons ´egalement le th´eor`eme du point fixe de Schauder-Tychonov dont on peut trouver une d´emonstration dans [Rud] ainsi que le th´eor`eme de KatoRellich sur la perturbation du spectre pour lequel nous renvoyons `a [RS]. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

6

INTRODUCTION

Enfin nous avons d´elib´eremment (c’est sˆ urement un tort) laiss´e de cˆot´e tout l’aspect quantique du sujet. Un mot encore concernant la forme : comme l’indique le titre de la collection, il s’agit d’un ouvrage de synth`ese. Mon but en l’´ecrivant ´etait de comprendre et de faire comprendre certains m´ecanismes et enchaˆınements d’id´ees. Pour ce faire j’ai dˆ u lire beaucoup d’ouvrages, tous ´ecrits par des personnes beaucoup plus savantes que moi. Je n’ai pas h´esit´e `a parfois reprendre presque mot pour mot certains d´eveloppements de ces ouvrages et ce dans un souci de clart´e : puisque c’est si clairement expliqu´e, pourquoi en effet changer ? Un travail de synth`ese est de toute fa¸con une sorte de pillage. Parmi toutes les r´ef´erences que j’ai consult´ees, je voudrais citer celles que j’ai le plus pill´ees. Il s’agit de : ´ • Douady, Hubbard [DH] : Etude dynamique des polynˆomes complexes ; •

Jancovici [Ja] : Thermodynamique et physique statistique ;



Khinchin [Kh1] : Mathematical Fundations of statistical physics ;



Landau et Lifschitz [LL] : Statistical Mechanics.



Milnor [Mi1] : Dynamics in one complex variable : Introductory lectures ;

• Parry et Pollicot [PP] : Zeta functions and the periodic structure of hyperbolic dynamics ; •

Ruelle [Ru3] : Thermodynamic formalism ;



Walters [W] : Introduction to ergodic theory ;

Ce travail n’aurait pu voir le jour sans l’aide et la bienveillance d’un tr`es grand nombre de personnes. Je tiens tout d’abord `a remercier l’´equipe de Panoramas et synth`eses pour leur encouragement permanent : Mich`ele Audin et Jean-Pierre Kahane dont les conseils ont ´et´e d´eterminants, sans oublier Nathalie Christiæn. Je remercie ´egalement mes coll`egues de l’universit´e d’Orl´eans et de Paris-Sud pour leur conseils : J.-P. Schreiber qui a lu attentivement une premi`ere version du manuscrit, F. James qui m’a initi´e `a la transformation de Legendre, J.-M. Caillol qui a apport´e sa caution de physicien et P. Sentenac qui a relev´e de nombreuses erreurs. Vassili Nestoridis et Stephen Heinemann ont ´egalement lu le manuscrit et corrig´e de nombreuses erreurs : je les en remercie vivement. Enfin, je remercie ´egalement K. Astala, A. Volberg et M. Denker pour des conversations math´ematiques fructueuses concernant le texte.

` PANORAMAS ET SYNTHESES 4

Chapitre 1 ` L’HYPOTHESE ERGODIQUE

1. M´ecanique statistique des syst`emes continus Le credo de la m´ecanique statistique est que, en derni`ere instance, ce sont les lois de la m´ecanique au niveau corpusculaire qui expliquent tout ph´enom`ene naturel, aussi compliqu´e soit-il. Si nous voulons d´ecrire le comportement `a l’´equilibre d’un litre d’air enferm´e dans une bouteille on consid`ere donc les N mol´ecules qui composent ce gaz (N est de l’ordre de 1027 ) et pour la j-i`eme mol´ecule, on d´esigne par qj (t), pj (t) ∈ R3 respectivement sa position et sa quantit´e de mouvement `a l’instant t. On pose p = (p1 , .., pn ), q = (q1 , .., qn ) et on d´efinit la phase comme (p, q) ∈ R6N , l’espace des phases. Ce qui r`egle l’´evolution du processus, c’est un Hamiltonien qui n’est autre que l’´energie du syst`eme H(p, q) =

N  |pj |2 + U (q). 2mj j=1

La premi`ere partie de la somme est l’´energie cin´etique et U repr´esente l’´energie potentielle qui se d´ecompose elle-mˆeme suivant l’´energie des forces ext´erieures qui s’appliquent au syst`eme et l’´energie interne provenant de l’interaction entre les particules. les ´equations du mouvement sont alors simplement ∂H , dpij =− dt ∂qij

∂H dqij = dt ∂pij

(i = 1, . . . , N, j = 1, 2, 3).

Une valeur initiale de la phase ´etant donn´ee on peut en th´eorie compl`etement d´ecrire le mouvement dans l’espace des phases. Mais ceci est irr´ealiste pour deux raisons : la premi`ere est le nombre ´enorme d’´equations `a r´esoudre — mˆeme si l’on pouvait les r´esoudre explicitement, le temps qu’il faudrait pour les ´ecrire d´epasserait largement la dur´ee d’existence du syst`eme solaire — et la deuxi`eme raison est qu’il est impossible de connaˆıtre une valeur initiale ; il est hors de question de suivre `a la trace chaque mol´ecule !

8

` CHAPITRE 1. L’HYPOTHESE ERGODIQUE

L’id´ee pour r´esoudre cette difficult´e apparemment insurmontable est de pr´ecis´ement mettre `a profit l’extrˆeme complexit´e du ph´enom`ene : les interactions sont tellement nombreuses et complexes au point de pouvoir ˆetre consid´er´ees comme al´eatoires que. . . de l’ordre finit par apparaˆıtre au mˆeme titre que de l’ordre apparaˆıt dans une suite de nombres al´eatoires (loi des grands nombres). Mais soyons plus pr´ecis : en g´en´eral l’´etude d’un ph´enom`ene se ram`ene `a un certain nombre de mesures de quantit´es thermodynamiques. Ces quantit´es sont en fait des fonctions sur l’espace des phases. D’apr`es la discussion pr´ec´edente on peut consid´erer ces fonctions comme des variables al´eatoires. On dit qu’un syst`eme est en ´equilibre si ces variables al´eatoires correspondant aux quantit´es thermodynamiques sont extrˆemement centr´ees autour de leur esp´erance, au point que des fluctuations dans les mesures sont inobservables dans la pratique. Tout ceci reste bien vague si on ne pr´ecise pas : 1) quelle est la loi de probabilit´e sur l’espace des phases et 2) comment dans la pratique sont effectu´ees les mesures. La r´eponse `a la question 1) d´ecoule d’un th´eor`eme de Liouville : la mesure de Lebesgue dp dq dans l’espace des phases est invariante par le flot Hamiltonien. Autrement dit, un ensemble mesurable de phases sera transform´e au bout d’un temps quelconque t en un ensemble de mˆeme volume. Il est en effet naturel de faire l’hypoth`ese que la loi cherch´ee ne d´epend pas du temps. Si donc V est un ensemble de l’espace des phases qui est invariant par le flot, la loi de probabilit´e  dP = dp dq V dp dq est un bon candidat. Les ensembles naturels qui sont invariants par le flot sont les hypersurfaces de niveau de l’´energie H. Comme elles sont de volume nul, la loi pr´ec´edente n’est pas d´efinie et un calcul simple de limite montre qu’il faut prendre dans ce cas pour loi dP = 

dσ/∇H , dσ/∇H

{H=H0 }

dσ d´esignant la mesure de surface sur {H = H0 }. Cette loi s’appelle l’ensemble microcanonique de Gibbs. La r´eponse `a la deuxi`eme question nous am`ene au point essentiel de ce chapitre. Supposons que l’on veuille mesurer une fonction thermodynamique f . Quelle que soit la mani`ere dont on s’y prenne, cette mesure prendra un certain temps qui sera forc´ement long par rapport `a la vitesse des changements dans le fluide (les mol´ecules d’un gaz se d´eplacent `a des vitesses de l’ordre de quelques centaines de m`etres par seconde). Ce que nous calculons, c’est donc une moyenne sur un (grand) intervalle de temps de la quantit´e f (Mt ), Mt d´esignant l’´etat du syst`eme `a l’instant t. L’hypoth`ese ergodique est que ces moyennes temporelles tendent presque sˆ urement (par rapport `a la loi invariante) vers l’esp´erance de f , c’est-`a-dire vers sa moyenne ` PANORAMAS ET SYNTHESES 4

´ 2. TRANSFORMATIONS PRESERVANT LA MESURE

9

spatiale : c’est une hypoth`ese tr`es vraisemblable car la complexit´e du ph´enom`ene implique que le flot va visiter tous les ´etats possibles sans privil´egier aucun d’entre eux. Elle n’est cependant pas d´emontr´ee `a l’heure actuelle. L’objet de ce chapitre est de d´ecrire la contribution du math´ematicien Birkhoff au sujet : il a montr´e que l’hypoth`ese ergodique est v´erifi´ee si l’on peut montrer que la mesure invariante est ergodique c’est-`a-dire si les seuls ensembles invariants sont de probabilit´e 0 ou 1. Naturellement cela ne fait que d´eplacer le probl`eme pour le physicien, mais ce th´eor`eme s’est av´er´e tr`es fructueux en math´ematiques. Nous nous en servirons `a plusieurs reprises dans la suite. Nous pr´esentons tout d’abord le cadre axiomatique du th´eor`eme dont nous ne donnerons que la version discr`ete : un espace X compact muni d’une mesure de probabilit´e qui soit invariante par rapport `a une transformation continue T . Dans le cas physique que nous venons de d´ecrire, on peut penser `a T comme `a l’application qui `a tout ´etat du syst`eme associe l’´etat apr`es une seconde. Au bout du compte, la th´eorie ergodique apparaˆıt comme l’´etude des actions de groupe (ou de semi-groupes) sur un espace compact. Dans l’exemple pr´esent´e, le groupe est R, repr´esentant le temps. Dans la suite, nous verrons d’autres exemples o` u ce n’est pas le temps qui agira mais Zn qui repr´esentera un groupe de translations dans le cas d’un mod`ele de gaz en r´eseau.

2. Transformations pr´eservant la mesure Nous oublions provisoirement l’arri`ere plan physique pour nous consacrer `a un expos´e axiomatique de th´eorie ergodique. Le changement risque de paraˆıtre brutal mais c’est la loi du genre et la rigueur l’exige ! Soit (X, B, µ) un espace de probabilit´es ; on dit d’une application T de X dans lui-mˆeme qu’elle pr´eserve la mesure si T est mesurable et si, pour tout A ∈ B,   µ T −1 (A) = µ(A). L’objet de la th´eorie ergodique est l’´etude des espaces de probabilit´e munis d’une transformation pr´eservant la mesure. Avant de donner des exemples, voyons un crit`ere pratique pour v´erifier qu’une transformation pr´eserve la mesure : Th´eor`eme 1. — Soit (X,B, µ) un espace probabilis´e et C une alg`ebre de Boole qui engendre B ; une transformation T de X pr´eserve la mesure si et seulement si pour tout A ∈ C, on a µ(T −1 (A)) = µ(A). Preuve. — La condition est ´evidemment n´ecessaire ; pour voir qu’elle est suffisante, on appelle T l’ensemble des A ∈ B tels que µ(T −1 (A)) = µ(A). On a T ⊃ C et le fait que c’est une classe monotone. C’est donc tout entier par le th´eor`eme sur les classes monotones. Exemples 1) Soit G un groupe compact ; on sait qu’il existe sur G une unique mesure de probabilit´e (mesure bor´elienne) qui soit invariante par translations `a gauche (i.e. telle ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

10

` CHAPITRE 1. L’HYPOTHESE ERGODIQUE

que µ(xA) = µ(A) pour tout x ∈ G) ; c’est la mesure de Haar `a gauche sur G. Dans une telle situation, la transformation T (x) = ax, i.e. la translation `a gauche par a, pr´eserve la mesure car, pour tout A ∈ B, on a :   T −1 (A) = a−1 A =⇒ µ T −1 (A) = µ(A). 2) Un premier exemple qui illustre la situation pr´ec´edente est G = U, le cercle unit´e de C ; la mesure de Haar est ici la mesure de Lebesgue et les translations sont les rotations. Une autre fa¸con de voir cet exemple est d’identifier le cercle avec R/Z et les translations sont alors les translations sur R modulo 1. 3) Soit toujours G un groupe compact muni de sa mesure de Haar et T un homomorphisme de G : Proposition. — Si T est surjectif, il pr´eserve la mesure de Haar. Preuve. — Posons ν = T ∗ µ ; il faut d´emontrer que ν = µ ; pour ce faire, par unicit´e de la mesure de Haar, il suffit de v´erifier que ν est invariant par translations `a gauche. Mais pour tout A ∈ B et tout x ∈ G, on a      ν T (x)A = µ T −1 T (x)A et un petit calcul alg´ebrique montre que T −1 (T (x)A) = xT −1 (A), ce qui implique       ν T (x)A = µ xT −1 (A) = µ T −1 (A) = ν(A). On conclut car T est surjectif. 4) Le prototype de la situation pr´ec´edente est le cas du cercle muni de sa mesure de Lebesgue et de la transformation z → z 2 ; si l’on identifie R/Z avec le cercle unit´e par l’application x → e2iπx , cette transformation devient la multiplication par 2 modulo 1. On peut encore voir cette transformation sous un autre angle. Tout r´eel de l’intervalle [0, 1[ admet un unique d´eveloppement dyadique de la forme x = 0, x1 x2 · · · xn · · · o` u les xi valent 0 ou 1, la suite n’´etant pas stationnaire en 1. Modulo un ensemble d´enombrable qui sera ici n´egligeable, on peut identifier R/Z avec {0, 1}N muni de la = µ, la mesure µ0 ´etant d´efinie tribu produit P({0, 1})N et de la mesure produit µ⊗N 0 sur {0, 1} par µ0 ({0}) = µ0 ({1}) = 12 . La transformation T apparaˆıt alors comme l’application d´ecalage sur l’espace produit (en anglais shift) d´efinie par ∀x = (x1 , x2 , . . . , xn , . . .), ` PANORAMAS ET SYNTHESES 4

T (x) = (x2 , x3 , . . . , xn , . . .).

´ 3. ERGODICITE

11

5) Cette situation se g´en´eralise de la fa¸con suivante ; soient A un ensemble fini de cardinal m (un alphabet) et X = AN ; c’est un espace compact dont la tribu bor´elienne n’est autre que la tribu produit P(A)N . Les ´el´ements de X sont les mots de longueur infinie sur l’alphabet A et l’on peut d´efinir l’application d´ecalage T sur X de la mˆeme fa¸con que pr´ec´edemment. La principale diff´erence avec la situation du 4), c’est qu’il n’y a pas de mesure naturelle sur X qui soit invariante par le d´ecalage. En fait, on peut construire beaucoup de telles mesures : On peut tout d’abord consid´erer les mesures produit ; on se donne une mesure µ0 de probabilit´e sur A, c’est-`a-dire une suite de n r´eels p1 , . . . , pn de [0, 1] dont la somme fait 1 et l’on consid`ere la mesure produit µ sur X. Il est imm´ediat de v´erifier que c’est une mesure invariante par le d´ecalage ; cette situation s’appelle le d´ecalage de Bernoulli. En toute g´en´eralit´e, une mesure sur X est enti`erement d´etermin´ee par la valeur qu’elle prend sur les cylindres   a1 · · · ap = x ∈ X; xi = ai , 1 ≤ i ≤ p . Se donner une mesure invariante par le d´ecalage revient donc `a se donner une famille de r´eels p(a1 , .., an ) ∈ [0, 1] v´erifiant les axiomes : m 1) p(j) = 1 (on suppose A = {1, . . . , m}) ; j=1

2) pour tout (a1 , . . . , an ) ∈ An , on a p(a1 . . . an ) =

m

p(a1 , . . . , an , j) ;

j=1 m

3) pour tout (a1 , . . . , an ) ∈ An , on a p(a1 , . . . , an ) =

p(j, a1 , . . . , an ).

j=1

Pr´ecisons un peu ce dernier point. L’alg`ebre de Boole engendr´ee par les cylindres est l’ensemble des r´eunions finies de cylindres ; une fonction µ d´efinie par une famille de fonctions v´erifiant 1) et 2) sur cette alg`ebre de Boole est alors automatiquement σ-additive car si un cylindre s’´ecrit comme une r´eunion d´enombrable disjointe de cylindres, cette r´eunion est n´ecessairement finie par compacit´e et la propri´et´e est facile `a voir avec 2). La fonction µ se prolonge alors en une mesure sur B(X) par le th´eor`eme de Carath´eodory. Enfin la condition 3) implique que la mesure µ est invariante par le d´ecalage d’apr`es le th´eor`eme 1.

3. Ergodicit´e ´ Etant donn´e un espace probabilis´e muni d’une mesure invariante par le d´ecalage, on s’int´eresse aux orbites des points de X, i.e. aux suites de la forme x0 ∈ X,

xn+1 = T (xn ).

Le premier th´eor`eme concernant ces suites va nous montrer que du point de vue de la mesure, ces suites ont tendance `a revenir ´eternellement `a leur point de d´epart : Th´eor`eme de r´ecurrence de Poincar´e. — Soit E ⊂ X tel que µ(E) > 0 ; alors pour presque tout x0 ∈ E, la suite (xn ) retourne infiniment souvent dans E. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

` CHAPITRE 1. L’HYPOTHESE ERGODIQUE

12

Preuve. — Pour N > 0, posons : EN = Alors F = E

 N ≥0



T −n (E).

n≥N



EN est l’ensemble des points de E dont l’orbite retourne dans E

−1 infiniment souvent. Il suffit de montrer que µ(E) = µ(F ). Mais T (EN ) = EN +1 et donc µ(EN ) = µ(E0 ), N ≥ 0 impliquent µ(F ) = µ(E E0 ) = µ(E) car E ⊂ E0.

Nous nous proposons `a pr´esent d’´etudier de fa¸con plus syst´ematique la fa¸con dont les orbites remplissent l’espace X. La propri´et´e centrale dans cette direction est la propri´et´e d’ergodicit´e. D´efinition. — La transformation T est dite ergodique si   B ∈ B et T −1 (B) = B =⇒ µ(B) = 0 ou 1. Th´eor`eme 3. — Les ´enonc´es suivants sont ´equivalents : 1) T est ergodique ;   2) B ∈ B et µ T −1 (B)  B = 0 impliquent µ(B) = 0 ou µ(B) = 1 ; ∞   3) A ∈ B et µ(A) > 0 impliquent µ T −n (A) = 1 ; n=1

4) pour tous A, B ∈ B, µ(A) > 0 et µ(B) > 0 impliquent l’existence d’un entier n > 0 tel que µ(T −n (A) ∩ B) > 0 ; 5) pour tout f : X → R mesurable, f ◦ T = f µ-p.p. implique f = Cte p.p. ; 6) pour tout f ∈ L2 (µ), f ◦ T = f p.p. implique f = Cte p.p. Preuve. 1) ⇒ 2). Soit B un ensemble v´erifiant 2) ; pour tout n ≥ 0, nous avons n−1

T −(i+1) (B)  T −i (B) T −n (B)  B ⊂ i=0

car

A  B ⊂ (A  C) ∪ (C  B) =



  T −i T −1 (B)  B

et donc µ(T −n (B) ∩ B) = 0. Soit : ∞



T −i (B). B∞ = n=0 i=n

On d´eduit de ce qui pr´ec`ede que µ(B  B∞ ) = 0. D’autre part, T −1 (B∞ ) = B∞ . Par ergodicit´e, µ(B∞ ) = 0 ou µ(B∞ ) = 1 et donc de mˆeme pour B. ∞ T −n (A) satisfait µ(B  T −1 (B)) = 0. 2) ⇒ 3). Il suffit de v´erifier que B = n=1

3) ⇒ 4). Par 3), ∞ ∞   



µ(B) = µ B ∩ T −n (A) = µ (B ∩ T −n (A) > 0 n=1

n=1

et donc l’un des ensembles B ∩ T −n (A) doit avoir une mesure positive. ` PANORAMAS ET SYNTHESES 4

´ 3. ERGODICITE

13

4) ⇒ 5). Supposons qu’il existe deux intervalles disjoints I, J tels que µ(f ∈ I) > 0 et µ(f ∈ J) > 0 ; posons A = {f ∈ I} et B = {f ∈ J}. Comme f ◦ T = f µ-p.p., on a µ(T −n (A)  A) = 0 et µ(T −n (B)  B) = 0 ; or, par 4), il existe n > 0 tel que µ(T −n (A)∩B) > 0). Ceci contredit le fait que A, B sont disjoints. Donc soit A, soit B est de mesure nulle. On en d´eduit facilement que f est constante p.p. ´ 5) ⇒ 6). Evident. 6) ⇒ 1). Soit A un sous-ensemble de X tel que T −1 (A) = A et posons f = 1A ; alors f ∈ L2 (X, µ) et f ◦ T = f ; par 6), f est constante p.p. et donc µ(A) = 0 ou 1. Exemples 1) Soient α un nombre irrationnel et T la translation par α dans R/Z ; alors T est ergodique. Soit en effet f ∈ L2 (R/Z) telle que f ◦ T = f p.p. ; en ´ecrivant que la s´erie de Fourier de f est ´egale `a celle de f ◦ T , on obtient 

an e2iπnx =

n∈Z



an e2iπnα e2iπnx

n∈Z

et donc, en identifiant les coefficients et en utilisant le fait que α est irrationnel, que an = 0 si n = 0, ce qui signifie f constante. 2) Tout d´ecalage de Bernoulli est ergodique. Soit en effet E un sous-ensemble invariant par le d´ecalage et A= Aj une r´eunion finie disjointe de cylindres telle que µ(A  E) < - ; si n est assez grand, on a :      −n  µ T (Ak ) ∩ Aj = µ(Ak )µ(Aj ) = µ(A)2 . µ T −n (A) ∩ A = j,k

Mais

j,k

    µ E  T −n (A) = µ T −n (E)  T −n (A) = µ(E  A) < -,

ce qui implique, comme E  (A ∩ T −n (A) est contenu dans (E  A) ∪ (E  T −n (A)), que µ(E  (A ∩ T −n (A)) < 2-, puis que   µ(E) − µ(A ∩ T −n (A) < 2-. Finalement,       µ(E) − µ(E)2  ≤ µ(E) − µ(A ∩ T −n (A) + µ(A)2 − µ(E)2  ≤ 4-. Le r´eel - ´etant arbitrairement petit, on a n´ecessairement µ(E) = µ(E)2 , d’o` u µ(E) = 0 ou µ(E) = 1.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

` CHAPITRE 1. L’HYPOTHESE ERGODIQUE

14

4. Interpr´etation g´eom´etrique de l’ergodicit´e Dans ce paragraphe, nous supposons (dans la pratique cela sera toujours v´erifi´e) que X est un espace m´etrique compact et B la tribu bor´elienne de X. Dans ce cadre, nous disposons de l’important th´eor`eme de repr´esentation de Riesz qui nous permet d’identifier l’ensemble des mesures bor´eliennes (sign´ees) avec le dual de C(X), l’espace des fonctions continues de X dans R. Soit M (X) l’ensemble des mesures de probabilit´e sur X ; cette identification nous permet de munir M (X) d’une topologie, la topologie faible de C(X) . Comme X est compact, on voit facilement que cette topologie est m´etrisable ; de plus le th´eor`eme de Banach-Alaoglu implique que M (X) est compact. En r´esum´e, cette ´etude nous permet de voir M (X) comme un convexe compact d’un espace vectoriel topologique ; le th´eor`eme de Krein-Milman affirme que dans cette situation toute mesure de M (X) est une moyenne de points extr´emaux de M (X), un point µ ´etant extr´emal si 

 µ1 , µ2 ∈ M (X) et µ = 12 (µ1 + µ2 ) =⇒ µ1 = µ2 = µ.

Par exemple, on montre que les masses de Dirac δx pour x ∈ X sont les points extr´emaux de M (X). Soit maintenant T une application continue de X dans X ; cette transformation induit une application T ∗ : M (X) → M (X) d´efinie par B ∈ B(X),

  T ∗ µ(B) = µ T −1 (B) .

Proposition. — L’application T ∗ est continue et affine sur M (X). Preuve. — L’application T ∗ est caract´eris´ee par   ∀f ∈ C(X), f d(T ∗ µ) = f ◦ T dµ. X

X

Sous cette forme il est imm´ediat de voir que si (µn ) est une suite de M (X) qui converge faiblement vers µ, alors T ∗ µn converge faiblement vers T ∗ µ. Le fait que T ∗ soit affine est une simple v´erification. On peut alors appliquer le th´eor`eme tr`es g´en´eral de Markov-Kakutani : toute application affine continue d’un compact convexe d’un espace vectoriel topologique dans lui-mˆeme admet un point fixe. Dans notre situation cela signifie que toute transformation continue de X admet une mesure invariante. On d´efinit alors M (X, T ) comme l’ensemble des mesures de M (X) invariantes par T ; il s’agit d’un convexe compact non vide ; l`a encore, il est engendr´e par ses points extr´emaux. Le th´eor`eme suivant identifie ces derniers : Th´eor`eme 4. — ergodiques.

Les points extr´emaux de M (X, T ) sont les mesures invariantes

` PANORAMAS ET SYNTHESES 4

´ ´ ´ ´ 4. INTERPRETATION GEOM ETRIQUE DE L’ERGODICITE

15

Preuve. 1) Extr´emal ⇒ ergodique. Supposons µ ∈ M (X, T ) non ergodique. Il existe alors E ∈ B(X) telle que 0 < µ(E) < 1, avec T −1 (E) = E. Soient : µ1 =

1 1E µ, µ(E)

µ2 =

1 1X \E µ. µ(X \E)

Comme E et X \E sont invariants, µ1 et µ2 appartiennent `a M (X, T ),   µ = µ(E)µ1 + 1 − µ(E) µ2 , ce qui implique que µ n’est pas extr´emal. 2) Ergodique ⇒ extr´emal. Soit µ ergodique et supposons µ = pµ1 + (1 − p)µ2 avec µj ∈ M (X, T ). N´ecessairement µj est absolument continue par rapport `a µ et par cons´equent, par le th´eor`eme de Radon-Nikodym, µj = fj µ, o` u fj ≥ 0 ∈ L1 (µ). Posons E = {fj < 1} ; alors 

 fj dµ +

E∩T −1 (E)

ce qui implique

 fj dµ = µj (E) =

E \T −1 (E)

 fj dµ +

E∩T −1 (E)

fj dµ,

T −1 (E) \E



 fj dµ = E \T −1 (E)

fj dµ.

T −1 (E) \E

Mais tout d’abord     µ E \T −1(E) = µ(E) − µ E ∩ T −1 (E)   = µ T −1 (E)) − µ(E ∩ T −1 (E)   = µ T −1 (E) \E . D’autre part, on a fj < 1 sur E \T −1 (E) tandis que fj ≥ 1 sur T −1 (E) \E ; ces u µ(E) = 0 ou µ(E) = 1 ; mais le fait que deux faits forcent µ(E  T −1 (E)) = 0, d’o` µj ∈ M (X) implique que n´ecessairement µ(E) = 0. On montrerait de la mˆeme fa¸con que µ({fj > 1}) = 0 ; on en d´eduit que fj = 1 µ-p.p. et donc que µj = µ.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

Chapitre 2 LA NOTION D’ENTROPIE

1. Un peu de thermodynamique classique : l’entropie de Clausius La production de la puissance motrice est donc due, dans les machines ` a vapeur, non `a une consommation r´eelle du calorique, mais `a son transport d’un corps chaud `a un corps froid, c’est-`a-dire `a son r´etablissement d’´equilibre, ´equilibre suppos´e rompu par quelque cause que ce soit, par une action chimique, telle que la combustion, ou par toute autre. Nous verrons bientˆot que ce principe est applicable `a toute machine mise en mouvement par la chaleur. Sadi Carnot, R´eflexions sur la puissance motrice du feu et sur les machines propres ` a d´evelopper cette puissance, . La thermodynamique est la science qui ´etudie les propri´et´es de la mati`ere en liaison avec les notions de temp´erature et de chaleur. Cette science est n´ee au si`ecle dernier et ses fondateurs ont pour noms Carnot, Clausius, Kelvin. Ils en ont pos´e les deux principes fondamentaux et bˆati `a partir d’eux une th´eorie tr`es belle et tr`es coh´erente en ne consid´erant que les propri´et´es macroscopique de la mati`ere. J’interromps momentan´ement le r´ecit pour intercaler un commentaire personnel : alors que j’´etais au lyc´ee j’ai toujours pr´ef´er´e les math´ematiques `a la physique. Les raisons en sont banales : j’aimais le cˆot´e bel ´edifice rigoureux et la dimension ludique des math´ematiques par opposition aux aspects exp´erimentaux et industriels de la physique. Cela a chang´e lors de ma Math Sup avec le cours de thermodynamique. L’aspect exp´erimental et industriel ´etait naturellement toujours pr´esent mais j’´etais fascin´e par le formalisme des quantit´es thermodynamiques. Je retrouvais l`a un terrain de jeu math´ematique avec en prime la satisfaction de voir que ces manipulations formelles ont des applications industrielles telles que les machines `a vapeur ou les r´efrig´erateurs ! J’esp`ere, dans ce premier paragraphe, recr´eer un peu de cette ambiance taupinale.

18

CHAPITRE 2. LA NOTION D’ENTROPIE

Ce qui est remarquable dans la thermodynamique classique c’est la quantit´e de r´esultats que l’on peut obtenir `a partir de notions compl`etement empiriques comme la temp´erature ou la quantit´e de chaleur. La th´eorie moderne, qui commence avec Boltzmann et la m´ecanique statistique, ´elucide bien des myst`eres de cette th´eorie mais les m´ecanismes fondamentaux restent les mˆemes. En particulier, il est remarquable que Clausius ait eu l’intuition de la notion d’entropie bien avant sa d´efinition corpusculaire. La thermodynamique classique d´ecrit la mati`ere `a partir de trois variables qui sont le volume V , la pression P et la temp´erature T . Commen¸cons par cette derni`ere : nos sens nous indiquent son existence qualitative. Pour la quantifier, on observe que lorsqu’on met en contact un corps chaud et un corps froid ils ´evoluent vers une situation d’´equilibre, le corps chaud devenant plus froid et inversement. On dit alors qu’ils sont en ´equilibre thermique. Le premier postulat de la thermodynamique, parfois appel´e principe z´ero, est que la relation ˆetre en ´equilibre thermique est transitive. On isole alors un objet dont l’aspect change avec la temp´erature (par exemple du mercure dans une colonne de verre), on l’appelle thermom`etre et on gradue la colonne de verre pour quantifier la notion de temp´erature. La notion de volume ´etant claire, rappelons que la pression est la force exerc´ee par le corps par unit´e de surface sur la paroi du r´ecipient. Si l’on n´eglige l’effet de la gravitation, les lois de l’hydrostatique nous indiquent que cette quantit´e ne d´epend pas de la position de l’unit´e de surface consid´er´ee. Ces trois variables sont reli´ees par une relation du type F (P, V, T ) = 0 appel´ee ´equation d’´etat du syst`eme. Par exemple, on dit qu’un gaz est parfait s’il est tr`es dilu´e. Au niveau microscopique cela se traduit par le fait que les mol´ecules de gaz sont tr`es ´eloign´ees les unes des autres et donc que l’on peut n´egliger leurs interactions. Pour un tel gaz, il est facile d’´etablir l’´equation d’´etat P V = N kT o` u k est la constante de Boltzmann et N le nombre de mol´ecules pr´esentes. Dans cette formule, la quantit´e T est par d´efinition la temp´erature absolue du gaz parfait. Nous verrons plus loin qu’elle est une fonction de la temp´erature d´efinie plus haut. Le premier principe de la thermodynamique n’est autre que le principe universel de conservation de l’´energie. L’´energie interne d’un syst`eme est fonction de deux des trois variables P, V, T . lors d’une transformation li´ee `a une action ext´erieure, des transferts d’´energie s’op`erent. Ces transferts se manifestent soit de mani`ere ordonn´ee (mouvement d’un piston par dilatation) et l’on parle de quantit´e d’´energie transf´er´ee sous forme de travail δW = −P dV, soit de mani`ere d´esordonn´ee sous forme de quantit´e de chaleur δQ. ` PANORAMAS ET SYNTHESES 4

1. UN PEU DE THERMODYNAMIQUE CLASSIQUE : L’ENTROPIE DE CLAUSIUS

19

Le premier principe affirme simplement l’´equivalence travail-chaleur et pose, pour une transformation infinit´esimale, U d´esignant l’´energie interne, dU = δQ + δW = δQ − P dV. Une parenth`ese s’impose ici pour justifier nos notations ; nous ´ecrivons δQ, δW et non dQ, dW car il n’existe pas de fonction thermodynamique Q, W dont ces variations seraient les diff´erentielles. Math´ematiquement ce sont des formes diff´erentielles qui n’ont a priori aucune raison d’ˆetre exactes. Ces consid´erations nous permettent une habile transition vers le second principe : d’apr`es ce que nous venons de dire, la forme diff´erentielle δQ = dU + P dV n’est pas exacte. Le deuxi`eme principe est qu’il existe une fonction θ ne d´ependant que de la temp´erature telle que la forme θδQ soit exacte. On d´efinit alors la temp´erature absolue T par 1 θ= T et l’entropie S du syst`eme `a une constante pr`es par dS =

δQ · T

Nous verrons au paragraphe 3 une d´emonstration du second principe ; en attendant, remarquons qu’il est imm´ediat pour les gaz parfaits, la temp´erature T co¨ıncidant avec celle d´ej`a d´efinie. En effet, dans ce cas, l’´energie interne est une fonction de la temp´erature et p dV = N kT dV /V d’o` u l’on d´eduit que δQ/T est exacte. Voici comment historiquement Clausius a d´efini la premi`ere notion d’entropie. On peut alors ´ecrire l’identit´e thermodynamique dU = T dS − p dV et la d´efinition alternative de la temp´erature 1 ∂S = · ∂U T Pour aller plus loin et comprendre plus profond´ement la notion d’entropie (en particulier le fait que ce soit une quantit´e additive), il nous faut la d´efinition de Boltzmann. Avant de l’´enoncer nous allons faire un saut de cent ans en avant et parler de l’entropie au sens de Shannon en th´eorie de l’information.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

20

CHAPITRE 2. LA NOTION D’ENTROPIE

2. L’entropie en th´eorie de l’information : l’entropie de Shannon My greatest concern was what to call it. I thought of calling it ‘information’. But the word was overly used, so I decided to call it ‘uncertainty’. When I discussed it with John Von Neumann, he had a better idea. He told me : You should call it entropy, for two reasons. In first place your uncertainty has been used in statistical mechanics under that name, so it already has a name. In second place, and more important, no one knows what entropy really is, so in a debate you will always have the advantage. Claude Shannon, cit´e dans [ME]. Peu apr`es la fin de la seconde guerre mondiale un math´ematicien am´ericain, Claude Shannon, cr´eait une nouvelle science appel´ee th´eorie de l’information. Centrale dans cette th´eorie est la notion d’entropie adapt´ee de celle de Boltzmann en m´ecanique statistique. Nous pr´esentons d’abord l’entropie selon Shannon car nous pensons que le concept est plus limpide avec le langage de la th´eorie de l’information. On consid`ere une exp´erience al´eatoire avec un nombre fini de r´esultats possibles, soit (A1 , . . . , An ) qui apparaissent avec des probabilit´es pj pour 1 ≤ j ≤ n. On veut associer `a cette exp´erience une quantit´e cens´ee mesurer l’incertitude associ´ee au r´esultat de cette exp´erience ; naturellement, cette incertitude devra ˆetre tr`es faible pour l’exp´erience   A2 A1 0.99 0.01 et maximum pour l’exp´erience



 A1 A2 . 0.5 0.5

Nous nous proposons dans un premier temps de d´ecrire des axiomes naturels pour cette notion. Nous verrons ensuite que ces axiomes la d´efinissent `a une constante multiplicative pr`es. Tout d’abord, on remarque que cette fonction peut s’´ecrire H(p1 , . . . , pn ) pour une exp´erience avec n r´esultats possibles de probabilit´es respectives pj . Consid´erons tout d’abord le cas ´equiprobable ; posons, pour N entier,   1 1 , ,···, 1 . f (N ) = H N N N Il est naturel d’imposer : (A1 )

la fonction f est croissante.

´ Il y a plus d’incertitude `a choisir une personne au hasard `a New York qu’`a Etampes ! Consid´erons ensuite deux exp´eriences ind´ependantes, la premi`ere avec M r´esultats ´equiprobables, la deuxi`eme avec L r´esultats ´equiprobables ; on peut alors consid´erer l’exp´erience produit qui aboutit `a M L r´esultats ´equiprobables ; il est naturel de ` PANORAMAS ET SYNTHESES 4

´ 2. L’ENTROPIE EN THEORIE DE L’INFORMATION : L’ENTROPIE DE SHANNON

21

poser que la connaissance du r´esultat de la premi`ere exp´erience n’influe en rien sur la connaissance du r´esultat de la deuxi`eme. Autrement dit, l’incertitude restante apr`es avoir ˆot´e l’incertitude concernant la premi`ere exp´erience, soit f (M ), n’est autre que f (L), ou encore (A2 )

f (M L) = f (M ) + f (L).

Soit maintenant une exp´erience aboutissant `a n r´esultats possibles ; on partitionne ces r´esultats en deux sous-ensembles A et B de probabilit´es respectives pA = p1 + · · · + pr ,

pB = pr+1 + · · · + pn .

On veut relier l’incertitude de l’exp´erience de d´epart `a celle qui consiste simplement `a r´ev´eler si le r´esultat est dans A ou dans B. Si l’on sait que l’on est dans A, l’incertitude r´emanente est H(p1 /pA , . . . , pr /pA ) tandis que si l’on est dans B, l’incertitude r´emanente est H(pr+1 /pB , . . . , pn /pB ) : on postule alors que l’incertitude r´emanente sachant si l’on est dans A ou B doit ˆetre la moyenne de ces deux incertitudes conditionnelles, soit p p pr  pn  1 , r+1 , + pB H . ···, ···, (A3 ) H(p1 , . . . , pn ) = H(pA , pB ) + pA H pA pA pB pB Enfin, nous imposons une condition technique : (A4 )

p −→ H(p, 1 − p) est continue sur (0, 1).

Nous avons alors le th´eor`eme : Th´eor`eme 1. — Les seules fonctions v´erifiant (Ai ) pour 1 ≤ i ≤ 4 sont les fonctions de la forme H(p1 , . . . , pn ) = −C

n 

pi log pi ,

i=1

o` u C est un r´eel > 0. Preuve. — On montre tout d’abord que f (M ) = C log M ; pour ce faire on observe facilement par r´ecurrence `a partir de (A2 ) que la fonction f v´erifie f (M k ) = kf (M ). Soit maintenant r un entier positif ; le nombre 2r appartient `a un unique intervalle [M k , M k+1 [ (le nombre M est fix´e) et donc, par (A1 ), (A2 ), kf (M ) ≤ rf (2) < (k + 1)f (M ), d’o` u l’on d´eduit, vu qu’une in´egalit´e similaire est vraie avec f = log,  f (2) log(2)  1  − < ·  f (M ) log(M ) r Le nombre r ´etant arbitraire, on en d´eduit que f (M ) = (f (2)/ log(2)) log M. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

22

CHAPITRE 2. LA NOTION D’ENTROPIE

Montrons `a pr´esent que H(p, 1 − p) = −Cp log p − C(1 − p) log(1 − p) o` u la constante C vaut une fois pour toutes C=

f (2) · log(2)

Grˆace `a (A4 ), il suffit de le faire pour p = r/s rationnel. Consid´erons pour cela une exp´erience al´eatoire avec s r´esultats ´equiprobables ; on partitionne cet ensemble de r´esultats en deux sous-ensembles de r et (s − r) ´el´ements respectivement et l’axiome (A3 ) nous apprend que r s − r  r s−r f (s) = H , + f (r) + f (s − r). s s s s La fonction f ´etant connue, on en d´eduit, pour p = r/s :   H(p, 1 − p) = C log s − p log r − (1 − p) log(s − r)   = −C p log p + (1 − p) log(1 − p) . Pour conclure, on fait une r´ecurrence sur N , le nombre de r´esultats possibles de l’exp´erience ; la propri´et´e est vraie pour N ≤ 2 par ce qui vient d’ˆetre vu ; supposonsla vraie pour N ≤ M − 1. Soit une exp´erience comportant M r´esultats possibles de probabilit´es pj pour 1 ≤ j ≤ M ; on partitionne cet ensemble en deux sous-ensembles, le premier contenant uniquement le premier r´esultat possible, de probabilit´e p1 , le deuxi`eme contenant le reste, de probabilit´e (1 − p1 ). Par l’axiome (A3 ), on a   p 2 , · · · , pM H(p1 , . . . , pM ) = H(p1 , 1 − p1 ) + p1 H(1) + (1 − p1 )H 1 − p1 1 − p1 et le r´esultat se d´eduit ais´ement de l’hypoth`ese de r´ecurrence. ` partir de maintenant nous appellerons entropie la quantit´e H jusque l`a nomm´ee A incertitude et qui correspond au cas C = 1 dans le th´eor`eme 1. a) Une premi`ere application : une version faible du th´eor`eme de Shannon-McMillan Consid´erons une exp´erience donnant lieu `a N r´esultats possibles et appelons H l’entropie de cette exp´erience. Effectuons cette exp´erience n fois de fa¸con ind´ependante. Il y a donc N n r´esultats possibles, le r´esultat x1 · · · xn ayant la probabilit´e px1 · · · pxn . Th´eor`eme 2. — Pour tout -, pour tout η > 0, il existe m ∈ N tel que pour tout n > m, l’ensemble des r´esultats peut ˆetre partitionn´e en deux parties A et B telles que : 1) pour tout x1 · · · xn ∈ A, on a :  − log(P (x · · · x ))    1 n − H  < η,  n 2) P (B) < -. ` PANORAMAS ET SYNTHESES 4

´ 2. L’ENTROPIE EN THEORIE DE L’INFORMATION : L’ENTROPIE DE SHANNON

23

Preuve. — Pour k ≥ 0, appelons Xk la variable al´eatoire valant − log(pxk ) si xk est le r´esultat de la k-i`eme exp´erience. Les Xk sont des variables ind´ependantes ´equidistribu´ees telles que E(Xk ) = H. De plus, on a l’´egalit´e − log(P (x1 · · · xn )) X1 + · · · + Xn = ; n n le th´eor`eme 2 n’est alors rien d’autre que la loi faible des grands nombres appliqu´ee `a la suite (Xk ). Nous allons maintenant plus ou moins paraphraser ce dernier th´eor`eme en une version qui nous sera utile au paragraphe suivant (cette pr´esentation des choses est directement inspir´ee de [Kh2]) ; on consid`ere l’ensemble de toutes les N n suites possibles et on les ordonne par ordre d´ecroissant de probabilit´e. On se fixe ensuite un r´eel λ ∈ ]0, 1[ et on appelle Nn (λ) le plus petit entier k tel que la somme des probabilit´es des k premiers ´el´ements de la liste d´epasse λ. Th´eor`eme 3. — lim

n→∞

1 log(Nn (λ)) = H. n

Preuve. — Disons d’une suite x1 · · · xn qu’elle est standard si sa probabilit´e v´erifie l’in´egalit´e 1) du th´eor`eme pr´ec´edent ou, ce qui est ´equivalent, si e−n(H+η) < P (x1 · · · xn ) < e−n(H−η) . Par le th´eor`eme 2, la somme des probabilit´es des suites standard est > λ si n est assez grand ; si n est ainsi choisi, parmi les suites s´electionn´ees il ne peut y avoir que 1) des suites standard ; 2) des suites non-standard de probabilit´e ≥ e−n(H−η) . Mais la somme des probabilit´es des ´el´ements de 2) est plus petite que -, ce qui implique que la somme des probabilit´es de 1) est ≥ λ − -. De cette ´etude, il vient que les probabilit´es des ´el´ements s´electionn´es sont toutes ≥ e−n(H+η) et par cons´equent que la somme est sup´erieure `a Nn (λ) e−n(H+η) . Par ailleurs elle est certainement moindre que λ + q o` u q est la probabilit´e du dernier s´electionn´e et n´ecessairement q ≤ e−n(H−η) car l’on sait que des suites standard ont ´et´e s´electionn´ees. Finalement, Nn (λ) e−n(H+η) ≤ λ + e−n(H−η) =⇒ lim sup n→∞

log(Nn (λ) ≤ H. n

D’autre part, les Mn (λ) suites standard s´electionn´ees ont une probabilit´e ≤ e−n(H−η) alors que la somme de leurs probabilit´es est ≥ λ − - ; on a donc : Nn (λ) e−n(H−η) ≥ Mn (λ) e−n(H−η) ≥ λ − - =⇒ lim inf n→∞

log(Nn (λ)) ≥ H. n

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

24

CHAPITRE 2. LA NOTION D’ENTROPIE

Des deux th´eor`emes pr´ec´edents, on d´eduit que dans la r´ep´etition un grand nombre n de fois de l’exp´erience al´eatoire tout se passe comme si les r´esultats les plus probables ´etaient au nombre de enH et avaient chacun une probabilit´e e−nH . Ceci est d’ailleurs rigoureusement exact dans le cas de l’´equiprobabilit´e. Cette remarque prendra tout son sens dans la d´efinition de l’entropie selon Boltzmann. b) Application a` la compression de textes Consid´erons un texte, c’est-`a-dire une suite de symboles appartenant `a un alphabet fini de m lettres ; on le regarde comme une suite infinie (en fait finie mais tr`es grande) de valeurs de variables al´eatoires ind´ependantes et ´equidistribu´ees `a valeurs dans l’alphabet en question. Soit H l’entropie correspondant `a une de ces variables al´eatoires. On veut coder ce texte de fa¸con `a le compresser au maximum ; pour ce faire on le d´ecoupe en s´equences de lettres et l’on remplacera autant que possible les s´equences qui apparaissent fr´equemment par des s´equences plus courtes ; la question que l’on se pose ici est de d´eterminer jusqu’`a quel point on peut faire cela. De fa¸con plus pr´ecise, on d´efinit un taux de compression de la fa¸con suivante ; si C est une s´equence de s lettres, sa probabilit´e est P (C) et cette s´equence est remplac´ee par une s´equence de σ(C) lettres. La compression moyenne suivant ce proc´ed´e est µ=

1 P (C)σ(C) s

et l’on d´efinit µs comme le minimum des µ sur tous les algorithmes de compression possibles sur s lettres. Le taux de compression optimal est par d´efinition la limite sup´erieure des quantit´es µs pr´ec´edentes lorsque s tend vers l’infini. Th´eor`eme 4. — Le taux de compression optimal est ´egal `a H/ log m. Preuve. — Soit un code quelconque et H < H ; nous dirons d’une s´equence de s termes  qu’elle est sp´eciale si σ(C) < H s/ log m. Le nombre de s´equences sp´eciales est ≤ esH de fa¸con ´evidente. Soit λs la probabilit´e de l’ensemble des s´equences sp´eciales. Lemme. — On a λs → 0 lorsque s → ∞. Preuve. — Par le th´eor`eme 3, pour d´epasser un - > 0, il faut au moins Ns (-) ≥ es(H−η) ≥ es(H



+η) 

si η est choisi assez petit, mais ce nombre est bien plus grand que esH si s est assez grand, ce qui prouve le lemme. On conclut facilement : pour toute s´equence non sp´eciale, on a σ(C) ≥ H s/ log m u le r´esultat. et par cons´equent µs ≥ (1 − λs )H / log m, d’o` Pour terminer la d´emonstration, il ne reste plus qu’`a construire un code de taux < (H + η)/ log m pour tout η > 0. Soit - > 0 arbitraire. Par le th´eor`eme 3, ` PANORAMAS ET SYNTHESES 4

3. L’ENTROPIE DE BOLTZMANN

25

Ns (1 − -) ≤ es(H+δ) pour s grand, δ ´etant petit. Comme es(H+δ) est ´egalement le nombre de s´equences de longueur s(H + δ)/ log m, on peut coder toutes ces s´equences par des s´equences de cette longueur. Quant aux autres s´equences, on les laisse fixes. Le taux obtenu ne d´epasse pas H +η H +δ +-< log m log m si - et δ sont choisis suffisamment petits.

3. L’entropie de Boltzmann Dans l’univers, il n’y a pas de distinction entre les deux directions du temps, de mˆeme que dans l’espace, il n’y a pas de haut ni de bas. Cependant, de mˆeme qu’`a un certain endroit de la surface terrestre nous pouvons appeler bas la direction du centre de la terre, ainsi un organisme vivant [. . .] peut d´efinir la direction du temps comme allant de l’´etat le moins probable `a l’´etat le plus probable (le premier ´etant le pass´e et le dernier le futur) ; selon cette d´efinition, il se rendra compte que sa propre petite r´egion , isol´ee du reste de l’univers, est initialement toujours dans un ´etat improbable. Il me semble que cette fa¸con de concevoir les choses est la seule qui nous permette de reconna¨ıtre la validit´e de la seconde loi de la thermodynamique ainsi que la mort thermique de chaque monde individuel, sans invoquer un changement unidirectionnel de l’univers, ` a partir d’un ´etat initial d´efini, vers un ´etat final. Ludwig Boltzmann, Vorlesungen ¨ uber Gastheorie, Leipzig, J.A. Barth, 1898, cit´e dans K. Popper, La quˆete inachev´ee, traduction de R. Bouveresse, Calman-L´evy 1981. Nous commen¸cons ce paragraphe par un petit calcul. Consid´erons un ensemble fini u N est un entier. Soit (pi ) une loi de probabilit´e sur A ; A = {1, . . . , k} et Ω = AN o` cette loi induit une loi produit sur Ω ; si ω est dans Ω, on appelle Ni (ω) le nombre d’occurrences de i dans ω. Si n1 + · · · + nk = N et 1 ≤ i ≤ k, la probabilit´e que Ni = ni est ´egale `a : N! pn1 · · · pnk k . n 1 ! . . . nk ! 1 Une utilisation de la formule de Stirling nous montre que le logarithme de cette quantit´e est approximativement ´egale `a N

k 

qi (log pi − log qi )

i=1

o` u l’on a pos´e qi = ni /N (ce qui fait que qi = 1 ). Un rapide calcul montre que cette quantit´e est maximale pour qi = pi (ce qui est bien intuitif !), auquel cas elle vaut 0. En fait la probabilit´e n’est pas ´egale `a 1, car nous avons utilis´e Stirling, mais elle est pr`es de 1. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

26

CHAPITRE 2. LA NOTION D’ENTROPIE

Nous dirons que ω est `a l’´equilibre si Ni (ω) = N pi pour 1 ≤ i ≤ k. Nous venons de montrer que l’´etat d’´equilibre est le plus probable avec une probabilit´e tr`es proche de 1 ; de plus le logarithme du nombre d’´etats d’´equilibre est approximativement   −P (ω) log P (ω), N (−pi log pi ) = Ω

ce qui est exactement la d´efinition de l’entropie du paragraphe pr´ec´edent. D’o` u l’id´ee de poser S = C log Card{´etats d’´equilibre}. Mais examinons maintenant une situation thermodynamique. Commen¸cons par un mod`ele tr`es simplifi´e : soit un r´ecipient contenant un grand nombre de mol´ecules de gaz pouvant chacune occuper un des niveaux d’´energie u1 , . . . , uk . Pour i = 1, . . . , k, soit Ni le nombre de mol´ecules de niveau ui . Le probl`eme que l’on veut r´esoudre est de d´eterminer les proportions de mol´ecules de diff´erents niveaux d’´energie `a l’´equilibre. Le syst` eme ´etant suppos´e isol´e, il ne peut ´echanger d’´energie : son ´energie interne est donc Ni ui ≡ U . D’apr`es ce que l’on vient de voir, si (pi ) d´esigne la distribution `a l’´equilibre, les N mol´ecules vont choisir un des eS/c ´etats microscopiques d’´equilibre. La question est alors : quelle est la distribution (pi ) ? Le postulat de base de la m´ecanique statistique est que cette distribution est celle qui maximise le nombre d’´etats microscopiques d’´equilibre ou encore qui maximise l’entropie. Math´ematiquement, il nous faut donc maximiser la quantit´e k  − pi log pi i=1

sous les contraintes pi ≥ 0,

k 

pi = 1,

i=1

k 

pi u i = U =

i=1

Ce probl`eme est compl`etement standard et sa solution est pi =

e−βui , k e−βui i=1

o` u β est solution de l’´equation k

ui e−βui

i=1 k i=1 ` PANORAMAS ET SYNTHESES 4

= U. e−βui

U · N

3. L’ENTROPIE DE BOLTZMANN

27

Posons (c’est la fonction de partition de Gibbs) : Φ(β) =

k 

e−βui .

i=1

L’´equation pr´ec´edente se r´eduit alors `a l’´equation ϕ(β) = U

avec ϕ = −

∂ (log Φ). ∂β

Le calcul de la d´eriv´ee de ϕ et l’in´egalit´e de Cauchy-Schwarz montrent que ϕ est strictement d´ecroissante de max(ui ) `a min(ui ) lorsque β croˆıt de −∞ `a +∞. L’´equation pr´ec´edente admet donc une solution unique. Calculons alors l’entropie du syst`eme pour cette distribution : k    S = −cN pi log pi = cN log(Φ(β)) + βU . i=1

Ce raisonnement va nous permettre dans ce cas particulier d’asseoir sur des bases saines l’´edifice thermodynamique. Montrons par exemple dans un premier temps que la notion d’entropie ainsi d´efinie co¨ıncide avec celle d´efinie au premier paragraphe : cela donnera au passage une d´emonstration du second principe. De l’´egalit´e N qi ui = U , on d´eduit : dU = N



ui dqi + N



qi dui .

Dans cette derni`ere somme, la quantit´e δQ correspond au premier des deux termes (les niveaux d’´energie ne changent pas) et on a −P dV = N



qi dui .

Mais par ailleurs, la r´esolution du probl`eme d’optimisation avec contraintes donnant S nous indique que l’on a : dS = cN

k 

(α + βui ) dqi = cN β



ui dqi = cβδQ.

i=1

Ainsi donc βδQ est une forme exacte. On d´efinit alors la temp´erature absolue par β −1 = kT o` u k est la constante de Boltzmann. On choisit ´egalement c = k dans la d´efinition de l’entropie, ce qui nous permet de retrouver la relation dS = δQ/T . Cette d´efinition de l’entropie rend transparent le fait que dans un m´elange de deux gaz `a l’´equilibre, l’entropie du m´elange est ´egal `a la somme des entropies de chaque composante. Montrons comment cela implique le principe 0. Pour i = 1, 2, ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

28

CHAPITRE 2. LA NOTION D’ENTROPIE

soient Ui et Si les ´energies et entropies des deux sous-syst`emes. Tout d’abord, on a U1 + U2 = U et S1 + S2 = S, quantit´es bien d´etermin´ees, le volume ´etant prescrit. On peut consid´erer Sj comme une fonction de Uj et `a l’´equilibre l’entropie est maximale d’o` u: ∂S1 ∂S2 − = 0. ∂U1 ∂U2 La preuve est termin´ee car ∂Sj /∂Uj = 1/Tj . La distribution (pj ) trouv´ee plus haut s’appelle l’ensemble canonique de Gibbs. Le cas particulier ´etudi´e est celui d’un gaz parfait dont les mol´ecules sont sans interaction, l’´energie provenant uniquement de forces ext´erieures. Les calculs sont ´evidemment consid´erablement plus simples dans ce cas, mais l’id´ee de la d´emonstration de l’existence des ´etats de Gibbs dans le cas g´en´eral est la mˆeme. Voyons `a pr´esent, dans le cadre de cette th´eorie thermodynamique miniature, le r´esultat essentiel de tout ce travail. Ce r´esultat implique la notion d’´energie libre : l’´energie libre de Helmholtz est la quantit´e thermodynamique F = U − T S. Par l’identit´e thermodynamique, on a dF = −P dV − S dT, ce qui explique pourquoi cette quantit´e est encore appel´ee ´energie utilisable, car sa diminution dans une transformation r´eversible isotherme correspond au travail fourni P dV = −δW . Remarquons que dans le cas qui nous occupe, cette ´energie libre vaut : −N

log Φ(β) · β

Montrons alors que l’´etat de Gibbs d´efini plus haut minimise, `a temp´erature fix´ee, l’´energie libre. Cela revient `a prouver que la quantit´e k 

1 pj log pj β j=1 k

pj u j +

j=1

atteint son minimum pour l’´etat de Gibbs pj =

e−βuj k

,

e−βuj

j=1

ce qui est laiss´e au lecteur. Nous pouvons r´esumer ce que nous venons de montrer en disant que, `a ´energie fix´ee, la nature maximise l’entropie, tandis qu’`a temp´erature fix´ee elle minimise l’´energie libre de Helmholtz. Cette derni`ere remarque sera le principe essentiel de tout ce travail. ` PANORAMAS ET SYNTHESES 4

Chapitre 3 ´ L’ENTROPIE EN THEORIE ERGODIQUE

1. Le cadre physique : la thermodynamique des r´eseaux Dans ce chapitre nous mettons en place de fa¸con rigoureuse les notions math´ematiques qui nous accompagneront jusqu’`a la fin de ce travail. Ces notions ont pour origine la thermodynamique. Comme nous en avons pris l’habitude, nous commen¸cons par une description de ce cadre physique originel. La pr´esentation est adapt´ee de [Ru3]. Ce cadre diff`ere de ceux que nous avons vus jusqu’`a pr´esent : ce n’est pas le temps qui va servir de groupe agissant ici mais l’espace. Nous consid´erons l’espace L = Zd comme mod´elisant notre corps physique (ici on peut penser `a une structure cristalline plutˆot qu’`a un fluide), chaque ´el´ement de L pouvant ˆetre dans un ´etat appartenant `a un ensemble fini A. L’exemple le plus simple est le cas o` u A = {0, 1}, 0 ou 1 ´etant attach´e `a un ´el´ement du r´eseau suivant que celui-ci est occup´e ou non. L’ensemble Ω = AL est l’ensemble des configurations du syst`eme. Si S ⊂ L , on notera ΩS = AS . Une interaction est une fonction Φ d´efinie sur

ΩΛ Λ⊂L fini

telle que pour tout x ∈ L, la contribution de x `a l’interaction, d´efinie par |Φ|x =

 1   sup Φ(ξ) |X| ξ∈ΩX

(o` u |X| = Card X)

x∈X

soit finie pour tout x. Nous ferons toujours l’hypoth`ese que Φ est invariante par translations. Dans ce cas, la quantit´e pr´ec´edente est ind´ependante de x est peut servir de norme sur l’ensemble des interactions. Cette hypoth`ese revient `a privil´egier l’action de L en tant que groupe sur lui-mˆeme par translations et c’est par le biais de cette action que la th´eorie ergodique entrera ici en jeu.

30

´ CHAPITRE 3. L’ENTROPIE EN THEORIE ERGODIQUE

Une interaction est dite finie s’il existe un ensemble fini ∆ ⊂ L tel que pour tout ξ ∈ Ω, Φ(ξ

X)

=0

sauf si X − x est contenu dans ∆ pour tout x ∈ X. (La notation ξ X d´esigne la restriction de ξ `a X.) Par exemple, si d = 1 et ∆ = {−1, 0, 1}, Φ(ξ X ) n’est ´eventuellement non nul que si X est compos´e de deux entiers cons´ecutifs. On v´erifie que le sous-espace des interactions finies est dense dans l’espace de Banach de toutes les interactions. Une interaction ´etant fix´ee, on d´efinit alors une fonction ´energie comme suit. Pour tout sous-ensemble fini Λ ⊂ L, on pose :    UΛΦ (ξ) = Φ ξX . X⊂Λ

On peut alors imiter ce que l’on a d´evelopp´e au paragraphe 3 du chapitre 2 et d´efinir pour l’ensemble fini Λ la fonction de partition ZΛΦ =



  exp −UΛΦ (ξ)

ξ∈ΩΛ

et l’ensemble de Gibbs comme la probabilit´e d´efinie sur ΩΛ par   1 −UΛΦ (ξ) e . PΛ {ξ} = ZΛ Tout l’art de la m´ecanique statistique consiste alors `a passer `a la limite lorsque Λ tend vers L et d’obtenir une limite thermodynamique qui est ce que l’on appelle un ´etat de Gibbs, le terme d’´etat d´esignant d’une fa¸con g´en´erale une mesure sur Ω. Nous ne d´eveloppons pas cet aspect des choses dans le cadre physique ; en revanche nous verrons au paragraphe suivant son analogue math´ematique. Nous verrons ´egalement dans ce cadre que cet ´etat minimise une quantit´e appel´ee pression et qui est l’analogue de l’´energie libre du paragraphe 3 du chapitre 2. Mais cette quantit´e sera d´efinie d’une mani`ere pour nous nouvelle, l’action de groupe (en fait le d´ecalage dans ce cas) jouant un grand rˆole. Le reste de ce paragraphe constitue une motivation physique de cette d´efinition. On a vu au chapitre pr´ec´edent que l’ensemble de Gibbs, la temp´erature ´etant fix´ee, rendait maximum la quantit´e log Z qui n’´etait rien d’autre que (−β/N ) fois l’´energie libre ; nous voulons ici donner un sens `a une limite thermodynamique des quantit´es log ZΛ et nous verrons dans un prochain chapitre que l’´etat de Gibbs convenablement d´efini est un ´etat d’´equilibre dans le sens qu’il maximise cette quantit´e. On commence par d´efinir AΦ (ξ) = −

 1  Φ ξ |X|

X0 ` PANORAMAS ET SYNTHESES 4

X

 ,

´ 1. LE CADRE PHYSIQUE : LA THERMODYNAMIQUE DES RESEAUX

31

quantit´e qui a un sens par la d´efinition d’une interaction et AΦ ∞ ≤ |Φ|. On d´efinit alors la fonction de partition modifi´ee    ZΛ∗ (AΦ ) = exp AΦ (τ x ξ ∗ ) ξ∈ΩΛ

x∈Λ

o` u pour tout ξ ∈ ΩΛ , ξ ∗ d´esigne un choix de ξ ∈ Ω tel que ξ τ x (ξ)(y) = ξ(y + x). On pose ´egalement

Λ

= ξ ∗ et o` u

Λ(n) = {0, . . . , n}ν . Nous allons montrer dans le prochain paragraphe (dans un cas particulier) que lorsque n tend vers +∞, 1 ∗ log ZΛ(n) (AΦ ) |Λ(n)| converge vers une quantit´e appel´ee pression de AΦ et not´ee P (AΦ ). Ce que nous voulons montrer ici en guise de motivation est qu’il en est de mˆeme de 1 log ZΛΦ , |Λ(n)| la limite ´etant la mˆeme. Pour le voir, on consid`ere tout d’abord une interaction finie Φ et on ´ecrit UΛΦ (ξ ∗ Λ) +



AΦ (τ x ξ ∗ ) =

x∈Λ

=

 

 Φ(τ x ξ ∗ Φ(ξ ∗ |X) − |X| |X| x∈Λ Λ⊃Xx X0  Φ(ξ ∗ |X)   x∈Λ

Xx, X∩c Λ=∅

X)



|X|

(on a ici utilis´e l’invariance de ϕ par translations), quantit´e dont on majore la valeur absolue par N (Λ)|Φ|, o` u N (Λ) d´esigne le nombre d’´el´ements y ∈ Λ tels que y + ∆ n’est pas inclus dans Λ. On conclut alors facilement en remarquant que N (Λn )/|Λn | tend vers 0 lorsque n → ∞. Le cas g´en´eral (Φ non n´ecessairement finie) s’obtient par un argument d’´equicontinuit´e que nous ne d´eveloppons pas. On peut se demander pourquoi la quantit´e P (AΦ ) s’appelle pression ; la r´eponse est encore donn´ee par le calcul du paragraphe 3 du chapitre 2. On y a vu que l’´energie libre ´etait donn´ee par −N log Z/β ; dans le calcul qui pr´ec`ede, la temp´erature n’entrait pas en jeu et on a pos´e β = 1. La diff´erence entre la situation qui pr´ec`ede et celle du § 3, chap. 2 est qu’ici le syst`eme est de volume infini et P (AΦ ) a donc la dimension d’une ´energie par unit´e de volume, c’est-`a-dire d’une pression. Nous passons maintenant au traitement proprement math´ematique du sujet dans un cas extrˆemement particulier : ν = 1. De plus Z va ˆetre remplac´e par N, ce qui modifie pas profond´ement les concepts (en fait les choses sont mˆeme plus simples dans ce cas). ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

32

´ CHAPITRE 3. L’ENTROPIE EN THEORIE ERGODIQUE

2. Entropie d’une mesure invariante Dans ce qui suit, nous nous pla¸cons syst´ematiquement dans le cadre de la dynamique symbolique, ce qui simplifie les d´emonstrations et sera suffisant pour les applications que nous avons en vue. Pour un expos´e plus g´en´eral on consultera avec profit [W]. a) Dans ce paragraphe on consid`ere un alphabet A = {1, . . . , m} et le syst`eme dynamique X = AN , T = le d´ecalage sur X. Tout ce qui va ˆetre dit reste valable dans le cas d’un sous-d´ecalage de type fini (d´efinition `a la fin du chapitre). L’espace mesurable (X, B) est muni d’une filtration naturelle (Bn ) o` u Bn est la tribu engendr´ee par l’ensemble An des cylindres x1 · · · xn . Soit maintenant µ une mesure de probabilit´e invariante par T sur X ; pour tout n on peut d´efinir l’entropie de l’exp´erience al´eatoire consistant `a choisir un cylindre dans An avec la probabilit´e µ ; c’est la quantit´e :    Hµ (An ) = − µ(A) log µ(A) . A∈An

Proposition 1. — On a Hµ (An+p ) ≤ Hµ (An ) + Hµ (Ap ) pour tous n, p ∈ N. Preuve. — Posons un = Hµ (An ) ; observons tout d’abord que du fait que µ est une mesure d’une part, et du fait que cette mesure est invariante par le d´ecalage ; d’autre part, pour tout cylindre A et tout p ≥ 0,   µ(AB) = µ(BA). µ(A) = B∈Ap

On ´ecrit alors un+p =

B∈Ap



  −µ(AB) log µ(AB)

A∈An B∈Ap

et on observe que les ´egalit´es  µ(AB) = 1, µ(A) B

 µ(AB) µ(B) 1 = µ(A) µ(AB) µ(A) B

ajout´ees `a la convexit´e de la fonction − log impliquent l’in´egalit´e  µ(AB)   µ(B) log log µ(A) ≤ − µ(A) µ(AB) B∈Ap

d’o` u l’on d´eduit :         µ(AB) log µ(B) + µ(AB) log µ(AB) . µ(A) log µ(A) ≤ − B

B

On somme ensuite sur A ∈ An et on utilise l’invariance par T . ` PANORAMAS ET SYNTHESES 4

2. ENTROPIE D’UNE MESURE INVARIANTE

33

Proposition 2. — Soit (un ) une suite de r´eels ≥ 0 tels que un+p ≤ un + up . Alors la suite un /n est convergente. Preuve. — Nous allons montrer plus pr´ecis´ement que cette suite converge vers B = inf{un /n ; n ≥ 0}. Soit donc - > 0 ; par d´efinition de la borne inf´erieure, il existe un entier n0 tel que l’on ait B ≤ un0 /n0 ≤ B + -. Pour n ≥ n0 , on effectue la division euclidienne n = pn0 + r et l’hypoth`ese sur la suite (un ) implique un ≤ pun0 + ur et donc un pun0 + ur un max(u0 , u1 , . . . , un0 −1 ) ≤ ≤ 0 + ≤ B + 2n pn0 n0 pn0 si n (et donc p) est assez grand. Les deux propositions pr´ec´edentes nous permettent de d´efinir l’entropie du d´ecalage par rapport `a la mesure µ par hµ (T ) = lim

n→∞

Hµ (An ) · n

Proposition 3. — L’application µ → hµ (T ) est affine sur le compact convexe M (X, T ) des mesures de probabilit´e sur X qui sont T -invariantes. Remarque. — L’´etude pr´ec´edente implique que l’application µ → hµ (T ) est s.c.s. Preuve. — Soient µ , µ ∈ M (T ), α ∈ [0, 1] et µ = αµ + (1 − α)µ . Si A ⊂ X est un bor´elien, la convexit´e de la fonction x log x implique que 0 ≤ −µ(A) log µ(A) + αµ (A) log µ (A) + (1 − α)µ (A) log µ (A)   = −αµ (A) log(µ(A)) − log(αµ (A))   − (1 − α)µ (A) log(µ(A)) − log((1 − α)µ (A)) − µ (A)α log α − µ (A)(1 − α) log(1 − α) ≤ −µ (A)α log α − µ (A)(1 − α) log(1 − α) et par cons´equent, pour tout n ≥ 0, 0 ≤ Hµ (An ) − αHµ (An ) − (1 − α)Hµ (An ) ≤

2 · e

On conclut en divisant par n et en passant `a l’infini. b) Comme au premier chapitre, nous voulons motiver l’introduction de cette notion en montrant qu’elle apparaˆıt naturellement dans certaines consid´erations. La meilleure motivation sera le th´eor`eme de Shannon-McMillan ; avant de le d´emontrer, nous ´etablissons une formule permettant le calcul de l’entropie. Soient x ∈ X et x = x1 x2 · · · xn · · ·. Pour n ∈ N, on pose :  µ(x2 · · · xn )/µ(x1 · · · xn ) si le d´enominateur n’est pas nul, Jn (x) = +∞ s’il est nul. Remarquons que l’invariance de µ fait que Jn est une fonction ≥ 1. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

´ CHAPITRE 3. L’ENTROPIE EN THEORIE ERGODIQUE

34

Proposition 4. — La suite (Jn ) est une martingale L1 (µ) par rapport `a la filtration (Bn ). Preuve. — Soit x1 · · · xn ∈ An ; on peut supposer µ(x1 · · · xn ) > 0. Sur ce cylindre, on a : E(Jn+1

Bn )

=

 1 µ(x2 · · · xn xn+1 ) = Jn . µ(x1 · · · xn xn+1 ) µ(x1 · · · xn ) x µ(x1 · · · xn xn+1 ) n+1

De plus, E(Jn ) =



µ(x2 · · · xn ) ≤ m.

x1 ···xn ∈An

Corollaire. — La fonction Jµ (x) = lim Jn (x) existe presque partout ; cette fonction n→∞ s’appelle le Jacobien de T par rapport `a la mesure µ. Soit maintenant M (x) = sup{log Jn (x) ; n ≥ 0}. Proposition 5. — M appartient `a L1 (X, µ). Preuve. — Pour λ > 0, on pose Eλ = {M > λ} ; cet ensemble peut encore s’´ecrire   µ(x1 · · · xn ) < e−λ . Eλ = x ∈ X ; inf n µ(x2 · · · xn ) −λ Soient (Cn ) les cylindres maximaux tels que µ(C µ(T (Cn )) ; par la maxin) < e malit´e, les Cn sont deux `a deux disjoints et Eλ = Cn . Donc   µ(Eλ ) = µ(T (Cn )) ≤ m e−λ , µ(Cn ) < e−λ

et l’on peut conclure car



M dµ =

∞ 0

µ(Eλ ) dλ ≤ m.

Nous sommes maintenant en mesure de d´emontrer la formule suivante, dite formule de Rohlin.  Th´eor`eme. — On a hµ (T ) = X log Jµ dµ. Preuve. — Par les trois r´esultats pr´ec´edents et le th´eor`eme de convergence domin´ee,   log Jµ dµ = lim log Jn dµ. X

Mais  log(Jn ) dµ = X

 A∈An

n→∞

X

     µ(A) log µ T (A) − µ(A) log µ(A) = un − un−1 . A∈An

On sait que cette suite converge vers, disons, L ; ses sommes de C´esaro convergent alors vers la mˆeme limite ; mais la somme de C´esaro d’ordre n vaut un /n − u0 /n et cette derni`ere suite converge vers hµ (T ). ` PANORAMAS ET SYNTHESES 4

2. ENTROPIE D’UNE MESURE INVARIANTE

35

Exemple. — Calculons en utilisant cette formule l’entropie d’un d´ecalage de Markov. On calcule tout d’abord le Jacobien du d´ecalage dans ce cas. On rappelle qu’un d´ecalage de Markov est d´etermin´e par une matrice de transition stochastique Π et un vecteur propre (`a gauche) p pour la valeur propre 1. Si x = x1 · · · xn ..., on a px 2 µ(x2 · · · xn ) = = Jµ (x). µ(x1 · · · xn ) px 1 px 1 x 2

Jn (x) =

Le Jacobien ne d´epend donc que des deux premi`eres variables et par cons´equent  hµ (T ) = X

=



log Jµ dµ = 

pi pij (log(pj ) − log(pi ) − log(pij ))

i,j∈A

pj log(pj ) −

j



pi log(pi ) −

i



pi pij log(pij ) = −

i,j



pi pij log(pij ).

i,j

Remarquons enfin que dans le cas d’un d´ecalage de Bernoulli, cette formule se r´eduit `a Hµ (A1 ) = −



pi log(pi ).

Th´eor`eme (Shannon-McMillan). — Si (X, T, µ) est ergodique, alors −

  1 log µ(x1 · · · xn ) −−−−−→ hµ (T ). µ -p.p. n

Preuve. — Nous avons −

n n   1   1 1   log(µ(x1 · · · xn ) = log Jk − log Jµ )(T n−k (x) . log Jµ (T k (x) + n n n k=1

k=1

La premi`ere partie se traite par le th´eor`eme ergodique ; sa limite est hµ (T ). Pour traiter la deuxi`eme partie, on pose, pour N > 0,



log(Jµ ) dµ =

  FN = sup | log Jk − log Jµ | ; k ≥ N . Alors n N n 1  1  1  | log Jk − log Jµ | ◦ T n−k ≤ F0 ◦ T n−k + FN ◦ T n−k . n n n k=1

k=1

N

 Par le th´eor`eme de convergence domin´ee, FN dµ tend vers 0 lorsque N → ∞ ; on fixe tout d’abord N tel que cette int´egrale soit ≤ -. On fait ensuite tendre n vers ∞ ; le premier terme tend alors  vers 0 p.p. par le th´eor`eme ergodique de Birkhoff ; quant au deuxi`eme, il tend vers FN dµ ≤ - par le mˆeme th´eor`eme ergodique. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

´ CHAPITRE 3. L’ENTROPIE EN THEORIE ERGODIQUE

36

3. Entropie et pression topologique Les r´esultats de ce paragraphe sont essentiellement dus `a Walters [W]. Soit ϕ une fonction continue sur X. Pour n ≥ 0, on pose Sn ϕ =

n−1 

ϕ ◦ Tk

k=0

et, si ψ appartient `a C(X) et C est un cylindre, on pose :   ψC = sup ψ(x) ; x ∈ C . Th´eor`eme. — La limite suivante existe ; c’est la pression de ϕ not´ee P(ϕ) : P (ϕ) = lim

n→∞



Preuve. — Posons Vn =

   1 e(Sn ϕ)C . log n C∈An

eSn ϕC . Alors

C∈An

Vn+p =

 A,B

eSn+p ϕAB ≤



eSn ϕA eSp ϕB ≤ Vn Vp .

A,B

On applique alors un r´esultat pr´ec´edemment d´emontr´e `a un = log(Vn ). L’entropie topologique est la pression de ϕ = 0 : dans le cas du d´ecalage sur AN , elle vaut log m ; dans le cas d’un sous-d´ecalage, voir le § 4. Dans le cas g´en´eral, on a le r´esultat suivant, appel´e le principe variationnel.    Th´eor`eme. — On a P (ϕ) = sup hµ (T ) + X ϕ dµ, µ ∈ M (X, T ) . Remarque. — La proposition 3 ainsi que la remarque qui l’accompagne montrent que ce sup est atteint pour au moins une mesure ergodique de M (X, T ). Preuve. Montrons d’abord que P (ϕ) est plus grand que la borne sup´erieure. Lemme. — Soient p1 , . . . , pn des r´eels ≥ 0 tels que pi = 1 et a1 , . . . , an des r´eels. Alors n n   pi (ai − log pi ) ≤ log eai ) •

i=1

avec ´egalit´e si et seulement si pi = eai /( eai ). C’est un simple exercice laiss´e au lecteur. ` PANORAMAS ET SYNTHESES 4

i=1

3. ENTROPIE ET PRESSION TOPOLOGIQUE

37

On applique le lemme `a pA = µ(A), aA = Sn ϕA et l’on obtient Hµ (An ) +

1  1 pA Sn ϕA ≤ log Vn . n n An



Mais, si ωk d´esigne sup{|ϕ(x) − ϕ(x )| ; xj = x j , 1 ≤ j ≤ k}, on a 

 pA Sn ϕA ≥ n

ϕ dµ − X

n 

ωn−k

k=0

et le r´esultat d´ecoule du fait que ωn tend vers 0 lorsque n → ∞. • Pour d´ emontrer P (ϕ) est plus petit que la borne sup´erieure, on fixe x ∈ X et on pose pour n ≥ 0 Sn (ϕ)(Cx) e δCx n−1 1  j∗ C∈An S (ϕ)(Cx) , mn = µn = T (µn ). n j=0 e n C∈An

Quitte `a extraire une sous-suite, on peut supposer que la suite (mn ) converge faiblement vers une mesure invariante m. Le calcul donne :   eSn (ϕ)(Cx) . Hµn (An ) + Sn (ϕ) dµn = log C∈An

Par ailleurs, fixons un entier M et posons n = λM : on peut alors ´ecrire, par la sous-additivit´e,  Hµn (An ) +

Sn (ϕ) dµn ≤

λ−1 

 Hµn (AkM+j ) + CM +

Sn (ϕ) dµn ,

k=0

et ceci pour tout j ≤ M − 1. En sommant sur j et en utilisant HT j∗ µn (Ap ) = Hµn (Ap+j ), il vient n−1  )=0

 HT ∗ µn (AM ) + M

Sn (ϕ) dµn ≥

M−1  λ−1 

 Hµn (AkM+j ) + M

Sn (ϕ)

j=0 k=0

≥ M log



eSn (ϕ)(Cx) − KM 2 .

C∈An

Par la concavit´e de la fonction −t log t, on en d´eduit   M Hmn (AM ) + M ϕ dmn ≥ log eSn (ϕ)(Cx) − KM 2 n C∈An

et l’on conclut en faisant tendre successivement n et M vers +∞. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

38

´ CHAPITRE 3. L’ENTROPIE EN THEORIE ERGODIQUE

4. Sous-d´ecalages Il y a toute une litt´erature sur ce vaste sujet : citons simplement [DGS] comme r´ef´erence notable. Dans la pratique, les mots de AN ne sont pas toujours admissibles. Consid´erons un exemple que nous rencontrerons `a nouveau dans la suite : soit G le groupe libre u `a p symboles γ1 , . . . , γp . Ce groupe est l’ensemble des mots de la forme x1 · · · xk o` xj est l’un des γk ou bien un autre symbole not´e γk−1 . La r`egle est que si γi est suivi de γi−1 (ou bien l’inverse) on identifie le mot avec celui o` u les deux symboles auraient ´et´e effac´es. Naturellement il peut arriver que l’on efface tout : on obtient alors le mot vide qui est l’´el´ement neutre de G. Ce groupe ´etant d´ecrit, on d´efinit l’ensemble limite (abstrait) de G comme l’ensemble des ´el´ements (mots) de {γ1 , . . . , γp , γ1−1 , . . . , γp−1 }N tels que pour tout i, les s´equences γi γi−1 et γi−1 γi n’apparaissent pas. Remarquons que cet ensemble limite est un ferm´e de AN (A = {γ1 , . . . , γp , γ1−1 , ..γp−1 }) qui garde la propri´et´e fondamentale d’ˆetre invariant par le d´ecalage. Soit A un alphabet fini et F un ensemble fini de mots finis sur A. Le sousensemble X de AN des mots dans lesquels les ´el´ements de F n’apparaissent pas est un ferm´e de AN qui est invariant par le d´ecalage T . Un tel couple (X, T ) est appel´e un sous-d´ecalage de type fini. Quitte `a agrandir l’alphabet en prenant pour nouvelles lettres des mots finis (et `a remplacer le d´ecalage T par une de ses it´er´ees), on peut toujours supposer que les mots interdits poss`edent deux lettres. une mani`ere alternative de d´efinir les sous-d´ecalages de type fini est alors la suivante. On consid`ere toujours un alphabet A = {1, . . . , m} et M = (mij ) une matrice m × m form´ee uniquement de 0, 1 de sorte que chaque que chaque ligne et chaque colonne comporte au moins un 1. Un mot x = x1 · · · xn · · · ∈ X = AN est dit M -admissible si on a mxi xi+1 = 1 pour tout i ≥ 0. On note X(M ) l’ensemble des mots admissibles ; il est clair que (X(M ), T ) est un sous-d´ecalage de type fini. Pour un sous-d´ecalage de type fini, toutes les d´efinitions pr´ec´edentes s’´etendent, ´etant entendu que les sommations sont toutes restreintes aux cylindres M -admissibles. On r´ecup`ere d’ailleurs le cas du d´ecalage usuel en prenant pour matrice M la matrice form´ee uniquement de 1. N´eanmoins certaines propri´et´es topologiques du d´ecalage sur AN peuvent ˆetre perdues pour certaines matrices M . Examinons le lien entre propri´et´es alg´ebriques de M et propri´et´es topologiques de (X(M ), T ). Soient X un espace compact et T une application continue de X dans X. Nous dirons que T est topologiquement transitive si pour tout couple (U, V ) d’ouverts de X il existe un entier n ≥ 0 tel que T n (U ) ∩ V = ∅. ` PANORAMAS ET SYNTHESES 4

´ 4. SOUS-DECALAGES

39

Le lecteur v´erifiera facilement que T est topologiquement transitive si et seulement si il existe x ∈ X tel que la suite des it´er´ees T n (x), n ≥ 0 soit dense dans X et si c’est le cas l’ensemble des x v´erifiant cette propri´et´e est dense dans X. Nous dirons que T est topologiquement m´elangeante si pour tout couple (U, V ) d’ouverts de X, il existe un entier n ≥ 0 tel que k ≥ n implique T k (U ) ∩ V = ∅. Naturellement cette derni`ere propri´et´e est plus forte que la premi`ere et elle est v´erifi´ee par le d´ecalage sur AN pour la simple raison que pour tout ouvert U de AN il existe n ≥ 0 tel que T n (U ) = AN . On a alors le th´eor`eme dont la d´emonstration, facile, est laiss´ee au lecteur : Th´eor`eme. — Le sous-d´ecalage (X(M ), T ) est topologiquement transitif si et seulement si quels que soient i, j ∈ A, il existe un n ≥ 1 tel que l’on ait mnij > 0 (i.e. M est irr´eductible). Il est topologiquement m´elangeant si et seulement si il existe un n ≥ 1 tel que pour tous i, j ∈ A on ait mnij > 0 (on dit alors que M est ap´eriodique). Il existe des matrices irr´eductibles non ap´eriodiques : l’exemple le plus simple est donn´e par la matrice circulante M (ej ) = ej+1 pour j ≤ n − 1 et M (en ) = e1 . En effet, on a mkii > 0 si et seulement si k est un multiple de n. Cet exemple permet de construire toutes les matrices irr´eductibles ap´eriodiques ; modulo l’ordre des g´en´erateurs, toute telle matrice s’obtient en effet `a partir de la matrice pr´ec´edemment d´efinie en rempla¸cant chaque 1 par une matrice ap´eriodique d-dimensionnelle et chaque 0 par la matrice nulle d-dimensionnelle (voir [DGS] pour plus d’information sur ces matrices). Dans la suite nous supposerons toujours, sauf mention express du contraire, que la matrice M est ap´eriodique. Une des propri´et´es de ces matrices est que si y est dans X(M ) avec M ap´eriodique, alors −n T (y) est dense dans X(M ). Proposition. — L’ensemble n≥0

Preuve. — Soit n l’entier donn´e par la condition d’ap´eriodicit´e ; alors T −2m (y) contient tous les cylindres admissibles d’ordre m. Cette derni`ere proposition permettra d’´etendre le th´eor`eme de Perron-FrobeniusRuelle au cas des sous-d´ecalages ap´eriodiques. Pour clore cette discussion alg´ebrique, revenons sur l’exemple du groupe libre `a p symboles. u 1n est L’alphabet A poss`ede ici n = 2p ´el´ements et la matrice M est 1n − In o` la matrice dont tous les ´el´ements sont des 1 tandis que In est la matrice identit´e d’ordre n. On a alors M 2 = (n − 2)1n + I > 0 ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

40

´ CHAPITRE 3. L’ENTROPIE EN THEORIE ERGODIQUE

d`es que p > 1 ; la matrice est donc ap´eriodique dans ce cas. Remarquons que si p = 1, la matrice M n’est mˆeme pas irr´eductible (et l’ensemble limite de G est r´eduit `a deux ´el´ements). Contrairement au cas du d´ecalage usuel, le calcul de l’entropie topologique n’est pas ´evident ; nous allons le faire dans le cas o` u la matrice M est irr´eductible. On a le th´eor`eme suivant, qui est (dans le cas ap´eriodique) un cas particulier du th´eor`eme principal du chapitre suivant : Th´eor`eme (Perron-Frobenius). — Si M est une matrice positive irr´eductible, il existe λ > 0 tel que si η est une valeur propre quelconque de M , on a |η| ≤ λ et telle que λ soit une valeur propre simple de M et t M associ´ee `a des vecteurs propres > 0. Ce th´eor`eme provisoirement admis, montrons le Th´eor`eme. — L’entropie topologique du sous-d´ecalage associ´e `a la matrice M suppos´ee irr´eductible est log(λ(M )) o` u λ(M ) est la plus grande valeur propre de M . Preuve. — L’entropie topologique est donn´ee par h(T ) = lim

n→∞

log(Nn ) n

o` u Nn d´esigne le nombres de cylindres admissibles de longueur n. Soit Nn (j) le nombre de cylindres admissibles se terminant par j ; on a alors les formules m 

Nn (j) = Nn ,

Nn+1 (j) =

j=1

m 

mij Nn (i).

i=1

Appelons Vn le vecteur ligne (Nn (j)) ; les formules pr´ec´edentes se traduisent par Vn+1 = Vn M implique Vn = V0 M n , V0 = (1, . . . , 1). Soit un vecteur propre > 0 `a gauche de M , a = inf(V (i)), b = sup(V (i)) ; on a alors V (j) n  V (i) (n)  V (j) n (n) λ = mij ≥ λ V0 (i)mij ≥ a a b i=1 i=1 m

∀j ∈ A,

m

et par cons´equent, le terme du milieu ´etant ´egal `a Nn (j), on voit en sommant sur j toutes les in´egalit´es que h(T ) = log(λ). Dans le cas particulier o` u toutes les lignes et toutes les colonnes de M ont le mˆeme u µ est la mesure Markovienne nombre k d’´el´ements non nuls, h(T ) = log k = hµ (T ) o` d´efinie par p = (1/m, . . . , 1/m), Π = (1/k)M . Ainsi, dans le cas du groupe libre `a p symboles, l’entropie topologique est ´egale `a log(2p − 1).

` PANORAMAS ET SYNTHESES 4

Chapitre 4 ´ ` LE THEOR EME DE PERRON-FROBENIUS-RUELLE

´ 1. Enonc´ e et d´emonstration du th´eor`eme L’objet de ce chapitre est d’introduire les outils math´ematiques n´ecessaires `a la preuve du th´eor`eme annonc´e au chapitre pr´ec´edent sous le nom de principe variationnel. L’outil principal est un op´erateur positif d´efini sur C(X) : on ´etablit pour cette op´erateur un analogue infini-dimensionnel du th´eor`eme de Perron-Frobenius. Il est trop tˆot pour motiver la d´efinition de cet op´erateur : le lecteur est donc pri´e de patienter jusqu’au prochain paragraphe o` u il apparaˆıtra naturellement. u A = {1, .., m} ; cet espace est Dans tout ce chapitre, X d´esignera l’espace AN , o` muni de sa m´etrique ultram´etrique d(x, y) = 2− inf{n≥0 ;

xn =yn }

.

Soit C(X) l’espace des fonctions continues sur X ; toute fonction de C(X) est uniform´ement continue. Par cons´equent, si f est dans C(X), pour k ≥ −1, on peut d´efinir   ωk (f ) = sup |f (x) − f (y)| ; d(x, y) ≤ 2−k−1 et l’appartenance `a C(X) ´equivaut `a la condition lim ωk (f ) = 0.

k→∞

Nous d´efinissons B0 (X) comme l’espace des fonctions f de C(X) telles que f B0 =

∞ 

ωk (f ) + ω−1 (f ) < +∞.

k=0

Il est facile de voir que c’est un espace de Banach (de fonctions modulo les constantes).

42

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

Nous aurons ´egalement besoin des espaces de fonctions h¨old´eriennnes Λδ , i.e. les fonctions f telles que ∃ C, ∃ δ > 0, ∀x, y ∈ X,

  f (x) − f (y) ≤ C|x − y|δ .

Ce sont des exemples de fonctions appartenant `a B0 . Remarquons ´egalement que tous les espaces pr´ec´edents sont des alg`ebres. Soit maintenant ϕ une fonction continue, r´eelle ; on lui associe un op´erateur sur C(X), not´e Lϕ et appel´e op´erateur de Ruelle ou encore op´erateur de transfert ; il est d´efini par ∀f ∈ C(X),

Lϕ (f )(x) =



eϕ(y) f (y) =

y∈T −1 (x)



eϕ(ix) f (ix).

i∈A

Il est imm´ediat (sous sa deuxi`eme forme, c’est transparent) de voir que Lϕ est continu sur C(X). Remarquons tout de suite, et cela nous servira `a faire le lien entre l’op´erateur de Ruelle et le calcul de la pression, que pour tout n ≥ 1, Lnϕ (f )(x) =



eSn (ϕ)(y) f (y),

y ; T n (y)=x

o` u nous rappelons que Sn (ϕ) = ϕ + ϕ ◦ T + · · · + ϕ ◦ T n−1 . Le principal r´esultat de ce chapitre est le : Th´eor`eme 1 (Perron-Frobenius-Ruelle). — Sous les hypoth`eses pr´ec´edentes, si ϕ appartient `a B0 (X), (i) il existe une valeur propre β > 0 simple de Lϕ et un vecteur propre associ´e h > 0 qui appartient `a C(X) ; (ii) il existe une unique mesure de probabilit´e µ sur X telle que L∗ϕ (µ) = βµ et pour toute fonction v de C(X), β −n Lnϕ (v) converge uniform´ement sur X vers  h v dµ/ h dµ. Enfin, on a log β = P (ϕ), la pression topologique de ϕ. Avant de passer `a la d´emonstration de ce th´eor`eme, remarquons que lorsque ϕ ne d´epend que des deux premi`eres variables (i.e. ϕ est constante sur les cylindres d’ordre 2), la fonction h ne d´epend en fait que de la premi`ere variable et le vecteur ligne (h(i)) est vecteur propre `a gauche de la matrice ( eϕ(ij) ) pour la valeur propre maximale β ; on retrouve ainsi le th´eor`eme classique de Perron-Frobenius. Preuve du th´eor`eme. — Nous allons appliquer plusieurs fois le th´eor`eme g´en´eral suivant pour la d´emonstration duquel nous renvoyons `a [Rud] : ` PANORAMAS ET SYNTHESES 4

´ ´ ET DEMONSTRATION ´ ´ ` 1. ENONC E DU THEOR EME

43

Th´eor`eme (Schauder-Tychonov). — Soit K un compact convexe inclus dans un espace vectoriel localement convexe et Φ une application continue de K dans K ; alors Φ a un point fixe. Nous appliquons une premi`ere fois ce th´eor`eme `a l’op´erateur adjoint L∗ϕ qui op`ere sur l’espace des mesures sign´ees sur X muni de la topologie faible. Plus pr´ecis´ement, l’application continue   Lϕ (1) dµ Φ : µ −→ L∗ϕ (µ) laisse invariant le compact convexe M (X) des mesures de probabilit´e sur X.  Soient µ un point fixe donn´e par le th´eor`eme pr´ec´edent et β = Lϕ (1) dµ, de sorte que L∗ϕ (µ) = βµ. Remarquons que nous avons utilis´e,pour avoir la continuit´e de Φ, le fait que Lϕ (1) ≥ exp(−ϕ∞ ) = b > 0 implique Lϕ (1) dµ ≥ b si µ ∈ M (X). En particulier, on a β > 0. Prouvons tout d’abord (i). Pour x, y ∈ X, d´efinissons   C(x, y) = sup sup Sk (ϕ)(Bx) − Sk (ϕ)(By) . k≥1 B∈Ak

Le fait que ϕ soit dans B0 montre que si d(x, y) satisfait d(x, y) ≤ 2−n−1 alors ∞ C(x, y) ≤ n+1 ωk (ϕ). La fonction C est donc born´ee et tend vers 0 avec d(x, y). On montre facilement que cette fonction C v´erifie   sup ϕ(ax) − ϕ(ay) + C(ax, ay) ≤ C(x, y). a∈A

D´efinissons alors    g dµ = 1, ∀x, y ∈ X, g(x) ≤ eC(x,y)g(y) , Λ = g ∈ C(X) ; g ≥ 0, X

T (g) = Lϕ (g)/β. Montrons tout d’abord que Λ est un convexe compact de C(X) et que T (Λ) ⊂ Λ. La convexit´e est imm´ediate. Pour obtenir la compacit´e, il suffit, d’apr`es le th´eor`eme d’Ascoli, de montrer que Λ est ´equicontinu ; mais si g ∈ Λ et si x, y ∈ X, on a   g(x) − g(y) ≤ emax(C(x,y),C(y,x)) − 1, ce qui prouve le r´esultat grˆace aux propri´et´es de la fonction C d´emontr´ees plus haut. De plus Λ est born´e car pour tout x ∈ X et tout g ∈ Λ, l’in´egalit´e g(x) ≥ bg∞ implique g∞ ≤ 1/b. V´erifions maintenant que Λ est stable par T . Nous avons tout d’abord :    g Lϕ (g) ∗ dµ = d(Lϕ µ) = g dµ = 1. β β ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

44

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

Ensuite, si g appartient `a Λ, Lϕ (g)(x) =



eϕ(ax) g(ax)

a∈A





eϕ(ay) g(ay) eϕ(ax)−ϕ(ay)+C(ax,ay)

a∈A

≤ Lϕ (g)(y) eC(x,y) par les propri´et´es de ϕ. On applique alors `a nouveau le th´eor`eme de SchauderTychonov. L’application T admet un point fixe dans Λ, ce qui se traduit par le fait que Lϕ admet une fonction propre h > 0 pour la valeur propre β > 0. La valeur propre β est une valeur propre simple. Soit en effet g un vecteur propre quelconque pour la valeur propre β ; on peut supposer qu’il existe x ∈ X tel que g(x) > 0 ; posons : t = sup{u ≥ 0 ; h − ug ≥ 0}. Alors h − tg ≥ 0 et il existe y ∈ X tel que h(y) − tg(y) = 0. On ´ecrit alors, pour n ∈ N,  β n (h − tg)(y) = eSn (ϕ)(z) (h − tg)(z) = 0, z ; T n (z)=y

ce qui implique que (h − tg) est nulle en tout z ; il existe n tel que T n (z) = y et donc partout, ce dernier ensemble ´etant dense dans X. Tout ceci prouve (i) et l’existence de µ dans (ii). Avant de poursuivre, soient h, β comme plus haut ; on d´efinit alors : g = ϕ − log h ◦ T + log h − log β. Si l’on note Mh l’op´erateur de multiplication par h, on a : Lg =

1 −1 M Lϕ Mh . β h

Par ailleurs, on a Lg (1) = 1, ce qui prouve que 1 est valeur propre (simple) de Lg ; montrons 1) qu’il existe une unique mesure ν de probabilit´e telle que L∗g (ν) = ν ;  2) que pour tout v ∈ C(X), Lng (v) tend vers v dν uniform´ement sur X. Mais avant cela, voyons pourquoi ceci termine la d´emonstration du th´eor`eme 1. On observe tout d’abord que si 1) est vrai alors L∗ϕ

ν  h

=

β ν h

ce qui implique existence et unicit´e de µ, avec de plus ν = hµ. De la mˆeme fa¸con, Lng (v) tend vers v dν uniform´ement si et seulement si (car h > 0) on a 2). En r´esum´e, les conditions 1) et 2) impliquent (ii). ` PANORAMAS ET SYNTHESES 4

´ ´ ET DEMONSTRATION ´ ´ ` 1. ENONC E DU THEOR EME

45

Attelons-nous `a la preuve de 1) et 2). Pour ce faire, on commence par ´etudier le module de continuit´e de g ou plutˆot la fonction Cg analogue `a la fonction C vue plus haut et que nous appellerons d´esormais Cϕ . On v´erifie facilement, la somme `a calculer ´etant t´elescopique, que l’on a Cg (x, y) ≤ Cϕ (x, y) + ωn (h) si d(x, y) ≤ 2−n−1 . Commen¸cons par montrer que la suite Lnϕ (v) est ´equicontinue : nous avons, pour d(x, y) ≤ 2−k−1 ,     n Lg (v)(x) − Lng (v)(y) = (1) + (2) avec

    S (g)(Bx)   (1) =  v(Bx) − v(By)  ≤ ωk+n (v), e n B∈An

        (2) =  v(By) eSn (g)(Bx) − eSn (g)(By)  ≤ v∞  eCg (x,y) − 1. B∈An

On a utilis´e ici de fa¸con cruciale le fait que g est normalis´ee par  eSn (g)(By) = 1. B∈An

L’´equicontinuit´e s’en d´eduit. Il existe donc (nk ) telle que la suite Lng k (v) converge uniform´ement vers une fonction v ∗ . Comme l’op´erateur Lg est positif de norme ≤ 1, on a :     sup(v) ≥ sup Lg (v) ≥ · · · ≥ sup Lng (v) ≥ · · · ≥ sup(v ∗ ). D’autre part, v ∗ ≥ Lng k (v) − -k avec -k → 0 et donc pour tout N , ∗ ∗ sup(LN g (v )) ≥ sup(v ) − -k

et ceci pour tout k, ce qui entraˆıne   ∗ ∗ sup LN g (v ) ≥ sup(v ) = s. En d´eveloppant cette in´egalit´e, on s’aper¸coit qu’elle implique v ∗ = s sur T −n (x) si v ∗ (x) = s. On en d´eduit que v ∗ est constante. Pour avoir 2), il nous suffit alors de v´erifier que la suite enti`ere converge vers cette constante. Soit (pk ) une autre suite croissante d’entiers telle que la suite Lpgk (v) converge ; par l’´etude pr´ec´edente, la limite est constante, et c’est aussi la limite de la suite sup(Lpgk (v)) qui est une sous-suite de la suite d´ecroissante sup(Lng (v)) ; la suite (Lng (v)) est donc convergente car elle n’a qu’une seule valeur d’adh´erence. D´emontrons 1). On remarque tout d’abord que L∗g pr´eserve M (X) car    ∗  d Lg (µ) = Lg (1) dµ = µ(X). X

X

Le th´eor`eme de Schauder-Tychonov implique alors l’existence d’une mesure ν invariante ; l’unicit´e d´ecoule de 2). Pour montrer enfin que log β = P (ϕ), il suffit d’appliquer (ii) `a la fonction v constante ´egale `a 1. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

46

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

Remarque. — Le lecteur v´erifiera sans peine que le th´eor`eme reste vrai dans le cadre des sous-d´ecalages de type fini ap´eriodiques. Terminons ce paragraphe par une propri´et´e spectrale importante de l’op´erateur de Ruelle dans le cas o` u ϕ est h¨old´erienne. Soit δ > 0 et V = Λδ l’espace des fonctions h¨old´eriennes d’ordre δ muni de la norme   f V = f ∞ + sup 2nδ ωn (f ) . n≥0

Supposons que la fonction ϕ appartienne `a V ; alors la fonction h du th´eor`eme appartient `a V ainsi que la fonction normalis´ee g. Les fonctions g, h, ϕ appartiennent `a V et les estimations vues plus haut impliquent que les op´erateurs Lg , Lϕ , Mh op`erent sur V ; naturellement β est valeur propre de Lϕ V de vecteur propre h. Le th´eor`eme suivant montre que cet ´el´ement du spectre sp(Lϕ V ) est remarquable. Th´eor`eme. — Il existe un r´eel r < β tel que sp(Lϕ Preuve. — Comme Lϕ = avec β = 1. Soit

βMh−1 Lg Mh ,

V ) \{β}

⊂ D(0, r).

il suffit de montrer la propri´et´e analogue pour g 



 f dm = 0 ,

∆ = f ∈ V ; f V ≤ 1 et X

o` u m est la mesure de probabilit´e telle que Lemme. —

sup{LN g (f )∞ ,

L∗g (m)

= m.

f ∈ ∆} tend vers 0 lorsque N → ∞.

Preuve. — Comme ∆ est compact dans C(X) par le th´eor`eme d’Ascoli et que la norme dans C(X) de LN g est ≤ 1 il suffit de montrer que pour tout f ∈ ∆ on (f ) = 0. Mais cela d´ecoule du 2) du th´eor`eme de Perron-Frobeniusa lim LN ∞ g n→∞ Ruelle. On observe ensuite que V peut s’´ecrire comme somme directe V = V1 ⊕ V2 o` u V1 = {f ∈ V ; X f dm = 0} et V2 est la droite vectorielle des fonctions constantes. Comme ces deux espaces sont stables par Lg montrer le th´eor`eme revient `a montrer que le rayon spectral de Lg V1 est < 1. Ce rayon spectral est ´egal `a :  1/N inf (Lg V1 )N L(V1 ) , N ≥ 1} Il suffit donc de montrer l’existence de N ≥ 1 tel que f ∈ ∆ entraˆıne LN g (f )V ≤ Mais, par une estimation d´ej`a vue,  N  −kδ       ∀N, ∀n ≥ 1, ∀k ≥ 0, ωk Ln+N (f ) ≤ ωk+n LN . g g (f ) + C Lg (f ) ∞ 2

3 4.

On utilise tout d’abord le lemme qui nous donne N > 0 tel que le deuxi`eme terme soit ≤ 14 2−kδ ; ce N ´etant fix´e, on peut majorer le premier terme par C(N )2−nδ 2−kδ et il suffit de choisir n de sorte que C(N )2−nδ ≤ 14 car alors  n+N    L (f )V ≤ 12 + Ln+N (f )∞ ≤ 34 · g g ` PANORAMAS ET SYNTHESES 4

´ ´ 2. MESURES DE GIBBS ET ETATS D’EQUILIBRE

47

2. Mesures de Gibbs et e´ tats d’´equilibre a) Formule de changement de variable Soit µ une mesure de probabilit´e sur X. u $ veut dire Nous dirons que µ est quasi-invariante si T ∗ µ $ µ et µ $ T ∗ µ (o` absolument continue par rapport `a ). Pour une telle mesure on peut encore d´efinir le Jacobien Jµ (en fait cette fonction est d´efinie pour toutes les mesures) et nous avons la formule de changement de variable suivante : Proposition. — Pour tout g ∈ C(X), on a : m   i=1

1 dµ = g(ix) Jµ (ix) X

 g dµ. X

Preuve. — On remarque tout d’abord que T ∗ (gµ) $ µ car µ(E) = 0 entraˆıne    ∗    T (gµ)(E) =  g dµ ≤ g∞ T ∗ µ(E) = 0 T −1 (E)

car µ est quasi-invariante. Par le th´eor`eme de Radon-Nikodym, T ∗ (gµ) = λµ, avec λ ∈ L1 (µ) d´efini par T ∗ (gµ)(x1 · · · xn ) n→∞ µ(x1 · · · xn )

λ(x) = lim Mais ∗

T (gµ)(x1 · · · xn ) =

m   i=1

g dµ =

ix1 ···xn

m 

µ-p.p.

g(ix)µ(ix1 · · · xn ) + -n

i=1

avec |-n | ≤ ωn+1 (g)Tµ∗ (x1 · · · xn ) d’o` u l’on tire facilement, T ∗ µ ´etant absolument continue par rapport `a µ, que λ=

m 

g(ix)

i=1

1 · Jµ (ix)

La proposition se d´eduit alors de ce qui pr´ec`ede et de l’identit´e   ∗ ∗ T (gµ)(X) = 1 = d(T (gµ)) = λ dµ. X

X

Posons ϕ(x) = − log(Jµ (x)) ; en termes de l’op´erateur de Ruelle, on a : m  i=1

1 g(ix) = Lϕ (g)(x). Jµ (ix) ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

48

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

On peut donc paraphraser la formule de changement de variable par : L∗ϕ (µ) = µ. En particulier, si ϕ est h¨old´erienne, la mesure µ est l’unique point fixe de L∗ϕ . L’objet de ce paragraphe est l’´etude des mesures quasi-invariantes µ pour lesquelles la fonction ϕ est pr´ecis´ement h¨old´erienne. b) Retour sur le principe variationnel. Soit ϕ une fonction r´eelle appartenant `a B0 (X) que l’on suppose dans un premier temps normalis´ee, c’est-`a-dire telle que ∀x ∈ X,

m 

eϕ(ix) = 1.

i=1

On peut consid´erer l’op´erateur de Perron-Frobenius-Ruelle associ´e qui est de norme 1 ; il existe donc une unique mesure de probabilit´e ν telle que L∗ϕ (ν) = ν. Examinons les propri´et´es de cette mesure : Propri´et´e 1. — La mesure ν appartient `a M (X, T ). En effet, pour tout f ∈ C(X), on a :     ∗ f ◦ T dν = f ◦ T d(Lϕ (ν)) = Lϕ (f ◦ T ) dν = f dν. X

X

X

X

Propri´et´e 2. — Pour tout x ∈ X et tout n ≥ 0, on a : e−ωn (ϕ) ≤

ν(x1 · · · xn ) e−ϕ(x) ≤ eωn (ϕ) ν(x2 · · · xn )

et en particulier ϕ = − log(Jν ). Pour le voir, on ´ecrit   e−ϕ 1x1 ···xn dν = Lϕ ( e−ϕ 1x1 ···xn ) dν X X    m  = 1x1 ···xn (ix) dν = 1x2 ···xn dν, X

i=1

X

et le r´esultat se d´eduit ais´ement. D´efinition. — Soit ϕ ∈ C (X) ; une mesure de probabilit´e µ est appel´ee une mesure de Gibbs par rapport ` a ϕ s’il existe A, B > 0, C ∈ R tels que ∀x ∈ X, ∀n ≥ 0,

A≤

ν(x1 · · · xn ) ≤ B. eSn (ϕ)(x)+Cn

Le fait que ϕ ∈ B0 (X) ajout´e `a la propri´et´e pr´ec´edente montrent que ν est une  mesure de Gibbs par rapport `a ϕ avec B = exp n≥0 ωn (ϕ) , A = 1/B et C = 0. ` PANORAMAS ET SYNTHESES 4

´ ´ 2. MESURES DE GIBBS ET ETATS D’EQUILIBRE

49

Propri´et´e 3. — La mesure ν est l’unique mesure de probabilit´e T -invariante telle que  P (ϕ) = hν (T ) + ϕ dν = 0. m

X

Preuve. — Soit µ ∈ M (X, T ) ; alors i=1 1/Jµ (ix) = 1 et l’in´egalit´e variationnelle mentionn´ee au chapitre pr´ecedent implique que ∀x ∈ X,

m  i=1

m    1 ϕ(ix) log Jµ (ix) + ≤0 Jµ (ix) J (ix) i=1 µ

avec ´egalit´e si et seulement si Jµ (ix) = exp(−ϕ(ix)). Si on int`egre cette in´  egalit´e par rapport `a µ, la formule du changement de variable implique que hµ (T ) + X ϕ dµ ≤ 0 avec ´egalit´e si et seulement si Jµ = e−ϕ . (Ce raisonnement est a priori vrai uniquement si log(Jµ ) est continue mais en fait il reste valable dans tous les cas, car on a vu que si µ est dans M (X, T ), alors log Jµ est limite domin´ee de la suite log(Jn ) et le th´eor`eme de Lebesgue permet d’´etendre la formule du changement de variable `a ce cas.) On a vu que ν v´erifie cette propri´et´e ; c’est la seule car, toujours par la formule du changement de variable, Jµ = e−ϕ implique L∗ϕ (µ) = µ et la remarque qui suit le th´eor`eme de Perron-Frobenius-Ruelle nous dit pr´ecis´ement que L∗ϕ a un seul point fixe dans le cas ϕ normalis´e appartient `a B0 (X). Nous pouvons maintenant ´enoncer le th´eor`eme principal : Th´eor`eme. — Soit ϕ ∈ B1 (X) et h, µ, β comme dans le th´eor`eme de Perron-FrobeniusRuelle. Alors on a β = eP (ϕ) et ν = hµ est l’unique mesure invariante telle que  ϕ dν. P (ϕ) = hν (T ) + X

Nous appellerons mesure d’´equilibre toute mesure invariante ν v´erifiant la derni`ere ´egalit´e. Preuve. — Le cas normalis´e (i.e. Lϕ (1) = 1) vient d’ˆetre fait ; on ram`ene le cas g´en´eral `a celui-ci en posant g = ϕ − log(hoT ) + log h − log β ; soit m la mesure de probabilit´e invariante par L∗g ; alors m = hµ = ν et d’apr`es ce qui pr´ec`ede, pour toute mesure λ de M (X, T ) on a   hλ (T ) + g dλ ≤ hm (T ) + g dm = 0 X

X

ce qui ´equivaut, en ´ecrivant g en fonction de ϕ et en utilisant l’invariance par T des mesures m, λ, `a   ϕ dλ ≤ hm (T ) + ϕ dm = log β hλ (T ) + X

X

d’o` u le th´eor`eme se d´eduit. Remarque. — On voit facilement que ν est une mesure de Gibbs par rapport `a ϕ de param`etre − log β. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

50

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

c) Caract´erisation de certaines mesures de Gibbs. Soit µ une mesure quasi-invariante et ϕ = − log(Jµ ). On suppose dans ce paragraphe que ϕ est dans Λδ . La formule du changement de variable montre que L∗ϕ (µ) = µ, et comme Lnϕ (f )/β n converge uniform´ement d’apr`es le th´eor`eme de Perron-FrobeniusRuelle, n´ecessairement β = 1 et µ est l’unique mesure quasi-invariante qui  est point fixe de L∗ϕ . Soit h le vecteur propre de Lϕ pour la valeur propre 1 tel que h dµ = 1 ; alors, comme on l’a vu, la mesure m = hµ est invariante par T et c’est l’unique ´el´ement  de M (X, T ) qui maximise l’´energie libre hν (T ) + ϕ dν. Mais cette fonctionnelle est concave sur M (X, T ) et par cons´equent m est n´ecessairement ergodique ; comme par ailleurs h > 0 sur X, on obtient le : Th´eor`eme. — Si µ est une mesure quasi-invariante telle que − log(Jµ ) = ϕ ∈ Λδ alors il existe une unique mesure invariante m absolument continue par rapport ` a µ ; de plus il existe γ ∈ Λδ telle que ϕ = − log(Jm ) + γ ◦ T − γ. Si µ et ν sont deux mesures de probabilit´e, nous ´ecrirons µ%ν

si il existe A, B > 0 tels que Aν ≤ µ ≤ Bν.

Nous dirons dans ce cas que les deux mesures sont fortement ´equivalentes. Th´eor`eme. — Soit µ une mesure de probabilit´e sur X. Les ´enonc´es suivants sont ´equivalents : 1) µ est quasi invariante et log(Jµ ) est dans Λδ ; 2) µ est une mesure de Gibbs pour une fonction ϕ ∈ Λδ ;  3) il existe ϕ ∈ Λδ et il existe ν % µ ∈ M (X, T ) telles que hν (T ) + X ϕdν = P (ϕ) (en d’autres termes, µ est fortement ´equivalente ` a une mesure d’´equilibre). Preuve. 1) ⇒ 2). Soit ϕ = log(Jµ ) ; comme on l’a vu plus haut, on a µ = m/h o` u h > 0 ∈ Λδ et m est une mesure de Gibbs par rapport `a ϕ. 2) ⇒ 3). Montrons d’abord le : Lemme. — Si µ est une mesure de Gibbs par rapport ` a ϕ pour la constante C, alors on a C = − log(P (ϕ)). Preuve. — Pour tout cylindre x1 · · · xn , on a µ(x1 · · · xn ) % exp(Sn ϕ(x1 · · · xn ) + nC) u le r´esultat. et par cons´equent log( exp(Sn ϕ(x1 · · · xn )))/n % −C, d’o` Soit m la mesure invariante qui r´ealise P (ϕ) ; c’est aussi une mesure de Gibbs par rapport `a ϕ et donc µ % m. 3) ⇒ 1). Comme µ % ν, c’est une mesure quasi invariante. Par ailleurs, le th´eor`eme pr´ec´edent montre que − log(Jµ ) = − log(Jν ) + γ ◦ T − γ avec γ ∈ Λδ et par la d´emonstration du th´eor`eme de Perron-Frobenius-Ruelle, on a − log(Jµ ) = ϕ + η ◦ T − η + P (ϕ) avec η ∈ Λδ . ` PANORAMAS ET SYNTHESES 4

´ 3. L’OPERATEUR DE RUELLE COMPLEXE

51

La th´eorie que nous venons de d´ecrire est celle d’un gaz en r´eseau unidimensionnel, c’est-`a-dire le cas ν = 1 dans la description de la thermodynamique des r´eseaux du chapitre pr´ec´edent. Grˆace `a l’op´erateur de Ruelle on peut d´emontrer dans ce cas l’existance et surtout l’unicit´e des ´etats d’´equilibres pour une interaction suffisamment r´eguli`ere. Nous commen¸cons maintenant `a entrevoir la th`ese de Ruelle ; nous avons sous les yeux une th´eorie math´ematique tr`es ´elabor´ee (elle portera d’aileurs ses fruits dans les prochains chapitres) qui est l’exact parall`ele de la th´eorie thermodynamique des r´eseaux : nos math´ematiques sont naturelles. Un autre aspect de la th´eorie thermodynamique est la notion de transition de phase. Nous y reviendrons plus en d´etail plus loin. Disons pour l’instant qu’il y a transition de phase en t0 si la fonction t → P (−tϕ) admet une singularit´e en t0 . Une autre cons´equence importante de la th´eorie de l’op´erateur de Ruelle est l’absence de transition de phase dans le cas d’un r´eseau unidimensionnel (et d’une interaction h¨old´erienne). Cette propri´et´e physique aura un analogue math´ematique dans la suite, `a savoir une propri´et´e de r´egularit´e de la dimension de Hausdorff de fractals d´ependant d’un param`etre. Ces deux propri´etes sont en fait des corollaires du fait que la pression est une fonction r´eelle analytique de l’interaction, r´esultat que nous pr´esentons maintenant.

3. L’op´erateur de Ruelle complexe Dans ce paragraphe, on autorise la fonction ϕ `a ˆetre `a valeurs complexes, soit ϕ = u + iv et dans un premier temps on suppose de plus u normalis´ee, c’est`a-dire telle que Lu (1) = 1. On suppose ´egalement les fonctions u, v h¨old´erienne d’exposant δ (avec u, v ∈ Λδ ) ; sous ces conditions, la fonction u admet une unique mesure d’´equilibre not´ee m. D’autre part, Lϕ op`ere sur Λδ en vertu de l’in´egalit´e suivante qui a d´ej`a ´et´e vue (le passage au cas complexe est ´evident) : (1)

∞     ωn Lkϕ (w) ≤ ωn+k (w) + eu∞ w∞ ω) (ϕ) . n

Cette in´egalit´e implique en particulier que les Lkϕ ont une norme uniform´ement born´ee dans Λδ et en particulier que le rayon spectral de Lϕ est ≤ 1. La discussion qui suit ´etudie l’existence d’une valeur propre de module 1. u l’on ´etudie l’op´erateur On se place tout d’abord dans l’espace L2 (m) o` V (f ) = e−iv f ◦ T (noter que Lϕ ◦V = I). Il s’agit d’une isom´etrie de L2 (m) et l’on veut d´eterminer si cet op´erateur admet une valeur propre (n´ecessairement de module 1). La raison essentielle pour consid´erer cet op´erateur est qu’il s’agit de l’adjoint de Lϕ dans L2 (m). En effet,   −iv e w ◦ T f dm = e−iv w ¯ ◦ T f d(L∗u (m)) (2) X X   Lu ( e−iv w ¯ ◦ T f ) dm = wL ¯ ϕ (f ) dm. = X

X ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

52

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

Proposition. — L’espace n≥0 V n (L2 (m)) est de dimension 0 ou 1 ; il est de dimension 1 si et seulement si V a une valeur propre simple dans L2 (m). Preuve. — Supposons cet espace non nul et soit w = 0 un de ses ´el´ements ; alors pour tout n il existe wn ∈ L2 (m) tel que w = V n (wn ) = e−iSn wn wn oT n . On en d´eduit premi`erement que |w| estT −n (B(X))-mesurable pour tout n et par cons´equent, par la loi de 0-1 que |w| est une constante n´ecessairement non nulle. On constate alors que V (w)/w = (wn /wn+1 ) ◦ T n+1 et par cons´equent pour les mˆemes raisons V (w) = λw avec |λ| = 1. Cette valeur propre est n´ecessairement simple car si w en est une autre, la fonction w/w est T -invariante et donc constante puisque m est ergodique. Proposition. — L’op´erateur V a une valeur propre dans L2 (m) si et seulement si il a une valeur propre dans Λδ . Preuve. — Soit w un vecteur propre de L2 (m) pour la valeur propre α. On a observ´e lors de la d´emonstration de la proposition pr´ec´edente que w ne pouvait s’annuler et l’on doit avoir w/w ◦ T n = αn eiSn v et par cons´equent αn Lnϕ (g) = Lnu (g/w)w pour toute fonction g ∈ Λδ . Mais le th´eor`eme  de Perron-Frobenius-Ruelle implique que Lnu (g/w) converge uniform´ement vers X wg ¯ dm. Par ailleurs, |α| = 1, et la partie 1) implique que la suite (Lnϕ (g)) est ´equicontinue ; il existe donc une soussuite de αn Lnϕ (g) qui converge uniform´ement vers α∗ g ∗ avec g ∗ ∈ Λδ . En regroupant, il vient α∗ g ∗ = ( X g w ¯ dm)w et donc que w ∈ Λδ . Proposition. — Si V n’a pas de valeur propre dans L2 (m), alors Lnϕ (g) converge uniform´ement vers 0 si g est dans Λδ . Preuve. — On sait d´ej`a que Lnϕk (g) converge uniform´ g∗  n ement vers une fonction  nk ∗ k pour une sous-suite nk . Par 2), wLϕ (g) dm = V (w)g dm tend vers wg dm ; d’autre part, comme V n (w) = w, on peut ´egalement supposer que V nk (w) converge faiblement dans L2 (m) vers une fonction qui est n´ecessairement dans V n (L2 (m)) = {0}. La proposition suit. Proposition. — Si V n’a pas de valeur propre dans L2 (m) alors Lϕ , en tant qu’op´erateur sur Λδ , a un rayon spectral < 1. −nδ Preuve. — Par 1) , Ln+N (w)δ ≤ CLN LN ϕ ϕ (w)∞ + 2 ϕ (w)δ < 1 si N et n sont choisis successivement assez grands.

Proposition. — L’op´erateur V a une valeur propre dans L2 (m)(Λδ ) si et seulement si il en est de mˆeme pour Lϕ . Preuve. — Supposons d’abord que V a une valeur propre α ; alors e−iv w ◦ T = αw ¯ w : alors Lu (|w|) ≥ |w| et donc Lϕ (αw) = w. R´eciproquement, supposons Lϕ (w) = α et donc en fait Lu (|w|) = |w| comme on le voit en int´egrant contre m et donc que |w| = c. Pour i = 1, . . . , m, posons alors αi = eu(ix) , Yi = eiv(ix) w(ix) et Y = α ¯ w(x). αi Yi /Y = 1, d’o` u l’on tire que n´ecessairement Yi = Y pour Alors |Yi | = |Y | et tout i puis facilement que V (w) = αw. Nous pouvons maintenant ´enoncer le th´eor`eme principal : ` PANORAMAS ET SYNTHESES 4

´ 3. L’OPERATEUR DE RUELLE COMPLEXE

53

Th´eor`eme. — Si ϕ est dans Λδ , Lϕ op`ere sur cet espace et son rayon spectral est ≤ eP (Reϕ) . Si Lϕ admet une valeur propre de module eP (Reϕ) , celle-ci est simple u u = Re ϕ, |α| = 1, et M est un op´erateur de et unique et Lϕ = αM Lu M −1 o` multiplication. De plus, le reste du spectre est inclus dans un disque de rayon < eP (u) . Si Lϕ n’a pas de valeur propre de module eP (u) , son rayon spectral est < eP (u) . Preuve. — Soit h le vecteur propre de Lu pour la valeur propre eP (u) ; alors u = g + log h ◦ T − log h + P (u) o` u Lg (1) = 1 et de plus Lϕ = P (u)Mh Lγ Mh−1 , γ = g + iv. Dire que Lϕ admet une valeur propre de module P (u) revient donc `a dire que Lγ a une valeur propre de module 1. Soit w un vecteur propre de Lγ pour la valeur propre α (|α| = 1) ; alors par les propositions pr´ec´edentes, w est de module constant (1 par exemple) et eiv = αw ◦ T /w ce qui implique Lγ (f ) = Lg ( eiv f ) = αLg (w ◦ T f /w) = αwLg (f /w). Le reste d´ecoule du th´eor`eme de Perron-Frobenoius-Ruelle. Enfin si Lϕ n’a pas de valeur propre de module P (u), Lγ n’a pas de valeur propre de module 1 et le th´eor`eme d´ecoule du fait d´emontr´e plus haut que le rayon spectral de Lγ est < 1. Nous avons maintenant tous les r´esultats n´ecessaires pour l’´etude de l’application ϕ → P (ϕ). Si B1 , B2 sont deux espaces de Banach complexes, U un ouvert de B1 et F une application de U dans B2 , on dit que F est holomorphe si elle est de classe C 1 pour la structure complexe de B1 . Consid´erons par exemple l’espace de Banach V = Λδ sur C et soit L(V ) l’espace de Banach des op´erateurs de B dans B ; on v´erifie facilement que les applications w → ew et h → Mh sont holomorphes de V dans V et de V dans L(V ) respectivement ; de mˆeme pour l’application Li : w → (x → w(ix)) (qui est C-lin´eaire). On en d´eduit que l’application ϕ → Lϕ est holomrphe de V dans L(V ). On invoque alors le th´eor`eme de perturbation suivant, que nous admettrons (voir [RS]). Th´eor`eme (Kato, Rellich). — Soient V un espace de Banach complexe et L(V ) l’espace de Banach des op´erateurs sur V ; si S0 ∈ L(V ) admet une valeur propre α0 simple qui est un point isol´e du spectre de S avec pour vecteur propre associ´e v0 alors, pour tout - > 0, il existe δ > 0 tel que si S − S0  < δ alors l’op´erateur S admet une valeur propre simple α(S) associ´ee `a un vecteur propre v(S) tels que   1) les applications S → α(S) et S → v(S) sont holomorphes sur S − S0  < δ ;   2) si S − S0  < δ, on a sp(S) ∩ D(α0 , -) = α(S) . Ce th´eor`eme implique imm´ediatement que   D(P ) = ϕ ∈ V ; Lϕ admet une valeur propre simple de module eP (u) est un ouvert de V et que l’on peut d´efinir une application holomorphe ϕ −→ valeur propre de module eP (u) de Lϕ de D(P ) dans C. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

54

´ ` CHAPITRE 4. LE THEOR EME DE PERRON-FROBENIUS-RUELLE

On d´efinit la pression P (ϕ) de ϕ comme le logarithme de cette valeur propre, un nombre modulo 2πi ; cela permet de d´efinir au voisinage de u r´eelle une d´etermination holomorphe de cette pression valant P (u) r´eelle en u. Un corollaire imm´ediat de cette remarque est la : Proposition. — La fonction ϕ → P (ϕ) est r´eelle-analytique sur l’espace de Banach r´eel Λδ . Cette r´eelle-analyticit´e jouera un rˆole tr`es important dans la suite ; notons tout de suite que l’espace de Banach ici consid´er´e (l’espace Λδ ) n’interviendra plus ; n’importe quel Banach aurait fait l’affaire pour appliquer le th´eor`eme de Kato-Rellich. De la proposition pr´ec´edente, nous d´eduirons que l’application t → P (tϕ) (de R dans R) est r´eelle analytique sous certaines conditions.

` PANORAMAS ET SYNTHESES 4

Chapitre 5 ´ LES REPULSEURS CONFORMES

1. D´efinition et propri´et´es g´en´erales Soit f une application holomorphe d’un ouvert V de C dans C. On note f −n (V ) = f −1 (f −1 ◦ · · · ◦ (f −1 (V )) · · ·).    n fois

Une remarque ´evidente et que les ouverts f −n (V ) forment une suite d´ecroissante d’ensembles sur lesquels l’it´er´ee f n = f ◦ f ◦ · · · ◦ f (n fois) est bien d´efinie. Soit maintenant J un compact du plan : D´efinition. — Le triplet (J, V, f ) est appel´e un r´epulseur conforme si : (i) il existe C > 0 et α > 1 tels que |(f n ) (z)| ≥ Cαn pour tout z ∈ J et n ≥ 1 ; −n (ii) on a J = f (V ) ; n≥1

(iii) chaque fois que U ouvert v´erifie U ∩J = ∅, il existe n > 0 tel que f n (U ∩J) ⊃ J. Avant de donner quelques exemples de r´epulseurs conformes, examinons un certain nombre de propri´et´es de ces objets. Remarque On peut toujours supposer que f est propre ; il suffit de remplacer V par l’image inverse par f d’un ε-voisinage de J pour ε assez petit. Le lecteur pourra s’en convaincre en utilisant les propositions suivantes ou inclure la propri´et´e dans la d´efinition. Proposition 1. — Si (J, V, f ) est un r´epulseur conforme, alors f (J) = J et f −1 (J) = J. Preuve. — Le fait que f −1 (J) = J d´ecoule de (ii) et du fait que les f −n (V ) sont d´ecroissants. Soit x ∈ J ; alors pour tout n ≥ 0, on a f n (f (x)) = f n+1 (x) ∈ V , ce qui implique que f (x) appartient `a J par (ii). R´eciproquement, soient x ∈ J et - > 0 tel que B(x, -) ⊂ V ; par (iii), il existe n > 0 tel que f n (B(x, -)) ⊃ J et donc y ∈ V tel que x = f (y). N´ecessairement y est dans J car f −1 (J) ⊂ J.

56

´ CHAPITRE 5. LES REPULSEURS CONFORMES

Proposition 2. — L’ensemble J est parfait s’il n’est pas r´eduit `a un point. Preuve. — Supposons J non r´eduit `a un point. Soit z ∈ J, - > 0 ; il faut montrer que D(z, -) contient un autre point de J. Si ce n’´etait pas le cas, soit n l’entier tel que f n (D(z, -)) ⊃ J ; alors, pour tout ζ ∈ J, l’´egalit´e ζ = f n (z) implique J = {z}. Proposition 3. — L’application f est expansive sur J au sens suivant : ∃ β > 0, ∀x = y ∈ J, ∃ n ∈ N,

 n  f (x) − f n (y) ≥ β.

Preuve. — Nous allons d´emontrer cette proposition dans le cas o` u C = 1 dans le (i) de la d´efinition. Cela correspond au cas o` u f est imm´ediatement dilatante. On peut montrer que l’on peut toujours se ramener `a ce cas quitte `a changer de structure conforme sur V . Les distances correspondant aux deux m´etriques Riemanniennes ´etant ´equivalentes sur le compact J (au sens o` u le quotient des deux m´etriques est compris entre deux constantes), la proposition sera vraie dans le cas g´en´eral. On suppose donc C = 1 : un argument standard de compacit´e nous dit qu’il existe - > 0 et α > 1 tels que x, y ∈ J et |x − y| < - implique |f (x) − f (y)| > α |x − y|. La propri´et´e est alors imm´ediate avec β = -. On va utiliser cette proposition dans la d´emonstration de la propri´et´e la plus importante (pour nous) des r´epulseurs conformes : l’existence d’une partition de Markov. Cette existence va en effet nous permettre d’identifier la dynamique de f sur J avec un d´ecalage sur un ensemble de mots infinis sur un alphabet fini et par suite d’utiliser le formalisme thermodynamique pour d´eduire des propri´et´es de f . Dans ce but, nous avons besoin d’une nouvelle notion : D´efinition. — Soit - un r´eel positif. Une suite finie ou infinie (xi ), 1 ≤ i ≤ N ≤ +∞ de points de J est appel´ee une --pseudo-orbite si pour tout i ≥ 1, on a |xi+1 − f (xi )| ≤ -. Une orbite est une 0-pseudo-orbite. Deux pseudo-orbites de mˆeme longueur (xi ), (yi ) sont dites η-proches si pour tout i, on a |xi − yi | ≤ η. Proposition 4. — Pour tout δ > 0, il existe η > 0 tel que toute η-pseudo-orbite est δ-proche d’une orbite. Preuve. — Commen¸cons par le cas d’une η-pseudo-orbite finie (xi ), 1 ≤ i ≤ N . On peut clairement supposer que η < -, la constante de la preuve de la proposition 3. Supposons ´egalement que D(xN , η) ⊂ V ; par le th´eor`eme de monodromie, f −1 (D(xN , η)) est compos´e d’un nombre fini de disques topologiques disjoints sur lesquels f est injective. Soit B la composante qui contient xN −1 : elle contient ´egalement x N −1 qui est une image r´eciproque de xN . Par la propri´et´e d’expansivit´e de f , on a n´ecessairement |x N −1 − xN −1 | ≤ ` PANORAMAS ET SYNTHESES 4

    η xN −1 − f (xN −2 ) ≤ 1 + 1 η. =⇒ α α

´ ´ ES ´ GEN ´ ERALES ´ 1. DEFINITION ET PROPRIET

57

Si (1 + 1/α )η < -, on peut alors refaire le mˆeme raisonnement avec xN remplac´e par x N −1 , xN −1 remplac´e par xN −2 et η remplac´e par (1 + 1/α )η. On trouve alors x N −2 , une image r´eciproque de x N −1 telle que     xN −2 − f (xN −3 ) ≤ 1 + 1 + 1 η. α α 2 En continuant le raisonnement, on s’aper¸coit alors que la proposition est d´emontr´ee ∞   (1/α )i ≤ min(-, δ). Un simple argument de compacit´e si η est choisi tel que η i=0

laiss´e au lecteur g´en´eralise ce dernier r´esultat au cas infini. On fixe maintenant γ < 12 η et tel que |x − y| ≤ γ implique |f (x) − f (y)| ≤ 12 η o` u le 1 η = η(δ) est celui de la pr´ec´edente proposition avec δ < 2 β (le β de la proposition 3) et l’on consid`ere un ensemble fini A = {x1 , . . . , xn } de points de J tel que pour tout x de J, il existe xj avec |x − xj | ≤ γ. On note alors Σ(f ) l’ensemble des ´el´ements de AN qui sont des η-pseudo-orbites. On v´erifie facilement que c’est un ferm´e de AN . Par la proposition 4, tout ´el´ement σ de Σ(f ) est δ-proche de l’orbite d’un ´el´ement x de J. Par la proposition 3, cet ´el´ement x est unique ; on le note x = θ(σ). Le choix de la constante γ implique que l’application θ est surjective et la proposition 3 implique que cette application est continue. Pour k = 1, . . . , n, on d´efinit :   Fk = θ {σ ∈ Σ(f ) ; σ(0) = xk } . Par la continuit´e de θ, c’est un ferm´e de J. Proposition 5. — Si f (Fk ) ∩ Fj = ∅, alors f (Fk ) ⊃ Fj . Preuve. — Dire que f (Fk ) ∩ Fj = ∅ revient `a dire qu’il existe σ ∈ Σ(f ) de la forme σ = (xk xj · · ·), ce qui implique que |f (xk ) − xj | ≤ η. Mais alors, pour tout σ = xj · · · ∈ Fj , xk σ ∈ Σ(f ) implique θ(σ) = f (θ(xk σ)) et donc que f (Fk ) ⊃ Fj . Une partition de Markov de J est un recouvrement fini de J par des ensembles Rj , 1 ≤ j ≤ k v´erifiant les conditions suivantes : 1) Les Rj sont propres, c’est-`a-dire ´egaux `a l’adh´erence de leur int´erieur. 2) Les int´erieurs des Rj sont deux `a deux disjoints. 3) Si x ∈ int Rj , f (x) ∈ int Ri alors f (Rj ) ⊃ Ri . 4) f

Rj

est injective.

Les ensembles Fj construits plus haut v´erifient 3), 4) mais pas n´ecessairement 1), 2). On modifie le recouvrement de la fa¸con suivante. Par ailleurs, On pose tout d’abord Z = J \ ∂Fj qui est un ouvert dense dans J. si j, k ∈ {1, . . . , n}, on partitionne Fj en Fj = Djk Ijk = (Fj \Fk ) (Fj ∩ Fk ). Pour x dans Z, on d´efinit alors R(x) comme l’intersection de tous les int´erieurs des ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

58

´ CHAPITRE 5. LES REPULSEURS CONFORMES

diff´erents Djk , Ijk contenant x : il est imm´ediat de v´erifier que si x, y ∈ Z alors les ensembles R(x), R(y) sont soit ´egaux, soit disjoints. Soit donc   {R1 , . . . , Rk } = R(x), x ∈ Z . Les R(x) ´etant ´egaux ou disjoints et Z ´etant dense dans J, n´ecessairement y appartient `a Z ∩ int R(x) implique R(y) = R(x) et donc on a 1) et par suite 2). Comme on a toujours 4), il reste `a v´erifier 3) : pour ce faire, il suffit de v´erifier que y ∈ f (R(x)) implique R(y) ⊂ f (R(x)). Mais par la locale injectivit´e de f , on voit que f (R(x)) est une intersection d’ensembles du type int f (Fj ) ∩ f (F) ) et du type intf (Fj ) \f les f (Fi ) ´etant des r´eunions de Fj , de l’un des (F) ), c’est-`a-dire, deux types int (Fi ∩ Fj ) ou int i ( ) (Fi ∩ F) )). Par ailleurs, il est facile de voir que f (Z) est contenu dans Z ; on en d´eduit que si un ensemble de l’un de ces deux derniers types contient y, il contient n´ecessairement R(y) par d´efinition de cet ensemble et la propri´et´e d´esir´ee est d´emontr´ee. Remarque La m´ethode pr´ec´edente permet de construire des partitions de Markov dont les ´el´ements ont un diam`etre aussi petit que l’on veut.

2. Exemples a) Tout ensemble de Cantor autosimilaire est l’ensemble invariant d’un r´epulseur conforme. Consid´erons un exemple : soient C = ]0, 1[ × ]0, 1[ et m carr´es ouverts C1 , · · · Cm de fermetures deux `a deux disjointes incluses dans C. Soient V = Cj et f : V → C l’application dont la restriction `a chaque Cj est l’unique similitude directe qui transforme Cj en C. Alors, si J d´esigne l’ensemble de Cantor J = n≥0 f −n (V ), u rj est le l’ensemble (J, V, f ) est un r´epulseur conforme car f (z) = rj−1 z sur Cj o` cˆot´e de Cj . Pour voir enfin (iii), d´ecrivons plus avant la structure de l’ensemble J. Pour j = 1, . . . m, posons gj = fj−1 : C → Cj la similitude directe transformant C en Cj . Alors

gx1 ◦ gx2 ◦ · · · ◦ gxn (C) Jn = f −n (V ) = (x1 ,x2 ,···xn )∈Am

o` u A = {1, . . . , m} et l’on passe de Jn `a Jn+1 en rempla¸cant chaque composante gx1 ◦ · · · ◦ gxn (C) ≡ x1 · · · xn par ses m sous-ensembles x1 · · · xn j pour j ∈ A (le dessin de la page suivante illustre le cas m = 3). V´erifions `a pr´esent (iii) : comme le diam`etre des cylindres tend de fa¸con ´evidente vers 0, tout ouvert U rencontrant J contient n´ecessairement un cylindre x1 · · · xn ; mais alors f n est la similitude transformant x1 · · · xn en C, ce qui implique que f n (U ) ⊃ J. Dans l’exemple pr´ec´edent la dynamique est enti`erement cod´ee par le d´ecalage u A = {1, . . . , k}. La partition de Markov est en effet ici transparente : sur AN o` ` PANORAMAS ET SYNTHESES 4

2. EXEMPLES

59

111

1 2 13

3

L’ensemble J lorsque m = 3. c’est {C1 , · · · , Ck }. On peut mˆeme voir le r´epulseur conforme comme une r´ealisation g´eom´etrique de ce d´ecalage. G´en´eralisons l’exemple en r´ealisant g´eom´etriquement un sous-d´ecalage : soit donc M une matrice form´ee de 0 et de 1 et   Σ(M ) = σ ∈ AN ; ∀j ≥ 0, Mσ(j)σ(j+1) = 1 . Pour j = 1, . . . , k posons : Rj = Cj \



gj (C i ),

VM =



Rj ,

JM =

i; mji =0

f −n (VM ).

n≥0

Il est clair que JM ⊂ J et que JM correspond exactement symboliquement aux mots de Σ(M ). Pour voir que (f, VM , JM ) est un r´epulseur conforme, il reste `a voir la propri´et´e (iii) : cela revient `a v´erifier que pour tout cylindre x1 · · · xi de Σ(M ), il existe N ∈ N tel que f N (x1 · · · xi ) = JM , ce qui ´equivaut `a montrer la mˆeme propri´et´e pour les cylindres u l’on d´eduit facilement d’ordre 1, c’est-`a-dire les Ri . Mais f N (Ri ) = mk >0 Rj , d’o` ij

que la propri´et´e (iii) sera v´erifi´ee si et seulement si la matrice M est ap´eriodique. b) R´ealisation g´eom´etrique du groupe libre ` a p symboles Soient D1 , · · · , Dp p disques ouverts d’adh´erences deux `a deux disjointes incluses dans le demi-plan ouvert {y < 0} et Dj∗ leurs sym´etriques par rapport `a l’axe r´eel. Pour tout j, on d´esigne par sj (s∗j ) l’unique antihomographie involutive qui ´echange l’int´erieur et l’ext´erieur de Dj (Dj∗ ) et qui vaut l’identit´e sur le bord de Dj . On d´esigne aussi par s0 la sym´etrie par rapport `a l’axe r´eel. On pose enfin rj = s0 ◦ sj ,

rj∗ = s0 ◦ s∗j = rj−1 .

Le groupe engendr´e par les rj est alors une r´ealisation du groupe libre `a p symboles comme groupe discret d’homographies du plan (voir [Be]). Cette construction va nous permettre de r´ealiser l’ensemble limite de ce groupe comme un r´epulseur conforme. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

60

´ CHAPITRE 5. LES REPULSEURS CONFORMES

p p Soient en effet V = i=1 Di ∪ i=1 Di∗ et f la fonction holomorphe sur V dont la restriction `a chaque Dj (Dj∗ ) est sj ; la condition (i) est satisfaite car, comme le montre un calcul simple, on a |f | > 1 sur V . Pour prouver les autres propri´et´es, on observe simplement que la d´ecomposition de V en composantes connexes nous fournit une partition de Markov dont la matrice M a d´ej`a ´et´e ´etudi´ee : mij = 1 si et seulement si i = j, et M est ap´eriodique (dessin ci-dessous).

c) G´en´eralisation de l’exemple a). Soit U un domaine de Jordan du plan et m domaines de Jordan Uj pour j = 1, . . . , m dont les fermetures sont deux `a deux disjointes et incluses dans U . Pour tout j, on d´esigne par fj une repr´esentation conforme de Uj sur U ; on pose alors V = Uj et f = fj sur Uj . Si l’on pose J = f −n (V ), montrons que (J, V, f ) est un r´epulseur conforme. On rappelle que l’on peut munir le disque unit´e D d’une m´etrique de courbure n´egative constante, la m´etrique hyperbolique dρD (z) = | dz|/(1−|z|2 ) ; cette m´etrique se transporte par la repr´esentation conforme de D sur U en la m´etrique hyperbolique dρU (z) = ηU (z) | dz|,

  o` u ηU ϕ(w) =

1 (1 −

|w|2 ) |ϕ (w)|

·

Le lemme de Schwarz permet alors d’affirmer que si g est une fonction holomorphe de U dans U qui n’est pas un automorphisme, alors ρU (g(x), g(y)) < ρU (x, y) si x, y ∈ U et x = y. Si g est l’une des gj , un argument de compacit´e facile laiss´e au lecteur (gj (U ) est relativement compact dans U ) montre en fait qu’il existe un kj < 1 tel que pour tous x, y ∈ U , on a ρU (gj (x), gj (y)) ≤ kj ρU (x, y). Soit k la plus grande des constantes kj ; si x, y appartiennent `a un mˆeme cylindre x1 · · · xn = gx1 · · · gxn (U ), on en d´eduit alors que ρU (f n (x), f n (y)) ≥

1 ρU (x, y). kn

On fait alors tendre yk vers x pour obtenir  n  (f ) (x) ≥ αn ` PANORAMAS ET SYNTHESES 4

ηD (x) ηD (f n (x))

(α = k −1 ).

3. CALCUL DE LA DIMENSION DE HAUSDORFF DE J

61

Pour conclure, on utilise le fait que J est compact dans U et que f (J) = J pour obtenir (i). La proposition (iii) sera montr´ee si l’on parvient `a ´etablir que la dynamique est similaire `a celle de l’exemple 2, ce qui ´equivaut `a montrer que les diam`etres des cylindres d´ecroissent exponentiellement. Or on vient d’´etablir ce fait pour la m´etrique hyperbolique ; le r´esultat d´ecoule encore de l’´equivalence de celle-ci avec la m´etrique euclidienne au voisinage de J. Notons que l`a encore une partition de Markov naturelle est donn´ee par les Uj : on pourrait ´evidemment comme au a) g´en´eraliser l’exemple en consid´erant des sous-d´ecalages de type fini. d) Le cas o` u J est une courbe de Jordan. Le prototype d’un tel r´epulseur conforme est le cercle unit´e, f ´etant l’application z → z p et V la couronne { 12 < |z| < 2}. Une partition de Markov est alors donn´ee par les intervalles du cercle contigus aux p racines de l’unit´e et symboliquement f n’est autre que le d´ecalage sur l’ensemble des mots infinis compos´es avec p lettres. D’une fa¸con g´en´erale, si J est une courbe de Jordan, des consid´erations topologiques standard montrent qu’il existe un entier p ≥ 0 tel que tout point de J est atteint par f exactement p fois. On consid`ere un point fixe de f sur J ; les intervalles contigus aux p pr´eimages de ce point forment alors une partition de Markov et l`a encore f apparaˆıt symboliquement comme le d´ecalage sur {1, · · · p}N . En particulier, f J est topologiquement conjugu´e `a z → z p sur le cercle unit´e. Nous verrons au chapitre suivant que pour c appartenant `a un certain voisinage de 0 dans C, le polynˆome z → z 2 + c agit comme un r´epulseur conforme sur une courbe de Jordan dont on ´etudiera les propri´et´es.

3. Calcul de la dimension de Hausdorff de J Dans ce paragraphe nous allons mettre `a profit le formalisme thermodynamique que nous avons d´evelopp´e pour ´etablir une formule (la formule de Bowen [Bo1]) permettant de calculer la dimension de Hausdorff des r´epulseurs conformes (J, V, f ). Soit donc (J, V, f ) un r´epulseur conforme et J1 , · · · Jm une partition de Markov de J. Comme on l’a vu plus haut, cette partition permet de symboliser la dynamique de f comme l’action d’un sous-d´ecalage sur un ensemble de mots. On d´efinit en effet la matrice M par mij = 1 si f (Ji ) ⊃ Jj et 0 sinon et on d´efinit les cylindres x0 · · · xn comme l’ensemble des x ∈ J tels que f j (x) ∈ Jj pour j = 0, . . . , n. L’´etape cruciale dans le calcul de la dimension de Hausdorff de J est l’estimation suivante du diam`etre des cylindres. Proposition. — Soit Φ = −(log |f |)|J ; alors il existe une constante C > 0 telle que pour tout cylindre x1 · · · xn et tout x ∈ x1 · · · xn on ait C −1 eSn Φ(x) ≤ diam(x1 · · · xn ) ≤ C eSn Φ(x) . Preuve. — Elle commence par un : ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

´ CHAPITRE 5. LES REPULSEURS CONFORMES

62

Lemme. — Soient U un domaine de C, K une partie compacte connexe non r´eduite `a un point de U et ϕ une fonction holomorphe injective de U dans C. Il existe une constante C ne d´ependant que de U et K (mais pas de ϕ) telle que pour tout x∈ K,     C −1 ϕ (x) ≤ diam(ϕ(K)) ≤ C ϕ (x). 1 Preuve du lemme. — Soient - la distance de K `a ∂U et η = 10 - ; si x, y sont les points de K tels que diam(ϕ(K)) = |ϕ(x) − ϕ(y)| il existe une suite de points y0 , y1 , · · · yN (o` u N ne d´epend pas de ϕ) de K tels que y0 = x, yN = y et d(yj , yj+1 ) < η. On utilise alors le r´esultat suivant qui est classique :

Th´eor`eme (Koebe). — Il existe une constante num´erique C > 0 telle que si ϕ est une fonction holomorphe injective dans D(a, r) alors   ∀x, y ∈ D a, 12 r , Alors diam ϕ(K) ≤

  |ϕ(x) − ϕ(y)|   ≤ C ϕ (a). C −1 ϕ (a) ≤ |x − y|

    ϕ(yj+1 ) − ϕ(yj ) ≤ Cη ϕ (yj ) ;

mais chaque yj peut ˆetre de la mˆeme fa¸con reli´e `a x en au plus N ´etapes ; on en d´eduit   diam(ϕ(K) ≤ C(N, η) ϕ (x). Pour l’in´egalit´e dans l’autre sens, soit D(a, r) un disque ferm´e centr´e sur K et inclus dans U ; Par le th´eor`eme de Koebe,     diam ϕ(K) ≥ C −1 ϕ (a) ≥ c(K, U ) |ϕ (x)|. Soit maintenant x0 · · · xn un cylindre ; l’it´er´ee f n envoie ce cylindre sur Jxn . Si les Jk sont choisis inclus dans des disques de rayons < - assez petit on montre (dans le cas de l’exemple c), c’est automatique) que tout cylindre x0 · · · xn est inclus dans une composante connexe de f −n (Dxn ). La proposition d´ecoule alors de la remarque qui suit la d´efinition des r´epulseurs conformes et de l’application du lemme `a U = Dxn , K = Jxn et f i = la branche de f −n d´efinie sur Dxn et qui envoie xn sur x0 · · · xn (voir [RU2] pour plus de d´etails). Un corollaire imm´ediat de ce calcul est que, comme Sn Φ = − log(|(f n ) |), on a par (i) c τ n ≤ diam(x0 · · · xn ) ≤ Cθn pour des valeurs τ, θ < 1. On en d´eduit que l’on peut identifier J modulo un ensemble d´enombrable avec X(M ), le sous-ensemble des mots M -admissibles de AN et que la topologie de J moins cet ensemble d´enombrable, comme sous-ensemble de C, co¨ıncide avec la topologie ultram´etrique de X(M ) ; la fonction Φ, vue comme ` PANORAMAS ET SYNTHESES 4

3. CALCUL DE LA DIMENSION DE HAUSDORFF DE J

63

fonction sur X(M ) est alors h¨old´erienne. En effet soit - < 12 dist(J, ∂V ) ; pour tout x appartenant `a J, la fonction Φ est harmonique dans D(x, -) et born´ee par une constante ind´ependante de x, elle est donc ´egale `a l’int´egrale de Poisson de ses valeurs au bord dans ce disque et on en d´eduit aussitˆot que son gradient est born´e sur x∈J D(x, 12 -), ce qui implique par les accroissements finis que Φ est h¨old´erienne (en fait Lipshitzienne sur J, mais seulement h¨old´erienne au niveau symbolique). On peut donc appliquer le formalisme thermodynamique `a notre situation ; consid´erons la fonction π(t)) = P (tΦ). En 0 elle vaut l’entropie topologique de f , soit log λ o` u λ est le rayon spectral de la matrice M , ce qui est une valeur positive car M est `a cefficients entiers. Par ailleurs, par (i), la fonction Sn Φ est n´egative si n est assez grand, d’o` u l’on tire imm´ediatement que la fonction π est strictement d´ecroissante. Enfin on voit facilement que π(t) ≤ C − t log α implique lim π(t) = −∞. Il existe t→∞ donc un unique r´eel t > 0 tel que π(t) = 0. Th´eor`eme (Bowen [Bo1]). — La dimension de Hausdorff de J est l’unique r´eel t > 0 tel que π(t) = 0. Preuve. — Notons d ce r´eel et soient -, δ > 0 ; pour n assez grand, tous les cylindres sont de diam`etre ≤ - et par cons´equent Λ9δ (J) ≤



diam(x0 · · · xn )δ ≤

cylindres



K eδ(Sn Φ)C ≤ K enPn (δ)

C cylindre

o` u Pn (δ) tend vers P (δΦ) quand n tend vers ∞, d’o` u l’on tire imm´ediatement que Λδ (J) = 0 si δ > d et par cons´equent que dimH (J) ≤ d. Pour d´emontrer l’in´egalit´e inverse, nous faisons usage du lemme de Frostman (voir appendice) ; il suffit de v´erifier que si µ d´esigne l’´etat d’´equilibre associ´e `a tΦ, alors µ(D(x, r) ≤ Crd pour x ∈ J et r ≤ r0 . Soient c une constante assez petite et n le plus grand entier tel que r|(f n ) (x)| ≤ c ; par Koebe, il existe K telle que la composante Un de f −n (D(f n (x), Kc)) contienne D(x, r) (on choisit c de sorte que Kc < dist(J, ∂V )). La mesure µ ´etant de Gibbs par rapport `a tΦ de param`etre 0, on a :  −d   µ D(x, r) ≤ µ(x0 · · · xn ) ≤ C (f n ) (x) . Mais |(f n ) (x)| ≥ λ|(f n+1 ) (x)| > λc/r, d’o` u l’in´egalit´e cherch´ee.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

Chapitre 6 ˆ ´ ITERATION DES POLYNOMES QUADRATIQUES

Dans ce chapitre, nous fixons notre attention sur une classe de r´epulseurs conformes particuli`ere, celle qui provient de l’it´eration des polynˆomes quadratiques dont nous avons d´ej`a cit´e l’existence. Apr`es un paragraphe de g´en´eralit´es sur l’it´eration des polynˆomes o` u nous introduisons sans souci de g´en´eralit´e les notions n´ecessaires, nous introduisons la cardio¨ıde principale qui est un ouvert voisinage de 0 de valeurs du param`etre c pour lesquelles la dynamique du polynˆome z 2 + c est hyperbolique sur son ensemble de Julia. L’int´erˆet de cette propri´et´e est double : tout d’abord on peut, pour chaque valeur de c dans la cardio¨ıde, appliquer les r´esultats du chapitre pr´ec´edent et calculer la dimension de Hausdorff de l’ensemble de Julia correspondant. Mais on peut aussi mettre `a profit la variation de la dynamique suivant les valeurs de c pour obtenir des r´esultats sur la r´egularit´e en c de la dimension de Hausdorff.

1. Quelques notions d’it´eration Ce paragraphe a pour but de pr´esenter les notions d’it´eration qui seront n´ecessaires ensuite. Cette pr´esentation est faite sans aucun souci de g´en´eralit´e ; les lecteurs int´eress´es par le sujet se reporteront `a [CG] par exemple pour un expos´e plus exhaustif. Soit : P (z) = z 2 + c. On veut ´etudier le comportement de la suite des it´er´ees P n (z). D´efinitions. • L’ensemble de Fatou de P est l’ouvert des points z ∈ C pour lesquels il existe un voisinage V tel que (P n ) soit une famille relativement compacte dans C(V, C), o` uC d´esigne la sph`ere de Riemann munie de la m´etrique sph´erique | dz|/(1 + |z|2 ). •

Le compl´ementaire de l’ensemble de Fatou est l’ensemble de Julia.

Par le crit`ere de Montel, tout point fixe attractif est dans l’ensemble de Fatou, tandis qu’un point fixe r´epulsif est dans l’ensemble de Julia. Il apparaˆıt ainsi que

66

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

l’ensemble de Fatou est la partie stable de la dynamique, la partie instable ´etant l’ensemble de Julia. Le point ∞ est attractif ; l’ensemble de Fatou contient donc un voisinage de l’infini, ce qui prouve que l’ensemble de Julia est compact ; remarquons que ce dernier ensemble est non vide car sinon la suite des it´er´ees serait relativement compacte sur toute C ; il existerait donc une sous-suite convergente et sa limite, holomorphe, serait n´ecessairement la constante ∞ , ce qui est impossible car P a un point fixe = ∞ . Soit A(∞) la composante de l’ensemble de Fatou contenant ∞ ; sur toute autre composante, la suite P n est born´ee d’apr`es le principe du maximum et le fait qu’elle est ´evidemment born´ee sur l’ensemble de Julia ; on en d´eduit que le bassin d’attraction de ∞ est inclus dans A(∞). R´eciproquement, soient z ∈ A(∞) et γ un chemin joignant z `a ∞ dans A(∞) ; on peut recouvrir le compact γ par un nombre fini de boules ouvertes sur lesquelles une sous-suite de (P n ) converge ; on peut mˆeme supposer que la mˆeme sous-suite converge sur tout γ. Ceci prouve que la limite est n´ecessairement ∞ et donc que A(∞) est le bassin d’attraction de ∞. Si z appartient `a A(∞), les deux images inverses de z ainsi que son image par P sont dans A(∞) puisque A(∞) est le bassin de ∞. Ceci prouve que P (A(∞)) = A(∞) et que P −1 (A(∞)) = A(∞). Montrons que, au voisinage de ∞, le polynˆome P est conjugu´e `a z → z 2 . On veut trouver ϕ, de la forme ϕ(z) = z + · · ·, holomorphe et injective au voisinage de ∞, telle que ϕ(P (z)) = ϕ(z)2 . Tout d’abord, il existe M > 0 tel que |z| > M implique |P (z)| > M ; il suffit de choisir M tel que M − |c|/M > 1, de sorte que M = 2 + |c| convient ; on pose n V = {|z| > M }. Dans V, on peut ´ecrire P (n) (z) = z 2 (1 + · · ·) qui ne s’annule pas (puisque de module > M ) et par cons´equent on peut d´efinir la racine 2n -i`eme de cette fonction, −n

ϕn (z) = z(1 + · · ·)2

.

Mais alors ϕ2n = ϕn−1 ◦ P et il suffit de montrer que la suite ϕn converge car alors sa limite conjuguera P . Mais  ϕ ◦ P (n) 2 ϕn+1 1 = ϕn P (n)

−n

et l’on en d´eduit que le produit infini



 = 1+

c

2−(n+1)

(P n )2

ϕn+1/ ϕn converge et donc aussi la suite ϕn .

Th´eor`eme. — L’ensemble de Julia est connexe si et seulement si la suite des it´er´ees de 0 (le point critique) est born´ee. Preuve. — Supposons tout d’abord l’ensemble de Julia connexe. Si 0 appartenait aussi `a A(∞) on pourrait construire une courbe de Jordan joignant 0 `a l’infini `a l’int´erieur de A(∞), soit Γ ; l’ensemble de Julia J serait inclus dans une couronne {|z| ∈ [a, b]} = C et Γ ∩ C contiendrait un arc de Jordan γ joignant les deux cercles de la couronne. Par compacit´e on peut trouver - > 0 tel que z∈γ D(z, -) ∩ J = ∅. ` PANORAMAS ET SYNTHESES 4

´ 1. QUELQUES NOTIONS D’ITERATION

67

Par ailleurs, on fait tout d’abord l’observation fondamentale que J est sym´etrique par rapport `a l’origine ; comme de plus J est connexe, si x ∈ J, on peut joindre x 1 - ; les sym´etriques de ces `a −x par une chaˆıne de points de J distants de moins de 10 points par rapport `a 0 sont alors ´egalement dans J et il est facile de construire une ligne polygonale ferm´ee simple dont les sommets sont des points de la chaˆıne ou leur sym´etrique et dont chaque cˆot´e est de longueur ≤ 12 -. Mais par le th´eor`eme de Jordan, γ rencontre n´ecessairement la courbe polygonale en ξ et D(ξ, -) ∩ J = ∅ , ce qui est contraire aux hypoth`eses faites. Donc 0 ∈ A(∞) ce qui implique P (n) (0) ∈ A(∞) pour tout n et donc que la suite des it´er´ees est born´ee. R´eciproquement, supposons que la suite des it´er´ees de 0 soit born´ee, ce qui ´equivaut au fait que 0 ∈ A(∞) ; nous allons montrer que dans ce cas, la fonction ϕ qui conjugue le polynˆome `a z 2 se prolonge en une repr´esentation conforme de A(∞) sur {|z| > 1}, ce qui prouvera que A(∞) est simplement connexe dans la sph`ere de Riemann. Soit M > 0 suffisamment grand pour que si V d´esigne {|z| > M } on ait P (V ) ⊂ V et ϕ injective sur V. Soit alors V1 = P −1 (V ) ; montrons que l’on peut prolonger holomorphiquement ϕ `a V1 . Pour ce faire on observe que V1 ⊂ A(∞) et donc que V1 ne contient pas 0. Si z0 est un point fix´e de {|z| = M } et z ∈ V1 \V , on peut consid´erer un lacet γ joignant z0 `a z et on d´efinit ϕ(z) comme l’extr´emit´e du lacet issu de ϕ(z0 ) relev´e du lacet ϕ(P (γ)). Cette construction permet de d´efinir ϕ localement, mais pour ˆetre sˆ ur de pouvoir prolonger ϕ `a tout V1 , il faut encore montrer que la d´efinition pr´ec´edente est ind´ependante du lacet γ joignant z0 `a z. Cela revient `a montrer que si Γ est un lacet ferm´e issu de z0 , alors le rel`evement de ϕ(P (Γ)) issu de ϕ(z0 ) est ´egalement ferm´e ; mais si ce n’´etait pas le cas, ce lacet aurait deux extr´emit´es sym´etriques par rapport `a 0 d’o` u l’on tirerait que ϕ(P (Γ)) tournerait un nombre impair de fois autour de 0 (voir dessin ci-dessous) ce qui est impossible car ϕ(P (Γ)) tourne autant de fois autour de 0 que P (Γ), c’est-`a-dire deux fois autant que Γ.

−→ −− −−

P (z) z¯

M

γ

z → P (z) −−−−−−−−−→

−−→ −−

M P (z0 )

−−−−−→

ϕ

z → z 2 −−−−−−−−→

Un argument similaire montre ´egalement que V1 est un domaine de Jordan ; on peut donc recommencer le mˆeme raisonnement avec V1 et ainsi de suite ; on prolonge ainsi ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

68

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

la fonction ϕ `a ∪P −n (V ) = A(∞) et l’image de ϕ est le domaine analogue pour z 2 , c’est-`a-dire {|z| > 1}. Enfin ϕ r´ealise un revˆetement entre ces deux domaines ; c’est donc un isomorphisme puisqu’ils sont tous deux simplement connexes. Dans la suite nous allons montrer que ϕ se prolonge en un hom´eomorphisme du bord de l’ensemble de Julia sur le cercle ; de ceci on d´eduit ais´ement que le polynˆome P est m´elangeant sur l’ensemble de Julia (tout ouvert de J est transform´e par une it´er´ee suffisamment grande de P en J tout entier) et par cons´equent que le bord de A(∞) est ´egal `a J tout entier, qui est donc connexe comme bord d’un domaine simplement connexe. L’ensemble des valeurs du param`etre c pour lesquelles l’ensemble de Julia est connexe est encore connu sous le nom d’ensemble de Mandelbrot. Le th´eor`eme pr´ec´edent nous fournit un algorithme pour dessiner cet ensemble. Pour chaque point du plan on teste si la suite des it´er´ees de 0 tend ou non vers ∞. Concr`etement, et suivant la pr´ecision que l’on souhaite obtenir, on se fixe un entier N , un grand r´eel M > 0 et on teste si le N -i`eme it´er´e de 0 est ou non de module plus grand que M . On trouvera page suivante l’ensemble que l’on obtient ainsi. Il s’agit d’un compact du plan d’une complexit´e inou¨ıe qui n’est d’ailleurs pas compl`etement comprise.

2. La cardio¨ıde principale Fatou et Julia avaient d´ej`a observ´e que si P admet un point fixe attractif, celui-ci attire n´ecessairement le point critique 0 et par cons´equent, si P (z) = z 2 + c, c appartient n´ecessairement `a l’ensemble de Mandelbrot. En effet, soit U la composante connexe de l’ensemble de Fatou contenant ce point fixe ; en raisonnant comme pour A(∞), on s’aper¸coit que U est inclus dans le bassin d’attraction du point fixe attractif ; par ailleurs, P (U ) ⊂ U et comme un polynˆome est une application propre, P (U ) = U . Comme U est simplement connexe, P r´ealise un isomorphisme de U sur lui-mˆeme si 0 n’est pas dans U , ce qui contredit le lemme de Schwarz appliqu´e `a la branche de P −1 : U → U au point fixe. Il est tr`es facile de d´eterminer les valeurs du param`etre c qui sont telles que P ait un point fixe attractif ; appelons u ce point fixe. Comme P (z) = 2z, il nous faut trouver les valeurs de c telles que l’´equation z 2 − z + c = 0 ait pour racine u avec |u| < 12 . Comme n´ecessairement c = u(1−u), l’ensemble cherch´e est l’image du disque {|u| < 12 } par l’application u → u(1 − u), ce qui repr´esente une cardio¨ıde, appel´ee la cardio¨ıde principale de l’ensemble de Mandelbrot, que nous noterons C. Le raisonnement pr´ec´edent peut ˆetre g´en´eralis´e aux cycles attractifs. Le lecteur montrera facilement que l’ensemble des valeurs de c pour lesquelles le polynˆome Pc admet un cycle attractif d’ordre 2 (i.e. pour lesquelles Pc2 = Pc ◦ Pc admet un point fixe attractif d’ordre 2 ) est le disque ouvert de centre −1 et de rayon 14 . Voici un dessin de l’ensemble de Mandelbrot avec les lieux des param`etres pour lesquels le polynˆome admet un cycle hyperbolique d’ordre p ≤ 5. Chaque composante connexe de l’ensemble des valeurs de c pour lesquelles Pc admet un cycle attractif est une composante connexe de l’int´erieur de l’ensemble de Mandelbrot. Un des grands probl`emes ouverts de la th´eorie est de d´ecider s’il existe des composantes connexes de int(M ) qui ne sont pas de ce type. Nous n’aborderons pas ce type de probl`eme et nous restreindrons `a la cardio¨ıde principale. ` PANORAMAS ET SYNTHESES 4

2. LA CARDIO¨IDE PRINCIPALE

69

L’ensemble de Mandelbrot (source [Mi2])

Venons-en au point essentiel : Th´eor`eme. — Si c appartient `a la cardio¨ıde principale, on peut trouver un voisinage V de J tel que (V, J, Pc ) soit un r´epulseur conforme. De plus, J est une courbe de Jordan. Avant de d´emontrer ce th´eor`eme, notons qu’avec le th´eor`eme de Jordan, il implique que l’ensemble de Fatou se compose, dans le cas o` u c appartient `a la cardio¨ıde principale, de deux composantes connexes qui sont les bassins d’attraction de ∞ et de l’unique point fixe attractif. D’une fa¸con g´en´erale, on a le th´eor`eme suivant, dont nous ne d´emontrerons et n’utiliserons qu’une partie : Th´eor`eme. — Pour un polynˆome P dont l’ensemble de Julia est J, les deux propri´et´es suivantes sont ´equivalentes : 1) P est expansive sur J c’est-`a-dire v´erifie le (i) de la d´efinition d’un r´epulseur conforme (on dit encore que P est hyperbolique). 2) Tous les points critiques de P sont attir´es par des cycles attractifs. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

70

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

L’ensemble de Mandelbrot avec, dans chaque composante, le nombre de points du cycle attractif (source [Mi2]) De plus, si l’une de ces deux conditions est v´erifi´ee, toutes les composantes de l’ensemble de Fatou sont des bassins d’attraction de cycles attractifs. Revenons `a la d´emonstration du premier th´eor`eme ; montrons tout d’abord l’expansivit´e de Pc , ce qui revient `a montrer dans ce cas particulier l’implication 2) ⇒ 1) du th´eor`eme pr´ec´edent. Soit P l’ensemble postcritique, c’est-`a-dire l’ensemble des it´er´ees de 0 par le polynˆome. Alors U = S 2 \P est un ouvert contenant Jc puisque P s’accumule au point fixe attractif et est donc inclus dans l’ensemble de Fatou. On v´erifie facilement que Pc−1 (U ) est contenu dans U : comme 0 n’est pas dans P, on peut construire un rel`evement de Pc−1 holomorphe du revˆetement universel U de U dans lui-mˆeme. Si l’on suppose que c = 0, U est alors le disque unit´e et le lemme de Schwarz implique que le rel`evement de Pc−1 est une contraction pour la m´etrique hyperbolique de U. Il s’ensuit que toute branche de Pc−1 est contractante pour la m´etrique hyperbolique de U . Comme Jc est contenu dans U et que Jc contient le point fixe r´epulsif, Pc−1 est en fait strictement contractante (toujours par le lemme de Schwarz) et Pc strictement dilatante pour la m´etrique hyperbolique, ce qui permet de conclure `a l’hyperbolicit´e de Pc sur Jc comme on l’a d´ej`a observ´e. Pour construire le voisinage V , on consid`ere un voisinage born´e W de Jc tel qu’il existe µ > 1 tel que pour la m´etrique hyperbolique   Df (x) ≥ µ, x ∈ Jc . ` PANORAMAS ET SYNTHESES 4

2. LA CARDIO¨IDE PRINCIPALE

71

On consid`ere alors - > 0 suffisamment petit pour que, ρ d´esignant la m´etrique hyperbolique de U,   N9 = z ∈ W ; ρ(z, Jc ) < soit disjoint du compact Pc (S 2 \W ). Alors Pc−1 (N9 ) est contenu dans W , ce qui implique en fait que Pc−1 (N9 ) ⊂ N9/µ ⊂ N9 . Le voisinage V = N9 convient. Reste `a voir la derni`ere propri´et´e, `a savoir que pout tout ouvert O tel que O∩Jc = ∅, on a Pcn (O) ⊃ Jc pour n assez grand. N´ecessairement par le th´eor`eme de Montel, la famille (Pcn ) O n’´etant pas normale, E = C \ ∪ P n (O) contient au plus deux points. Mais E est un ferm´e tel que Pc−1 (E) ⊂ E. Soit z un point de E ; si z = c, alors E contient aussi 0 et, si c = 0 les deux it´er´ees inverses de 0 et E a plus de deux points. Donc si E contient c, c = 0, E = {0}. Si z = c, E contient aussi les deux inverses de z ; comme E a au plus deux points, z est un point fixe et si z1 d´esigne l’autre image inverse de z, z1 est n´ecessairement ´egal `a c, ce qui est impossible par ce qui vient d’ˆetre vu. Donc, on a soit c = 0 soit E = ∅, et par cons´equent dans tous les cas P n (O) ⊃ J. N Par compacit´e, il existe N tel que k=1 P k (O) ⊃ J. Supposons que O contienne un point fixe r´epulsif : quitte `a restreindre O en un voisinage de ce point, on peut alors supposer P (O) ⊃ O et alors P N (O) ⊃ Jc . Si O ne contient pas de point fixe r´epulsif, montrons qu’au moins il contient un point fixe r´epulsif de Pck pour un certain k ≥ 1. On peut supposer que c ∈ O et par cons´equent d´efinir deux inverses g1 , g2 de Pc sur O. Si la propri´et´e n’´etait pas vraie, la famille Pck (z) − g1 (z) z − g2 (z) · Pck (z) − g2 (z) z − g1 (z) omettrait les valeurs 0, 1, ∞ sur O ce qui impliquerait que c’est une famile normale sur O. Mais alors la famille Pck serait aussi normale ce qui est faux. Pour terminer le raisonnement, il suffit alors de reprendre ce qui pr´ec`ede ; le lecteur v´erifiera sans peine que si k ≥ 2 alors E = C \ n Pcnk (O) = {0} ou ∅ et concluera `a l’existence de N > 0 tel que PckN (O) ⊃ J. Montrons enfin que Jc est une courbe de Jordan si c appartient `a la cardio¨ıde principale. Par les r´esultats du paragraphe pr´ec´edent, si Pc admet un point fixe attractif, l’ensemble de Julia du polynˆome est connexe et par cons´equent A(∞) est simplement connexe ; de plus on a construit une transformation conforme de A(∞) sur {|z| > 1}. Appelons Φc l’inverse de cette transformation conforme, qui va donc de {|z| > 1} dans A(∞). Par construction, c’est une fonction holomorphe en c∈ C (c’est-`a-dire que pour tout z, |z| > 1, c → Φc (z) est holomorphe sur C ). On peut alors appliquer les r´esultats puissants concernant les mouvements holomorphes : D´efinition. — Soient X un sous-ensemble de la sph`ere de Riemann et C un domaine simplement connexe propre du plan contenant 0. On appelle mouvement holomorphe de X une aplication F : X × C → S 2 telle que : ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

72

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

1) pour tout c ∈ C, x → F (x, c) est injective. 2) pour tout x ∈ X, F (x, 0) = x. 3) pour tout x ∈ X, c →  F (x, c) est holomorphe dans C. On a alors le th´eor`eme suivant, dˆ u `a Slodkowski [Sl] : Th´eor`eme. — Tout mouvement holomorphe de X ⊂ S 2 se prolonge en un mouvement holomorphe de la sph`ere toute enti`ere. De plus, pour tout c ∈ C, le prolongement de Fc est quasiconforme sur S 2 . On rappelle qu’une application quasiconforme est une application injective d’un ouvert de la sph`ere dans la sph`ere appartenant `a l’espace de Sobolev (W21 )loc (S 2 ) et dont les diff´erentielles formelles d´efinies presque partout transforment le cercle unit´e en des ellipses d’excentricit´e uniform´ement born´ees. Ces applications sont n´ecessairement h¨old´eriennes sur tout compact (avec un exposant ne d´ependant que du compact et de la constante de quasiconformalit´e). Ce th´eor`eme s’applique `a notre situation et montre que si c appartient `a la cardio¨ıde principale, l’ensemble de Julia correspondant est une courbe de Jordan et que le polynˆome Pc est conjugu´e `a P0 sur son ensemble de Julia par une application quasiconforme. Les r´esultats du chapitre pr´ec´edent s’appliquent alors : la dimension de Hausdorff de Jc est donn´ee par la formule   P −t log |2Φc | = 0. Comme c → log(|2Φc |) est une fonction r´eelle-analytique, le th´eor`eme de PerronFrobenius-Ruelle complexe permet de voir que cette dimension varie r´eel-analytiquement avec c.

3. Applications num´eriques La formule de Bowen permet de fabriquer facilement un algorithme de calcul num´erique des dimensions de Hausdorff des ensembles de Julia de la cardio¨ıde principale. Il suffit de remplacer dans la formule la pression par son approximation `a l’ordre n. Malheureusement, comme la th´eorie nous l’indique, la convergence de cette suite vers la pression est tr`es lente (de l’ordre de 1/n) et donc pour avoir la dimension avec disons deux d´ecimales, il nous faut remplacer la pression par une somme de 2100 termes, ce qui est incalculable ! Dans [BZ], nous avons contourn´e cette difficult´e en employant une m´ethode de type Monte-Carlo. Voici quelques r´esultats num´eriques obtenus par cette m´ethode. on observe que la dimension se comporte bien sur l’axe des x au voisinage de 14 et de − 34 ; ce fait a ´et´e d´emontr´e rigoureusement dans [BZ] en utilisant la th´eorie de Denker-Urbanski (voir le chapitre sur les transitions de phase). ` PANORAMAS ET SYNTHESES 4

−−−−−−−−−− −−−−−−→

4. LA FORMULE DE MANNING

73









−−−− −−−−−−−−−−−−−−−−− −−−−−−→ 1 0 − 43 4 Je conclus par une remarque sur ce qui se passe `a droite en 14 . Du point de vue topologique il y a une discontinuit´e dans la variation de l’ensemble de Julia tr`es nette sur ces dessins d’ordinateur :

Ceci est dˆ u au ph´enom`ene d’implosion parabolique. L’´etude thermodynamique de ce ph´enom`ene reste `a faire et est en cours ; comme pour la topologie, on peut montrer (voir [DSZ]) que la dimension de Hausdorff pr´esente une discontinuit´e `a droite au point 14 .

4. La formule de Manning Il reste un point `a v´erifier apr`es le dernier paragraphe : c’est de s’assurer que la fonction c → dimH (Jc ) n’est pas constante ´egale `a 1, ce qui rendrait toute cette ´etude passablement vide ! Pour le voir, nous allons suivre une voie qui n’est pas la voie habituelle, mais qui nous permettra de d´emontrer une tr`es belle formule en utilisant beaucoup de notions des chapitres pr´ec´edents. Consid´erons un r´epulseur de Cantor (f, V, J). Soit µ une mesure de probabilit´e bor´elienne invariante par f , (c’est-`a-dire par le d´ecalage) sur J ; on d´efinit la mesure de Hausdorff de µ comme la borne inf´erieure des dimensions de Hausdorff des sousensembles bor´eliens E de J tels que µ(E) = 1. Th´eor`eme (Manning [Man]). — Si µ est ergodique et si son exposant de Lyapounov  log |f | dµ = χµ n’est pas nul, alors dimH (µ) = hµ /χµ (on rappelle que hµ est l’entropie de µ ). ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

74

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

Preuve. — Observons tout d’abord comme on l’a d´ej`a fait que log |(f n ) | = Sn (log |f |) ; le th´eor`eme ergodique de Birkhoff implique alors que log |(f n ) |/n tend vers χµ µ-presque partout. De la mˆeme fa¸con, le th´eor`eme de Shannon-McMillan implique que −

  1 log µ(x1 · · · xn ) n

tend µ-presque partout vers hµ . Soit alors E un sous-ensemble de J tel que µ(E) = 1 et tel que les deux convergences ci-dessus ont lieu pour tout x ∈ E. Montrons que dimH (E) ≤ d = hµ /χµ , ce qui prouvera que dimH (µ) ≤ d. Pour ce faire, il suffit de montrer que dimH (E) ≤ d+- pour tout - positif. Soit donc - positif et Cj les cylindres contenant les points de E maximaux (i.e. n minimal) tels que n ≥ N `a d´efinir et     log |(f n ) | − nχµ  + − log(µ(x1 · · · xn )) − nhµ  ≤ ndans E ∩ Cj . Soient α > 0 et N assez grand pour que tout cylindre d’ordre n ≥ N soit de diam`etre < α. On a alors, si η > 0 est `a d´efinir, Λα d+η (E) ≤

 j

≤C

diam(Cj )d+η ≤ C



  (f n ) (cj )−d−η j

e

n(9−χµ )(d+η)

≤C

Cj =x1 ···xn

≤C



e

n(9+9(d+η)−ηχµ )



e−nhµ en(9(d+η)−ηχµ )

Cj =x1 ···xn

µ(x1 · · · xn ) ≤ C

Cj =x1 ···xn

pour le choix de η = -(1 + d)/(χµ − -). Dans cette suite d’in´egalit´es, cj d´esigne un point de E ∩ Cj et la derni`ere in´egalit´e d´ecoule du fait que les Cj sont deux `a deux disjoints. De tout ceci on d´eduit que dimH (E) ≤ d + η puis le r´esultat cherch´e en faisant tendre - vers 0. Pour d´emontrer l’in´egalit´e dans l’autre sens, on utilise d’abord le th´eor`eme d’Egorov : si E est un ensemble de mesure 1, on peut trouver un ensemble F ⊂ E tel que µ(F ) ≥ 12 et tel que les deux convergences vues plus haut soient uniformes sur F . Pour tout x de F et tout - > 0, il existe alors une constante C9 > 0 telle que, pour tout n ≥ 0,   µ(x1 · · · xn ) ≤ C9 en(−hµ +9) (f n ) (x) ≤ C9 en9+nχµ Consid´erons `a pr´esent un disque D(x, r) avec x ∈ F . Soit n le plus petit entier tel que r |(f n ) (x)| ≥ c, o` u c est une constante qui sera d´etermin´ee plus tard ; alors 1 r |(f n ) (x)| ≤ Kc et l’on choisit c tel que Kc/λ < 10 (dist(f n (x), J)) o` u λ est la constante donn´ee par Koebe ;    Kc   Kc  (f −n ) (f n (x)) ≥ r. diam f −n D f n (x), ≥λ λ λ ` PANORAMAS ET SYNTHESES 4

5. DIMENSION DES ENSEMBLES DE JULIA DE

z2 + c

75

Ainsi donc     Kc  ≤ µ(x1 · · · xn ) ≤ C9 en(−hµ +9) ≤ e−ndχµ +n9 µ D(x, r) ≤ µ f −n D(f n (x), λ et, si η = -/χµ , cette derni`ere expression est encore plus petite que 

d−η C9 en(9−ηχµ ) ≤ Crd−η . |(f n ) (x)|

Le lemme de Frostmann (voir appendice) implique alors que dimH (F ) ≥ d − η et le th´eor`eme suit en faisant tendre - vers 0. Exemple. — On se place dans le cas du polynˆome z 2 + c avec c dans la cardio¨ıde principale ; comme on l’a vu, il d´efinit un r´epulseur conforme conjugu´e `a z 2 sur l’ensemble de Julia. Par formalisme thermodynamique, il existe une mesure (de Gibbs) d’entropie maximale, soit ν, et hν = log 2. Par ailleurs, l’exposant de Lyapounov de ν est donn´e par, Φc (z) = z + · · · d´esignant la repr´esentation conforme de {|z| > 1} sur le bassin de l’infini de z 2 + c,  log(2 |Φc (z)|)

χν = ∂D

| dz| = log 2 2π

par le th´eor`eme de la moyenne pour les fonctions harmoniques ; on en d´eduit avec le th´eor`eme de Manning que la dimension de Hausdorff de ν est 1. Comparons maintenant la dimension de la mesure d’entropie maximale et la mesure de Hausdorff de l’ensemble de Julia : Th´eor`eme. — Soit ν une mesure invariante ergodique sur l’ensemble de Julia J ; alors, •

soit dimH (ν) < dimH (J),

soit ν est l’´etat d’´equilibre correspondant `a P (− dimH (J) log |P |) (auquel cas naturellement dimH (ν) = dimH (J)). •

Preuve. — Notons µ l’´etat d’´equilibre associ´e `a P (− dimH (J) log |P |), c’est-`a-dire l’unique mesure invariante ´equivalente `a la mesure de Hausdorff dans la dimension d = dimH (J). Si ν = µ, le principe variationnel implique que hν − dχν < hµ − dχµ = 0 et par cons´equent, par le th´eor`eme de Manning, dimH (ν) = hν /χν < d.

5. Les ensembles de Julia de z 2 + c sont de dimension > 1 si c = 0 dans la cardio¨ıde principale Supposons le contraire et montrons que l’ensemble de Julia est n´ecessairement un cercle. Soit donc c dans la cardio¨ıde, tel que la dimension de Hausdorff de Jc soit ´egale `a 1. Par les r´esultats que l’on a vus concernant les r´epulseurs conformes (la mesure ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

76

en dimension est finie), Jc est une courbe de Jordan rectifiable et par cons´equent la repr´esentation conforme Φc du compl´ementaire du disque unit´e sur le bassin de l’infini de z 2 +c est telle que Φ c appartient `a l’espace de Hardy H 1 ; en particulier, log Φ c (r eiθ ) converge presque partout lorsque r tend vers 1. Par ailleurs la repr´esentation Φc v´erifie l’´equation fonctionnelle Φc (z 2 ) = Φc (z)2 + c ce qui prouve, en d´erivant, que, b(z) d´esignant la fonction holomorphe b(z) = log

Φc (z) , z

on a l’identit´e log Φ c (z) =

(*)



n

b(z 2 )

n≥0

qui d´ecoule de la formule log Φ c (z 2 ) − log Φ c (z) = b(z). D’autre part, si Jc est de dimension 1, les r´esultats du paragraphe 1 impliquent que la mesure d’entropie maximale co¨ıncide avec l’´etat d’´equilibre associ´e `a − log |P | ; par le formalisme thermodynamique, il existe une fonction γ h¨old´erienne sur le cercle unit´e telle que   − log 2 = − log 2|Φc (z)| + γ(z 2 ) − γ(z) et donc log(|Φc (z)|) = γ(z 2 ) − γ(z) sur {|z| = 1}. Mais comme par ailleurs on a       logΦc (z) = logΦ c (z 2 ) − logΦ c (z) presque partout, n´ecessairement log |Φ c (z)| = γ(z) presque partout. En particulier, c’est une fonction continue. Montrons que cela n’est compatible avec (*) que si b est identiquement nulle. Pour ce faire, il suffit de montrer que la condition (*) implique que log |Φ c (z)| ne peut appartenir `a L2 ({|z| = 1}). −n

Soit r = 22

; estimons la norme L2 de log |Φ c (r eiθ )| ; par le th´eor`eme de Koebe,   b(z) ≤ C |z|

si |z| ≥ 2 et par cons´equent    k    b z 2  ≤ C.  k≥n ` PANORAMAS ET SYNTHESES 4

´ 6. DEVELOPPEMENT DE LA DIMENSION DE HAUSDORFF

77

n−1  k Il reste `a minorer  b(r ei 2 θ )L2 . Pour ce faire, on utilise tout d’abord le fait que k=0

la fonction b est h¨old´erienne dans le disque : n−1  n−1     i 2k θ    i 2k θ  − b re b e   ≤ n(1 − r)α ≤ Cn2−nα . k=1

k=1

Finalement,   n−1      i2n θ  log Φ c (r eiθ ) 2 ≥ b e   L (dθ)

L2 (dθ)

k=0

− C.

On termine par un argument de presque orthogonalit´e ; l’int´egrale de b sur le cercle est nulle : les propri´et´es spectrales de l’op´erateur de Ruelle associ´ees ´etudi´ees dans le chapitre correspondant montrent que   



k



b( ei 2 θ ) ¯b( ei 2 θ ) 0

dθ   ≤ Cλ|k−)| 2π

pour un λ ∈ ]0, 1[ et l’on en d´eduit facilement que  n−1  k   b( ei2 θ ) 

L2

k=1

√ ≥ b2 n − C

et la contradiction cherch´ee.

6. D´eveloppement a` l’ordre 2 en 0 de la dimension de Hausdorff de l’ensemble de Julia de z 2 + c Appelons d(c) cette dimension ; on a vu aux chapitres pr´ec´edents qu’il s’agit d’une fonction r´eelle-analytique de c dans la cardio¨ıde principale qui atteint un minimum strict en 0. Nous nous proposons dans ce dernier paragraphe de pr´eciser ce th´eor`eme en d´emontrant le th´eor`eme suivant, dˆ u `a Ruelle [Ru2] : Th´eor`eme. — Au voisinage de 0, on a :  2 |c| + o |c| . 4 log 2 2

d(c) = 1 +

Preuve. — Comme le lecteur pouvait s’en douter, ce calcul repose sur celui des deux premi`eres diff´erentielles de la fonction pression. Plus pr´ecis´ement, on se place sur X = AN avec A = {1, . . . , m} (dans notre cas m = 2) et on consid`ere une fonction f ∈ Λδ (X) normalis´ee par la condition Lf (1) = 1. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

78

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

On a vu pr´ec´edemment que la fonction ϕ →  P (ϕ) est r´eelle-analytique au voisinage de f . Soit m la mesure d’´equilibre de m, i.e. l’unique mesure de probabilit´e sur X telle que L∗f (m) = m. Proposition 1. — La diff´erentielle de P : Λδ (X) → C en f est donn´ee par  P (f ) · g = g dm. X

Preuve. — On a d´ej`a vu que l’on peut trouver, si s est assez petit, δ > 0 et une fonction w(s) = w(s, ·) ∈ Λδ (X) telle que s → w(s) soit holomorphe, w(0) = 1 et telle que pour tout s, w(s)  soit un vecteur propre de Lf +sg pour la valeur propre exp{P (f + sg)}. Comme w(0) dm = 1, on peut supposer que pour tout s, on ait  eduit, et on s’en servira plus loin, que X w(s) dm = 1. On en d´  w (0) dm = 0. X

Appelons, pour simplifier, ϕ(s) = P (f + sg) qui est analytique en 0. On a alors   Lf +sg w(s) = eϕ(s) w(s) et, en diff´erentiant, (1)

    d  Lf +sg w(s) + Lf +sg w (s) = ϕ (s) eϕ(s) w(s) + eϕ(s) w (s). ds

De l’identit´e (h est une fonction de Λδ ) Lf +sg (h)(x) =



ef (y)+sg(y) h(y)

T (y)=x

on d´eduit facilement (2)

 d  Lf +sg = Lf +sg ◦ Mg ds

o` u Mg repr´esente l’op´erateur de multiplication par g. En regroupant (1) et (2), on obtient successivement pour tout s, puis pour s = 0 (on se rappelle ´egalement que w(0) = 1)       Lf +sg Mg (w) (s) + Lf +sg w (s) = ϕ (s) eϕ(s) w(s) + eϕ(s) w (s), (3)  L (g) + L (w (0)) = ϕ (0)1 + w (0). f f ` PANORAMAS ET SYNTHESES 4

´ 6. DEVELOPPEMENT DE LA DIMENSION DE HAUSDORFF

79

L’int´egration de cette derni`ere ´egalit´e par rapport `a m implique alors ϕ (0) =

 g dm X

et par suite la proposition 1. Proposition 2. — Si g est dans Λδ (X), on a : 1 n→∞ n

P (0) · (g, g) = lim

   2 Sn (g) − n g dm dm, X

X

l’existence de la limite d´ecoulant de la preuve. Preuve. — Avec les notations de la proposition pr´ec´edente, on a P (0) · (g, g) = ϕ (0). Pour calculer cette derni`ere d´eriv´ee, on d´erive (3), ce qui donne :       Lf +sg ◦ Mg2 w(s) + 2Lf +sg ◦ Mg w (s) + Lf +sg w (s) = ϕ (0) eϕ(s) w(s) + ϕ (s)2 eϕ(s) w(s) + 2ϕ (s) eϕ(s) w (s) + eϕ(s) w (s), puis, en faisant s = 0,     Lf (g 2 ) + 2Lf gw (0) + Lf w (0) = (ϕ (0) + ϕ (0)2 )1 + 2ϕ (0)w (0) + w (0). Comme plus haut, on ´evite le calcul de w (0) en int´egrant par rapport `a dm : 

 g 2 dm + 2

X

gw (0) dm = ϕ (0) +

X



2 g dm

.

X

L’ignorance de w (0) semble alors faire ´echouer le calcul. Pour contourner cette derni`ere difficult´e, on reprend tous les calculs avec Lf +sg remplac´e par Lnf+sg = LSn (f )+sSn (g) , ce qui, compte tenu du fait que P (Sn (f ) + sSn (g)) = nP (f + sg), donne : ϕ (0) =

1 n

 Sn (g)2 dm + X

2 n



Sn (g)w (0) dm − n

X



2 g dm

.

X

Mais, par le th´eor`eme ergodique, le deuxi`eme terme du second membre tend vers 0 quand n tend vers ∞ et la proposition 2 s’en d´eduit. D’apr`es les r´esultats d´emontr´es aux chapitres pr´ec´edents, la fonction d(c) v´erifie l’´equation   P −d(c) log |2Φc | = 0, ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

´ ˆ CHAPITRE 6. ITERATION DES POLYNOMES QUADRATIQUES

80

o` u Φc d´esigne la repr´esentation conforme de C \D sur le domaine ext´erieur de l’ensemble de Julia Jc qui conjugue z 2 en z 2 + c. On a ici naturellement identifi´e X et le cercle unit´e via le d´eveloppement dyadique. On proc`ede alors par identification des coefficients : on pose   F (d, x, y) = P −d log |2Φx+iy | , d(x + iy) = 1 + αx + βy + γx2 + δy 2 + -xy + o(x2 + y 2 ). Les d´eriv´ees partielles ´etant toutes ´evalu´ees en (1, 0, 0), un calcul sans surprise donne alors :  ∂F   ∂F 1 ∂2F  ∂F +y + x2 γ + 0 = F d(x, y), x, y = x ∂x ∂y ∂d 2 ∂x2  ∂F   ∂F 1 ∂2F ∂2F  + xy + + + o(x2 + y 2 ) + y2 δ ∂d 2 ∂y 2 ∂d ∂x∂y et par suite ∂F 1 ∂ 2 F  ∂F 1 ∂ 2 F  ∂F ∂ 2 F  ∂F ∂F = 0, = 0, γ = − , δ = − , = − . ∂x ∂y 2 ∂x2 ∂d 2 ∂y 2 ∂d ∂x ∂y ∂d Il ne nous reste plus qu’`a calculer les d´eriv´ees partielles de F . Le calcul de ∂F/∂d est ´el´ementaire : F (d, 0, 0) = P (−d log 2) = (1 − d) log 2 et par cons´equent ∂F = − log 2. ∂d Afin d’effectuer le calcul des d´eriv´ees d’ordre 2, il nous faut donner un d´eveloppement `a l’ordre 2 de c → Φc qui est, on l’a vu, une fonction analytique. On peut donc ´ecrire Φc (z) = z + a1 (z)c + a2 (z)c2 + · · · et l’´equation fonctionnelle Φc (z 2 ) = Φc (z)2 + c implique les identit´es (4)

a1 (z 2 ) = 2za1 (z) + 1,

a1 (z 2 ) + 2za2 (z) = a2 (z 2 ),

d’o` u l’on tire (5)

a1 (z) = −z

 n≥0

1 · 2n+1 z 2n

Le calcul de a2 est plus compliqu´e est s’av`erera en fait inutile. Il importe juste de noter que  2π a2 ( eit ) dt = 0, 0 ` PANORAMAS ET SYNTHESES 4

´ 6. DEVELOPPEMENT DE LA DIMENSION DE HAUSDORFF

81

ce qui se voit facilement `a partir de (4). On a alors, pour |z| = 1,     Φc (z) = 1 + b(z)c + z¯a2 (z)c2 + · · ·,

b(z) = z¯a1 (z),

d’o` u le d´eveloppement 2 2        2   2 log Φc (z) = Re b(z)c + 12 b(z) |c| + Re z¯a2 (z)c2 − Re(b(z)c + o |c| . Injectons `a pr´esent ce r´esultat dans le calcul du d´eveloppement de F (d, x, y) :  2 2     F (d, x, y) = P − log 2 + Re(b(z)c − 12 b(z) |c| − Re z¯a2 (z)c2  2    2  + Re(b(z)c) − h log(2) + hRe b(z)c + o h2 + |c| ) o` u l’on a pos´e d = 1 + h et c = x + iy. On utilise maintenant les propositions 1 et 2 avec f = − log 2 qui est bien normalis´ee et dont la mesure m associ´ee est la mesure de Lebesgue normalis´ee sur le cercle : F (1 + h, x, y) = P (− log 2)g + 12 P (− log 2)(g, g) + o(h2 + x2 + y 2 ) o` u    2 2 g = Re(bc) − 12 |bc| − Re z¯a2 (z)c2 + Re(bc)2 − h log 2 + hRe(bc) + o h2 + |c| . On observe alors que 

1 2

   Re(bc) dm = Re z¯a2 (z)c2 dm = 0,   |bc|2 dm = Re(bc)2 dm = 23 ·

En posant b = b1 + ib2 , on en d´eduit :   2 1  lim F (1 + h, x, y) = −h log 2 + x Sn (b1 ) dm n→∞ n    2 1  Sn (b2 ) dm + o(x2 + y 2 + h2 ) + y 2 lim n→∞ n 1 2 = −h log 2 + 4 x + 14 y 2 + o(x2 + y 2 + h2 ). 2



On a donc ∂2F 1 ∂2F = = , ∂x2 ∂y 2 2

∂2F =0 ∂x∂y

puis que γ = δ = 1/(4 log 2), - = 0 et le th´eor`eme cherch´e. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

Chapitre 7 TRANSITIONS DE PHASE

1. Les transitions de phase comme ph´enom`enes naturels Rien n’est plus naturel et plus commun´ement observable que les changements de phase d’un corps. Je ne surprendrai personne en affirmant que sous la pression athmosph´erique du niveau de la mer l’eau se solidifie `a 0 ◦ C et se vaporise `a 100 ◦ C. De fa¸con plus g´en´erale tout corps chimique peut exister sous les trois phases solide, liquide et gazeuse. Il peut mˆeme arriver que le nombre de phases soit plus grand ; un corps solide peut par exemple se pr´esenter sous diff´erentes formes cristallines. Nous nous proposons de discuter dans ce chapitre du probl`eme de la transition entre les phases. La premi`ere remarque que l’on peut faire est qu’il s’agit d’un ph´enom`ene discontinu ; l’eau g`ele brutalement `a 0 ◦ C, c’est-`a-dire qu’on ne peut en aucun cas affirmer qu’`a l’approche du point de cong´elation l’eau ´epaissit progressivement jusqu’`a devenir solide. La deuxi`eme remarque est qu’`a la temp´erature de cong´elation l’eau et la glace peuvent coexister en proportions indiff´erentes. C’est surtout de ce dernier point qu’il sera question dans ce chapitre, la discontinuit´e du ph´enom`ene ´etant, de l’aveu mˆeme des physiciens, tr`es mal comprise. L’approche classique du ph´enom`ene de transition de phase est la repr´esentation du r´eseau des isothermes de Clapeyron. Concr`etement on enferme un gaz dans un r´ecipient et on le comprime `a temp´erature constante ; on mesure alors la variation de la pression du gaz en fonction du volume. On observe alors exp´erimentalement les faits suivants : 1) Il existe une temp´erature Tc , dite temp´erature critique, telle que si la temp´erature du r´ecipient est maintenue constante `a une temp´erature T > Tc alors la r´eduction du volume s’accompagne d’un accroissement ind´efini et r´egulier de la pression. En d’autres termes, dans le plan (V, P ), l’isotherme correspondant `a une valeur de T sup´erieure `a la temp´erature critique est le graphe d’une fonction tr`es r´eguli`ere (en fait r´eelle-analytique) de V . 2) Si T < Tc et si l’on diminue le volume, la pression va r´eguli`erement croˆıtre

84

CHAPITRE 7. TRANSITIONS DE PHASE

jusqu’`a ce que l’on atteigne une valeur V+ `a partir de laquelle se produisent deux ph´enom`enes : tout d’abord le gaz se condense ce qui signifie que de plus en plus de gouttes de liquide apparaissent, et ensuite la pression reste constante, et ceci jusqu’`a ` partir de cette valeur, la pression u le gaz est compl`etement liquide. A une valeur V− o` augmente alors de nouveau r´eguli`erement avec la diminution de volume, le corps restant liquide. Il est `a noter que l’exp´erience devient alors difficle `a r´ealiser car la diminution de volume d’un liquide s’accompagne d’une tr`es forte augmentation de la pression. L’intervalle [V− , V+ ] s’appelle le palier de liqu´efaction. 3) Si T = Tc , l’isotherme est le graphe d’une fonction d´ecroissante pr´esentant un point d’inflexion au point Vc , le volume critique.

−−−−−−−−−−−−−−−−−− −−−−− −−−−→

p

T < Tc T = Tc T > Tc

−−−−−−−−−−−−−−−−−−−−−−−−−− −−− −−− −− −− → 0 V− V Vc V+ (La r´egion situ´ee en dessous de la courbe pointill´ee s’appelle le domaine de coexistence et la courbe pointill´ee la courbe de saturation.) Il est clair que pour expliquer th´eoriquement les transitions de phase, la loi des gaz parfaits est totalement inefficace, les isothermes dans ce cas ´etant toutes des hyperboles. Ceci est dˆ u au fait que la loi des gaz parfaits n´eglige totalement les interactions entre particules alors que celles-ci ont une grande influence dans le cas o` u le gaz est fortement comprim´e. Le mod`ele de Van der Waals est un mod`ele simple qui tient compte de ces forces ; l’´equation d’´etat correspondante est p=

A RT − 2· V −B V

Si T > Tc = 8A/(27BR), la pression est une fonction d´ecroissante du volume alors que si T < Tc , la pression d´ecroˆıt, croˆıt, puis d´ecroˆıt `a nouveau. Le mod`ele ne rend donc pas compte du palier de liqu´efaction, ce qui est normal, puiqu’il ne tient pas compte de la diff´erence entre les ´etats, notamment en ce qui concerne la densit´e. Nous justifierons plus loin la construction de Maxwell : la partie oscillante doit ˆetre remplac´ee par un palier plac´e en sorte que les deux aires hachur´ees soient ´egales (figure page suivante). ` PANORAMAS ET SYNTHESES 4

85

−−−−−−−−−−−−−−−−→

´ ` 1. LES TRANSITIONS DE PHASE COMME PHENOM ENES NATURELS

p

−−−−−−−−−−−−−−−−−−−−−−−−−− −−− −−− −− −− → 0 V− V V+

−−−−−−−−−−−−−−−−→

La partie oscillante de la courbe a n´eanmoins une interpr´etation physique, surtout pr`es des points anguleux. Elle correspond `a des ´etats m´etastables de la mati`ere. Le lecteur me pardonnera de raconter encore une anecdote personnelle : dans ma jeunesse, j’habitais les r´egions froides de l’est de la France o` u, durant l’hiver, il n’´etait pas rare d’observer des temp´eratures de −10 ◦ C `a −20 ◦ C. Lors d’un de ces hivers rigoureux nous avions oubli´e sur le balcon une bouteille de limonade ; tr`es ´etonn´e de la voir intacte malgr´e la temp´erature sib´erienne, je la rentrai `a l’int´erieure o` u elle m’a litt´eralement explos´e dans les mains. Je venais d’ˆetre le t´emoin d’un ph´enom`ene de surfusion. Le liquide ´etait dans un ´etat m´etastable en dessous de la temp´erature de cong´elation ; le simple fait de l’avoir boug´e l’a remis dans son ´etat stable, c’est-`a dire solide. Or il se trouve que l’eau est plus dense que la glace : il y a donc eu brutale augmentation de volume et donc explosion de la bouteille. Cette anecdote concerne le changement liquide solide, qui ne diff`ere pas beaucoup de la transition liquide gaz : il y a l`a aussi un palier de cong´elation sur lequel coexistent les deux ´etats solide et liquide. La troisi`eme transition de phase est la sublimation,le passage direct de l’´etat solide `a l’´etat gazeux, que l’on observe par exemple avec la mousse carbonique. Si l’on reporte dans le plan (T, p) les points en lesquels peuvent coexister plusieurs ´etats d’un corps donn´e, on obtient un diagramme d’´etat qui a l’allure suivante (diagramme d’´etat de l’eau) :

p

c

liquide solide vapeur

−−−−−−−−−−−−−−−−−−−−−−−−−− −−− −−− −− −− → 0 T Les deux points remarquables de ce diagramme sont t, le point triple qui est le seul o` u les trois ´etats coexistent et C = (Tc , pc ) le point critique que nous avons d´ej`a rencontr´e. L’existence d’un point critique rend les notions de liquide et de gaz assez floues puisqu’il est possible de passer de l’un `a l’autre des deux ´etats de fa¸con continue. ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

86

CHAPITRE 7. TRANSITIONS DE PHASE

2. Interpr´etation th´eorique des transitions de phase Nous avons d´ej`a vu que pour un syst`eme isol´e, un ´etat d’´equilibre est un ´etat qui maximise l’entropie. Pour un syst`eme de pression et de temp´erature fix´ees, c’est-`a-dire par exemple pour les ph´enom`enes naturels `a pression et temp´erature atmosph´eriques on peut facilement montrer que les ´etats d’´equilibre sont ceux qui minimisent l’´energie libre de Gibbs G(p, T ) = U − T S + pV. ` une pression et une temp´erature donn´ees on peut consid´erer deux valeurs G1 (p, T ) et A G2 (p, T ) de cette ´energie libre correspondant `a deux ´etats (liquide-solide par exemple) et la phase stable correspondra `a la plus petite de ces deux valeurs. La courbe dans le plan des (p, T ), G1 = G2 est alors la courbe d’´equilibre entre les deux phases ; si l’on consid`ere enfin la fonction G3 (p, T ) correspondant `a la phase gazeuse, on trouve le point triple en r´esolvant les ´equations G1 (p, T ) = G2 (p, T ) = G3 (p, T ). Ce raisonnement physique permet de justifier la construction de Maxwell ; en effet on a tout d’abord dG = −S dT + V dp ; si on int`egre cette forme sur le circuit γ = (A → (segment)B → (courbe)A)  et que l’on observe que ce circuit est isotherme on obtient γ V dp = 0 ce qui signifie pr´ecis´ement l’´egalit´e des deux aires. Passons maintenant au cas qui nous int´eresse plus pr´ecis´ement dans ce travail, `a savoir la thermodynamique des r´eseaux. Ce cas correspond `a un syst`eme de volume fix´e reli´e `a un r´eservoir de temp´erature. Les ´etats d’´equilibre sont donc ceux qui minimisent l’´energie libre de Helmholtz F = U − TS Nous sommes alors ramen´es `a un probl`eme math´ematique bien pos´e ; trouver une mesure invariante qui minimise la quantit´e *µ, ϕ+ − T S(µ) o` u ϕ d´esigne le potentiel d’interactions. En langage d’analyse convexe, on dit que l’on a affaire `a une transform´ee de Legendre. Plus g´en´eralement, si ψ est une fonction d´efinie et continue sur un convexe compact d’un espace topologique E en dualit´e avec F , on d´efinit la transform´ee de Legendre de ψ comme l’application ψ ∗ : F → R d´efinie par   y −→ inf *y, x+ − ψ(x) . x∈K

Ainsi donc l’´energie libre apparaˆıt comme la transform´ee de Legendre de l’entropie (multipli´ee par la temp´erature). Imaginons tout d’abord le cas extrˆemement simple d’une fonction affine d’une variable r´eelle (ψ(t) = αt + β sur l’intervalle [a, b]) ; un calcul ´el´ementaire montre le ` PANORAMAS ET SYNTHESES 4

3. TRANSITION DE PHASE PARABOLIQUE

87

graphe de ψ ∗ pr´esente un angle pr´ecis´ement au point α qui est l’unique point y en lequel la borne inf´erieure d´efinissant ψ ∗ (y) est atteinte en plusieurs points x. Naturellement le cas qui nous occupe est beaucoup plus compliqu´e mais la philosophie reste la mˆeme : Les points (T, p) d’´equilibre entre deux phases sont les points (T, p(T )) (on rappelle que dans le cas des r´eseaux la pression est proportionnelle `a l’´energie libre) correspondant `a une singularit´e de la fonction p. Pour ˆetre plus pr´ecis, ce sont les points autour desquels la fonction p n’est pas r´eelle-analytique. Toute l’´etude accomplie dans les chapitres pr´ec´edents montre que pour un gaz en r´eseau unidimensionnel avec potentiel d’interaction h¨old´erien il n’y a pas de transition de phase. Ainsi en est-il pour l’action de Pc (z) = z 2 + c sur son ensemble de Julia si c appartient `a la cardio¨ıde principale. Le paragraphe qui suit a pour objet de montrer que pour c = 14 (au bord de la cardio¨ıde) par contre, il y a transition entre deux phases.

3. Transition de phase parabolique Nous revenons `a l’it´eration des polynˆomes quadratiques et nous nous int´eressons `a la valeur c = 14 qui correspond `a l’extr´emit´e du rebroussement de la cardio¨ıde principale. Il est bien connu depuis Fatou et Julia, et nous l’admettrons, que l’ensemble de Julia correspondant est une courbe de Jordan qui pr´esente, `a la diff´erence des ensembles de Julia dans la cardio¨ıde, des rebroussements en tous les points d’argument externe dyadique (i.e. les images par la repr´esentation Φ1/4 des points du cercle d’argument (calcul´e en nombre de tours) dyadique).

La repr´esentation Φ = Φ1/4 conjugue topologiquement l’action de z 2 sur le cercle unit´e `a celle de z 2 + 14 sur le bord du chou-fleur . En particulier la dynamique peut toujours ˆetre symbolis´ee par l’action du d´ecalage sur les mots infinis sur l’alphabet ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

88

CHAPITRE 7. TRANSITIONS DE PHASE

`a deux ´el´ements. Nous consid`ererons d’ailleurs dans la suite la partition de Markov pour laquelle commenceront par 1 les points correspondant au demi-cercle inclus dans le demi-plan {y > 0} et par 0 les autres. Avec cette partition le point correpondant au mot ne comportant que des 1 (ou que des 0) est 12 , le point fixe indiff´erent, et les mots dyadiques sont les images it´er´ees inverses de ce point. La dynamique dans le choufleur est de type parabolique, tous ses points ´etant attir´es par 12 , et en particulier le point critique 0 : l’ensemble de Julia n’est donc pas un r´epulseur conforme et les r´esultats valables pour les valeurs de c `a l’int´erieur de la cardioide cessent de l’ˆetre en 14 . N´eammoins la fonction ϕ = − log |2Φ| est continue sur le cercle et par cons´equent on peut d´efinir pour t ∈ R la pression π(t) = P (tϕ) et le principe variationnel est encore v´erifi´e. De plus il existe toujours des ´etats d’´equilibre, c’est `a dire des mesures invariantes qui r´ealisent le maximum dans le principe variationnel. La diff´erence essentielle avec le cas hyperbolique est l’on est pas assur´e de l’unicit´e de ces ´etats d’´equilibre. Le th´eor`eme suivant, dˆ u `a Denker et Urbanski [DU1], prouve l’existence d’une transition de phase : Th´eor`eme. — La fonction π est d´ecroissante sur R et positive ou nulle. Si s d´esigne la borne sup´erieure des dimensions des mesures invariantes ergodiques sur J, on a π > 0 sur ] − ∞, s[ et π(t) = 0 si t ≥ s. Preuve. — Le fait que π soit d´ecroissante r´esulte du principe variationnel et de l’existence d’une mesure d’´equilibre. Par ailleurs la masse de Dirac en 12 , soit δ, est invariante et, 12 ´etant un point fixe indiff´erent, hδ = χδ = 0 ce qui implique que π(t) ≥ hδ − tχδ = 0. Si t < s il existe une mesure invariante µ de dimension > t. On remarque ici que l’ensemble de Julia J1/4 est ext´erieur au disque centr´e en 0 et de rayon 12 ; si une mesure invariante a un exposant de Liapounov nul, c’est donc n´ecessairement la mesure δ. On en d´eduit que χµ > 0 et la formule de Manning implique que π(t) > 0. Supposons r´eciproquement que π(t) > 0. Il existe alors une mesure d’´equilibre µ pour tϕ et χµ > 0 : par la formule de Manning de nouveau, s > t. Pour ˆetre tout `a fait complet montrons que s n’est autre que la dimension de Hausdorff de J. L’op´erateur de Ruelle Lt = Ltϕ est bien d´efini sur C(X) : on appelle mesure t-conforme toute mesure de probabilit´e sur X qui est point fixe de l’adjoint L∗t . Une mesure ω (vue comme une mesure sur l’ensemble de Julia) est t-conforme si et seulement si pour tout bor´elien A ⊂ J1/4 sur lequel le polynˆome est injectif on a   ω P (A) =



|P |t dω.

A

Dans le cas hyperbolique, la seule valeur de t pour laquelle il existe des mesures tconforme est la dimension de Hausdorff de l’ensemble de Julia et la seule mesure conforme est alors la mesure de Hausdorff normalis´ee : ceci d´ecoule du formalisme thermodynamique. ` PANORAMAS ET SYNTHESES 4

3. TRANSITION DE PHASE PARABOLIQUE

89

Dans le cas qui nous occupe, si m est une mesure t-conforme, le th´eor`eme de Koebe implique que m(C) est comparable `a diam(C)t si C est un cylindre ne se terminant pas par disons quatre 0 ou quatre 1 cons´ecutifs. On en d´eduit aussitˆot que la mesure Ht de Hausdorff en dimension t est absolument continue par rapport `a m ce qui implique que t ≥ dimH (J). Lemme. — Pour tout t ≥ s, il existe une mesure t-conforme.  Preuve. — Posons Λ(µ) = L∗t (µ)/ Lt (1) dµ. C’est une application continue de M (X) dans lui-mˆeme. Elle admet donc un point fixe par le th´eor`eme  de Schauder-Tychonov. Il existe donc µ ∈ M (X) telle que L∗t (µ) = βµ avec β = 1/ Lt (1) dµ. Mais π(t) = 0 et donc log(Lnt (1))/n tend vers 0 uniform´ement sur X ; on en d´eduit que  Lnt (1) dµ = eo(n) = β n =⇒ β = 1 X

puis que µ est t-conforme.

−−−−−−−−−−−−−−−−→

Le lemme et ce qui le pr´ec`ede impliquent imm´ediatement que s ≥ dimH (J) et donc que s = dimH (J) puisque l’in´egalit´e inverse est ´evidente. Nous terminons par une description sans d´emonstrations de la transition de phase. Tout d’abord un th´eor`eme de Ruelle [Ru4] permet d’affirmer que la fonction π est r´eelle analytique sur ] − ∞, s[. Ensuite une analyse de la r´epulsivit´e du polynˆome au voisinage du point fixe indiff´erent permet de montrer (voir [ADU]) qu’il existe une unique mesure d-conforme o` u d est la dimension de J et que cette mesure est diffuse (sans atomes). Un r´esultat tr`es profond permet alors de montrer l’existence d’une mesure invariante µ ´equivalente `a la mesure de Hausdorff d-dimensionnelle (voir [ADU]). Son entropie est n´ecessairement > 0 ce qui prouve que l’on a affaire `a une transition de phase du premier ordre au sens de la thermodynamique : π(t)

−−−−−−−−−−−−−−−−−−−−−−−−−− −− −− −− → 0 t d( 14 )

Par ailleurs au moins deux ´etats coexistent (on peut d’ailleurs montrer [HZ] que ce sont les seuls) en d, µ et δ. Tout se passe comme si (rappelons que t est homog`ene `a 1/kT o` u T est la temp´erature) le fluide se solidifiait `a la temp´erature correspondant `a t = d.

´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

APPENDICE DIMENSION ET MESURES DE HAUSDORFF

1. Rappels admis sur la th´eorie de la mesure On appelle mesure ext´erieure sur Rn toute application µ : P(Rn ) → R+ v´erifiant : (i) E ⊂ F ⇒ µ(E) ≤ µ(F ) ; ∞ ∞   Ei ≤ µ(Ei ). (ii) µ i=0

i=1

Une telle mesure est dite de plus m´etrique si : (iii) d(E, F ) > 0 ⇒ µ(E ∪ F ) = µ(E) + µ(F ). Soit µ une mesure ext´erieure sur Rn . On d´efinit l’ensemble T des parties µmesurables par E ∈ T ⇐⇒ ∀X ⊂ Rn , µ(X) = µ(X ∩ E) + µ(X \E). Nous admettrons le r´esultat suivant, connue comme th´eor`eme de Carath´eodory : Th´eor`eme. — L’ensemble T est une tribu et µ une mesure sur T ; si de plus µ est m´etrique, alors T contient la tribu bor´elienne de Rn .

2. Mesures de Hausdorff Soit ϕ une fonction croissante continue de R dans R telle que ϕ(0) = 0. Si E est une partie de Rn , on d´efinit : u Λ9ϕ (E) = inf Λϕ (E) = lim Λ9ϕ (E) o` 9→0

{(Bi )}

∞    ϕ diam(Bi ) , i=0

la borne inf´erieure ´etant pris sur tous le recouvrements (Bi ) de E par des boules de rayon ≤ -. Remarquer que la limite existe car - → Λ9ϕ (E) est clairement croissante en -.

92

APPENDICE. DIMENSION ET MESURES DE HAUSDORFF

Proposition. — Λϕ est une mesure ext´erieure m´etrique. Preuve. — Il est ´evident que Λϕ est une fonction croissante d’ensembles. Soient maintenant (Ei )i≥0 une suite de sous-ensembles de Rn et δ, - deux r´eels positifs ; pour tout i, on consid`ere un recouvrement (Bji )j≥0 de Ei par des boules de rayon ≤ tel que ∞    ϕ diam(Bji ) ≤ Λ9ϕ (Ei ) + δ2−i−1 . j=0

Il est clair qu’alors (Bji )i,j≥0 est un recouvrement de et donc Λ9ϕ





Ei par des boules de rayon ≤ -

∞   Λ9ϕ (Ei ) + δ Ei ≤ i=0

et l’on conclut en faisant successivement tendre δ vers 0 et - vers ∞. 1 Si maintenant d(E, F ) > 0, consid´erons - < 10 d(E, F ) et (Bi ) un recouvrement de E ∪ F par des boules de rayon ≤ - ; il est ´evident que l’on peut supposer que Bi ∩ (E ∪ F ) = ∅ pour tout i et la condition sur - fait que l’on peut partitionner les Bi en deux sous-ensembles, ceux qui rencontrent E et ceux qui rencontrent F , ´etant donn´e qu’ils ne peuvent rencontrer les deux ensembles `a la fois. On en d´eduit ∞    ϕ diam(Bi ) ≥ Λ9ϕ (E) + Λ9ϕ (F ) i=0

et le fait que Λϕ est m´etrique en passant tout d’abord `a la borne inf´erieure `a gauche puis en faisant tendre - vers 0. Le cas particulier le plus important est celui o` u ϕ(t) = tα lorsque α > 0 ; on ´ecrit dans ce cas Λα = Λϕ . • Lorsque α = n, la mesure de Hausdorff associ´ ee n’est autre qu’un multiple de la mesure de Lebesgue sur Rn . C’est en effet une mesure bor´elienne invariante par translations qui assigne une valeur finie au cube unit´e [0, 1]n (exercice !). • On en d´ eduit facilement que Λα = 0 sur les bor´eliens si α > n. En effet, soit E un bor´elien ; on peut ´ecrire E = p≥0 Ep o` u Λn (Ep ) < ∞. Soient - > 0, α > n et (Bi ) un recouvrement de Ep par des boules de rayon ≤ - ; alors ∞  i=0

diam(Bi )α ≤ -α−n

∞ 

diam(Bi )n

i=0

ce qui implique Λ9α (Ep ) ≤ -n−α Λ9n (Ep ), d’o` u Λα (E) ≤ ` PANORAMAS ET SYNTHESES 4

p≥0

Λα (Ep ) = 0.

3. DIMENSION DE HAUSDORFF

93

3. Dimension de Hausdorff Si E est un bor´elien de Rn , on d´efinit sa dimension de Hausdorff par   dimH (E) = inf α > 0 ; Λα (E) = 0 , quantit´e bien d´efinie par le paragraphe pr´ec´edent, et qui appartient `a l’intervalle [0, n]. Proposition. — La dimension de Hausdorff dimH (E) est l’unique r´eel d≥ 0 tel que Λα (E) = 0 si α ≥ d et Λα (E) = +∞ si 0 ≤ α < d. Preuve. — On a Λα (E) = 0 si α > d par d´efinition mˆeme de la dimension ; si maintenant 0 ≤ α < d il existe d > β > α tels que Λβ (E) > 0 et, si (Bi ) est un recouvrement de E par des boules de rayon ≤ -, on peut ´ecrire 

diam(Bi )β ≤ (2-)β−α



diam(Bi )α =⇒ Λ9β (E) ≤ (2-)β−α Λ9α (E)

et par cons´equent Λα (E) < ∞ implique Λβ (E) = 0, ce qui est contraire aux hypoth`eses. Remarquons que dans la dimension, la mesure peut prendre toute valeur entre 0 et +∞ inclus. Par exemple E = [0, r] avec r ∈ ]0, +∞] est de dimension 1 (exercice) et Λ1 (E) = r. Il est plus difficile en revanche de construire un ensemble de dimension 1 mais de Λ1 -mesure nulle. Pour le voir on utilise le r´esultat suivant : Proposition. — Si E est un bor´elien de Rn et s’il existe C, α ≥ 0 et une mesure µ de probabilit´e sur E telle que pour tout x ∈ E et tout r > 0 on ait µ(B(x, r) ∩ E) ≤ Crα , alors dimH (E) ≥ α. Preuve. — Soient β < α, - > 0 et (Bi ) un recouvrement de E par des boules de rayon ≤ -, de sorte que :       c c , α cµ(Bi ) = c 1∪Bi dµ = 1Bi dµ ≥ diam(Bi ) ≥ C(n) C(n) E E ce qui prouve que Λ9α (E) ≥ c pour tout - et donc le r´esultat. Remarquer que l’on d´emontre en fait plus : Λα (E) > 0. Frostman a d´emontr´e une r´eciproque : si E est compact et si Λα (E) > 0, alors il existe une mesure de probabilit´e µ sur E telle que µ(B(x, r) ≤ Crα mais nous n’aurons pas besoin de ce r´esultat. Revenons `a notre exemple ; nous allons construire un compact de [0, 1] de type Cantor de mesure de Lebesgue (i.e. Λ1 ) nulle mais de dimension 1. On proc`ede par r´ecurrence ; pour tout n ≥ 0, Kn est une r´eunion de 2n intervalles disjoints Ijn de mˆeme longueur Bn et l’on passe de Kn `a Kn+1 en ˆotant `a chaque Ijn un intervalle ouvert de mˆeme centre de longueur n−1 Bn . On commence le processus avec K0 = [0, 1] et −1 et le fait que n = ∞ implique que K = Kn est de mesure nulle. Soient maintenant α < 1 et µ la mesure Cantorienne sur K, c’est-`a-dire la mesure sur K ´ E ´ MATHEMATIQUE ´ SOCIET DE FRANCE 1996

94

APPENDICE. DIMENSION ET MESURES DE HAUSDORFF

telle que µ(Ijn ) = 2−n . Soit alors x ∈ K, 1 > r > 0 ; soit n le plus grand entier tel que B(x, r) ∩ K est inclus dans une composante de Kn . On a n´ecessairement   µ B(x, r) ≤ 2−n ,

r≥

2−n Bn % 2 · n n

Mais il existe une constante C > 0 telle que 2−n ≤ C(2−n /n2 )α ≤ Crα et la proposition pr´ec´edente nous permet de conclure que dimH (K) ≥ α.

` PANORAMAS ET SYNTHESES 4

BIBLIOGRAPHIE

[ADU] AARONSON J., DENKER M., URBANSKI M. — Ergodic theory for Markov fibred systems and parabolic rationnal maps, Trans. Am. Math. Soc 337, 2 (1993). [AM] ASTALA K., MARTIN G. — Holomorphic Motions, Univ. of Helsinki, Math. report 8 (1992). [Be] BEARDON A. — The Geometry of Discrete Groups, Springer (1983). [Bo1] BOWEN R. — Hausdorff dimension of quasicircles, Publi. IHES (1979). [Bo2] BOWEN R. — Equilibrium States and the Ergodic Theory of Anosov Diffeomorphisms, Lecture Note Math. 470 (1975). [BZ] BODART O., ZINSMEISTER M. — Quelques r´esultats sur la dimension de Hausdorff des ensembles de Julia des polynˆ omes quadratiques, Fund. Math. (`a paraˆıtre). [CG] CARLESON L., GAMELIN T. — Complex Dynamics, Springer (1993). [DGS] DENKER M., GRILLENBERGER C., SYGMUND K. — Ergodic Theory on compact spaces, Lecture Note Math. 527 (1976). ´ dynamique des polynˆomes complexes, Publi. Math. [DH] DOUADY A., HUBBARD A. — Etude d’Orsay (1985). [DSZ] DOUADY A., SENTENAC P., ZINSMEISTER M. — Implosion parabolique et dimension de Hausdorff, `a paraˆıtre. [DU1] DENKER, M., URBANSKI, M. — Hausdorff and conformal measures on Julia sets with rationnally indifferent fixed point, J. London Math. Soc. 43 (1991), 107–118. ´ thermodynamique de la transition de phase [HZ] HAVARD G., ZINSMEISTER M. — Etude 1 2 pour le polynˆ ome z + 4 (`a paraˆıtre). [J] JANCOVICI B. — Thermodynamique et Physique Statistique, Ediscience. [Kh1] KHINCHIN A. — Mathematical Foundations of Statistical Physics, Dover (1949). [Kh2] KHINCHIN A. — The Mathematical Foundations of Information theory, Dover (1957). [LL] LANDAU L., LIFSHITZ E. — Statistical Mechanics, Pergamon Press (1959). [Man] MANNING A. — The dimension of the maximal measure for a polynomial map, Ann. Math. 119 (1984), 425–430. [ME] MARTIN M., ENGLAND J. — Mathematical theory of entropy, Encycl. Math. no 12, Addison Wesley (1981).

96

BIBLIOGRAPHIE

[Mi1] MILNOR J. — Dynamics in one complex variable : Introductory Lectures, preprint, Stony Brook (1991). [Mi2] MILNOR J. — Self-Similarity and hairiness in the Mandelbrot set, p. 211–250, in Computers in geometry and Topology, Lecture Notes in Pure and Applied Mathematics 114, Dekker (1992). [Mo] MOSTOW D. — Quasiconformal mappings in n-space and the rigidity of hyperbolic space forms, Publi. IHES 34 (1968), 53–104. [PP] PARRY W., POLLICOT M. — Zeta Functions and the periodic structure of Hyperbolic Dynamics, Ast´erisque 187–188 (1990). [Po1] POINCARE´ H. — M´emoire sur les groupes Klein´eens, Acta Math. 3 (1887). [Po2] POINCARE´ H. — Poincar´e Papers on Fuchsian Groups, Springer (1986). [Pom1] POMMERENKE Ch. — Univalent Functions, Vandenhoeck & Ruprecht (1975). [RS] REED M., SIMON B. — Lectures on modern mathematical physics, Academic Press (1975). [Ru1] RUELLE D. — Is our mathematics natural ? The case of equilibrium statistical mechanics, Bull. Am. Math. Soc. 19, 1 (1988), 259–268. [Ru2] RUELLE D. — Repellers for Analytic Maps, Erg. Th. Dyn. Sys. (1982). [Ru3] RUELLE D. — Thermodynamic Formalism, Encycl. Math. no 5, Addisson Wesley (1978). [Ru4] RUELLE D. — Dynamical Zeta functions for piecewise monotone maps of the interval, CRM Monograph Series (1993). [Rud] RUDIN W. — Functionnal Analysis. [Sl] SLODKOWSKI S. — Holomorphic Motions, Proc. Am. Math. Math. Soc. (1992). [W] WALTERS P. — An Introduction to Ergodic Theory, GTM Springer (1981).

` PANORAMAS ET SYNTHESES 4