194 34 15MB
French Pages 408 [406] Year 2022
Théorie statistique des champs 2
Claude Itzykson Jean-Michel Drouffe
Théorie statistique des champs2
S A V O I R S
A C T U E L S
InterEditions/Editionsdu CNRS
@ 1989, InterEditions, 25. rue Leblanc, 75015 Paris. et
Editions du CNRS, 1, Place Aristide Briand, 92195 Meudon. Tous droits réservés. Aucun extrait de ce livre ne peut être reproduit, sous quelque forme ou par quelque procédé que ce soit (machine électronique, mécanique, à photocopier, 3 enregistrer ou tout autre) s a w l’autorisation écrite préalable de InterEditions. ISBN 2-7296-0327-1 ISBN 2-222-04365-4
TABLE DES MATIERES
Avant-propos
........................................................................
IX
.....
1
1. Techniques générales ........................................................... 1.1 Définitions et notations ................................................. 1.2 Graphes connexes et cumulants ..................................... 1.3 Irréductibilité et transformation de Legendre ................ 2 Développements en série ..................................................... 2.1 Développement de haute température ........................... 2.2 Le rôle des symétries ..................................................... 2.3 Développements de basse température - cas discret ...... 2.4 Développement de basse température - cas continu ....... 2.5 Développement en champ fort ....................................... 2.6 Champs fermioniques .................................................... 3 Enumération de graphes ..................................................... 3.1 Nombres de configurations ............................................ 3.2 Graphes multiplement connexes .................................... 4 Résultats et analyse ............................................................. 4.1 Techniques d’analyse des séries ...................................... 4.2 Un exemple ................................................................... Notes ......................................................................................
1 1 6 10 16 16 21 24 27 31 31 33 33 35 39 39 43 47
Chapitre VI11 .SIMULATIONS NUMERIQUES .............
49
Chapitre VI1 . METHODES DIAGRAMMATIQUES
.
. .
.
1 Algorithmes ........................................................................... 1.1 Généralités .................................................................... 1.2 Algorithmes classiques ................................................... 1.3 Simulations microcanoniques ......................................... 1.4 Considérations pratiques ............................................... 1.4.1 Conditions aux limites ............................................. 1.4.2 Taille du réseau ....................................................... 1.4.3 Temps de thermalisation ......................................... 1.4.4 Mesure des observables ............................................
49 49 53 57 58 58 60 61 62
VI
TABLE DES MATIÈRES
1.4.5 Erreurs statistiques .................................................. 1.4.6 Paramétrisation des champs .................................... 2 Mesures .................................................................................. 2.1 Détermination des transitions ........................................ 2.2 Effets de taille finie ....................................................... 2.3 Méthode de renormalisation Monte Carlo ...................... 2.4 Equation de Langevin ................................................... 3 Simulations fermioniques .................................................... 3.1 Approximation des variables fermioniques gelées ........... 3.2 Fermions dynamiques .................................................... 3.3 Spectre hadronique ........................................................ Notes ......................................................................................
.
.
Chapitre IX .INVARIANCE CONFORME
.......................
.
1 Tenseur impulsion-énergie . Algèbre de Virasoro .......... 1.1 Invariance conforme ...................................................... 1.2 Tenseur impulsion-énergie ............................................. 1.3 Transformat ions conformes en deux dimensions ............. 1.4 Charge centrale ............................................................. 1.5 Algèbre de Virasoro ....................................................... 1.6 Les déterminants de Kac ............................................... 1.7 Représentations unitaires et minimales .......................... 1.8 Caractères de l’algèbre de Virasoro ............................... 2 Exemples ................................................................................ 2.1 Modèle gaussien ............................................................ 2.2 Modèle d’king ............................................................... 2.3 Modèle de Potts à trois états ......................................... 3 Invariance moduliaire ........................................................... 3.1 Fonction de partition sur un tore .................................. 3.2 Formule limite de Kronecker .......................................... 3.3 Modèle d’Ising ............................................................... 3.4 La c1assificai;ion A-D-E des modèles minimaux ............ 3.5 F’rustrations et symétries discrètes ................................. 3.6 Modèles non. minimaux ................................................. 3.7 Fonctions de corrélation dans un demi-plan ................... 3.8 Le voisinage du point critique ....................................... Appendice A Séries et produits û de Jacobi .................. Appendice B Algèbre super-conforme ............................ Appendice C Algèbre des courants .................................. C.l Algèbres de Lie simples ................................................. C.2 Modèles de ‘Wess-ZumineWitten ................................. C.3 Représentations et caractères des algèbres de Kac-Moody
.
.
. .
.
Notes
......................................................................................
62 63 65 65 68 71 76 79 80 82 83 88 89 90 90 94 96 101 107 118 129 133 135 135 139 142 148 149 152 158 163 172 175 182 186 192 196 201 202 209 220 224
TABLE DES MATIÈRES
Chapitre X . SYSTEMES DESORDONNES ET METHODES FERMIONIQUES ..................................
.
VI I
229
1 Modèles unidimensionnels .................................................. 1.1 Le potentiel aléatoire gaussien ....................................... 1.2 Equation de Fokker-Planck ........................................... 1.3 La méthode des répliques .............................................. 1.4 Réseau aléatoire unidimensionnel .................................. 2 Gaz bidimensionnel d’électrons en présence d’un champ magnétique ............................................................................ 2.1 Niveaux de Landau - L’effet Hall quantique .................. 2.2 Spectre à une particule en présence d’impuretés ............ 3 Matrices aléatoires ............................................................... 3.1 Loi du demi-cercle ......................................................... 3.2 Méthode fermionique ..................................................... 3.3 Espacements des niveaux ............................................... 4 Approximation planaire ...................................................... 4.1 Analyse combinatoire .................................................... 4.2 Approximat ion planaire en mécanique quantique .......... 5 Système de spins en interactions aléatoires ..................... 5.1 Champ extérieur aléatoire et transmutation dimensionnelle ............................................................... 5.2 Modèle d’king bidimensionnel désordonné .................... Appendice A La conductivité de Hall en tant qu’invariant topologique ..................................................... Notes ......................................................................................
229 229 232 240 246
........................ 1. Réseaux aléatoires ................................................................ 1.1 Réseaux poissonniens et statistique locale ..................... 1.2 Equations des champs discrétisées ................................. 1.3 Spectre du laplacien ......................................................
317
.
. . .
.
Chapitre XI .GEOMETRIE ALEATOIRE
256 256 260 269 271 274 277 283 284 292 295 295 298 308 313
2 Surfaces aléatoires ................................................................ 2.1 Surfaces triangulées ....................................................... 2.2 Anomalie conforme et action de Liouville ...................... 2.3 Sommes sur des surfaces régulières ................................ 2.4 Modèles discrets ............................................................ Notes ......................................................................................
317 318 332 339 343 343 351 358 377 386
...................................................................................
389
.
INDEX
Avant-propos
La théorie quantique des champs vise à décrire les interactions fondamentales dans un cadre unique conciliant les principes de la mécanique quantique et les invariances géométriques et cinématiques. Cette discipline s’est enrichie, au cours des deux dernières décennies, d’applications insoupçonnées, qui tiennent à la parenté de ses méthodes avec celles de la physique statistique, à travers l’étude des phénomènes critiques ou des modèles de physique du solide. Certains développements ont permis de s’affranchir en partie des techniques perturbatives, qui sont à la source de succès considérables dans le domaine des interactions électromagnétiques et faibles. En jetant un jour nouveau sur le rôle du groupe de renormalisation, en permettant d’aborder des questions comme le confinement des constituants dans la chromodynamique, en s’ouvrant aux possibilités de simulation numérique, en découvrant des problèmes nouveaux comme ceux posés par la théorie des cordes quantiques, la théorie des champs s’est entièrement renouvelée. Nous nous sommes attachés à en donner un panorama complétant un texte précédent sur la théorie quantique des champs écrit par l’un des auteurs en collaboration avec J.-B. Zuber. Bien qu’on suppose du lecteur qu’il possède quelques rudiments de cette théorie, le présent ouvrage veut éviter de faire de trop nombreux appels à des connaissances extérieures et s’inscrit dans le cadre d’un enseignement destiné à de jeunes chercheurs et, plus généralement, à des scientifiques intéressés par les progrès de cette discipline. L’abondance des matières, le rythme rapide des nouvelles contributions et les compétences limitées des auteurs ont cependant posé des bornes à l’ensemble des sujets traités. Si l’on veut bien admettre ces limites, nous avons cependant tenté de décrire les fondements de la théorie euclidienne des champs, reposant sur l’usage des intégrales de chemins de Feynman et concrètement réalisée à travers les modèles statistiques qui utilisent un réseau discret, dont le paradigme est le modèle d’Ising. Ce point de vue permet d’attribuer un sens global aux quantités physiques, d’étudier des régimes de couplage fort, suggère l’existence de transitions de phases et montre le rôle du groupe de renormalisation agissant comme filtre des propriétés universelles au voisinage des théories critiques continues.
X
AVANT-PROPOS
Le premier volume est consacré pour l’essentiel à l’illustration de ces thèmes. I1 s’ouvre par une étude des chemins aléatoires et leur relation avec les champs bosoniques, et introduit les intégrales fermioniques sur l’exemple du modèle d’Ising bidimensionnel. I1 expose la méthode du champ moyen, les propriétés relatives à l’invariance d’échelle, et illustre les idées de la renormalisation dans le cadre de la transition de Kosterlitz et Thouless du modèle des rotateurs. Un long chapitre est consacré à la théorie des transitions de phases continues à partir des idées de Wilson, où nous nous sommes appuyés sur les contributions de nos collègues E. Brézin, J.-C. Le Guillou et J. Zinn-Justin. C’est encore à Wilson qu’on doit la formulation des théories de champs de jauge sur réseau et leurs applications à la chromodynamique et au confinement dont la présentation clôt la première partie. Le second volume est plus éclectique. On y trouve d’abord des indications sur les développements de haute ou basse température et les applications des simulations numériques de Monte Carlo, en particulier à la chromodynamique. Un copieux chapitre décrit les résultats récents concernant les systèmes critiques bidimensionnels, dans le cadre des théories conformes, qui servent aussi d’outil à la théorie des cordes quantiques. Nous discutons ensuite les applications de l’intégration fermionique à des systèmes désordonnés simples. Enfin le dernier chapitre expose quelques résultats de géométrie aléatoire et introduit l’étude des surfaces fluctuantes. Dans la première partie, au risque de répétitions, nous nous sommes efforcés de présenter le sujet de manière aussi élémentaire que possible. Nous ne supposons du lecteur qu’une certaine familiarité avec la notion de poids statistique de Gibbs, ainsi qu’avec la représentation des amplitudes de transition quantiques comme superpositions relatives à toutes les évolutions possibles, affectées d’un poids exponentiel dans l’action. C’est précisément ce parallélisme qui est à la source des convergences évoquées précédemment. Le choix des sujets traités et les nombreuses omissions reflètent les intérêts des auteurs et leurs préoccupations. Nous ne sommes que trop conscients de nombreuses lacunes dont la liste serait à l’origine d’un texte encore plus volumineux. I1 est quelque peu dangereux de vouloir systématiser ce que l’on a cru comprendre sans laisser percer de-ci de-là des ignorances. I1 est bon de comprendre .A quel point la recherche débouche sur des problèmes ouverts, des questions en suspens, des interrogations. Comprendre nécessite le plus souvent que l’ori reprenne la plume, que l’on retrace les étapes d’un raisonnement, que l’on refasse un calcul, que d’une façon générale on ne se satisfasse jamais de ce ‘que l’on trouve écrit ou dit ici et là. Malgré tous nos efforts, et ils s’étalent hélas sur une trop longue période, il nous a été difficile, voire impossible, de polir suffisamment notre texte pour éviter les no tations conflictuelles, fruit de l’usage, les erreurs matérielles, voire les erreurs tout court. Comme il est rituel, nous invitons le lecteur patient à les redresser et à nous en faire part. Nous espérons cependant que ces défauts inévitables ne nuisent pas trop à la compréhension de
AVANT-PROPOS
XI
l’ouvrage, même si une quantité change parfois de symbole de chapitre en chapitre, ou si la même lettre désigne dans des paragraphes voisins deux entités distinctes. Nous avons inclus des passages en petits caractères, concernant des compléments, des explications et quelquefois des exercices, le plus souvent résolus. En outre, quelques appendices constituent de (trop) brefs résumés de sujets qu’il n’était pas possible de présenter en détail. Enfin des notes bibliographiques complètent chacun des chapitres et sont destinées à indiquer nos sources, fournir des jalons, et surtout à encourager le lecteur à poursuivre son étude dans les articles originaux ou de revue. Ces notes sont évidemment très incomplètes. Parmi les textes qui servent de références, figurent bien entendu ceux de la série publiée par C. Domb et M.S. Green, et maintenant J. Lebowitz, intitulée Phase Transitions and Critical Phenomena, publiée par Academic Press (New York). En ce qui concerne la mécanique statistique, citons K. Huang, Statistical Mechanics, J. Wiley and Sons, New York (1963), H.E. Stanley Introduction to Phase Transitions and Critical Phenomena, Oxford University Press (1971), S.K. Ma Modern Theory of Critical Phenomena, Benjamin New York (1976) et Statistical Mechanics, World Scientific, Singapour (1985), D.J. Amit Field Theory, the Renormalization Group and Critical Phenomena, World Scientific, Singapour (1984). Tandis que nous préparions cette édition sont venus s’ajouter plusieurs ouvrages traitant des mêmes sujets. I1 s’agit tout d’abord du livre de M. Le Bellac Des phénomènes critiques aux champs de jauge, une introduction aux méthodes et aux applications de la théorie quantique des champs, publié dans la même collection par InterEditions, Editions du CNRS Paris (1988) et de ceux de G. Parisi Statistical Field Theory, Addison Wesley, New York (1988) et S. Polyakov Gauge Fields and Strings, Harwood (1988). Enfin un traité de J . Zinn-Justin devrait paraître sous peu. La référence classique où 1,011 trouve un traitement des intégrales de chemins est R.P. Feynman et A.R. Hibbs Quantum Mechanics and Path Integrals, Mc Graw Hill, New York (1965). Des aspects variés sont discutés dans C. Itzykson et J.-B. Zuber Quantum Field Theory, Mc Graw Hill, New York (1980), P. Ramond Field Theory, A Modern Primer, Benjamin, Cummings, Reading, Mass. (1981), J. Glimm et A. Jaffe Quantum Physics, Springer, New York (1981). De nombreux progrès récents de la théorie des champs qui n’ont pas trouvé place dans notre traitement sont présentés dans S. Coleman Aspects of Symmetry, Cambridge University Press (1985), S. Treiman, R. Jackiw, B. Zumino et E. Witten Current Algebra and Anomalies, World Scientific, Singapour (1985). Pour s’initier aux systèmes intégrables, on consultera R. Baxter Exactly Solved Models in Statistical Mechanics, Academic Press, New York (1982) et M. Gaudin La Fonction d’Onde de Bethe, Masson, Paris (1983). Bien entendu cette liste n’est qu’indicative et 1’01.1 trouve de nombreuses autres références dans les notes.
XII
AVANT-PROPOS
L’un des auteurs (C.I.) remercie ses collègues qui lui ont fourni l’occasion d’enseigner des parties de cet ouvrage dans le cadre du Troisième cycle de Suisse Romande à Lausanne, du Département de Physique de l’université de Louvain la Neuve, du Troisième cycle de Physique Théorique à Marseille et à Paris, où les deux auteurs ont eu l’opportunité de participer à l’enseignement. Nos remerciements vont aux secrétaires de ces institutions qui ont pris part à la frappe des, divers textes préliminaires, ainsi qu’à toutes celles et tous ceux qui ont permis la réalisation finale, à Dany Bunel et Sylvie Zaffanella qui ont eu la lourde charge de mettre au point le manuscrit, à M. Leduc qui a accueilli ce livre dans sa collection. Nous remercions chaleureusement les chercheurs et amis du Service de Physique Théorique à Saclay qui au cours des années ont été nos interlocuteurs et co11aborateui:s et qui sont trop nombreux pour être tous cités ici. Enfin le Commissariat à 1’Energie Atomique et son Institut de Recherche Fondamentale inous ont toujours offert des conditions de travail d’une qualité difficile à égaler. C’est en quelque sorte témoigner de notre gratitude que de dédier ce livre aux futurs chercheurs. C’est aussi la raison pour laquelle nous sommes heureux de bénéficier d’une édition française grâce au concours du Centre National de la Recherche Scientifique. Bien souvent il nous est arrivé d’hésiter sur une formulation, simplement parce que nous avions perdu l’habitude de nous exprimer dans notre langue et que nous cherchions un précédent impossible à trouver, tant la langue anglaise a fini par envahir toutes les publications dans notre domaine. S’il n’est pas souhaitable de retourner à l’époque de la tour de Babel et si l’on ne peut espérer revenir aux siècles où le français était une langue scientifique universelle, du moins peut-on souhaiter maintenir un vocabulaire et une capacité d’exprimer les idées contemporaines dans sa propre langue. Sans prétendre aux effets de style, nous nous sommes attachés à trouver une terminologie simple qui puisse rendre compte de concepts nouveaux et nous nous associons à tous les efforts, heureusement de plus en plus nombreux, pour maintenir une langue scientifique vivante. Saclay, Février 1989
Avertissement Dans cet ouvrage, nous avons utilisé les notations internationales. Ainsi, les nombres décimaux ont un point décimal plutôt qu’une virgule, In représente le logarithme népérien, tan la tangente, sinh, cosh, tanh les lignes hyperboliques, etc.
CHAPITRE VI1
METHODES DIAGRAMMATIQUES
Ce chapitre est consacré aux aspects techniques de divers développements déjà rencontrés dans le premier volume. Nous examinerons surtout ceux qui sont reliés à la formulation des modèles sur réseau, à haute ou basse température, ou à couplage fort. Nous n’explorerons pas de façon très. approfondie le vaste domaine de la théorie des graphes, mais nous donnerons plutôt des exemples empruntés aux modèles les plus courants. I1 existe cependant de nombreux traits communs de nature topologique qui sont manifestes dans des développements variés. I1 est bon de les souligner malgré le caractère en apparence élémentaire des procédures employées.
1. Techniques générales 1.1 Définitions et notations Un graphe étiqueté Ç est une collection de v éléments d’un ensemble d’indices et de 1 paires de ces éléments, avec des répétitions possibles (liens multiples). Nous utiliserons aussi le mot diagramme au lieu de graphe. Cet objet abstrait sera représenté par le dessin de v points (ou sommets) reliés par 1 lignes. A chaque sommet est associé la valeur de son indice. Suivant le problème considéré, on ne retiendra qu’une partie de l’ensemble de tous les graphes possibles. A chacun de ces graphes admissibles, on fait correspondre un poids w ( l ; ) (nombre réel ou complexe) par un ensemble de règles. On veut évaluer la somme des poids de tous les graphes admissibles. Parmi les restrictions que 1,011sera amené à considérer, citons (i) la contrainte d’exclusion qui interdit à deux sommets de porter le même indice, (ii) la simplicité, lorsque deux sommets ne sont reliés que par une ligne au plus (le graphe de la figure l(a) n’est pas simple). Par exemple, la série de haute température de la fonction de partition du modèle d’king
2
VII.1.1
METHODES DIAGRAMMATIQUES
z r l : El
k
(4
(b)
Figure 1 : ( u ) Un graphe étiqueté. ( b ) Le graphe libre correspondant.
est représentée par des jraphes associés à chacun des termes du développement . graphe sera du produit, caractérisés par un ensemble d’entiers { n z J }Le constitué de nz3 lignes joignant les points i et j. Les points isolés ne seront pas dessinés. La sommation terme à terme sur les configurations {uz = kl} revient à retenir les termes où chaque u, n’apparaît qu’à une puissance paire. Ainsi les graphes admissibles sont déterminés par les conditions suivantes (i) une ligne ne peul joindre que deux points indexés par des sites voisins (le graphe est dessiné sur le réseau) (ii) le nombre de lignes incidentes en chaque sommet est pair (iii) deux sommets distincts ont des indices distincts (contrainte d’exclusion). Le poids associé est évalué en attribuant un facteur p à chaque ligne et en divisant le résultat par n z J !ordre , du groupe de symétrie du graphe (2-3) par échange de ses lignes.
n
Nous avions aussi écrit
qui conduit à un autre développement pour Z/(cosh@)N. Dans ce cas, les graphes doivent être siinples, et leur poids est calculé en attribuant un facteur tanh B à chaque ligne. Les deux développements ont chacun leur intérêt et sont utilisés concurremment,.
Deux graphes sont isomorphes s’il existe une correspondance bi-univoque entre leurs éléments, telle que deux lignes homologues joignent des points homologues. Ils lie different donc que par la valeur des indices des
VII.1.1
METHODES DIAGRAMMATIQUES
3
sommets. Cet isomorphisme est une relation d’équivalence, et les classes. correspondantes, notées G, sont appelées graphes libres. Leur représentation (figure l(b)) ne comporte plus d’indices. Conventionnellement, le poids w(G) du graphe libre G est la moyenne des poids de tous les graphes isomorphes correspondants. Appelons nombre de configurations n(G) d’un graphe libre G le nombre des graphes étiquetés correspondants; on a alors
Cette notion est particulièrement utile lorsque le poids d’un graphe ne dépend pas de ses indices, puisque les règles de calcul des poids des graphes étiquetés s’étendent immédiatement aux graphes libres. Cependant, son principal intérêt est de séparer l’influence du modèle ou du type de modèle considéré (évaluation de w ( G ) ) des contraintes dues à la géométrie du réseau (dont dépend n(G)). Les sections 2 et 3 de ce chapitre traitent successivement ces deux problèmes. Les graphes ainsi introduits peuvent être généralisés dans diverses directions. Ainsi, (i) on peut considérer plusieurs types de sommets, (ii) les lignes peuvent être orientées, (iii) une modification plus profonde consiste à étendre ces graphes unidimensionnels (collection de points de dimension O et de lignes de dimension 1) à des dimensions supérieures (dimension 2 pour les théories de jauge); (iv) enfin les indices peuvent être composés, et une ligne pourra en porter à ses extrémités. Cette liste n’est qu’indicative des extensions possibles.
Nous aurons besoin dans certaines applications (en particulier pour l’estimation des fonctions de corrélations) de conserver un indice sur un ou plusieurs sommets. Les classes de graphes isomorphes respectant cette contrainte sont appelées graphes avec racines. Deux sommets x , y d’un graphe G sont liés s’il existe un chemin les joignant, c’est-à-dire une suite de liens du graphe 5 2 1 , 2 1 2 2 , ..., z,y. On définit ainsi une relation d’équivalence entre sommets, et les classes correspondantes permettent de séparer le graphe en parties connexes. Un graphe connexe n’a qu’une seule partie connexe. I1 peut exister sur un graphe des cycles ( x 1 , x 2 ,...,x,, X I ) , c’est-à-dire des chemins fermés passant par n points distincts. Un graphe connexe sans cycle est un arbre (figure 2 ( a ) ) . Le nombre de boucles d’un graphe est le nombre minimal de lignes qu’il faut ôter pour qu’il devienne un arbre (figure
W)). Un point d’articulation (figure 2(c)) est tel que sa suppression (ainsi que celle des lignes qui lui sont incidentes) augmente le nombre de parties connexes du graphe. C’est donc un point de passage obligé pour les chemins
4
METHODES DIAGRAMMATIQUES
VII. 1.1
Figure 2 : ( a ) Un arbre. ( b ) Un graphe à quatre boucles. ( c ) Un graphe à deux points d’articulakion. ( d ) Un graphe multiplement connexe. joignant certaines paires de points. En particulier, tous les sommets non terminaux d’un arbre sont des points d’articulation. Un graphe sans points d’articulation (figure 2i:d)) est appelé graphe multiplement connexe; deux quelconques de ses sommets sont sur un cycle et peuvent donc être reliés par deux chemins totalement distincts au moins. Appelant v k , le nombre de sommets d’où partent k lignes v = C kv k , le nombre total de sommets I, le nombre de lignes b, le nombre de boucles c, le nombre de pa:rties connexes d’un graphe nous avons la relation 21 = kvk k
En effet, puisque chaque lien joint deux sommets, la somme des sommets pondérée par le nombre de liens incidents est égale à deux fois le nombre de liens. Par ailleurs, la relation d’Euler
v+b=c+Z
(5)
s’obtient par récurrence, en supprimant une à une les lignes du graphe jusqu’à obtention de u points isolés. A chaque étape, ou bien on diminue le nombre de boucles d’une unité, ou bien on augmente le nombre de parties connexes. (i) Calculer exp icitement jusqu’à l’ordre 4 la fonction de partition du modèle d’king sur un réseau hypercubique à d dimensions. Les graphes libres admissibles ayant au plus 4 lignes sont représentés sur la figure 3. Leurs nombres de configurations, calculés pour u n réseau fini de N points avec conditions aux limites périodiques, sont respectivement N d , 1). En tenant compte du N d , Nd(2d - l ) , $ N d ( d - 1) et $ N d ( N d - 4d
+
VII. 1.1
METHODES DIAGRAMMATIQUES
préfacteur de symétrie, les poids correspondants sont $pZ,&O4, $p4,p4, aB4. La sommation de ces différentes contributions conduit à 2=1
+ $Nd,B2 + [ $ N d ( 6 d
-7)
+ i N 2 d 2 ]B4 + 0 ( B 6 )
A cet ordre, il est facile de vérifier l’extensivité de l’énergie libre. L’expression
N
-
F N
-
In2 N
-
$dp2
+ k d ( 6 d - 7)p4+ u(f’)
est en effet indépendante de N .
(a)
(b)
(4
(cl
Figure 3 : Graphes du modèle d’king jusqu’à l’ordre ,û4. Notons qu’il était plus rapide d’utiliser le développement en tanh p. En vertu de la contrainte de simplicité, seul le graphe de la figure 3 ( d ) donne une contribution non nulle, ce qui conduit à la formule suivante, équivalente à ( 6 ) dans un développement à l’ordre ,û4 Z = (cosh /3)Nd[l 1- i N d ( d
-
1)tanh4 ,û
+ 0(tanh6 a)]
Cette contrainte est donc bien utile dans ce cas pour réduire le nombre de graphes, qui prolifèrent rapidement avec l’ordre. Les sous-sections suivantes étudient d’autres techniques de réduction. (ii) Théorème de Kirchoff. Les définitions précédentes nous permettent de rappeler un théorème dû à Kirchoff, donnant le nombre d’arbres distincts tracés s u r un graphe connexe et joignant tous les sommets. Associons à un graphe connexe G sa matrice d’incidence A (qui est l’équivalent topologique du laplacien). Sur la diagonale principale, (-A)%i est le nombre de liens incidents au sommet i, alors quc ( - A ) L jest l’opposé du nombre de liens joignant les sommets (distincts) i et j. Comme la somme des éléments de chaque ligne ou colonne est nulle, det(-A) s’annule. Cela correspond à l’existence d’un mode nul, unique car le graphe est conncxe. Le théorème stipule que tout mineur principal (c’est-à-dire ( - l ) i + J fois le déterminant de la matrice où l’on a supprimé la i-iènie ligne et la 1-ièrne colonric) est égal au nombre d’arbres recherché. Le vecteur propre corrcspondant à l’unique mode nul a toutes ses compole mirieur principal de l’élément ij (avec son signe). santes égales. Soit Puisque
5
6
MFTHODES DIAGRAMMATIQUES
VII. 1.1
tous les M k j , à IC fixi, sont égaux. Comme la matrice est symétrique, on en déduit que le résultat s’étend à toute valeur de k, tout mineur étant égal à la même valeur M . I1 nous suffit donc d’évaluer M = M i l . Soit v le nombre de sommets et f? 2 v - 1 le nombre de liens. Introduisons la matrice Lai de dimension 1 x v, où CI indexe les liens et i les sommets, après avoir orienté arbitrairement chaque lien, en posant
+1
si le lien a part du sommet i
-1
si le lien a arrive au sommet i
O
si le lien a n’est pas incident au sommet i
On a alors (-A) = L??L. Appelons L’ la matrice déduite de L en supprimant sa première colonne, de telle sorte que
où la sommation porte sur toutes les matrices La,...û., d’ordre (v - 1) x (v - 1) obtenues en choisissant v - 1 lignes de L’. Chaque terme de la somme est de la forme (detLkz..,a,,;2, et n’est non nul que si l’application i + a; associe à chaque sommet i = 2, ..., v un lien incident. Dans ce cas, la matrice Laz ,,,Qu ne diffère d’une matrice de permutation que par le fait que ses éléments sont *1 plutôt que +l. I1 s’ensuit que (detLa,,,,,v)2 vaut 1, et que la matrice est en correspondance bi-univoque avec un arbre. On a ainsi prouvé le théorème de Kirchoff. Cette interprétation topologique du laplacien se révèle utile dans les problèmes de percolation et de polymères. Nous en verrons une application au chapitre XI.
1.2 Graphes connexes et cumulants La propriété fondamentale d’exponentiation se fonde sur les conditions suivant es: (i) Le graphe vide (sans point, ni ligne) est admissible, et son poids est égal à 1; il a c = O parties connexes et n’est donc pas connexe (e # 1). (ii) Toute juxtaposition d’éléments de graphes admissibles est un graphe admissible. (iii) Le poids d’un graphe est égal au produit des poids de ses parties connexes. Sous ces hypothè:jes, la somme des poids des graphes est égale à l’exponentielle de celle des graphes connexes.
VII.1.2
METHODES DIAGRAMMATIQUES
7
La contrainte d’exclusion est incompatible avec la condition (ii). On vérifiera sans peine que dans ce cas la proposition précédente appliquée telle quelle est inexacte en prenant pour exemple le modèle d’king à l’ordre B4. Nous montrerons dans cette sous-section comment tourner cette difficulté et construire un développement pour l’énergie libre.
La démonstration tient en quelques lignes. Un graphe quelconque sera construit en choisissant indépendamment et successivement ses c parties connexes ...Çc d’après la première condition. L’ordre dans lequel ce choix est fait étant indifférent, chaque graphe est ainsi obtenu exactement c! fois. Utilisant la propriété de factorisation et sommant sur le nombre c de parties connexes
on reconnaît dans le membre de droite de cette relation l’exponentielle annoncée, soit
Bien que dans la pratique, il ne soit pas toujours indispensable de se servir de ce résultat, la propriété d’exponentiation est d’une importance capitale : les calculs de quantités extensives, de comportements asymptotiques, de longueurs de corrélation, d’effets de bord reposent sur une proprieté d’exponentiation. Nous avons vu que la contrainte d’exclusion, fréquemment rencontrée, l’invalide. Cependant , un simple changement des règles diagrammatiques, connu sous le nom de méthode des cumulants, permet de rétablir la propriété. Supposons donc qu’il existe un autre ensemble de règles n’obéissant, pas à la contrainte d’exclusion. Nous en différencierons les graphes en représentant les sommets par des cercles plutôt que des points noirs. Un nouveau graphe représente une partie de la contribution de l’ancien graphe obtenu en fusionnant les sommets portant le même indice. Si l’on veut que le nouveau développement conduise au même résultat, on obtiendra un système de contraintes que l’on peut écrire symboliquement
8
VII.1.2
ME:THODES DIAGRAMMATIQUES
10
l!
+-1 O O + 1 ooo+.** 2!
3! (1+ . ) ( O - )
(1+.)(-0-+4+)=
-
=O =
-c
Le facteur (i+.) tient compte de la possibilité de fusionner autant de points isolés qu’on le désire. Dans ces relations, tous les points portent le même indice, qu’on a omis pour la clarté de la formule. Pour résoudre ces équations, nous allons préciser les règles de calcul des poids. Dans le développement utilisant la contrainte d’exclusion, (i) un facteur
zk
eE,t associé à chaque sommet relié
k lignes,
(ii) un facteur ,B est associé à chaque ligne, (iii) le produit des facteurs précédents doit être divisé par l’ordre du groupe de symétrie du graphe. Le développement sans contrainte d’exclusion obéit aux mêmes règles, le facteur zk étant remplacé par un facteur uk. Les équations (il)s’écrivent alors
et permettent de ca1cu:ler de proche en proche les cumulants
‘uk
VII.1.2
METHODES DIAGRAMMATIQUES
u2
=-z2 -
9
(z) 2
z0 u3
I
z3 zo
22
=- - 3--
z1
zo zo
+ 2 (:)3
La solution peut s’exprimer sous forme compacte en introduisant les fonctions génératrices
u(h)= k=O
(15)
IC!
Le premier membre des équations (12) s’interprète alors comme la suite des coefficients du développement en h de expu(h)
(i) Justifier plus complètement la méthode des cumulants et vérifier l’équation (16) jusqu’à l’ordre 4. (ii) Retrouvons par ces règles l’énergie libre (7) du modèle d’king à haute température. Les règles initiales imposent Z 2 k = 1, Z g k + l = O , de sorte que z ( h ) = cosh h ~ ( h=)lncoshh = i h z - A h 4
(17)
+...
Les graphes connexes sont les quatre premiers de la figure 3. Mais, la contrainte d’exclusion étant levée, leurs nombres de configuration diffèrent et sont maintenant respectivement N d , N d , $ N ( 2 ~ l )a~N, d ( 2 d - 1). Ces nombres sont tous proportionnels à N , à cause de l’invariance par transition, ce qui assure à tous les ordres l’extensivité de l’énergie libre. Les poids respectifs sont alors (puisque 212 = 1, 214 = -2) $p2, i p 4 ,-$p4,p4.On notera la perte de la positivité des poids, consécutive à celle des cumulants. La sommation des graphes connexes redonne immédiatement la formule (7) et fournit ainsi une vérification de la proposition générale énoncée ci-dessus. La même méthode est applicable au développement en tanh p. On doit introduire des facteurs Zk dépendant de la
(18)
10
MIETHODES DIAGRAMMATIQUES
VII. 1.2
direction des lignes incidentes, et les graphes obtenus ne sont plus simples. Cela limite l'intérêt de la méthode pour les graphes simples. Le choix entre les contraintes de simplicité et de connexité dépend du problème considéré. Nous verrons en particulier qu'il est plus avantageux, pour les théories de jauge, de choisir la simplicité.
En ce qui concerne les graphes avec racines, la répartition des indices fixés entre les différentes parties connexes conduit à des relations similaires à (11). Si Z ( i l . ..i k ) désigne la somme des contributions de tous les graphes (connexes ou non) avec racines il ,.. . ,i k , et si (il . . . i k ) , désigne la somme correspondante des graphes connexes calculés avec les règles des cumulants, on a
< i l >= < i l >c < i l i 2 >= < i l i 2 :>, + < i l >,< i 2 >, < i l i 2 i 3 >= < i 1 i 2 i : I > c + < i l i a > c < i 3 > c + < i l i 3 >,< 22 >, + ,< i l >, + < i l >,< i 2 >,< i 3 >,
(19)
En effet, les graphes non connexes se factorisent d'une part en parties connexes ne comportant aucune racine et dont la somme va reconstruire la fonction de partition 2, d'autre part en graphes avec racines qui vont réaliser toutes les partitions possibles des indices i l , ..., ik fixés. Ces propriétés sont évidentes zi un introduit une source j pour les champs. Les graphes avec racines correspondent alors aux fonctions de corrélation, qu'elles soient non connexes
ou connexes
Les relations (19) deviennent alors une simple conséquence de (20-21).
1.3 Irréductibilité e t transformation de Legendre Poursuivons la réduction du nombre de graphes en décomposant les graphes connexes en parties irréductibles. La notion d'irréductibilité peut être plus ou moins poussée. Elle peut aller jusqu'aux graphes multiplement connexes (cf. exercice ci-après). Une étape intermédiaire conduisant à des calculs assez simples él!mine seulement les graphes réductibles relativement aux lignes.
VII.1.3
METHODES DIAGRAMMATIQUES
11
Un graphe connexe est réductible s’il contient au moins une ligne dont la suppression le rend non connexe; tel est le cas de celui de la figure 4u, où l’on a indiqué les lignes par rapport auxquelles il peut être réduit. On notera qu’un arbre est réductible par rapport à n’importe laquelle de ses lignes. Ayant supprimé les lignes de réductibilité, le graphe se trouve disjoint en parties irréductibles, qui vont depuis le simple point isolé jusqu’aux “cactus” formés de blocs multiplement connexes reliés par des points d’articulation. Si l’on représente ces blocs par un cercle hachuré, tout graphe prend l’aspect d’un arbre dont les sommets sont des cercles hachurés. La figure 4b illustre cette décomposition par une équation symbolique; le membre de gauche est la somme des graphes connexes, représentés par un cercle vide.
Figure 4 : (u) Un graphe réductible et sa décomposition en parties irréductibles. ( b ) Aspect général des graphes connexes. Sous les conditions énoncées au paragraphe précédent, nous allons montrer qu’il est possible de définir des règles diagrammatiques pour ces graphes en arbre, puis nous les calculerons en exposant une méthode de resommation des arbres. Soit C ( { h i } )la somme des poids des graphes étiquetés connexes où l’on associe au sommet étiqueté i, d’où partent IC lignes, un facteur dku(hi)/dht. Ultérieurement, on annulera les champs auxiliaires hi afin de retrouver les règles diagrammatiques initiales. L’opération de dérivation dC/dhi consiste à choisir successivement dans tous les graphes de C les points d’indices i et de remplacer leur contribution dku(hi)/dhFpar dk+f’u(hi)/dhf+l. Ceci s’interprète diagrammatiquement par l’addition d’une ligne supplémentaire sur les graphes avec racine i, soit symboliquement
i
De même, nous faisons correspondre au cercle hachuré la fonction
12
METHODES DIAGRAMMATIQUES
VII.1.3
I ( h z ) , somme des poids de tous les graphes irréductibles calculés avec des poids similaires dku(h,)/dht pour le sommet i. L’interprétation (22) de la dérivation restant valable pour cette fonction, la contribution des sommets hachurés dans les arbres de la figure 4b est donnée par la fonction génératrice pour un champ unifoIme I ( h ) = I({hz})lh,=h. Ces graphes sont non étiquetés et il convient, dans les règles diagrammatiques, de diviser leur contribution par l’ordre de symétrie du graphe afin de reconstituer de façon unique chaque graphe etiqueté connexe du développement primitif. Pour resommer les arbres, nous allons les engendrer avec un poids incorrect, puis corriger le résultat en utilisant les relations topologiques du paragraphe 1.1. Considikons tout d’abord tous les graphes ayant un sommet généralisé distingué. Leur somme C. s’obtient en comptant chaque arbre un nombre de fois égal à son nombre de sommets. Construisons l’arbre à partir de ce sommet d’où peutent partir IC = O, 1,2, ... lignes. Le sommet généralisé représenté par le cercle hachuré contient plusieurs sommets simples, et il va falloir les “habiller” individuellement. Rajouter kt lignes incidentes à l’un de ces sommets i revient à effectuer la dérivation ûkl/ûhf*. A chaque ligne qui relie le sommet i à l’un des sites voisins, on attribue un facteur ,L?. En d’autres termes, le sommet habillé est obtenu à partir du sommet nu par l’opération
+
qui revimi à effectuer la substitution hi + h, ,L?Cj O. En d’autres termes, on doit pouvoir atteindre chacune des configurations. (iii) Probabilité limite
E,
52
SIMULATIONS NUMERIQUES
VIII.1.1
X
Considérée comme une matrice dans l’espace des configurations, la distribution W a donc une valeur propre maximale unité d’après les conditions (i) et (ii) et la condition (iii) entraîne que le vecteur propre correspondant de composantes positives n’est autre que P(x). Ainsi WP appliqué à une loi de distribution arbitraire sur les configurations la transforme, lorsque p croît indéfiniment, en celle définie par P , ce qui est le résultat désiré. On peut aussi obtenir la distribution limite de l’estimation f n de (f).Pour n grand c’est une loi gaussienne exp[-(fn - (f))’/2c~:], avec une déviation standard telle que
Obtenir cette relation par transformation de Fourier.
Les trois conditions précédentes sont loin de déterminer uniquement la probabilité conditionnelle W(x, y). I1 est commode en pratique de décompcser W en une succession d’étapes élémentaires
w(x’ y) =
IV1 (x’ z1) w2 (z 1,552 1 * * * Wk (Zk -1 ’Y
(5)
zi
On impose alors la condition plus restrictive de l’équilibre détaillé
de sorte que la relation (3) soit automatiquement satisfaite. I1 est plus facile de vérifier et de mettre en oeuvre la condition (6) et ses propriétés de symétrie sont souvent très utiles. Mais même cette dernière laisse encore un grand arbitraire pour W, lequel explique la diversité des algorithmes. Concrètement on préfère procéder en étapes élémentaires qui n’affectent qu’un petit nombre de degrés de liberté à la fois. Par exemple Wj reviendra à agir sur une variable a u site j sans modifier celles relatives aux autres sites. Cette procédure est iiitéressante pour les systèmes ayant des interactions à courte portée en limitant le temps de calcul nécessaire à chaque étape, indépendamment de la taille. Le temps total pour balayer le système entier (c’est-à-dire pour effectuer une itération complète du processus de Markov) sera donc proportionnel au volume de ce dernier. L’impartialité demande cependant de mentionner le défaut principal de cette procédure, à savoir, qu’il est difficile d’exciter ainsi les modes collectifs de grande longueur d’onde à basse température ou près d’un point critique. Le temps de thermalisation nécessaire pour effacer la mémoire de la configuration
VIII.1.1
53
SIMULATIONS NUMERIQUES
initiale devient relativement long. De plus le domaine critique est caractérisé par des corrélations importantes entre configurations successives (c’est le ralentissement critique). En d’autres termes il existe aussi des phénomènes critiques ,dynamiques à l’approche de l’équilibre, contrepartie des propriétés critiques statiques.
1.2 Algorithmes classiques Le moyen le plus simple de satisfaire à la condition ( 6 ) est de choisir
qui s’interprète comme la thermalisation d’un spin (ou d’une variable locale) avec une source à la température voulue, les autres degrés de liberté du système étant figés. La variable cible est réactualisée en contact thermique avec la source en tenant compte de ses interactions avec les spins voisins qui restent passifs. C’est l’algorithme du themnostat (“heat bath” en anglais). Comparée au problème initial de réactualiser simultanément l’ensemble des variables avec une probabilité proportionnelle au poids de Boltzmann, la procédure est considérablement simplifiée puisque la loi de probabilité (7) ne dépend que du voisinage d’un site. Dans une simulation du modèle d’Ising par exemple, on calcule le champ local hj = O k auquel est soumis le spin au site j. Indépendamment de sa valeur initiale on choisit alors pour le spin final une valeur +1 avec une probabilité p j = [l exp(-2phj)]-’ et -1 avec la probabilité complémentaire. En pratique, ce choix se fera en engendrant un nombre aléatoire uniformément distribué dans l’intervalle O et 1 et en prenant le spin égal à +1 si ce nombre est inférieur à p j , et à -1 sinon. Cet algorithme s’applique efficacement à des systèmes discrets plus généraux. Quand on a affaire à des variables continues il n’est pas toujours facile d’engendrer des nombres aléatoires selon la loi (7) qui peut conduire à des calculs longs et dispendieux qu’on cherche à éviter. La méthode suivante est mieux adaptée. Définissons la fonction &‘(y) telle que
ck(j)
+
Si on choisit pour y une loi de probabilité uniforme sur [O, 11, on vérifie que x = F(y) est distribué selon la loi de probabilité P ( z ) . L’inversion nécessaire dans l’expression ci-dessus est en général malcommode, excepté dans des cas très simples comme celui de la distribution normale ou de la loi exponentielle; mais on peut l’éviter par l’usage d’un procédé qui admet de nombreux raffinements. Par une transformation simple on peut supposer que la variable z prend ses valeurs dans l’intervalle [O, il. L’algorithme suivant engendre II: en deux temps selon la probabilité P ( z ) .
54
SIMULATIONS NUMEFUQUES
VIII.1.2
1. On tire deux variables x et y indépendamment et uniformément distribuées sur [O, 11. 2. Si P ( x ) < (SupP)y on procède à un nouveau tirage, sinon on retient la valeur x qui se trouve être correctement distribuée. Confirmer la validité de la méthode et calculer le taux de rejet dans le second temps.
Cet algorithme demande d’engendrer deux nombres aléatoirement, de calculer P ( x ) , de faire une comparaison et effectuer ces opérations un nombre moyen de fois égal à SupP. Son efficacité s’accroît lorsque la loi devient plus uniforme. On en trouvera de nombreuses adaptations dans un texte de référence cité dans les notes. En généralisant les idées précédentes, Metropolis a été conduit à proposer une méthode qui peut se substituer à celle du thermostat. On réactualise encore la configuration x site par site d’après les règles suivantes. M1 On engendre au hasard une valeur d’essai pour le champ au site donné conduisant à une nouvelle configuration y. La loi de probabilité & ( y ) qui gouverne ce choix est arbitraire (excepté un souci d’efficacité) et peut même dépendre de la valeur antérieure du champ. M2 Si H(y) 5 H ( x ) , la configuration y est acceptée et l’algorithme s’achève. M3 Si au contraire l’énergie croît, H(y) > ‘H(x),on tire un nombre X au hasard uniformément distribué dans l’intervalle ] O , l[et on n’accepte la configuration y que si X < exp-B(X(y) - X ( x ) ) . Sinon on conserve l’ancienne configuration x. Observons que le deuxième temps de l’algorithme serait identique si l’on cherchait l’état fondamental du système. C’est dans le troisième temps qu’un accroissement d’énergie est admis selon une loi de probabilité qui dépend de la température. Vérifier que la probabilité de transition
Wj (x, Y ) 0:
r)
si %(Y) 5 3i(x), x # Y si % ( y ) > ‘H(x) & ( Y ) ~ X -PB ( W Y ) - WX)) Q ( z ) ( l- exp -/3(N(z) - X(x)) si x y
Z,%(Z)>X(X)
(9)
satisfait aux conditions requises pourvu que Q ( y ) obéisse au critère d’ergodicité. On pourrait se contenter de demander qu’une puissance finie de W remplisse ces conditions.
On choisira Q(y) de manière à maximiser (empiriquement) l’efficacité de la procédure. Par exemple on modifiera une variable continue cp selon un incrément aléatoire Scp en s’assurant que la valeur moyenne (Scp) reste de l’ordre de grandeur des fluctuations dans le système entier. Tirer trop
VIII.1.2
SIMULATIONS NUMERIQUES
55
souvent des valeurs beaucoup plus grandes de l’incrément conduirait à un taux important de rejets. Inversement, si les valeurs sont trop petites, le taux de rejet serait faible, mais l’évolution très lente. Dans les deux cas il serait nécessaire de balayer le système un très grand nombre de fois pour obtenir des configurations indépendantes et une bonne thermalisation. En pratique on admet qu’un taux de rejet d’environ 50% conduit à de bons résultats. I1 est possible d’appliquer l’algorithme plusieurs fois à la même variable locale avant de passer à la suivante. Si ce nombre devient très grand, il revient à créer une chaîne de Markov secondaire qui converge vers la loi de probabilité (7). I1 est donc possible d’interpoler entre la méthode de Metropolis et l’algorithme du thermostat, ce qui peut améliorer l’efficacité. (1) On utilise sur les ordinateurs des suites déterministes, possédant des propriétés d’ergodicité, en guise de générateurs de nombres aléatoires. I1 faudrait peut-être qualifier ces nombres de “pseudo-aléatoires” . Les générateurs classiques sont fondés sur des congruences linéaires du type suivant. On produit une suite de nombres xn entre O et 1 à partir du système dynamique auxiliaire un tel que
~n
un+1
=2-’~n
=Aun
[mod 2’1
La suite des nombres (2,) obtenue possède des propriétés aléatoires “raisonnables” pour un choix approprié de l’entier impair A . L’algorithme est facile à mettre en oeuvre et bien adapté à la structure des ordinateurs. I1 peut cependant présenter des défauts et c’est une sage précaution que de vérifier les propriétés du générateur dans des simulations de grande taille. Par exemple on peut découvrir des corrélations entre trois tirages consécutifs susceptibles de produire des biais considérables dans des simulations tridimensionnelles. I1 faut alors utiliser des procédures plus complexes. Ainsi en utilisant un générateur du type précédent on peut extraire un nombre au hasard dans une table qu’on renouvelle aléatoirement à l’aide d’une suite telle que (10) après modification des constantes A et uo. En tout cas, une simulation d’importance requiert de nombreuses vérifications statistiques destinées à assurer l’indépendance et la distribution correcte des configurations. I1 est évident que la substitution d’un générateur de nombres aléatoires à un autre ne doit pas modifier les résultats. (2) I1 est possible, dans certains exemples, de classer les champs en groupes sans interaction directe. Ainsi dans le cas d’interactions entre proches voisins sur un réseau (hyper-) cubique, les sites peuvent être groupés selon la parité de la somme de leurs coordonnées. I1 est essentiel de tenir compte de cette possibilité dans les simulations sur un processeur vectoriel ou parallèle. En effet les machines vectorielles “pipelinées” effectuent très rapidement des séquences d’opérations répétées sur des tableaux d’éléments, à condition que ces opérations soient indépendantes, le résultat d’un pas de calcul ne devant
56
SIMULATIONS NUMERIQUEÇ
VIII.1.2
pas influencer le suivant. La même remarque est valable pour les calculs faits en parallèle. Pour satisfaire à cette contrainte, on peut décomposer chaque balayage du réseau en deux boucles successives traitant les sites pairs, puis impairs. L’organisation des mémoires doit elle aussi être soigneusement étudiée. Par exemple, un spin d’un modèle d’king peut être représenté par un bit (unité d’information binaire). Ces derniers peuvent être groupés en mots (l’unité d’information d’un ordinateur) de façon telle qu’ils puissent être traités simultanément à l’aide d’une seule instruction logique. Cela assure ainsi une parallélisation des calculs sur les machines monoprocesseur. Ces considérations sont importantes dans la pratique, car le temps, la capacité de mémoire et le coût sont des limitations essentielles. Les progrès effectués ne permettront pas de s’en affranchir, car on les mettra à profit pour augmenter la taille des systèmes simulés.
(3) Citons encore une autre difficulté qui peut se présenter quand une série de balayages réguliers successifs conduit à la Stabilisation d’états métastables. Considérons à titre d’exemple une théorie de jauge bidimensionnelle avec une action
s =81
fflOZff304
+
B2
OlO203ff4U5U6
qui fait intervenir des termes bordant deux plaquettes adjacentes. Supposons /?z grand et négatif. Ce modèle est équivalent à un système antiferromagnétique de spins dans un champ extérieur. Un état fondamental peut être représenté comme l’indique la figure 1. 11 a l’aspect d’un damier sur lequel les variables de plaquettes prennent alternativement les valeurs +1 et -1. Si l’on initialise le système en choisissant toutes les variables de plaquette égales à +1, un balayage régulier des liens ligne à ligne laisse la configuration inchangée, comme le lecteur s’en assurera aisément. Le même phénomène se produit pour B2 grand et positif (système ferromagnétique), lorsqu’on prend pour point de départ une configuration en damier. Dans les deux cas l’état initial reste stable et il est très difficile d’analyser la transition du premier ordre entre les deux régions. Cette difficulté se présente aussi dans les simulations du modèle à huit vertex (ou ce qui est équivalent des chaînes de Heisenberg quantiques, ou encore des systèmes d’king couplés). Pour une simulation plus efficace, on pourra tirer au hasard le lien à réitctualiser, au lieu de balayer le réseau régulièrement. Les résultats ne sont cependant pas encore satisfaisants car le plan peut être divisé en deux régions correspondant aux deux configurations dégénérées (résultant de l’échange des plaquettes paires et impaires) dont les frontières évoluent très lentement. I1 est nécessaire de comprendre le mécanisme de stabilisation pour surmonter cette difficulté. On s’attend à ce que la transition entre la phase de pure jauge (ou ferromagnétique) et la phase gelée (ou antiferromagnétique) se produise le long d’uns ligne voisine de la droite j 3 1 + 4 B 2 M O . Supposons Bi positif et donc 8 2 négatif. Si on renverse une variable de lien dans l’un ou l’autre état ordonné on s’attcnd à un accroissement d’énergie de l’ordre - 2 p 2 et -6B2 respectivement, processus qu’on peut considérer comme très improbable. En
VIII.1.2
SIMULATIONS NUMERIQUES
57
revanche si on renverse simultanément les variables sur deux liens parallèles voisins, la variation d’énergie est bien plus faible. I1 s’agit donc de l’excitation élémentaire dans ce domaine et il paraît judicieux de fonder une simulation sur cette technique de double renversement. Malheureusement ce faisant on violerait le critère d’ergodicité si on n’alternait pas avec un balayage lien par lien. L’efficacité d’une simulation sera grandement accrue si on s’inspire des remarques précédentes.
Figure 1 : La configuration en damier de l’état fondamental d’un système de jauge décrit par l’action (11) pour PZ < O. Les variables le long des liens appartenant aux lignes ondulées et les variables de plaquettes en grisé sont égales à -1.
1.3 Simulations microcanoniques On a proposé de s’affranchir de l’usage des générateurs de suites pseudo-aléatoires tout en engendrant une séquence ergorlique de configurations à l’aide d’un processus déterministe dans l’espace de configuration. L’idée consiste à contraindre l’énergie à demeurer dans un étroit intervalle de largeur SE comme dans l’analyse du théorème ergodique. On comparera cette technique à celle d’un générateur de nombres aléatoires. Dans les deux cas l’ergodicité résulte du mécanisme spécifique qui gouverne le mouvement. Les simulations microcanoniques nécessitent une vérification expériment ale des propriétés d’indépendance statistique. La méthode qu’on va exposer semble satisfaire à ce critère. Considérons un démon possédant un réservoir d’énergie positive de capacité 6E. I1 visite tous les sites successivement et renverse les spins (s’il s’agit d’un système à variables dichotomiques) chaque fois qu’il le peut. Si l’énergie nécessaire pour modifier la configuration localement est supérieure à celle dont il dispose dans son réservoir, ou si la modification
58
SIMULATIONS NUMERIQUES
VIII.1.3
envisagée dégage une iinergie supérieure à la capacité du réservoir, les variables demeurent inchangées. Sinon le spin est renversé et la quantité d’énergie disponible dans le réservoir est modifiée en conséquence. I1 est aisé de procéder à une simulation de ce type dans le cas d’un modèle d’Ising ou de tout modèle analogue, en tirant en outre parti de la subdivision possible du système en groupes de variables qu’on pourra traiter en parallèle. Concrètement on mettra en oeuvre un “bataillon de démons” visitant simultanément des spins sans interaction directe. La procédure exposée ci-dessus peut être considérée comme l’analogue d’un générateur pseudo-aléatoire, sur le même plan que les algorithmes usuels. Elle a conduit jusqu’à présent à d’excellents résultats pour des systèmes de type Ising. Son intérêt réside dans sa très grande économie de temps de calcul. On peut lui apporter des améliorations empiriques pour augmenter l’ergodicité, par exemple en redistribuant aléatoirement les contenus des réservoirs des différents démons à des intervalles de temps réguliers. Contrairement aux précédents algorithmes, l’énergie est fixée (à SE près) dans les simulations microcanoniques. I1 est alors nécessaire de mesurer la température. 11 cet effet, l’énergie moyenne dont disposent les démons peut servir de thermomètre. A l’équilibre thermique la distribution de l’énergie des réservoirs doit être donnée par le facteur de Boltzmann exp(-PEdémon). Etant donné que le réservoir ne possède qu’un seul degré de liberté, il est facile de calculer son énergie moyenne en fonction de p. Pour un système d’Ising par exemple, &,4mon est un multiple de l’énergie correspondant au renversement d’un spin (que nous prenons comme unité pour simplifier) avec une coupure à l’énergie maximale SE. Ainsi
relation qu’il est facile d.’inverser pour obtenir p.
1.4 Considérations pratiques I1 est clair d’après ce qui précède que les simulations Monte Carlo constituent en fait un art. Les détails de leur mise en oeuvre dépendent du but qu’on s’est fixé (et des capacités de l’utilisateur). Nous présentons ci-dessous quelques remarques techniques supplémentaires. 1.4.1 Conditions aux limites
Tant que les tailles des réseaux employés demeurent modestes, les conditions au bord jouent un rôle essentiel. Par exemple un réseau tndimensionnel de lo3 sites avec bords libres possède 48.8% de sites sur la frontière. Cet effet croît avec la dimension et l’estimation des quantités thermodynamiques devient douteuse. La façon la plus courante de s’affranchir en partie
VIII.1.4.1
SIMULATIONS NUMEFUQUES
59
de ce problème est d’utiliser des conditions de bord périodiques. Du point de vue de l’ordinateur ceci se réalise aisément à l’aide d’une instruction élémentaire modulo. De plus on utilisera au mieux la structure binaire des données en choisissant une taille linéaire en puissance de 2, qui remplace cette opération par une instruction logique, plus rapide à exécuter. I1 est même possible de traiter toutes les dimensions à la fois en enveloppant le réseau sur une hélice. Considérons par exemple un réseau bidimensionnel. Dans la mémoire de l’ordinateur on dispose les sites en une série linéaire (1’1)’(1’2)’ ( l , L ) , (2’1)’ (2,L), (3’1)’ De la sorte les adresses des sites voisins d’un site donné s’obtiennent à partir de la sienne en les décalant de quantités fixes ( k l et f L ) . Les conditions hélicoïdales reviennent à étendre la règle aux sites initiaux et finaux, les adresses étant définies modulo L 2 . Ce procédé simplifie considérablement le programme et est très efficace. La périodicité introduit cependant des effets parasites qui peuvent provoquer des désastres si on n’en est pas conscient comme le démontrent les exemples suivants. (i) La mesure des masses (ou des longueurs de corrélation) résulte de l’ajustement d’une décroissance exponentielle en exp( - x / c ) au comporte ment asymptotique des fonctions à deux points (cpocp,.). Du fait des conditions aux limites, les fonctions de corrélation deviennent périodiques. Si on ne retient que la première duplication c p de ~ cpo, la formule précédente est modifiée en - - e ,
e - - ,
I
-
grand
O
Cstcosh
-
.
.
(T) SL 2-
(13)
O 1) (20) où 70est un temps caractéristique de la phase métastable. Ces phénomènes sont typiques de transitions du premier ordre et sont à l’origine des boucles d’hystéresis que nous discuterons plus loin. La barrière énergétique est ici l’énergie de “nucléa,tion” de la phase stable. On rencontre des effets analogues dans les problèmes comme celui des verres de spin qui conduisent à des temps de relaxation extrêmement longs, et qui de ce fait rendent la méthode de Monte Carlo très inefficace. Au voisinage d’une transition du second ordre, le temps de relaxation diverge puisque les champs sont corrélés dans des volumes d’ordre Id.On s’attend donc à un ralentissement critique au voisinage de T,,associé à un exposant critique dynamique r - ( 1 - 8 ) -c Pour la fonction de relaxation ~ A A le, temps de relaxation est approximativement proportionnel à la susceptibilité X A A = P N [ ( A 2 )- ( A ) 2 ]Pour . un système fini il n’y a pas à proprement parler de divergence (voir ci-dessous). Dans la pratique, en 1’a.bsence de prédictions convaincantes, on se contente d’estimer r en observant comment une observable se stabilise à sa valeur d’équilibre. I1 faut prentdre garde au fait que des observables distinctes peuvent avoir des temps de relaxation très différents.
1.4.4 Mesure des observables La mesure de certaines observables peut consommer une fraction non négligeable du temps de calcul comparé à celui qui est nécessaire pour engendrer les configurations d’équilibre. Nous verrons ainsi que les moyennes fermioniques impliquent l’inversion de très grandes matrices Ld x L“. Les fluctuations statistiques constituent un autre facteur de limitation. I1 est clair que les mesures perdent tout sens si les moyennes des quantités qu’on désire obtenir sont de l’ordre du bruit statistique. Par exemple on ne peut calculer des dtirivées par des approximations de différences finies entre des quantités memrées sur des échantillons indépendants. C’est le cas par exemple de la chaleur spécifique C = dE/dT. Nous verrons qu’il est possible de contourner cette difficulté pour obtenir cette grandeur. I1 est plus facile de mesurer des moyennes thermodynamiques, mais leur intérêt est en général restreint lorçqu’on s’intéresse aux quantités renormalisées de la limite continue. On cherchera plutôt à obtenir les masses ou les longueurs de corrélation qui requièrent malheureusement des simulations plus soigneuses et plus longues, puisqu’il s’agit de les déterminer à partir de la façon dont un signal décroît avec la distance et tend à disparaître dans le bruit.
VIII.1.4.5
63
SIMULATIONS NUMEFUQUES
1.4.5 Erreurs statistiques
Soit A l’estimation de la moyenne d’une observable, égale à la moyenne arithmétique sur N mesures. On prendra comme ordre de grandeur de l’erreur statistique la quantité I
.
formule qui suppose les valeurs Ai sans corrélation, ce qui n’est pas le cas lorsqu’elles sont engendrées par une chaîne de Markov. On retrouve là la nécessité de faire des tests variés de l’indépendance statistique des mesures. Une méthode empirique consiste à calculer les valeurs de ~ v ( b Asur ) ~divers échantillons et à vérifier que les résultats sont indépendants de N. La détermination du temps de relaxation TAA (équation (18)) est évidemment reliée à cette question. On montre que la formule précédente doit être multipliée par un facteur d’ordre d m . Justifier ce résultat.
1.4.6 Paramétrisation des champs
Les champs peuvent prendre leur valeur dans des domaines variés, en particulier dans des groupes de Lie (c’est le cas des champs de jauge). La structure de ces domaines peut allonger le temps de calcul de manière significative. De plus la paramétrisation adoptée peut influer sur la capacité de mémoire nécessaire. A titre d’exemple considérons le cas de champs prenant leur valeur dans le groupe S U ( 2 ) . Nous avons le choix entre les techniques suivantes. 6 ) Nous pouvons paramétriser les champs à l’aide de matrices complexes 2 x 2. Ceci implique de garder en mémoire 8 mots (nombres à virgule flottante) par champ. I1 est facile d’effectuer les multiplications des matrices qui nécessitent 32 multiplications ordinaires (en fait ce nombre peut être légèrement réduit grâce à des astuces de programmation). (ii) Nous pouvons encore traiter les champs comme des points sur la sphère unité S3 dans un espace quadridimensionnel sous la forme U = a0 ia.Ü, avec a i a2 = 1, a0 et a réels. Cette fois-ci, 4 mots sont suffisants. En revanche la multiplication est un peu plus complexe à programmer : UU’ = (aoab - a.a‘) i(a0a‘ aoa a A a‘).Z), mais ne nécessite que 16 opérations élémentaires.
+
+
+
+
+
La seconde paramétrisation est la meilleure à tous points de vue et c’est celle qu’on préférera, Elle a l’avantage supplémentaire de se prêter à une simulation utilisant l’algorithme du thermostat (Creutz, 1980). Le poids de Boltzmann relatif à un champ U se réduit à exp Tr U V où V est une somme de matrices qui admet une paramétrisation analogue de la forme V = bo S i b 3 sans contrainte sur b2 = bi b2. Le tirage de U s’effectue selon la loi
+
64
SIMULATIONS NUMERIQUES
dP(U‘ == U V - l )
c (
VIII.1.4.6
dâ‘ d--exp(pbab)dao
Le choix de ab est gouverné par une exponentielle et s’obtient en utilisant les algorithmes usuels corrigés par une procédure de rejet pour tenir compte du facteur en racine camée. On choisit alors la direction de a’ uniformément au hasard et on peut reconstruire l’élément du groupe. On obtient ainsi une méthode de simulation très efficace. La structure des groupes W ( n ) pour n 2 3 ne permet pas de telles simplifications. La variété du groupe est plus compliquée et jusqu’à présent il a semblé préférable d’employer une paramétrisation en termes de matrices complexes n x n bien que la capacité de mémoire nécessaire en soit considérablement accrue.
I1 est parfois possible de discrétiser à son tour le domaine des valeurs des champs dans le but de diminuer la capacité de mémoire nécessaire (un seul entier suffira à prescrire la valeur du champ) ainsi que le temps de calcul (en construisant une table de multiplication appropriée). Cependant il est indispensable de s’assurer qu’on ne modifie pas ainsi les propriétés du système que l’on étudie. Examinons le cas du groupe U(1) qui est bien représenté par 2, pour n grand. On a étudié très exhaustivement les systèmes de spins correspondants (l’action s’écrivant ,O &s,j) cos[27r(mi - mj)/n],mi = O , . . .,n - 1) ainsi que leur contrepartie invariante de jauge. Ces modèles présentent génériquement deux transitions pour n > 4 (figure 3). On interprète la phase intermédiaire comme décrivant des ondes de spins analogues à celle du modèle X Y (chapitre IV, volume 1). La transition entre la phase intermédiaire et celle de haute température appartient à la même classe d’universalité que la transition du modèle à symétrie U(1). A très basse température, la structure discrète de 2, devient apparente et le système possède une seconde transition. Lorsque n croît, le point critique inférieur s’approche de la température nulle. On conçoit qu’il est alors possible de remplacer l’étude du modèle U(1) par celle d’un modèle à symétrie 2, pourvu que la température excède cette transition inférieure. La technique précédente serait extrêmement intéressante si on pouvait l’étendre aux cas des groupes continus non abéliens. Malheureusement les sous-groupes finis intéressants ne sont qu’en nombre fini et en général pas assez denses pour assurer une transition discrète à température suffisamment basse. Considérons à nouveau le cas du groupe SU(2). En se servant de la structure des polyèdres réguliers (c’est-à-dire en se réduisant à S O ( 3 ) obtenu par quotient de S U ( 2 ) par son centre Z 2 ) et en écartant les groupes cycliques et diédraux (d’ordre supérieur à quatre), peu représentatifs, on a le choix entre les sous-groupes suivants (chapitre XI).
VIII.1.4.6
SIMULATIONS NUMERIQUES
65
(1) Q groupe quatemionique à 8 éléments. C’est le groupe multiplicatif des éléments izl, f i q , un double recouvrement du groupe à quatre éléments des rotations d’angle ?r autour de trois axes orthogoiiaux. (2) T double recouvrement du groupe tétraédral, 24 éléments. (3) O double recouvrement du groupe cubique ou octaédral, 48 éléments. double recouvrement du groupe icosaédral ou dodécaédral, 120 élé(4) ments. Les théories de jauge quadridimensionnelles correspondantes exhibent une transition du premier ordre unique à une valeur de la constante de couplage égale respectivement à 1.23, 2.175, 3.21 et 5.9. Rappelons que pour S U ( 2 ) le raccord entre régimes de couplage fort et faible s’effectue aux environs de B N 2. On voit donc que les deux derniers groupes peuvent être utiles dans un domaine limité comme approximation au modèle à symétrie continue. Dans le cas de S ü ( 3 ) , et en écartant comme précédemment des séries infinies généralisant les sous-groupes cycliques et diédraux, qui n’offrent pas une approximation satisfaisante de la variété, on connaît des sous-groupes discrets d’ordre 108, 216, 648 et 1080 (liste non exhaustive). Les transitions du premier ordre correspondantes sont à B = 2.5, 3.2, 3.43 et 3.58. Aucune de ces approximations ne semble donc étre un substitut satisfaisant pour le groupe continu, puisque la région de transition vers la limite continue se situe aux environs de x 5.9 dans le cas de SU(3).
2. Mesures Lorsqu’un programme a été suffisamment développé, on a à sa disposition un système dont les paramètres (température, champ extérieur, ...) peuvent être modifiés à volonté, permettant ainsi d’effectuer diverses mesures. Mis à part les questions relatives au traitement statistique des données déjà discutées, nous allons passer en revue ci-dessous divers points spécifiques aux phénomènes critiques.
2.1 Détermination des transitions La première tâche consiste à déterminer le diagramme de phase - s’il n’est pas déjà connu - et à situer les régions critiques. On effectue une exploration préliminaire le long d’un chemin dans le diagramme de phase parcouru dans un sens et dans l’autre, tout en mesurant une (ou plusieurs) observables. A titre d’exemple considérons un modèle de jauge de groupe 2,. La température est choisie assez grande et la configuration initiale totalement désordonnée. On autorise le système à évoluer pendant un temps assez long pour atteindre l’équilibre thermique (ce dernier étant déterminé par la condition que les observables fluctuent autour d’une valeur moyenne stable). On poursuit le processus de Markov en faisant décroître régulièrement la température par un très faible décrément à chaque balayage, tout en poursuivant la mesure de l’énergie moyenne d’une plaquette E = 1- (?I.U p ) .
66
VIII.2.1
SIMULATIONS NUMEFUQUES
Lorsqu’on atteint une température suffisamment basse, on inverse le processus de manière à revenir à la température initiale. La figure 3 représente la courbe obtenue pour la valeur de l’énergie. On y observe deux boucles d’hystéresis qui signalent l’existence de deux transitions et déterminent grossièrement leur position.
o.e E O.ii
o. O 0.0
1.0
2.0
3.0
P Figure 3 :L’énergie moyenne d’une plaquette dans une théorie de jauge en fonction de la température (d’après M. Creutz, L. Jacobs et C. Rebbi, Phys. Rev. D20, 1915 111979)).
26
Pour obtenir les températures critiques avec précision et connaître leur ordre, il est nécessaire de procéder à une étude plus minutieuse. Dans les circonstances présentes un effet d’hystéresis n’est pas nécessairement caractéristique d’une transition du premier ordre. En principe, quand on a affaire à une telle transition, le système peut rester bloqué dans une phase métastable jusqu’à ce qu’une fluctuation d’énergie libre provoque un saut vers une phase plus stable. Une observable telle que E présente alors une discontinuité. Dans le ciis d’une transition du second ordre, il se pourrait que le phénomène d’hystéresis soit dû à un temps de relaxation très grand viçà-vis du temps de calcul. L’énergie à l’équilibre est une fonction continue de la température et la boiicle devrait s’amenuiser avec une variation plus lente de la température. Ceci ne constitue cependant pas un critère très fiable, car le facteur dominant est la taille finie du système. Les singularités des courbes relatives au système infini sont alors supprimées et il devient très difficile de distinguer les comportements caractéristiques qui différencient les transitions selon l e x ordre. En tout état de cause, il n’existe pas de transitions dans les systèmes finis. I1 faut donc que les critères qu’on va présenter soient suffisamment clairs pour permettre une distinction qui subsiste sans ambiguïti à limite thermodynamique. A titre d’exemple on peut préparer le système dans deux états, l’un d’entre eux étant totalement ordonné et l’autre désordonné. On laisse alors
VIII.2.1
SIMULATIONS NUMERIQUES
67
Figure 4 : Evolution des systèmes à la température critique selon que la configuration initiale est ordonnée ou désordonnée. ( a ) Modèle de jauge 2 6 (transition du second ordre). (b) Modèle de jauge 2 2 (premier ordre). Même source que la figure 3. chacune de ces configurations évoluer à la température critique (ou à une valeur très voisine). Dans le cas d’une transition du second ordre, chacun des spécimens atteint le même état d’équilibre (figure 4a) alors qu’ils demeurent dans des phases différentes s’il s’agit d’une transition du premier ordre (figure 4b). I1 reste cependant la possibilité que le temps de relaxation vers l’équilibre soit extrêmement long. On étudiera alors un échantillon possédant une interface séparant deux phases pures en le laissant évoluer à diverses températures proches de la valeur critique. On a représenté sur la figure 5 le résultat de telles expériences effectuées sur le système de jauge 2 2 quadridimensionnel à des valeurs p = 0.41, 0.42, .. ., 0.47. Les courbes sont suffisamment caractéristiques pour qu’on puisse confirmer l’existence d’une transition du premier ordre pour une valeur critique légèrement supérieure à 0.44 (on sait que la dualité prédit la valeur 0.4407). Dans le cas d’une transition du second ordre, on veut déterminer les exposants critiques et l’amplitude des singularités, ou plus généralement l’ensemble des quantités universelles. Cherchons à estimer la difficulté de telles mesures sur l’exemple du modèle d’Ising. Nous voulons mesurer la susceptibilité
x= ou la chaleur spécifique
(
-
(
(23)
68
VIII.2.1
SIMULATIONS NUMERIQUES
O .1’
1
I
1
2 2
0.5
E 0.4
0.:1
O.? 0.1
0.11
O
100
200
300
400
Figure 5 : Evolulion temporelle d’un système de jauge 22 où les conditions initiales mettent en présence deux phases pures, lorsque B croît (du haut vers le bas) de 0.41 à 0.47. Même source que celle de la figure 3. Signalons au passage un détail technique qui a son importance. Comme on l’a déjà indiqué ces quantités ne peuvent être obtenues par différentiation des quantités mesurées, aimantation ou énergie, en raison des erreurs statistiques. Cette méthode ne permettrait pas de distinguer le signal du bruit. La technique correcte consiste à mesurer l’aimantation et l’énergie sur des échantillons s t a t i s t i q u w w n t indépendants et d’estimer leur variance comme l’indiquent les équations (23) et (24). Insistons sur l’indépendance statistique. Des mesures effectuée:; le long d u même processus de Markov portent sur des configurations en général corrélées et conduisent ainsi à une sous-estimation.
La figure 6 montre l’effet d’une taille finie sur la chaleur spécifique du modèle d’king tridimensionnel. La température critique est déterminée par extrapolation du maximum de la courbe. L’ajustement des exposants critiques est bien plus délicat et très sensible à la détermination de T,. D’autres méthodes sont nécessaires. La première consiste à invoquer des informations sur les effets de taille finie, incorporant ainsi des contraintes sur les quantités qu’on cherche à obtenir.
2.2 Effets de taille finie Les lois d’échelle ont déjà été étudiées dans les chapitres précédents et nous y reviendrons. Résumons-les ici dans l’optique présente. Nous considérons un système dans un volume Ld dépendant d’une seule échelle L (on peut aussi généraliser à des tranches ou des barreaux). I1 nous faut
VIII.2.2
SIMULATIONS NUMERIQUES
69
1 0
O8
cv 06
O1
O2
0.0
Figure 6 : La chaleur spécifique du modèle d’Ising sur des réseaux de taille croissante. La courbe en pointillé est l’estimation de la limite thermodynamique (d’après K. Binder, Physica 6 2 508 (1972)). tenir compte à la fois du déplacement de la température “critique” T,(L) et de celui des différents exposants y(L), . . .. On fait l’hypothèse que la susceptibilité se comporte comme
Pour un système fini toutes les quantités sont bien sûr régulières et il est incorrect stricto sensu d’utiliser le terme de température critique. Nous le définissons cependant ici comme la valeur correspondant au maximum de X L . Ceci signifie donc que l’exposant s’annule. Dans d’autres cas comme celui des tranches ou de barreaux, il peut y avoir un exposant y(L) non trivial. Par exemple dans le cas d’une tranche, quand la taille de l’échantillon est très grande dans d - 1 dimensions et peut être considérée en pratique comme infinie relativement à la dernière direction, y(L) interpole entre la valeur y(m) du système thermodynamique à d dimensions et y* = y(1) du système à ( d - 1) dimensions. Lorsque la température s’approche de T, T,(w), la longueur de corrélation croît d’abord selon la loi de puissance attendue t;”, jusqu’à ce qu’elle devienne de l’ordre de LI où les effets de taille finie commencent à l’emporter. Le déplacement de la température critique peut donc être estimé en supposant L N )( A l ( z 1 , E l ) . . . An(zn, 2,))
=O
dilatations (complexes)
p= 1 11
(zig,,,
+ 2hpzp)( ~ l ( z 1E,I ) . . .~ ~ ( z2,)), ,
= O transformations spéciales
p= 1
(43) De la même façon que nous n’écrivons pas de faqon explicite les équations conjuguées, nous omettrons parfois de mentionner la variable dans les équations en z . En deux dimensions, rotations et dilatations réelles sont des transformations conjuguées. Dans le formalisme complexe, elles se combinent pour donner des dilatations complexes, ainsi que l’indique l’équation (43). Les relations (41) expriment une forme généralisée de covariance par transformation conforme locale infinitésimale. Pour aller plus loin, nous avons besoin des corrélations impliquant le tenseur impulsion-énergie, et notre première tâche consiste à étudier leur comportement dans les transformations mentionnées ci-dessus.
1.4 Charge centrale L’invariance par translation dans le plan implique que la valeur moyenne ( T ( z ) )soit une constante. Dans l’équation (42)’ cette constante a été implicitement choisie égale à zéro
(44) ( T ( z ) )= (T(E)) = O De la même façon l’invariance par translation et l’invariance d’échelle globale entraînent que la fonction à deux points correspondante doit être une fonction homogène de 212. De l’équation (42) nous déduisons donc
102
IX.1.4
INVARIANCE CONFORME
ce qui nous apprend que T a pour poids conformes (2’0) (et (T les poids (0’2)) comme prévu. Le choix du facteur $- dans la normalisation de la constante réelle c commune à T et T est conventionnel. Son objet est de produire la valeur c = 1 pour un champ scalaire de masse nulle (ainsi qu’on le verra ci-dessous, cf. section 2.1). Comme l’échelle de T est déjà fixée par des relations telles que l’équation (40)’ nous n’avons pas la liberté de fixer la valeur de c. Si la théorie admet une interprétation en termes d’un hamiltonien quantique. agissant dans un espace de Hilbert d’états muni d’un produit scalaire défini positif, et un spectre borné inférieurement, alors c doit être positive, ainsi que nous le montrerons ultérieurement. Mais cela n’est en rien nécessaire pour une interprétation statistique cohérente, et nous allons rencontrer des exemples intéressants correspondant à c < O. La constante sans dimension c est appelée charge centrale pour des raisons qui apparaîtront par la suite. Une des principales conclusions de ce chapitre sera que la connaissance de c est (presque) suffisante pour caractériser un modèle critique dans nombre de cas. Quoi qu’il en soit, elle fournit une information essentielle aux multiples conséquences. L’apparition de la charge centrale c peut s’interpréter comme une anomalie résultant du fait qu’une symétrie classique (ici l’invariance conforme locale) ne peut pas être étendue au cas quantique en raison d’effets dus à la renormalisation. Dans le contexte des intégrales de chemin, ceci peut être interprété en disant que la mesure fonctionnelle complète ne peut pas être rendue invariante. On peut aussi par exemple considérer que les équations du groupe de renormalisation expriment un comportement anormal dans une dilatation en dehors des points fixes. Nous venons de \air que ( T ( z ) )s’annule dans le plan infini. Si nous avions invariance par transformations conformes locales infinitésimales, nous nous attendrions à ce que cette valeur moyenne reste égale à zéro. Mais à l’exception des transformations engendrées par un polynôme du second degré en z , nous savons que nous ne pourrons pas, d’une façon stricte, parler d’invariance, étant donné que les transformations ne sont pas des applications bijectives du plan complexe (complété) sur lui-même. Nous ne nous attendons pa:j à ce que ( S T ( z ) )s’annule. De fait, combinant les équations (41) et (45)’ nous avons
z -+ z’ =z + 6 e g ( z ) T -+ T’ =T + ST dz’ g ( z ’ ) 2i7r (2’ - z ) ~ et par conséquent
( S T ( z ) )= &cg”‘(z)
SE
(46a)
IX.1.4
INVARIANCE CONFORME
103
On obtient une expression analogue pour T . Quand g est un polynôme du second degré, g”’ s’annule et on retrouve l’invariance attendue. L’équation (46) donne une première expression de l’anomalie. Etant donné que ( T ( z ) )= O, et que les poids de T sont (2,0), il est naturel de postuler que la loi de transformation minimale incorporant cette anomalie s’écrit
avec une expression analogue pour T.Ce comportement se différencie de celui des champs primaires, donné par l’expression (33). L’équation (47) nous apprend que T n’est pas un champ primaire. Le tenseur impulsionénergie se transforme selon une loi inhomogène, avec une contribution supplémentaire proportionnelle à l’identité. Ceci suggère que l’anomalie doit pouvoir être déduite du comportement correspondant de la fonction de partition, ou de l’énergie libre. Transcrivons ici les expressions (12) et (13) pour des fonctions a 2 et 3-points arbitraires, en omettant les variables z
Par conséquent
Vérifier que ceci est en accord avec
Considérons la généralisation de la loi de transformation infinitésimale (47) à une transformation conforme finie correspondant à une application du plan sur un domaine éventuellement différent. Nous avons maintenant z’ = f(z). A T ( z ) correspondra T’(z’). Dans l’interprétation active, la formule de transformation s’écrit
T(z)dz‘ = T’(z’)dz’’
+ &c{z‘,z}dz’
(50)
où le symbole {z’,z} désigne la dérivée schwarzienne de l’application z z’ = f(z),soit
104
IX. 1.4
INVARIANCE CONFORME
Au premier ordre en ô&, ceci se réduit à la dérivée troisième de & g ( z ) , pour f(z) = z &g(z).
+
I1 n’est pas évident d’obtenir la dérivée schwarzienne à partir de la composition de transformations infinitésimales. Nous en donnerons une preuve directe utilisant le champ libre dans la section 2 . 1 . Faisons ici une petite digression afin de donner une interprétation de la dérivée schwarzienne. Celle-ci joue vis-à-vis du groupe conforme global le même rôle que la dérivée ordinaire vis-à-vis des translations. Si nous utilisons la notation
pour la différentielle quadratique correspondante (on rappelle que z’ et z sont reliés analytiquement) la compatibilité de l’équation (50) requiert
Dans l’équation ( 5 2 c ) , on a supposé que 2 1 = f 1 2 ( z 2 ) , 22 = f 2 3 ( 2 3 ) , z3 = f 3 1 ( z 1 ) tandis que f i 2 O f23 O f31 est la transformation identité. Finalement, si z1 et z2 sont reliés par une transformation homographique, la différentielle quadratique s’annule comme conséquence de ( 5 2 b , d )
az1z2+bz1+cz2+d=O
u
(52e)
[z1,22]=0
Le birapport de quatre nombres complexes est invariant par transformation homographique. Afin de mesurer de combien une transformation donnée y = f(z) diffère localement d’une telle transformation, comparons les birapports de quatre points zi et de leurs images. Posant zij = xi - xj, nous évaluons la quantité 213242
Y13Y42
212243
Y12Y43
Q(~,I/)=---
+
pour des valeurs x; voisines d’un point 2, de la forme zi = 2 t c i . De façon analogue, nous développons les yi au troisième ordre en t. Un calcul élémentaire montre que le terme dominant en Q est d’ordre t 2 , et de la forme
IX.1.4
INVARIANCE CONFORME
105
Les propriétés (52b-e) en découlent immédiatement. Observons finalement que
Nous pouvons maintenant passer à l’interprétation de l’équation (50)’ et donc de l’anomalie. A cette fin, effectuons une application conforme du plan complexe, privé de l’origine, sur une bande périodique dans le plan u, de largeur L. La transformation correspondante est donnée par une exponentielle I
z = exp(2im/L)
(54)
im u
Re u
-;L
+L
Figure 2: Bande périodique de largeur L dans le plan de la variable u
Par conséquent
et comme ( T p ~ a i i (=~O, ) ) nous trouvons (Tbaiide(u))= &c(2./L)2
(56)
Ceci nous permet d’interpréter l’anomalie comme un effet Casimir, c’est-àdire un déplacement de l’énergie libre comme conséquence de la géométrie finie. Cet effet fut à l’origine prédit, puis mesuré, en électrodynamique quantique où il donne lieu à une force entre conducteurs neutres. Le seul fait qu’il soit mesurable bien que très faible, démontre que les interactions électromagnétiques sont à longue portée. De même nous nous attendons dans le cas présent à un déplacement de l’énergie libre dépendant de L, dû aux conditions aux limites confinantes. Comme convention de normalisation,
106
INVARIANCE CONFORME
IX.1.4
nous supposons que dans le plan infini l’énergie libre par unité de surface s’annule au point critique. En incluant le facteur 1/27r1 introduit ci-dessus, la variation de l’énergie libre totale est donnée par une formule analogue à (19), soit
où le domaine d’intégration V est la bande infinie. Choisissons en particulier Srl = S E U ~Sr2 = O , qui correspond à une dilatation horizontale de la bande. Naturellement ce n’est pas là une transformation conforme (elle est du type quasi conforme, transformant les cercles en ellipses avec un rapport fixe des axes). Mais la définition de T p yn’implique en rien une transformation conforme. Le seul terme qui ne s’annule pas dans ûpSr, est dlSrl = SE, et TI1 = T ( u )+ T ( a ) .Dans une bande infinie, la quantité In 2 est infinie. Par invariance par translation, nous nous at tendons cependant à ce qu’il existe une énergie libre par unité de longueur bien définie, en d’autres termes que 1 F ( L ) = lim - l n Z ( L , M ) M-oo
M
existe, pourvu qu’on impose une condition aux limites supplémentaire dans la direction longitudinale à une distance M . En supposant que l’énergie libre par unité de longueur possède une limite indépendante de cette condition supplémentaire, nous concluons des équations (56)-(58) que
S F ( L ) = SELet donc
dF(L) 27r = -=c - S E dL L 7r
F ( L ) = ‘c6 L Nous avons utilisé le fait que l’énergie libre FO par unité de longueur dans le plan infini s’annule. Sinon elle donnerait lieu à une contribution supplémentaire FOL au membre de droite. De manière équivalente, si l’on utilise une matrice de transfert, le logarithme de la plus grande valeur propre X O se comporte au point critique comme 1nXO = FOL + ‘c6 L 7r
(59b)
quand L devient infini. Nous examinerons dans la section 2 la validité des hypothèses conduisant à l’équation (59). Manifestement si certaines corrélations croissent avec la distance, comme cela se produit dans des modèles non unitaires, on s’attend à ce que le résultat ne soit plus valable. Pour l’instant, supposant que toutes les corrélations décroissent avec la distance, nous voyons qu’une relation comme (59) donne accès à la valeur de la charge centrale, ainsi que les études numériques l’ont amplement
IX.1.4
INVARIANCE CONFORME
107
illustré. Par exemple, pour des polymères (modèles O ( n ) ,n +. O) ou pour la percolation (modèle de Potts à Q-états, avec Q +. l ) , on trouve comme on s’y attend c = O. Nous verrons que le modèle d’king correspond à c = le modèle de Potts à 3 états à c = et le champ bosonique libre (modèle gaussien) à c = 1, pour ne mentionner que ces quelques valeurs.
4
i,
1.5 Algèbre de Virasoro L’application définie ci-dessus du plan pointé sur une bande périodique suggère l’utilisation d’un formalisme opératoriel, avec une matrice de transfert 7. Comme cette transformation correspond à l’utilisation de coordonnées polaires dans le plan, ce formalisme a reçu le nom de quantification radiale. L’évolution dans le teiiips est équivalente aux dilatations, et les va,leurs propres du générateur correspondant sont les poids conformes. Afin d’alléger les notations, nous absorbons le facteur 2i7r/L dans la définition de la variable u,de sorte que
D’après cette équation, la propagation s’effectue le long de l’axe réel u.Les valeurs moyennes dans la bande sont identifiées à des traces de produits ordonnés d’opérateurs (l’ordre étant pris le long de l’axe des “temps” Reu). Cette procédure permet d’associer à une observable A(u)un opérateur Â(u). La matrice de transfert est l’analogue de l’exponentielle d’un hamiltonien, et relie les opérateurs à différentes valeurs de R e u selon
Â( Re u,Im u)= ‘TRe ”Â( O, Im u)TRe
(61)
Les corrélations sont écrites pour une suite décroissante de valeurs de R e u sous la forme
Si nécessaire, on effectue des soustractions de façon à rendre ces expressions connexes. Dans un contexte quantique, cette formule n’est autre que celle de Gell-Mann et Low. Supposons pour simplifier que le modèle soit unitaire.
108
INVARIANCE CONFORME
IX.1.5
Dans l’espace euclidien, cela veut dire que 7 = exp - H , où H est hermitien et borné inférieurement. Désignons son état fondamental unique par IO), (01 étant le bra conjugué. Dans le cas d’un modèle unitaire, la limite M -f 00 projette sur l’état fondamental si nous supposons que ce dernier correspond à un point isolé du spectre. Comme la situation considérée implique une bande de largeur finie, cette supposition paraît réaliste. Nous trouvons donc
Dans le cas d’une observable réelle A, l’opérateur correspondant est hermitien
et les corrélations satisfont à la propriété de positivité par réflexion
Le second argument ü n’a pas été écrit explicitement, mais il est sousentendu. Grâce à l’application exponentielle, nous pouvons exprimer les translatioiis dans le plan u comme des dilatations dans le plan z (privé à‘un point), à condition. de tenir compte de la loi de correspondance entre opérateurs Abande(U,Ü)
= Âpla*,(Z, Z)zhZh
I1 en résulte que
Dans une application conforme z -+ z’ = z un champ primaire se transforme selon
+ & g ( z ) , avec g ( z ) analytique,
et l’équation (39) entraîne l’existence d’un opérateur ? ( z ) tel que pour jzll lz2l
> ... > lznl,
>
IX.1.5
INVARIANCE CONFORME
109
... 6 Â p ( z p ... ) Ân(zn)JO)=
où le contour C entoure tous les points zi, tandis que le contour C' laisse tous ces points à l'extérieur. Introduisant des contours intermédiaires, nous voyons que ceci est équivalent à un énoncé opératoriel
Développons maintenant T, tout comme T, en série de Laurent +W
(71) n=-w
n=-w
Le facteur z-2 a pour origine la relation (60). Nous substituons le développement (71) dans (70), où g(z) est également développé en série de Laurent. Identifiant le facteur de chacun de ses coefficients dans les deux membres, nous obtenons un ensemble de relations de commutation définissant deux algèbres de Lie de dimension infinie, appelées algèbres de Virasoro [Lj, Lrcl
= ( j - k)Lj+k
[Zj, L]= ( j
- k)Ej+rc
+ & c j ( j 2 - 1)6j+rc,o
+ &cj(j2
- l)Sj+k,O
(72)
[Lj,Zk]=O Ces algèbres furent initialement introduites par Virasoro dans le cadre du modèle dual de la physique des particules, l'ancêtre de la théorie des
110
INVARIANCE C O N F O R M E
IX.1.5
cordes, avec pour objet d’imposer ce que nous interprétons aujourd’hui comme l’invariance par reparamétrisation. Du point de vue du plan z , l’origine ne joue aucun rôle particulier, et ces opérateurs T et i? pourraient être développés au voisinage de tout autre point, obtenu comme image de l’origine par une transformation homographique. Les formules (72) admettent l’interprétation suivante. Supposons en premier lieu c = O, et examinons une des deux algèbres équivalentes. On observe alors que les opérateurs peuvent être réalisés comme opérateurs différentiels du premier ordre de la forme
Si nous nous restreignons z au cercle IzI = 1, les champs de vecteurs e, agissent sur des fonctions définies sur ce cercle, et sont les générateurs des difféomorphismes du cercle unité, c’est-à-dire d’applications bijectives indéfiniment différentiables (ici connexes à l’identité). Le terme supplémentaire dans (72)’ proportionnel à c, commute avec tous les éléments de l’algèbre. I1 indique par conséquent une extension de l’algèbre de Lie (73) par une algèbre unidimensionnelle. Comme cette dernière commute avec tous les éléments, on parle d’extension centrale, et donc de charge centrale. La situation est analogue au niveau des algèbres de Lie à celle qui prévaut en mécanique quantique, quand on cherche des représentations à une phase près d’un groupe de symétries. Par exemple les spins demi-entiers correspondent à une extension centrale de SO(3) par le groupe à deux éléments 2 2 , sous la forme de SU2. Un calcul simple montre que la forme indiquée dans l’équation (72) est la seule extension centrale de l’algèbre (73) à un changement de base près. ou l o , e*,, engendrent tous une Les opérateurs Lo, L&ll (Loi algèbre à trois dimensions, qui n’est autre que l’algèbre de Lie complexe du groupe conforme global SL(2,C). On notera que le coefficient correspondant de l’anomalie s’annule. Le générateur LOdes dilatations est diagonal dans la représentation adjointe [Lo,L-,] = PL-,, avec des valeurs propres entières. I1 permet de définir une graduation de l’algèbre enveloppante engendrée par les L,, c’est-à-dire une décomposition en sous-espaces homogènes correspondant aux valeurs propres de LO.En d’autres termes, L-, agissant sur un état propre de L o accroît la valeur propre de p . Le vide est invariant par transformation conforme globale, et il est donc annihilé par L O , L h l .Comme on suppose que T ( z )10) reste régulier quand z -+ O (de manière que (OlT(z) quand z + CO), il s’ensuit que l’on a les propriétés plus fortes
P 2 -1
L, 10) = O (01 L, = O
P l l
avec des équations analogues pour
E,.
(74)
IX.1.5
INVARIANCE CONFORME
111
(i) Montrer que pour obtenir les relations (74), étant entendu que LO et L k 1 annihilent 10) et (01,il suffit d’exiger que L2 annihile 10) à droite, ou L - 2
annihile (01 à gauche. (ii) Comme conséquence de (74), ( O lLpl O ) = O pour tout p . Montrer à partir des relations de commutation ( 7 2 ) que pour Iz11 > 1221 par exemple on retrouve l’expression
Dans un modèle unitaire, une observable hermitienne obéit à la relation Z)t = p
z - 2 q ( Z - ’ ,
2-1)
(75)
Appliquée à T ou T , cette égalité fournit une condition nécessaire pour qu’une représentation soit unitaire
L2, = L-,
,
LtP = L-,
(76)
L’équation (40) implique, si z1 + 2 2 , ?(21)Â(22) 10) se comporte comme h.4zi2Â(z2)IO). Définissons l’état Ih, I;) par
I1 s’ensuit que
Lo Ih, 71) = h Ih, E )
P>O
L, Ih, h ) = E , Ih, h ) = O
et les relations conjuguées
Dans une représentation unitaire, le générateur des dilatations (réelles), LO+ EO et celui des rotations, LO- EO,sont tous deux hermitiens. Nous en concluons que l’espace des états d’un modèle critique porte une représentation du produit des algèbres {L,}x { E , } , que nous désignons Une telle représentation est en général réductible, contenant des par V x
v.
112
IX.1.5
INVARIANCE CONFORME
états tels que Ih, h ) et leurs descendants, c’est-à-dire des états engendrés par application d’un produit de Lp et de &,. Concentrons notre attention sur une de ces algèbres, disons V . Par isomorphisme, les raisonnements s’appliqueront aussi bien à Considérons une représentation possédant un vecteur appelé vecteur de plus haut poids, c’est-à-dire un état Ih) qui remplit les conditions (77). Nous omettons La dans ce qui suit d’expliciter les propriétés analogues relatives à dénomination vecteur de plus haut poids est empruntée à la théorie des représentations des algèbres de Lie. Dans le contexte présent, il s’agit plutôt d’un état fondamental dans un secteur donné. Considérons le “module de Verma” engendré par Ih) , c’est-à-dire l’espace vectoriel de dimension infinie engendré par les combinaisons linéaires finies de monômes en L,, m > O appliqués à Ih) et supposés linéairement indépendants. Cet espace se décompose en sous-espaces homogènes caractérisés par la valeur propre h+n de Lo, où n est un entier non négatif, qui sera appelé le niveau. La quantité h n est aussi parfois appelée poids de l’état correspondant. Ici ce n’est pas autre chose que le poids conforme d’un champ non primaire, qui crée cet état quand il est appliqué à l’état vide IO). Quand nous considérons les états de niveau In),nous pouvons utiliser les relations de commutation (72),ainsi que les propriétés de l’état Ih) annihilé par L,,p > O, pour montrer qu’ils se réduisent tous à des combinaisons d’états de base, impliquant seulement L,, p < O, et ordonnés de façon commode, par exemple des états de la forme
v.
v.
+
De façon analogue dans l’espace conjugué
avec les mêmes contraintes sur les indices. L’espace de ces états, de dimension infinie, fournit manifestement un espace de représentation de l’algèbre de Virasoro. L’algèbre de Virasoro est similaire aux algèbres de Kac-Moody définies comme extensions de dimension infinie d’algèbres de Lie semi-simples (appendice C), qui interviennent dans l’étude des algèbres de courants ainsi que dans celle des systèmes intégrables de dimension infinie. Un opérateur Lpt,p’ > O, appliqué à un état tel que I{p} h ) ,diminue son niveau de p‘. Par conskquent si un produit de tels opérateurs a un degré égal à n, il produira, s’il est appliqué à [ { p ),h ) un multiple de l’état fonda.mental Ih ). Nous écrivons
IX.1.5
113
INVARIANCE C O N F O R M E
O
< p1 i P2 i ... 1.Pk
o O
une condition nécessaire d’unitarité est que l’on ait les inégalités h 2 O et c 2 O. Nous trouvons donc seulement des poids positifs dans les modèles unitaires. Les poids négatifs, qui correspondent à des corrélations croissant avec la distance, ne sont cependant pas exclus dans le cas non unitaire. Nous avons donc unitarité
--r.
c 2 O,
h2O
(82)
Dans toute représentation le nombre d’états linéairement indépendants au niveau n ne peut excéder p ( n ) , nombre de partitions de l’entier n. Si l’on convient de définir p(0) = p ( 1 ) = 1, la fonction génératrice des partitions due à Euler s’écrit 00
On suppose IqI < 1. La fonction de Dedekind q = exp 2ir.r’ jouera un rôle essentiel dans la suite.
Q(T)
= ~ l / ~ ~ P où (q),
114
INVARIANCE CONFORME
IX.1.5
Pour étudier la forme contragrédiente on va calculer son déterminant à chaque niveau n (au niveau O c’est 1 par définition). Ces déterminants,
dont l’expression a été obtenue par Kac,
sont manifestement des polynômes en c et h. Ils possèdent la propriété que det,(c,h) s’annule si et seulement si à un niveau n’ 5 n, il existe une combinaison linéaire
annihilée par tous les L,,p > O. Si un tel vecteur existe à un niveau n’ 5 n , il engendre au niveau n un sous-espace de vecteurs annihilés par les L,, p > O. Inversement si le déterminant s’annule, certaines de ses colonnes obéissent à des relations linéaires. Les vecteurs correspondants de la forme cyp) L-pl . . . L P p kIh), pi = n sont annihilés par tous les produits de L,!, C p ! , = n. Un raisonnement par récurrence montre qu’il doit exister un vecteur singulier de degré n’ 5 n. S’il existe de tels vecteurs singuliers (ou “nuls”) tels que n’ > O, la représentation de V est réductible. Pour obtenir une représentation irréductible le sous-espace maximal invariant engendré par les vecteurs singuliers peut être éliminé en considérant l’action de l’algèbre de Virasoro dans un espace quotient. Ceci revient à dire que les champs qui créent ces vecteurs singuliers par application sur l’état du vide IO), doivent être égalés à zéro. Ceci nous permet de distinguer à c fixé des valeurs privilégiées, des poids conformes correspondant aux racines des déterminants de Kac qui sont des polynômes en h. Ces derniers peuvent être calculés en utilisant les relations de commutation. Les cas triviaux sont detc,(c,h)= 1
deti(c,h) = 2h
(85)
où l’annulation de detl pour h = O reflète le fait que 10) lui-même est un vecteur nul. Considérons le cas instructif n = 2 tel que
où les lignes et colonnes sont indexées respectivement par les partitions (2) et (1’1). En conséquence det2(c, h) = 2h [16h2
+ 2(c - 5)h + c]
(86b)
On observe que det2 contient detl en facteur. L’information nouvelle est l’existence de deux nouvelles racines, qui sont données par
IX.1.5
115
INVARIANCE CONFORME
5 - c f J(1 - c)(25 - c) 16 Ces racines sont complexes conjuguées pour c réel compris entre 1 et 25, et réelles dans les autres cas. On écarte la première possibilité et on examine les vecteurs singuliers correspondants de niveau 2, c’est-à-dire de poids h* 2. On peut vérifier directement que le vecteur
h* =
+
Li + 3
Is*) =
(88a)
1)L t l - L-2) Ih)
obéit à
Lo
1%)
= (hi
+ 2)
L,
IS&)
1 4= 0
p
>O
(88b)
Afin de vérifier (88b), nous observons que LI et L2 engendrent, via les relations de commutation, tous les L,, p > O. Pour la suite il est commode d’introduire la paramétrisation suivante de la charge centrale, pour tout m réel, complexe, fini ou infini c=l-
6 m(m 1)
+
(89)
Les valeurs h& ci-dessus prennent la forme
+
+
[2(m 1) - mI2 - 1 h+ =-m 3 4m 4m(m 1) m - 2 - [m+i-2m] 2 -1 h- = 4m(m 1) 4(m 1)
+
+
(90)
+
Ce qui précède est formulé dans le langage opératoriel. Nous pouvons aussi l’exprimer en termes du développement à courte distance d’un champ primaire A (de poids h ) avec un produit de champs T ( z ) . Afin d’alléger les notations, nous omettons à nouveau l’argument de A. Les équations (40) s’interprètent en disant que, lorsque T ( z ) est inséré dans les fonctions de corrélations, on a le développement à courte distance
A(O)(u)=hA(u)
... ainsi que
116
INVARIANCE CONFORME
T ( z ) T ( u )=
3C ~
(z-u)4
W u ) +-(.-up
1 dT(u) ++ . .. ( 2 - u ) du
IX.1.5
(91b)
Nous avons donc une correspondance A ( 0 ) H Ih), A(O)(O) H Lo Ih), A(-’) H L-, Ih). On peut répéter pour les champs dérivés A(-,) le dévelop(0) pement à courte distance ci-dessus, définissant A(-Pl?-P?)en correspondance avec L p P lL-p2 Ih) , et ainsi de suite. Le champ primaire A , ou A(O) = hA(z) a des propriétés de transformation connues; il en est de même de A(-I)(u) = ûUA(u). I1 est instructif de déterminer les lois de transformations des champs secondaires ou “descendants’’, afin d’obtenir une nouvelle interprétation des vecteurs singuliers, en termes des champs correspondants. Rappelons que si A est primaire
I1 est clair que A(-1) ne se transforme pas comme un champ primaire. Pour obtenir le comportement de A ( - 2 ) , on compare les développements de courte distance de T ( z ’ ) A ( z )et T ‘ ( < ’ ) A ‘ ( < en ) , utilisant la loi de transformation (92). Ainsi
Après des calculs assez laborieux, nous trouvons que
IX.1.5
INVARIANCE CONFORME
117
Nous laissons au lecteur courageux le soin de déduire les formules correspondantes pour A(-P1,-Pz-...)!Le moins que l’on puisse dire est que les champs secondaires ont des lois de transformation assez complexes. Comparons cependant ( 9 3 a ) au comportement de a : A ( z ) correspondant à l’état L z l Ih);nous avons
Si l’on forme la combinaison 3
x * ( z ) = 2(2h*
+ 1) û : A ( z ) - A ( - 2 ) ( z )
on vérifie sans difficulté que pour chacune des valeurs h* données par (87) ou (90)
En d’autres termes, les vecteurs singuliers correspondent aux combinaisons des champs secondaires, provenant du développement à courte distance avec le tenseur impulsion-énergie, qui se transforment comme des champs primaires avec un poids augmenté d’un entier. Cette équivalence est utile en ce sens qu’elle montre que si x est une telle combinaison, exiger que x s’annule est une condition cohérente (covariante) indépendante du choix de coordonnées. En termes de représentations, ceci revient à quotienter par les espaces invariants, obtenant ainsi des représentations irréductibles. Finalement nous verrons que l’existence de telles conditions entraîne que les fonctions de corrélations du champ initial satisfont à des équations aux dérivées partielles qui permettent essentiellement de les déterminer. Naturellement, le poids conforme h associé doit être choisi comme une racine d’un déterminant de Kac.
Considérons un champ Al tel que hl G h k . Exiger que xk s’annule entraîne que les fonctions de corrélations impliquant ce champ satisfont à des équations aux dérivées partielles du second ordre de la forme
obtenues à partir de l’équation (40) en utilisant le développement à courte distance de T avec Al. De manière analogue on obtiendra les équations
118
IX.1.5
INVARIANCE CONFORME
d’ordre plus élevé lorsqu’on aura affaire à des vecteurs singuliers de niveau plus élevé. Nous voyons ainsi que la théorie conforme offre la possibilité de déterminer certaines valeurs remarquables des poids conformes (ou des exposants critiques) ainsi que les fonctions de corrélations des champs correspondants. Dans ce but, il apparaît donc essentiel d’obtenir une expression explicite des déterminants de Kac à tout niveau. Montrer qu’au niveau 3
dets(c, h ) = 48h2 [16h2
+ 2(c - 5)h + c] [3h2+ (C - 7 ) h+ + 21 C
et obtenir les vecteurs singuliers correspondants. Montrer qu’en général det,est un facteur de det,.
1
1.6 Les déterminants de Kac C’est à Kac que l’on doit l’expression n
det,(c, h ) = cst x
( h - hT,s)p(n-TS)
(96)
I-.*=1
1. 3 et un ensemble fini de poids possibles, et donc un ensemble fini de
130
INVARIANCE CONFORME
IX.1.7
dimensions possibles pour les observables fondamentaies, ou primaires. Dans ce sens nous pouvons appeler les représentations correspondantes minimales. Les modules de Verma associés possèdent des vecteurs singuliers, c’est-à-dire des sous-espaces invariants. Pour la même valeur de e, il est ainsi possible d’introduire des champs appartenant à des représentations de poids h , , , où T et s sont extérieurs au domaine ci-dessus. Ceux-ci pourraient intervenir dans la construction d’autres types de modèles, qui ne seront pas envisagés ici. I1 est utile d’introduire un tableau des inclusions de sous-espaces invariants, tableau qui nous permet de comprendre le décompte des états linéairement indépendants qui subsistent à un niveau donné, une fois que les sous-espaces invariants ont été factorisés. Fixons une valeur de c satisfaisant aux inégalités (145). Feigin et Fuchs ont déterminé l’ensemble des inclusions entre modules de Verma, représenté sur la figure 3, résultant de la formule de Kac. Dans cette figure, une flèche pointe du plus grand espace vers un sous-espace. Les poids correspondants different par des produits d’entiers. De plus cinq sous-espaces tels que M , N ’ , N ” , P’, P” sont tels que M contient la somme (qui n’est pas une somme directe) N’ @ N ” , tandis que l’intersection N’ n N” est égale à la somme P’ @ P”. Pour obtenir la représentation irréductible dont le poids figure au sommet, avec r et s dans le domaine défini en (145), on doit factoriser la somme de ses deux premiers “descendants”. Nous verrons dans la prochaine section des applications de ces ensembles d’inclusions. Lorsque c est supérieur à 1, il n’y a pas de contrainte sur la charge centrale due à l’unitarité. Pour c = 1, il existe à nouveau une forme (plus simple) de réductibilité (et d’unitarité) chaque fois que h = an2 avec n entier. Comme nous ne prétendons pas donner ici une présentation exhaustive, nous nous limiterons pour l’essentiel à des valeurs de c dans le domaine c 5 1, conduisant aux exemples les plus simples. Ils incluent de nombreux modèles, possédant au plus des symétries discrètes pour c < 1. Dans le cas de la série minimale unitaire, nous illustrons les considérations qui précèdent en montrant sur la figure 4 les trois premiers exemples de grilles de poids conformes. Les attributions à des modèles concrets seront justifiées ultérieurement. I1 est intéressant d’observer que l’invariance conforme à elle seule prédit l’existence de systèmes avec un petit nombre d’exposants rationnels. Ce qui reste à trouver est la clé de correspondance dans des exemples spécifiques, ansi que la signification physique des observables. Les représentations minimales ne sont pas nécessairement unitaires, ainsi que le démontre l’exemple le plus simple présenté ci-dessous. Naturellement on peut admettre certaines pathologies, comme des corrélations croissantes, qui doivent recevoir une interprétation appropriée. Ces cas minimaux s’obtiennent en substituant dans la formule c = l - 6/m(m l)
+
IX.1.7
INVARIANCE CONFORME
[m- r , rn
131
+ i - SI
[2m- r , s]
[r
+ m ,m + 1 - SI
[3m- r , m + i - s]
[r
+ 2m, s]
[4m - r , s]
[r
+ 3m,m + I - SI
+ i - s]
[r
+ 4m, s]
[5m- r , m
Figure 3:Inclusions des modules de Verma [T’, s’] correspondant à une charge centrale c = 1- 6/m(m 1),m 2 3, et hr,,s,= [ ( ~ ’ ( m1)- ~ ’ m- ) ~ 1]/4m(m 1).
+
+
+
une valeur de m rationnelle. Par exemple si p et p’, p > p’ sont deux entiers positifs premiers entre eux, tels que m = - p’ m+l=- P (146a) P-p’ P-p’ la valeur correspondante de c (qui n’est plus restreinte à être positive) est donnée par
c = l - 6(P - P’I2 (146b) Pp’ Les poids conformes des représentations minimales correspondantes prennent la forme
132
IX.1.7
INVARIANCE CONFORME
s=4
s=
s=2d 23
2
1
0
r=l 2 m=3
Ising
f
3
s=l
s=
r=l 2 m=4
3
5
5
r=l 2 3 m=5
4
Potts à 3 états
Ising tricritique
Figure 4: Grille des poids conformes pour les trois premiers exemples de représentations unitaires minimales. Pour p,p’ définis comme ci-dessus on peut trouver T O et SO dans le domaine indiqué tels que (rop = 1. I1 s’ensuit que pour p - p’ 2 2, il existera des poids négatifs dans la table. Le champ scalaire correspondant A h o , ~aura o des corrélations qui croissent avec la distance. Ceci était exclu dans un cas unitaire. La cohérence de ces modèles minimaux sera étudiée dans la section 3. Afin de montrer que ceci n’est pas une possibilité académique, considérons l’exemple suivant dû à Cardy, impliquant un champ scalaire unique, outre l’opérateur unité (et ses descendants comme le tenseur énergie-moment). En nous concentrant sur l’algèbre V, nous cherchons une grille à deux cases (prenant en compte la symétrie indiquée dans (147)). Avec la duplication, ceci veut dire quatre éléments dans les intervalles 1 5 T 5 p’ - 1, 1 5 s 5 p - 1 tels que p > p ‘ , et p et p‘ premiers entre eux. L a seule possibilité est une colonne unique ( r = 1, p’ = 2) de quatre poids ( p = 5, 1 5 s 5 4) égaux deux à deux. En conséquence nous avons deux poids indépendants, et les valeurs de h et c sont c = -22
h = O , -15
5
L’unique champ scalaire non trivial A- 1 - 1 a pour dimension 5 -
5
A quelle théorie des champs en interaction (au point critique) ceci pourrait-il correspondre? Le seul candidat semble être le modèle scalaire avec un terme d’interaction en i(p3 avec un couplage cubique imaginaire pur, qui coïncide avec le modèle continu effectif de la singularité de Lee et Yang. Dans cet
IX.1.7
133
INVARIANCE CONFORME
example, il n’y a pas de symétrie brisée au point critique, mais la longueur de corrélation diverge, et le modèle n’a aucune chance d’être unitaire. Désignons, comme de coutume, l’exposant critique de la corrélation à deux points par 17. I1 s’ensuit que dans ce cas bidimensionnel 17 = 2A = ce qui est bien une valeur négative (ainsi les corrélations croissent avec la distance!). L’exposant O relatif à la singularité de l’aimantation est tel que
-2,
m,
N
(150)
‘h
où h désigne ici la déviation par rapport au champ magnétique critique (externe). Les lois d’échelle impliquent que O=-
d-2+17 d+2-17
~
d=2
L - - 1
4-17
‘
(151)
en excellent accord avec les simulations numériques. I1 existe une relation entre cette partie singulière croissante de l’aimantation et le fait que, après soustraction, il reste au point critique une corrélation qui croît à grande distance.
1.8 Caractères de l’algèbre de Virasoro Pour les applications ultérieures, il est utile de connaître les caractères des représentations de l’algèbre de Virasoro. Dans une représentation caractérisée par c et par le poids dominant h, ces caractères sont des fonctions génératrices des nombres d’états linéairement indépendants au niveau n, et correspondant donc à une valeur propre h f n pour LO. A q fixé, q = exp 2inr inférieur à un en module (Imr > O), le caractère apparaît comme la trace dans la représentation donnée de l’opérateur qLo. En d’autres termes, si dim(h + n ) est la dimension de l’espace au niveau n on définit 00
~ ( ~ (, Th) = )
Tr qL0-c/24-
dim(h + n)qn+h-c/24
q = exp 21x7
n=O
(152) On verra plus loin le rôle du facteur supplémentaire q-c/24 inclus dans cette définition. Pour des valeurs génériques de c et h, quand la représentation de poids dominant est telle que le module de Verma correspondant n’a pas de vecteur singulier, il est clair que
La forme factorisée de P ( q ) montre que la série qui définit x converge pour tout 141 < 1. Partant de l’équation (83), il n’est pas difficile de montrer que le terme dominant dans le développement asymptotique de p ( n ) , le nombre de partitions de R , est (Hardy-Ramanujan)
134
IX.1.8
INVARIANCE CONFORME
La situation est plus intéressante pour les représentations dégénérées, où le module de Verma contient des sous-espaces invariants. D’après le diagramme du type indiqué dans la figure 3, et partant d’une expression telle que celle donnée dans (153), on doit soustraire des termes analogues. A chacune des étapes intermédiaires, la somme des espaces invariants n’est pas directe. I1 en résulte que, pour r et s dans la grille conforme, la formule des caractères des représentations minimales obtenue par Rocha-Caridi s’écrit, avec X(c,h,,) E x T , S
Dans cette expression, comme dans (146), p et p’ sont des entiers premiers entre eux tels que p > p’, r varie entre 1 et p‘ - 1, s entre 1 et p - 1, avec une restriction supplémentaire, par exemple r p - sp’ > O, afin d’éviter un double comptage. La charge centrale vaut c = 1 - 6(p - ~ ‘ ) ~ / p pOn ’ . obtient les modèles minimaux unitaires pour p’ = m , p = m + 1, m entier 2 2. (i) Dans le cas minimal unitaire, la représentation irréductible correspondant à rn = 2 est trivia.le, de dimension 1. Posant x 1 dans la formule (155) on obtient l’identité (pentagonale) d’Euler
(156) n=-cc
1
(ii) I1 est possible de présenter l’expression (155) des caractères sous une forme plus compacte, qui nous sera utile par la suite, en introduisant la notation suivante. Soit N = 2pp’ un entier pair. Au lieu d’indexer le caractère par le couple r, s correspondant à hr,6 dans (147), utilisons un entier X T P - sp’ modulo N . Observons que si wo TOP sop‘ mod N , avec rop - sop’ = 1 (étant donné que p et p‘ sont premiers entre eux), nous avons 1 mod 2N et woX rp sp’ mod N . Finalement on substitue à P ( q ) la fonction de Dedekind
=
wi
+
+
n O, de sorte que IqI < 1. L’intérêt de ce choix de conditions aux limites est de mettre en évidence l’indépendance des termes correspondants aux variables T et ;i (ou q et rj). Décomposons l’espace des états en représentations irréductibles du produit des algèbres (V, caractérisées par des poids dominants (h,h). A ces représentations ~ nombre seront associés des opérateurs primaires de même poids. Soit N h , le de fois où la représentation ( h ,h) apparaît dans cette décomposition. Si le nombre de représentations irréductibles distinctes est fini (ou dénombrable), nous pouvons utiliser la définition des caractères conformes donnés par les équations (152), (155), (158) pour écrire
v),
Les entiers IVh,&sont positifs. De plus l’unicité dé l’état fondamental, ou état du vide, invariant par les transformations globales (dans le plan le groupe SL(2,C), sur le tore, les translations), impose la normalisation &,O = 1. Comme nous utilisons des représentations “réelles”, x , , ~ ( ; i= ) X ~ ~ ( T ) . Dans un domaine rectangulaire, q = rj = e x p ( - 2 ~ M / L ) , considérons le cas où M I L -f 00, q -f O. Si nous supposons que tous les opérateurs primaires ont une dimension positive A = h h > O, nous retrouvons le comportement limite
+
ainsi que nous l’avions afErmé dans la section 1. Tout état tel que A, = h h n donnera lieu à une correction relative exponentiellemenmt petite, exp( -2nA,M/L). Le spectre de la matrice de transfert engendre ainsi
+ +
IX.3.1
151
INVARIANCE CONFORME
l’ensemble des dimensions conformes de la théorie, donné par les rapports de valeurs propres Xn/Xo = exp(-27rAn/L)
(213)
qui sont tels que ln(X,/Xo) se comporte en L-l. Cependant, si certains opérateurs ont une dimension négative, le comportement dominant (212) sera modifié, comme nous l’avions anticipé dans la section 1.4, et l’on trouvera
La succession des valeurs propres de la matrice de transfert sera déplacée de -Ainf X n / h = exp(-2r(An
- Ainf)/L)
(215)
Ceci montre que l’on doit être prudent dans l’interprétation des résultats numériques. Un exemple de ce phénomène est fourni par la singularité de Ainf = On prédit (et de fait on observe Lee et Yang, avec c = numériquement) que teff = f . Plus généralement dans un modèle minimal (équation (146) et (147)) caractérisé par une paire ( p , p ‘ ) , on a dans le cas le plus extrême
-?,
Ainf =
1-(P-P‘I2
2PP‘
-2.
Ceff
6
= 1 - -> O PP’ -
La fonction de partition dans un domaine périodique obéit à des contraintes de cohérence globale. D’après l’invariance euclidienne, l’espace et le temps jouent des rôles symétriques. Nous pouvons les échanger, de telle sorte que, dans un rectangle de taille L, M , la fonction de partition prend les formes équivalentes 2 = T r ( 7 ~=) Tr(7~)~. ~ Ni l’une ni l’autre de ces expressions n’exhibe explicitement cette symétrie, et on conçoit qu’imposer une telle invariance impose une limitation très forte dans le choix des coefficients du développement (211). En termes plus généraux, un tore peut être considéré comme le quotient du plan complexe par un réseau de translations A, engendré par deux périodes indépendantes w1 et w2. Un autre choix de périodes fondamentales w i et w i engendre le même réseau A, pourvu que la relation entre (w1,wz) et ( w i , w i ) soit linéaire à coefficients entiers dans les deux sens, c’est-àdire inversible et de déterminant un. Ces conditions préservent l’aire ainsi
152
INVARIANCE CONFORME
IX.3.1
que l’orientation d’une cellule fondamentale. Le groupe des transformations associées est le groupe modulaire SL(2, Z ) . De plus, l’invariance par rotation et par dilatation entraîne que seul le rapport des poids r = w2/w1 est la seule variable significative. Les transformations ci-dessus agissent sur r comme transformations homographiques avec des coefficients entiers et un déterminant un, les matrices f A étant identifiées. On donne parfois le nom de groupe modulaire à SL(2,2)/22 (écrit aussi PSL(2;Z), groupe projectif linéaire sur les entiers), et la contrainte d’invariance des fonctions de partition (ou de covariance des fonctions de corrélations sur un tore) est appelée invariance modulaire.
3.2 Formule limite de Kronecker Revenons au modèle gaussien, afin de vérifier l’invariance modulaire dans un cas élémentaire. L’espace des états est l’espace de Fock du champ libre. Dans une version hamiltonienne, les modes propres correspondent à un moment quantifié p , prenant des valeurs qui sont des multiples entiers de 2.ir/L. Les modes de propagation vers la droite correspondent aux valeurs positives de p,, les modes de propagation vers la gauche à p , négatif. La condition de périodicité spatiale implique que ces modes sont associés à la propagation sur un cercle. Nous soustrayons le mode nul (correspondant à une valeur constante du champ), qui conduirait à un résultat infini, en effectuant une renormalisation multiplicative de la fonction de partition 2. Pour chaque mode bosonique, le nombre d’occupation prend des valeurs entières non négatives, et la charge centrale est c = 1. Nous nous attendons donc à ce que la fonction de partition soit un produit de facteurs statistiques de Bose de la forme
en accord avec l’équation (153) pour c = 1, h = O. Nous avons utilisé ici la définition (157) de la fonction de Dedekind ~ ( 7 ) . Une preuve directe de (217), susceptible de généralisations ultérieures, est connue depuis le travail de Kronecker dans les années 1880 dans le contexte de la théorie des nombres. La preuve consiste en une évaluation directe de l’intégrale de chemin et exhibe un facteur inattendu, qui fait défaut dans l’expression (217), et qui est essentiel pour l’invariance modulaire. C’est pour cela que nous n’avons écrit la forme (217) que comme une relation de proportionnalité. Appelons ICi les générateurs du réseau dual de A,
IX.3.2
INVARIANCE CONFORME
153
où A = Imw2Wl est l’aire du tore. Les valeurs propres du laplacien sont données par
En,,,, = ( 2 ~ ) ’Inllc’
+ nzk212
(219)
où les n1,2 sont entiers. La fonction propre normalisée correspondant au mode nul sur 7 = C/A est cpo = A - + . En omettant ce mode nul, l’intégrale fonctionnelle exprimant la fonction de partition est formellement égale à
Z1 =ID. Ai6 (Ld’xcpcpo)
=A$’ ,
exp (-$Ld’x(Vcp)’)
1
(220)
-
1 1 . 1 , ~ Ez1,nz ~
Le facteur A i est destiné à rendre le résultat final sans dimension. Dans l’équation (220), le produit sur les modes est divergent ultraviolet car les valeurs propres Enl ,n2 ne sont pas bornées. Le prime dans le produit indique l’omission de la contribution n1 = nz = O. La régularisation (et renormalisation) standard d’un tel produit infini utilise le procédé dit régularisation C. Cette terminologie a pour origine le prolongement analytique de la fonction C de Riemann utilisée dans l’étude de la distribution des nombres premiers. Introduisons la fonction analogue
absolument convergente’ et donc analytique, pour R e s > 1. Comme nous allons le voir ci-dessous, cette fonction possède un pôle à s = 1, mais admet un prolongement analytique jusqu’à s = O. En comparant les expressions (220) et (221), on définit la fonction de partition renormalisée 21 par la formule dG ds Désignons comme précédemment le rapport w2/w1 par r , et posons 4 = exp2ii-rr. Pour R e s > 1, nous insérons la définition de Eni,nzdans (221), ce qui donne l’expression
Zr = A* exp $-(O)
qui possède une propriété d’invariance modulaire explicite. Si nous subcwi, w2 = bwi awb, et donc r = stituons dans G(s), w1 = dwi
+
+
154
INVARIANCE CONFORME
+
IX.3.2
+
(UT' b)/(cr' d), ad - bc = 1, on voit immédiatement que G(s) est invariant. Par conséquent le prolongement analytique assure que cette propriété restera vraie pour 21. Revenant à (223), le premier terme fait intervenir la fonction C(s) = Cïm-', qui a un pôle simple de résidu unité à s = 1 et telle que 2C(O) = -1, 2C'(O) = -1n2n. Dans le second terme, la somme sur m donne une fonction périodique de nr, de période unité. Elle admet donc un développement en série de Fourier de la forme
dy e2inp(nRe~-y) [y2
&g:
+
dy e 2 i s p ( n R e ~ - y )
-
1 n2Im r 2 ]
1"
dt ts-ïe-t(y2+n2imT2)
dt ts-3/2e-[tnZ~rnr2+n2(p2/t)-2inpnReT ]
4)
Pour p = O, l'intégrale se réduit à î ( s - lnImr11-28. Nous isolons ce terme, sommons sur n # O, et utilisons l'équation fonctionnelle pour la fonction de Riemann
Changeant t en Iap/nImrI t , donne
IX.3.2
155
INVARIANCE CONFORME
2,
La dernière somme double est une fonction entière paire de s et le membre de droite est donc pair en s + 1- s, ce qui fournit le prolongement analytique requis de G(s). Comme pour 2 > O
et que C(2) = r2/6, on trouve au voisinage de s = O
Finalement
G(0) = -1 Remarquant que Jw1J /All2 = i/(Im 7 ) l I 2 , on trouve, d'après l'équation (222)' la valeur précise de la fonction de partition 21 2 1
1
=
(227)
(Im.>'i'I(M3
qui dif€ère de (217) par le préfacteur (Im T ) - + . Ce facteur est essentiel pour assurer l'invariance modulaire, qui était en évidence tout au long du calcul. L'origine de ce facteur tient à la soustraction du mode nul. 1
On déduit de l'équation (227) que lq(~)1(Im T)4 est invariant modulaire. Pour être précis, l'action des deux générateurs T 4 T 1 et T 4 -7-l du groupe modulaire sur V ( T ) est donnée par
+
Dans une transformation générale T + 7' = (a7
=
~ ( 7 ' ) EA(CT
+ b)/(cT + d) nous avons donc
+ d )1
2~(7)
(229)
où E A est une racine vingt-quatrième de l'unité. La détermination de ces phases à partir de la théorie des nombres, qui n'est pas nécessaire ici, est due à Jordan et Dedekind.
Dans le cas du champ libre, la fonction à deux points peut être aisément calculée sur le tore. Elle doit satisfaire à
156
IX.3.2
INVARIANCE CONFORME
Le facteur 2~ additionnel dans le membre de droite est en accord avec la normalisation à courte distance (équation 162) tandis que le terme 1/A représente la soustraction du mode nul, rendant -A inversible dans le sous-espace orthogonal. I1 est entendu que la fonction S et la fonction de corrélation doivent être doublement périodiques. La solution de l’équation (230) est exprimée en termes d’une des fonctions û (appendice A), que nous normalisons selon
-00
où, comme précédemment, nous utilisons la notation q = exp(2ir.r) tandis que y = exp(2irz/wl), et, comme d’habitude, P(q) = nY(1- qn). On vérifie qu’on a
= exp (--2r
[
(Im ~ 1 2 / w 1 ) ~ Imr
2
(232)
I1 est aisé de montrer que est doublement périodique, symétrique dans l’échange 1 H 2, et que son comportement à courte distance est de la forme r 1 2
-
212212
(233)
I1 sera utile dans la suite de connaître les valeurs r12 quand z12 a des coordonnées rationnelles .dans la base w1, w2. Soit N , k et e des entiers. Alors
où Dk/N,e/N(T) =q
- &(Üe(N-e)/N2-1)
IX.3.2
157
INVARIANCE CONFORME
Par construction D k / N , e / N ( T ) s’annule quand k et e sont tous deux multiples de N . Vérifier que cette fonction possède les propriétés
Les fonctions D admettent une autre interprétation qui est la suivante. Revenons au calcul de la fonction de partition du champ libre, mais, au lieu de supposer le champ doublement périodique, exigeons que, après un cycle autour de w1 et w 2 , il soit multiplié par une phase (naturellement le champ est alors complexe). Plus précisément, pour X et 1-1 entiers, nous convenons we
Les modes propres correspondent à des valeurs propres de la forme
-
(n2
+
6)
k1 +
(n1
+ $) k2 =
{
(n1+
$)
w1+
(n2
+ 6)
w 2 )
(240) Nous n’avons pas à effectuer la soustraction du mode nul lorsque k ou 1 (ou les deux) sont différents d’un multiple de N . Finalement, au lieu de calculer la racine carrée du déterminant inverse, nous calculons simplement le déterminant. Définissant
nous trouvons en répétant les calculs précédents et après un prolongement analytique
Ainsi D k / N , e / N (T) apparaît-il comme un déterminant renormah6 sur des modes correspondant à des conditions aux limites du type (239). (i) Vérifier l’équation (242).
158
INVARIANCE CONFORME
IX.3.2
(ii) Dans le cas du champ libre, obtenir la valeur moyenne (constante) du tenseur impulsion-énergie sur un tore. En effectuant une déformation 6 x p = 6 ~ p ” x ” ,où 6c est une matrice infinitésimale, nous avons
(Tpy(x)) 8 ” z ” = ( T p v ( x ) )68‘” = ( T ( z ) )[ô€’’ où ( T ( z ) )=
- 6c22 + i(6ci2 + 6c21)] + C.C.
(T)est indépendant de z ,
Insérant l’expression (227) de Zi, nous obtenons
La dernière somme semi-convergente doit &re comprise comme une double limite, où l’on somme d’abord symétriquement sur p , et ensuite sur n.
3.3 Modèle d’Ising D’après l’expression (171) de l’action dans le cas d’un champ de Fermi libre, et prenant en compte la statistique antisymétrique, nous obtenons la fonction de partition sur un tore comme un produit de deux Pfaffiens Pf(d)Pf(a), où d et sont les opérateurs de Cauchy-Riemann. Cette quantité est également la racine carrée du déterminant du laplacien, soit (det - A ) l j 2 . Cependant, les conditions aux limites doivent être choisies de façon appropriée. D’après les résultats du chapitre II, les champs 1c, et $ doivent être antipériodiques le long d’un des générateurs w1, w2 au moins. Désignons par O ou les conditions périodiques ou antipériodiques, en accord avec les notations de la sous-section précédente. Nous venons d’obtenir la valeur de (det -A) comme 1 D k p ~ / ~ ( 7 avec ) 1 ~ ,k, = O, 1. D’après le chapitre II, il s’ensuit que nous avons
a
fr
Le terme ID0,oI s’annule, ce qui reflète la présence d’un mode nul. Ce résultat est en accord avec les calculs directs de Kaufmann, Ferdinand et Fisher. On remarque que partant d’un des termes non nuls dans (244), l’invariance modulaire requerrerait la présence des deux autres. De fait, d’après les équations (236) et (237) nous obtenons l’action des transformations T + T 1 et T --+ - 7 - l . Ces derniers engendrent des permutations sur les trois déterminants
+
IX.3.3
159
INVARIANCE CONFORME
2 5)
Ceci peut aussi être compris en suivant l’effet du changement de base (w1,w2) indiqué sur les conditions aux limites correspondantes. I1 en résulte que la combinaison (244) est invariante modulaire. Les diverses conditions aux limites qui apparaissent dans cette expression sont appelées “structures de spin”. Trois d’entre elles contribuent à la fonction de partition. I1 est maintenant possible de faire le lien avec le développement en caractères, conformément à l’équation (211). Les fonctions D i r c , +s’expriment naturellement comme des carrés. Définissant
O
O 00
d 2l 1o ( ~ )= qh n ( l
+ qn)
(247)
1
qui obéissent aux relations 1
d+,+(7-)dO,+(.)d+,O(‘) di,$(‘)
= qiû
+
(248)
= dO,+(r) 16di,o(.)
On reconnaît alors que les caractères prennent la forme des combinaisons
xc,h,
1
avec c = 5 et h = O,
$
ou
&,
(249a)
160
INVARIANCE CONFORME
- 2I
{
$(1
+$+a)
IX.3.3
p+t)}
- n(1CO O
+CO
=- 1
[(24k+5)*-1]/48
(Q
-
Q
[(24k+11)2-1]/48
1
(249b)
1 p(q)
+Oo
=-
[(24k-2)’-1]/48
(Q
- Q [(24k+10)z-1]/48
I;=-CO
(249c) Par conséquent on peut récrire la fonction de partition du modèle d’Ising comme forme sesquilinéaire dans les caractères correspondants
en accord avec la discussion générale. Cette formule met en évidence le contenu physique du modèle, avec trois opérateurs primaires, à savoir l’identité, la densité d’énergie et le spin. La déduction directe confirme la valeur c = $ de la charge centrale, ansi que les poids conformes (O, O), et &) respectivement. L’invariance modulaire est également claire, ainsi que nous l’avons vu ci-dessus.
(h,
(a, 2)
On peut aussi obtenir les diverses fonctions de corrélations sur le tore. Considérons d’abord 16:s champs fermioniques. Nous rappelons que dans le plan
avec l’expression complexe conjuguée pour les champs $. En supposant le champ S) de poids ( $ , O ) , il s’ensuit que sur un ruban périodique, obtenu par la transformation zplaii = exp(2ia/L)z,,ban, on a l’expression
IX.3.3
161
INVARIANCE CONFORME
-
Cette fonction est antisymétrique dans l'échange z1 2 2 , et antipériodique $(z + L) = - @ ( z ) (d'où l'indice $). I1 existe cependant une autre possibilité, impliquant un champ périodique @(z L) = @ ( z )(indice O ) , à savoir
+
Sur un tore, des corrélations analogues satisfaisant à a1 ($(Zi)@(tZ))
= 4 1 , 2)
(254)
sont distinguées par un double ensemble de conditions périodiques et antipériodiques, lesquelles interdisent l'existence de modes nuls. Les indices k , e prenant les valeurs O , 1 et k , e n'étant pas simultanément nuls, nous écrivons
Le premier indice i k se réfère au comportement dans la direction w2, le second au comportement dans la direction w1. En utilisant la function F ( z ) introduite en (231), et y = exp(2inz/wl), on peut vérifier que les expressions requises sont
Les facteurs de normalisation s'écrivent
162
INVARIANCE CONFORME
IX.3.3
On retrouve les expressions (252) et (253) dans la limite d’un ruban. Ces dernières sont appelées fonctions de corrélation avec conditions aux limites de Neveu-Schwarz et Ramond respectivement, dans le contexte de la théorie des cordes. On tire de l’équation (255) la fonction de corrélation énergieénergie sur un tore, somme pondérée de trois termes
Le prime dans la somme indique l’omission du secteur (0,O). Bien que ID0,ol s’annule, ce secteur périodique-pérodique peut donner des contributions à d’autres quantités. Nous verrons par exemple dans la section 3.8 que la valeur moyenne ( E ( z , Z)) est une constante non nulle, qui provient uniquement de ce secteur
De même ce secteur contribue aux corrélations spin-spin (Di Francesco, Saleur et Zuber). En utilisant les notations des fonctions 0 (appendice A) nous avons
de sorte que
et, à un facteur multiplicatif près,
u=2
avec
el(Z,T)
N
2-0
e;(o,T)z, e ; ( o , T ) = 2 n 9 ( ~ ) ~ .
L’expression (261) se comporte à courte distance comme on s’y attend. On peut aussi se convaincre que la fonction de corrélation est doublement
IX.3.3
163
INVARIANCE CONFORME
périodique. Le point remarquable est que cette fonction est une somme de
E
contributions provenant de quatre secteurs, sous la forme 2, (ou), / Z,, où, au numérateur, le secteur doublement périodique (v = 1) donne une = O. Chacune des quantités contribution non nulle, en dépit du fait que 2, partielles 2, (au),,relative à une structure de spin donnée, satisfait à une équation qui généralise sur un tore l’équation correspondante de Belavin, Zamolodchikov et Polyakov valable dans le plan et qui a été obtenue par Eguchi and Ooguri. Pour tout opérateur A associé à une représentation possédant un vecteur singulier au niveau 2, on a ainsi
c,
Ces équations font intervenir les fonctions de Weierstrass p et qui ont respectivement un pôle double et simple à l’origine, ainsi que la constante QI, ces quantités étant définies par les relations
Notons que C(z,T ) n’est pas doublement périodique et que la constante 01 a déjà fait son apparition dans l’équation (243). En utilisant les mêmes notations, la fonction de corrélation ( E ) donnée par l’équation (258) s’écrit
Les fonctions de corrélation d’ordre plus élevé sur un tore peuvent aussi être obtenues sous forme fermée.
3.4 La classification A-D-E des modèles minimaux Revenons à la discussion de la section 3.1, et en particulier à l’équation (211)’ où la fonction de partition est écrite comme une forme sesquilinéaire dans les caractères de l’algèbre de Virasoro, avec des coefficients entiers non négatifs. Une telle expression résulte d’une formulation hamiltonienne, ayant fait choix des axes de temps et d’espace. Cependant un tel choix
164
INVARIANCE CONFORME
IX.3.4
est en fait arbitraire. Dans une transformation modulaire, la fonction de partition doit être invariante, ce qui conduit à des contraintes sur le contenu opératoriel des modèles. Dans la sous-section précédente, nous avons montré par un calcul direct (équation (250)) un exemple typique impliquant une telle somme de trois termes. En un sens, la fonction de partition gaussienne (équation (227)) est aussi un cas limite de cette situation. Dans cette section, nous allons exposer les résultats obtenus en imposant la contrainte d’invariance modulaire dans le cas général, où la charge centrale prend la valeur rationnelle c = 1 - 6(p - ~ ’ ) ~ / p pavec ’ , le cas particulier mais important des modèles unitaires tels que p et p’ soient des entiers consécutifs. De façon remarquable, une classification complète peut être décrite en des termes reliés à la classification de Cartan-Killing des algèbres de Lie simples (de façon spécifique, une sous-famille appelée “simplement lacée”). Cette même classification A-D-E , où A désigne l’algèbre de Lie des groupes unitaires, D celle des groupes orthogonaux en dimension paire et E les trois algèbres de Lie exceptionnelles Ec, E7 et Es, apparaît dans des circonstances variées, en apparence sans relation. Un autre cas fameux est celui des sousgroupes finis du groupe des rotations tridimensionnelles (à une conjugaison près). Le fait que nous puissions obtenir une description complète de tous les modèles minimaux est, jusqu’à un certain point, tout à fait surprenant. I1 montre la puissance de l’invariance conforme appliquée aux modèles critiques bidimensionnels. Bien que toutes les implications de ce résultat n’aient pas encore été dégagées au moment où nous écrivons ces lignes, nous savons grâce aux travaux sur les modèles intégrables (Baxter, Andrews et Forrester, Pasquier) que l’on peut construire des modèles sur réseau qui correspondent à chacun des comportements critiques prédits. La relation avec les modèles intégrables n’est cependant pas encore claire. Quoi qu’il en soit, il est d’une certaine importance d’obtenir, même dans un domaine restreint, une description complète des classes d’universalité critiques. Afin de mener à bien le présent programme, nous devons décrire l’action du groupe modulaire sur les caractères de l’algèbre de Virasoro. Ce groupe est engendré par les deux transformations
T S
T-+T+1 T -+ -T-l
(265a)
qui satisfont aux relations
S2 = ( S T ) 3
(265b)
Dans la section 1.8, nous avons montré qu’on peut indexer les représentations par un entier X défini modulo N = 2pp‘. Les caractères sont alors donnés sous forme compacte par l’équation (158). Rappelons que dans une transformation modulaire, la fonction de Dedekind, qui apparaît dans les dénominateurs, se transforme comme indiqué en (228). En utilisant la formule de Poisson
IX.3.4
INVARIANCE CONFORME
165
(266) on trouve ainsi que
T
(267~)
L’action de la transformation T est diagonale, étant, à une phase près, la multiplication par exp(2i7rX2/2N), tandis que celle de S n’est autre que la transformée de Fourier finie sur les entiers modulo N. La transformation de Fourier a un carré égal à G X , - ~ ~ , ~ N ~ ,, , mais ~ l’égalité x x = X - X restaure la propriété S2 = I. On vérifie sans peine que les deux transformations (267) sont compatibles avec la propriété d’antisymétrie x x = - x w o ~Rappelons . que wo est donné par wo = rop+sop’ mod.N, avec T O , so tel que rop-s0p’ = 1, identité qui exprime que les entiers p et p’ sont premiers entre eux. Nous pourrions bien sûr utiliser les symétries de x x pour restreindre la somme du membre de droite de (267b). Ceci, cependant, masquerait la relation entre les caractères de l’algèbre de Virasoro et un ensemble de fonctions analogues qui apparaissent dans l’étude des représentations de l’algèbre de KacMoody Ai1), c’est-à-dire l’algèbre des courants SU(2) locaux. Une classe intéressante de représentations de poids dominants de l’algèbre de Lie infinie correspondante est caractérisée par une anomalie (analogue à la charge centrale), appelée dans ce contexte le niveau, qui est désignée par un entier k , prenant les valeurs 0’1,... . Ces représentations de dimension infinie peuvent être décomposées comme sommes des représentations usuelles de SU(2), celle de spin le plus petit étant non dégénérée, de dimension X = 2jmin 1. Nous donnons dans l’appendice C un bref survol de cette théorie. La raison pour introduire ici les caractères de Kac-Moody SU2 tient à la relation étroite avec les caractères de l’algèbre de Virasoro. On va voir qu’il existe un parallèle dans la recherche de fonctions de partition invariantes modulaires.
+
Nous désignerons par x”xff(~) les caractères de l’algèbre A r ) (définis dans l’appendice C) pour les distinguer des caractères de l’algèbre de Virasoro qu’on pourrait appeler caractères conformes. Pour une représentation de niveau k de Ai’), nous posons N = 2( k 2)’ qui est à nouveau un entier pair. Le caractère s’écrit
+
166
IX.3.4
INVARIANCE CONFORME
Remarquons la ressemblance avec le cas des caractères de Virasoro (équation (158)), et observons que xXff se prolonge en une fonction périodique impaire de X (de période N )
Dans le cas présent, le rôle de l’involution X + WOX est joué simplement par la symétrie X + -A. La similitude se poursuit lorsqu’on considère les propriétés de transformation modulaire, que l’on doit comparer à (267)
x;ff ( T + 1) = e2ix(X2/2N-i) xxa f f (7) Xiff(-l/T)
-1
=-
(270~)
e2ixXX’/N
aff XXt (7-1
(270b)
X‘EZINZ Ainsi que l’ont suggéré Gepner et Witten, on peut développer un programme analogue de classification des fonctions de partition de type (211) en termes des caractères affines au lieu des caractères conformes, en imposant des conditions analogues sur les coefficients, pourvu que la somme sur X porte sur un domaine fondamental 1 5 A 5 frN - 1 puisque xgff = x i: = O . Dans les deux cas, les solutions invariantes modulaires peuvent être trouvées en deux étapes. Dans la première étape commune, on recherche simplement des matrices N x N avec des éléments arbitraires (appelons-les N ) ,qui commutent avec les deux matrices
où X et A‘, ainsi que les indices de N , portent sur les entiers modulo N . On trouve que de telles matrices N peuvent être écrites comme des combinaisons d’un ensemble linéairement indépendant défini comme suit. Soit S un diviseur positif quelconque de a N , unité incluse, et a le plus grand commun diviseur de S et 8 = N/26, noté a = (S,8).Manifestement a2 est un diviseur de SN. Définissons la matrice N x N (Ra)x,x, de sorte que celle-ci ait des éléments de matrice nuls à moins que a ne divise à la fois X et A’, auquel cas ( R ~ ) A= ,~J
SX’,wX+CN/a
(272)
cES/aS
L’entier w mod N/a2 est obtenu comme suit. Comme S/a et $/a sont premiers entre eux, on peut trouver des entiers p et a tels que p S / a - a S / a = 1, alors w = $ / a + aS/a (mod N / a 2 ) .On note que w2 = 1 (mod 2N/a2), en accord avec le fait que dans la définition (272) X‘/a = wX/a (mod N/cr2).
IX.3.4
INVARIANCE CONFORME
167
On vérifie que 0 6 commute à la fois avec T et S. On peut encore montrer, comme l’ont fait Gepner et Qiu, que inversement toute matrice N possédant cette propriété est une combinaison linéaire des matrices 0 6 et que ces dernières sont linéairement indépendantes. On remarque que si S = $ N , B = 1, Q = I, w = 1, et =I. La partie difficile est de trouver la superposition correcte des 0 6 telle X : ( T ) ( Y ~ ~ ~ ) A X( T~)X, Aqui I est invariante modulaire, se que l’expression réduise, quand elle est sommée sur les caractères fondamentaux (conformes ou affines), à une combinaison à coefficients non négatifs entiers. La normalisation dans le cas affine requiert que le coefficient de xTaff(~)xYff(~) soit l’unité. Dans le cas conforme, le coefficient de l’état fondamental analogue, correspondant à h = h = O, doit aussi être égal à l’unité. En utilisant la notation A, ceci correspond à un coefficient unité pour xi-,,( ~ ) x , - (T). ,~ La difficulté provient de I’antisymétrie des caractères dans les involutions X + w O X ou X + -A respectivement. Décrivons d’abord la solution pour les fonctions de partition affines, où nous écrivons la combinaison requise sous la forme
4
Le coefficient prend en compte l’antisymétrie X - X = - X X qui entraîne que chaque produit X ; X X , est compté deux fois. On démontre que deux séries infinies et trois solutions exceptionnelles remplissent tous les critères. Pour être concis, nous écrivons la solution c y 6 s / 6 apparaissant dans (273) en posant n = N/2, et nous rappelons que 0, agit comme la matrice unité
Quand n est impair, la solution est unique. Quand n est pair, il existe en général deux solutions distinctes, et trois quand n = 12, 18 ou 30. La signification de ce résultat apparaît de façon plus claire quand ces combinaisons invariantes (273)-(274) sont explicitées dans la table I. On peut alors faire le lien avec la classification A-D-E des algèbres de Lie simplement lacées (appendice C), en remarquant que les éléments diagonaux (O, 1 ou 2) dans la matrice (274), ainsi que le montre la table, sont reliés aux degrés des polynômes invariants fondamentaux de Casimir de l’algèbre de Lie correspondante. L’algèbre enveloppante d’une algèbre de Lie simple admet un sous-ensemble de polynômes invariants. Ces derniers peuvent, à leur tour, être écrits comme des polynômes dans un ensemble de T d’entre eux, T étant le rang de l’algèbre de Lie. Si l’on soustrait
168
3
x
m
t-
-
+ x
m -
+ x + s + x + N