258 16 18MB
French Pages 354 [345] Year 2019
François David
Théorie statistique des champs Tome 1
Table des matières Introduction du tome 1 0.1 But de l’ouvrage . . . . . 0.2 Contenu de l’ouvrage . . . 0.3 Remerciements . . . . . . 0.4 Bibliographie sommaire . 0.5 Plan structuré du tome 1
I
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
v . v . vi . viii . ix . xi
Mécanique quantique et intégrale de chemin
1 Rappels de mécanique classique et quantique 1.1 Mécanique classique . . . . . . . . . . . . . . . 1.2 Mécanique quantique . . . . . . . . . . . . . . . 1.3 Mécanique statistique quantique . . . . . . . . 1.4 Notes . . . . . . . . . . . . . . . . . . . . . . . 2 L’intégrale de chemin : introduction 2.1 Présentation . . . . . . . . . . . . . . . . . . . . 2.2 L’intégrale de chemin pour la particule libre . . 2.3 La particule dans un potentiel V (q) . . . . . . . 2.4 Observables et fonctions de corrélations . . . . 2.5 Système quantique à température finie : temps euclidien périodique . . . . . . . . . . . . . . . 2.6 L’oscillateur harmonique . . . . . . . . . . . . . 2.7 Notes . . . . . . . . . . . . . . . . . . . . . . . 3 Intégrale de chemin et physique statistique 3.1 Introduction . . . . . . . . . . . . . . . . . . 3.2 Intégrale de chemin et processus stochastique . . . . . . . . . . . . . . . . . . 3.3 Mécanique quantique euclidienne et physique statistique 1D . . . . . . . . . . 3.4 Notes . . . . . . . . . . . . . . . . . . . . .
1
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
3 . 3 . 17 . 26 . 33
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
35 35 37 42 47
. . . . . . . . . 54 . . . . . . . . . 61 . . . . . . . . . 68
69 . . . . . . . . . . . 69 . . . . . . . . . . . 69 . . . . . . . . . . . 75 . . . . . . . . . . . 82
ii
Théorie statistique des champs
4 L’intégrale de chemin : présentation générale 4.1 Introduction . . . . . . . . . . . . . . . . . . . . 4.2 Systèmes à plusieurs degrés de liberté . . . . . 4.3 Hamiltonien dépendant du temps . . . . . . . . 4.4 Méthode du col et limite semi-classique . . . . 4.5 Intégrale de chemin dans l’espace de phase . . . 4.6 Densité de niveaux et formule des traces . . . . 4.7 La particule chargée dans un champ classique . 4.8 La particule relativiste . . . . . . . . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
. . . . . . . .
83 83 83 86 87 94 98 101 106
5 Systèmes à N -corps : bosons, fermions, spin 115 5.1 Intégrale de chemin pour les bosons . . . . . . . . . . . . . . . 115 5.2 États cohérents et intégrale de chemin pour le spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136 5.3 Fermions, algèbre de Grassmann et intégrale de chemin anti-commutante . . . . . . . . . . . . . 144 5.4 Conclusion : avantages et désavantages de l’intégrale de chemin 153 5.5 Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
II
Théorie des champs et intégrale fonctionnelle
157
6 L’intégrale fonctionnelle : le champ libre 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . 6.2 Le champ libre comme limite continue du modèle gaussien 6.3 La fonction de corrélation à deux points et le propagateur . . . . . . . . . . . . . . . . . . . . . . . 6.4 Fonctions de corrélation à N points et théorème de Wick . . . . . . . . . . . . . . . . . . . . . 6.5 Configurations du champ libre gaussien . . . . . . . . . . 6.6 Opérateurs composites et développement à courte distance (OPE) . . . . . . . . . . . . . . . . . . . . . . . . 6.7 Équations quantiques du mouvement (Schwinger-Dyson) . . . . . . . . . . . . . . . . . . . . . . 6.8 Champ libre, particule relativiste et marches aléatoires . . . . . . . . . . . . . . . . . . . . . 6.9 Du champ scalaire aux bosons non relativistes . . . . . . . . . . . . . . . . . . . . . . . . 6.10 Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
159 . . . 159 . . . 160
7 La théorie des champs φ4 : théorie des perturbations 7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . 7.2 Intégrale fonctionnelle pour la théorie φ4 . . . . . . . . . 7.3 Le développement perturbatif : diagrammes de Feynman 7.4 Fonctions de corrélations et diagrammes connexes . . . .
. . . .
. . . 173 . . . 180 . . . 183 . . . 187 . . . 199 . . . 201 . . . 203 . . . 204
. . . .
. . . .
. . . .
207 207 208 212 226
Table des matières 7.5 7.6 7.7 7.8 7.9 7.10
Diagrammes et amplitudes irréductibles . L’action effective Γ[ϕ] . . . . . . . . . . . Calcul des amplitudes de Feynman . . . . Équations de Schwinger-Dyson . . . . . . Symétries, courants conservés et théorème Notes . . . . . . . . . . . . . . . . . . . .
iii . . . . . . . . . . . . . . . . . . . . . . . . . . . . de Noether . . . . . . .
. . . . . .
. . . . . .
8 La théorie φ4 : Renormalisation à l’ordre d’une boucle 8.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . 8.2 Régularisations UV . . . . . . . . . . . . . . . . . . . . . . 8.3 Les divergences UV en D = 4 . . . . . . . . . . . . . . . . 8.4 Renormalisation de φ4 à D = 4 : principe . . . . . . . . . 8.5 Renormalisation de la théorie de masse nulle à D = 4 . . 8.6 Renormalisation de la théorie massive pour D = 4 . . . . . . . . . . . . . . . . . . . . . . . . . . 8.7 Échelle de renormalisation et couplages effectifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.8 Transformations d’échelle et groupe de renormalisation . . . . . . . . . . . . . . . . . . . . . . 8.9 Renormalisation de φ4 en dimension D < 4 . . . . . . . . 8.10 Analyse des flots du groupe de renormalisation . . . . . . . . . . . . . . . . . . . . . . . . 8.11 Renormalisation dimensionnelle . . . . . . . . . . . . . . . 8.12 Notes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 Renormalisation perturbative : aperçu général 9.1 Introduction . . . . . . . . . . . . . . . . . . . . . 9.2 Divergences UV et comptage de puissance . . . . 9.3 Renormalisation et contretermes . . . . . . . . . 9.4 Premier aperçu historique . . . . . . . . . . . . . 9.5 Notes . . . . . . . . . . . . . . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . .
. . . . . .
. . . . . .
. . . . . .
231 238 249 258 259 264
. . . . .
. . . . .
. . . . .
265 265 266 274 278 283
. . . 286 . . . 288 . . . 294 . . . 299 . . . 305 . . . 311 . . . 312
. . . . .
. . . . .
. . . . .
313 313 313 322 325 328
Index
329
Bibliographie
334
Introduction du tome 1 0.1
But de l’ouvrage
Ce livre présente une introduction aux principaux concepts et outils communs à la physique statistique et à la théorie quantique des champs : développements perturbatifs et diagrammes de Feynman, intégrales de chemin et intégrales fonctionnelles, théorie de la renormalisation et groupe de renormalisation. Ces concepts et ces techniques mathématiques sont apparus à partir des années 1940-1950 à la fois en physique des hautes énergies (QED, théorie de la renormalisation, théories de jauge non abéliennes), en physique du problème à N-corps (physique nucléaire, physique de la matière condensée) et en physique statistique. Ces développement croisés ont culminé au début des années 1970 avec les applications du groupe de renormalisation à la fois (1) en physique des hautes énergies : construction du modèle standard des interactions électrofaibles et de la chromodynamique quantique, liberté asymptotique, et (2) en physique statistique par la théorie moderne des phénomènes critiques : les transitions de phase continues et les comportements critiques associés sont en fait décrits par des théories quantiques des champs ! Depuis ces idées et ces méthodes théoriques se sont appliquées à de très nombreux domaines de la physique statistique (phénomènes critiques, systèmes désordonnés, phénomènes hors équilibre, processus de croissance), de la physique de la matière condensée (physique des solides, matière molle, systèmes mésoscopiques), de la physique des systèmes quantiques (atomes froids), des systèmes dynamiques (transition vers le chaos, turbulence, systèmes complexes), pour citer les principaux. Elles sont en train d’irriguer et d’inspirer des domaines importants des mathématiques. Elles sont regroupées souvent sous le terme de « théorie statistique des champs ». Plutôt qu’une théorie comme la relativité ou la mécanique quantique, la théorie statistique des champs est une « boîte à outils » (outils venus de la physique statistique et de la physique quantique) dont le contenu est maintenant indispensable au physicien théoricien. Ces succès reposent sur deux éléments. (1) Tout d’abord il existe une analogie profonde entre le traitement mathématique des fluctuations thermiques en physique statistique et celui des « fluctuations quantiques » (principe d’incertitude) en physique quantique. Cette
vi
Théorie statistique des champs
analogie est particulièrement claire dans la formulation de la mécanique quantique en termes d’intégrale de chemins (Feynman). Une intégrale de chemin en « temps imaginaire » est analogue à une somme sur les micros états d’un système statistique classique 1D dans l’ensemble grand canonique, la constante de Planck ~ jouant le rôle de la température T . Cette analogie se généralise très naturellement entre les champs quantiques en D dimensions d’espace et les systèmes statistiques étendus en D + 1 dimensions. (2) Ensuite, les théories quantiques des champs (en général) et les phénomènes critiques sont des systèmes physiques avec un très grand nombre de degrés de liberté indépendants où les fluctuations (quantiques et statistiques) sont importantes sur une très grande gamme d’échelles de distance (longeur d’onde) et de fréquence (énergie). Leurs couplages et leur influence sur la dynamique « effective » du système ne peuvent être traités simplement. La théorie du groupe de renormalisation permet précisément de contrôler – plus ou moins proprement – ces couplages multi-échelles, en définissant proprement le concept de « théorie effective » et en permettant de calculer les « couplages effectifs ». Elle permet de dégager quels sont les degrés de liberté importants (en théorie quantique quels sont les champs) pour décrire la dynamique d’un système à une échelle donnée. De ce point de vue, le groupe de renormalisation a révolutionné notre façon d’aborder de nombreux problèmes en physique (nature des interactions fondamentales, émergence de comportements complexes, apparition de lois d’échelles) et au-delà. Il faut aussi mentionner d’autres idées très importantes qui font partie de cette boîte à outil, en particulier dans l’étude des systèmes de basse dimensionnalité et des systèmes désordonnés : excitations topologiques (solitons, vortex, instantons) et effets non perturbatifs, solutions exactes et systèmes intégrables, invariance conforme, supersymétrie... Elles forment le socle de la théorie des cordes. Elles sont également à l’origine des contacts et de la fertilisation croisée entre la théorie quantique des champs et les mathématiques. Enfin un certain nombre de méthodes de discrétisation (théories sur réseau, développements de couplage fort) et de méthodes de simulations numériques (Monte-Carlo), venues de la physique statistique, sont devenues des outils standards en théorie quantique des champs et en physique des hautes énergies.
0.2
Contenu de l’ouvrage
Cet ouvrage est donc une introduction aux applications de la théorie des champs à la mécanique statistique. Son contenu est cohérent, il peut être utilisé seul, ainsi que comme une introduction à certains aspects de la physique des champs et des particules, et à la physique statistique des systèmes à l’équilibre. Il ne dispense pas de la pratique de traités de théorie quantique des champs pour la physique des hautes énergies, ni d’ouvrages consacrés à la physique statistique et à la physique de la matière condensée.
Introduction du tome 1
vii
Ce manuel est divisé en quatre grandes sections, et pour des raisons pratiques en deux tomes. Ce premier tome se compose des parties I et II, et traite plutôt des aspects théorie quantique et théorie quantique des champs. Le deuxième tome se composera des parties III et IV, et traitera tout d’abord des aspects « statistique » et des applications en physique statistique de la théorie. La partie I traite de l’intégrale de chemin en mécanique quantique. Le but de cette partie est de bien faire comprendre l’analogie entre physique statistique à l’équilibre et mécanique quantique (formalisme du temps imaginaire). Les chapitres 1, 2 et 3 en forment la partie essentielle. Les chapitres 4 et 5 présentent des aspects plus avancés. Ils peuvent être sautés en première lecture, et leurs différentes sections peuvent être lues indépendamment en général. La partie II est une introduction à l’intégrale fonctionnelle en théorie quantique des champs, partir de l’exemple de la théorie scalaire φ4 . Les formulations de la théorie à temps réel et à temps euclidien et les règles de Feynman pour construire la théorie des perturbations sont traitées dans les chapitres 6 et 7. La théorie de la renormalisation perturbative et les équations du groupe de renormalisation sont introduites en détail au premier ordre dans le chapitre 8. Une brève introduction aux aspects plus généraux de la renormalisation perturbative est donnée dans le chapitre 9. Les formulations non perturbatives de la renormalisation « à la Wilson » et l’équivalence entre la théorie des champs φ4 renormalisée et la limite d’échelle au point critique du modèle d’Ising sont abordées dans le tome 2. La partie III traitera de la physique statistique des phénomènes critiques et de la théorie du groupe de renormalisation dans l’espace réel. Après un rappel des concepts de base de physique statistique, la théorie du champ moyen et la théorie de Laudau des phénomènes critiques seront introduites. Le principe de la théorie de K. Wilson du groupe de renormalisation et ses conséquences pour les phénomènes critiques seront ensuite explicités. Un chapitre sera consacré à des calculs explicites sur la théorie de Landau-Ginsburg-Wilson (LGW), essentiellement dans l’approximation du potentiel local. Ceci illustrera la puissance de la théorie de Wilson, et permettra de discuter en profondeur les relations entre renormalisation de Wilson et renormalisation perturbative en théorie des champs. La partie IV présentera des applications physiques de la théorie statistique des champs en physique statistique et en physique de la matière condensée. Elle contiendra également une introduction à des aspects plus avancés et modernes : invariance conforme, effets de taille finie. Les différents exemples pourront s’étudier indépendamment. En principe, les parties I (intégrale de chemin en mécanique quantique) et III (mécanique statistique, phénomènes critiques et groupe de renormalisation) peuvent être lues indépendamment (bien que pour la fin de la partie III il vaille mieux avoir vu I et le début de II). La partie II (théorie quantique des
viii
Théorie statistique des champs
champs et renormalisation) peut être lue à la suite de I, et indépendamment de III. Mettons en garde le lecteur à propos de ce qu’il ne trouvera pas, ou peu, dans cet ouvrage : — une exposition détaillée aux méthodes numériques et de calcul formel (analyse des développements en séries de hautes tempéatures, simulations par Monte-Carlo, matrice de transfert) ; — une introduction aux méthodes exactes (systèmes intégrables, ansatz de Bethe, matrice S) ; — un traité sur l’invariance conforme et les techniques reliées (gaz de Coulomb, dualité) ; — une introduction à la physique des systèmes désordonnés (un sujet en soi) ; — un traité sur les approches mathématiques rigoureuses (théorie constructive des champs, groupe de renormalisation exact, théorie de la renormalisation à tous les ordres) ; — une introduction au groupe de renormalisation pour les systèmes quantiques.
0.3
Remerciements
Ce livre est issu principalement des notes destinées aux étudiants du cours de deuxième année du parcours « Physique théorique » du Master « Concepts fondamentaux de la physique », que j’ai donné à l’École normale supérieure (et dans les locaux de l’université Denis Diderot) de 2001 à 2015. Je tiens à remercier tout particulièrement Jesper Jacobsen, qui m’a assisté pour construire et assurer les séances d’exercices, et m’a remplacé pour les cours à l’occasion pendant toutes ses années. Je suis également très reconnaissant à Édouard Brézin, à qui je dois l’opportunité d’avoir donné ce cours, ainsi qu’à Costas Bachas et Adel Bilal, qui ont coordonné ce parcours, et mes collègues enseignants et administratifs (en particulier Nicole Ribet et Mascia Reato). Cet ouvrage a également beaucoup bénéficié des cours que j’ai donnés dans d’autres établissements, à commencer par celui de théorie quantique des champs pour le programme Perimeter Scholars International du Perimeter Institute, que je donne depuis 2009, et de celui pour le programme doctoral de la Suisse romande que j’ai donné à l’Ecole polytechnique fédérale de Lausanne. Je tiens donc à remercier chaleureusement Neil Turok, Tibra Ali, David Gerson et Dan Wohn du Perimeter, ainsi que Frédéric Mila et Aurelio Bay de l’EPFL. Avoir pu enseigner dans de telles institutions est pour moi une chance inestimable. Michèle Leduc et Michel Le Bellac m’ont encouragé à faire de ces notes un ouvrage. Je les remercie infiniment pour leur persévérance et leur patience... Merci à Michel pour le temps passé à relire mes notes. De nombreux collègues
Introduction du tome 1
ix
m’ont, à divers stades, encouragé, conseillé ou inspiré pour la préparation de mes cours et l’écriture de ces notes. Je ne saurais me les remémorer tous, mais je tiens à mentionner, outre Jesper, Costas et Adel déjà cités, Denis Bernard, Michel Bauer, Olivier Parcollet et Jean Zinn-Justin. Enfin, mes remerciements et ma gratitude vont bien sûr à tous les étudiants et les étudiantes qui ont suivi mes cours, pour leur intérêt, leur patience, leurs questions et leurs critiques. Ce sont eux qui ont été ma principale source de motivation et d’inspiration pour travailler sur ce cours et préparer ces notes.
0.4
Bibliographie sommaire
La littérature sur le sujet est très riche, et il existe déjà d’excellents ouvrages d’introduction à la physique quantique, la physique statistique, la théorie des champs et la théorie statistique des champs. Cet ouvrage essaye d’avoir une présentation quelque peu originale du sujet, surtout en ce qui concerne les relations entre groupe de renormalisation perturbatif et groupe de renormalisation wilsonien, mais je me suis inspiré consciemment ou inconsciemment de plusieurs ouvrages et cours que j’ai eu l’occasion de suivre.
Ouvrages en français En mécanique classique, les livres de L.D. Laudau et E.M. Lifchitz [LL94] et le livre de V. Arnold [Arn74] sont des ouvrages de base. Pour la mécanique quantique, les deux volumes incontournables de C. Cohen-Tannodji, B. Diu et F. Laloë [CTDL73a] et le récent troisième volume de C. Cohen-Tannoudji, F. Laloë et B. Diu [CTLD17], sont des références ainsi que le livre de M. Le Bellac [LB13a, LB13b]. Pour une introduction à la mécanique statistique, on peut citer les deux volumes de cours de R. Balian [Bal82, Bal94]. Le livre de J. Zinn-Justin [ZJ12] est une introduction détaillée à l’intégrale de chemin en mécanique quantique. Le classique (un peu ancien) ouvrage de C. Itzykson et J.-B. Zuber [ID13] est une bonne introduction à la théorie quantique des champs, plutôt du point de vue physique des hautes énergies. Les deux volumes (un peu plus récents) de C. Itzykson et J.-M.Drouffe [ID13, ID89], et de M. Le Bellac [LB12] sont des introductions classiques à la théorie statistique des champs.
Ouvrages en anglais Si on considère l’anglais, qui est la lingua franca de la communauté scientifique, et tend à le devenir pour l’enseignement pré-doctoral et doctoral, la littérature devient immense. Les ouvrages en français précités sont pour la plupart disponibles en version anglaise : pour la mécanique quantique, le traité de Cohen-Diu-Lalo
x
Théorie statistique des champs
[CTDL92], celui de M. Le Bellac [LB06], celui de J. Zinn-Justin [ZJ10] ; pour la théorie des champs, ceux de C. Itzykson et J.-B. Zuber [IZ12], de C. Itzykson et J.-M. Drouffe [ID91], et celui de M. Le Bellac [LBB91]. Des ouvrages très classiques sont pour la théorie quantique des champs (donc surtout orientés physique des hautes énergies) : le traité de S. Weinberg [Wei95] (le premier des trois volumes pour ce qui est traité ici), le livre de M.E. Peskin et D.V. Schroder [PS18]. Le livre J. Zinn-Justin [ZJ02] est une bible orientée à la fois vers la physique des hautes énergies et la physique statistique. Beaucoup moins rigoureux et moins complet mais stimulant est le livre de A. Zee [Zee10]. Et pour ne pas oublier l’école russe, citons l’inspirant livre de A. Polyakov [Pol87]. Pour la théorie statistique des champs et ses applications à la mécanique statistique, citons (outre le Zinn-Justin) le livre de G. Parisi [Par98] et plus courts mais plus récents, les ouvrages de E. Brézin [Bré10] et de J. Cardy [Car96]. Des ouvrages récents orientés vers la physique de la matière condensées sont ceux de A.M. Tsvelik [Tsv07], de E. Fradkin [Fra13] et la très complète introduction à la physique de la matière condensée de P.M. Chaitkin et T.C. Lubensky [CL00]. Des références de base sur les méthodes mathématiques pour la physique théorique, indispensables pour un lecteur peu familier avec les outils mathématiques utilisés dans cet ouvrage, sont les ouvrages classiques de L. Schwartz et D. Huet [SH82] et de R. Courant et D. Hilbert [CH08] (ancien mais actualisé), et le traité plus récent et plus moderne de M. Stone et P. Goldbart [SG09]. Des références plus précises ou plus avancées seront données à la fin des différents chapitres.
0.5
Plan structuré du tome 1 Basique (première lecture)
Avancé (seconde lecture)
1 Rappels de mécanique classique et quantique 2 Intégrale de chemin : introduction 3 Intégrale de chemin et physique statistique 4 Intégrale de chemin : présentation générale 5 Bosons, fermions et spins 6 Intégrale fonctionnelle : le champ libre 7 φ4 : théorie des perturbations 8 φ4 : renormalisation à 1 boucle 9 Renormalisation : théorie générale
Chapitre 1 Rappels de mécanique classique et quantique Ce chapitre est consacré à des rappels standard de mécanique classique, de mécanique quantique et de physique statistique. Ceci afin de définir les concepts de base et de fixer les notations. Pour le lecteur qui n’est pas (ou plus) familier avec la mécanique classique analytique, nous renvoyons aux ouvrages classiques de Landau & Lifshitz [LL94] et de V.I. Arnold [Arn74].
1.1 1.1.1
Mécanique classique Formulation lagrangienne
Espace des configurations Dans la formulation lagrangienne, un système classique est décrit par son espace des configurations C et la loi d’évolution dynamique dans cet espace. C est l’espace des configurations instantanées possibles à un instant donné. Si le système a un nombre fini N de degrés de libertés, C est une variété (réelle) de dimension N . Une configuration instantanée du système sera un point q de C. Dans un système de coordonnée local de C au voisinage de cette configuration, les coordonnées locales d’un point x sont les {xi }i=1,N et donc pour la configuration q on utilise la notation q = {q i }i=1,N . La configuration du système évolue au cours du temps q = q(t) et la vitesse ˙ avec instantanée (vélocité) est le vecteur tangent q, i dq i i q = {q } , q˙ = {q˙ } = (1.1) dt On utilise la notation standard d’Einstein où les composantes d’un vecteur contravariant (coordonnées ou positions, vitesses, champs de vecteurs, etc.) sont étiquetées par des exposants, alors que celles d’un objet covariant (éléments d’une base, composante d’une forme différentielle) sont étiquetées par des indices. Mathématiquement, C est une variété différentielle, les vélocités appartiennent au fibré tangent à C.
4
Théorie statistique des champs
Exemple : N particules ponctuelles Donnons tout de suite un exemple simple : N particules ponctuelles et discernables, sans contraintes et se déplaçant dans l’espace euclidien de dimension D, E = RD . L’espace des configurations est donc C = E N = RN D , de dimension dim(C) = N D. Les coordonnées de l’espace des configurations sont les D coordonnées spatiales (indexées par les directions µ = 1, · · · D) des N particules (indexées par a = 1, · · · N ). Donc on note les configurations q = {q i } = {q µ,a }. Équations d’Euler-Lagrange En mécanique classique, l’évolution du système est donnée par les équations du mouvement, qui sont en général des équations différentielles du deuxième ordre par rapport au temps t. Pour des systèmes conservatifs (sans dissipation) les équations du mouvement dérivent (en général) d’un lagrangien L. Le lagrangien est une fonction de ˙ la configuration (position) et de la vélocité instantanée (vitesse) L(q(t), q(t)). Le lagrangien peut dépendre explicitement du temps, dans le cas d’un système nonconservatif. Ce sont les équations d’Euler-Lagrange ˙ ˙ ∂L(q, q) d ∂L(q, q) = dt ∂ q˙ ∂q
(1.2)
qui en termes, de composantes correspondent aux N équations ˙ ˙ d ∂L(q(t), q(t)) ∂L(q(t), q(t)) = dt ∂ q˙i (t) ∂q i (t)
,
i = 1, · · · N
(1.3)
Exemple : la particule 1D dans un potentiel Le cas le plus simple est celui d’une particule de masse m dans un champ de force dérivant d’un potentiel V indépendant du temps. Dans le cas unidimensionnel, la particule est sur une ligne, N = 1 et la coordonnée q est la position de la particule q ∈ C = R. Le lagrangien est l’énergie cinétique moins l’énergie potentielle m L(q, q) ˙ = q˙2 − V (q) (1.4) 2 Les équations du mouvement sont d dV (q) d2 q dV (q) d ∂L ∂L − = (mq) ˙ + =m 2 + =0 dt ∂ q˙ ∂q dt dq dt dq
(1.5)
donc l’équation de Newton pour une force dérivant d’un potentiel m q¨(t) = F (q(t)) = −
∂ V (q) ∂q
(1.6)
1. Rappels de mécanique classique et quantique
5
Formulation variationnelle et principe de moindre action Les équations d’Euler-Lagrange se déduisent d’un principe variationnel, le principe de moindre action. Pour trouver les trajectoires classiques, c’est-àdire les solutions classiques q(t) (ti < t < tf ) des équations du mouvement, à configurations initiales et finales données q(ti ) = qi
,
q(tf ) = qf
,
ti < tf
(1.7)
il faut déterminer les trajectoires q(t) dont l’action S[q] est stationnaire par rapport à des variations arbitraires de cette trajectoire. L’action est définie comme l’intégrale du lagrangien entre les temps initiaux et finaux Z
tf
S[q] =
˙ dt L(q(t), q(t))
(1.8)
ti
L’action est définie pour toute trajectoire (suffisamment régulière), mais qui n’est pas en général une solution classique des équations du mouvement. Le principe de moindre action s’énonce donc ainsi. Une trajectoire q est une solution classique des équations du mouvement avec les conditions aux limites 1.7 si pour toute variation « infinitésimale » de la trajectoire qui ne change pas les conditions aux limites q(t) → q (t) = q(t) + δq(t) ,
δq(ti ) = δq(tf ) = 0
(1.9)
la variation de l’action est nulle, autrement dit au premier ordre en S[q ] = S[q] + O(2 )
(1.10)
Dans le formalisme du calcul fonctionnel, le principe de moindre action veut dire que la dérivée fonctionnelle de l’action S[q] par rapport aux variations des trajectoires δq(t) aux temps intermédiaires ti < t < tf s’annule pour une trajectoire classique δS[q] = 0 , ∀ ti < t < tf ⇐⇒ q trajectoire classique δq(t)
(1.11)
Le concept de dérivée fonctionnelle δF δq(t) est la généralisation du concept de ∂ dérivée partielle ∂i f = ∂qi d’une fonction f ({q i }). C’est la dérivée partielle d’une fonctionnelle F[g] de la fonction de t, q = {q(t)}, par rapport à la valeur de la fonction q à l’instant t. Le concept de dérivée fonctionnelle est un concept fondamental de l’analyse fonctionnelle. Il jouera un très grand rôle dans la suite de cet ouvrage, et en particulier pour la théorie quantique des champs. À ce stade il suffit de savoir que les dérivées fonctionnelles obéissent aux mêmes règles que les
6
Théorie statistique des champs
dérivées partielles en ce qui concerne leur application à la multiplication et la composition de fonctions, en partant de la règle fondamentale δq i (t) = δ ij δ(t − t0 ) δq j (t0 )
(1.12)
δ(t − t0 ) est la distribution de Dirac sur R, qui généralise la relation pour les dérivées partielles ( 1 si i = j, ∂xi i (1.13) = δj = ∂xj 0 sinon. où δ ij est le symbole de Kronecker.
q
q2
q1
t1
t2
t
Figure 1.1 – Principe de moindre action : la trajectoire classique (trait plein) est celle qui extrémise l’action S[q], les conditions initiales et finales pour les positions étant fixées. Avec ces règles on obtient facilement les équations du mouvement à partir du principe de moindre action "Z !# 2 δ m dq(u) du − V (q(u)) = δq(t) 2 du Z dq(u) d δ(u − t) dV (q(u)) du m − δ(u − t) du du dq d2 q(t) dV (q(t)) = −m 2 − (1.14) dt dq
1. Rappels de mécanique classique et quantique
1.1.2
7
Formulation hamiltonienne
Espace des phases et équations de Hamilton La formulation hamiltonienne de la mécanique quantique est plus générale, elle s’applique en particulier aux systèmes avec contraintes. Elle est indispensable pour formuler la quantification canonique des systèmes classiques. Dans la formulation hamiltonienne, les « états dynamiques » du système, sont donnés par leur configuration classique (position) et leur « impulsion » (reliée à leur vélocité). C’est l’état à un instant donné qui détermine entièrement l’évolution future du système. Un état classique pour un système à N degrés de liberté est maintenant un point x dans un espace Ω de dimension 2N , appelé « espace des phases » ou « espace des états » (phase space) du système. Cet espace est muni d’une structure de Poisson et d’une forme symplectique. Les équations d’évolution correspondent à un flot hamiltonien dans l’espace des phases. Considérons d’abord le système simple de P particules dans RD , où N = P D et Ω = R2N . Un système de coordonnées canoniques sur Ω (voir plus loin la définition précise) est donné par les positions q = (q i ) et les impulsions p = (pi ), i = (µ, a) avec toujours µ = 1 · · · D et a = 1 · · · P . Pour une seule particule (P = 1) dans un potentiel scalaire V (q), le hamiltonien est l’énergie totale p2 + V (q) (1.15) H(q, p) = 2m P avec p2 = i p2i . Les équations du mouvement sont les équations de Hamilton p˙ = −
∂H ∂q
,
q˙ =
∂H ∂p
(1.16)
qui redonnent la relation entre l’impulsion (ici égale à la quantité de mouvement) et la vélocité, et la relation entre l’accélération et la force (ici le gradient du potentiel). p ∂V q˙ = , p˙ = − (1.17) m ∂q Crochets de Poisson Considérons deux fonctions (différentiables) f et g sur l’espace des phases, donc des fonctions de x = (p, q). Leur crochet de Poisson est défini comme {f, g} =
∂f ∂g ∂f ∂g ∂f ∂g ∂f ∂g − = i − ∂q ∂p ∂p ∂q ∂q ∂pi ∂pi ∂q i
(1.18)
avec la convention d’Einstein de sommation sur les indices répétés. Le crochet de Poisson est antisymétrique {f, g} = −{g, f }
(1.19)
8
Théorie statistique des champs
et satisfait l’identité de Jacobi {f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0
(1.20)
On a évidemment {p, q} = 1
i.e.
{pi , q j } = δij
(1.21)
où 1 est la matrice identité N × N . Les équations de Hamilton s’écrivent de façon symétrique q˙ = {q, H} , p˙ = {p, H} (1.22) autrement dit pour x = (q, p) un point dans l’espace des phases x˙ = {x, H}
(1.23)
Les équations de Hamilton sont des équations de flot. Elles sont de la forme x˙ = V(x) avec x = (q, p) et V est un champ de vecteur sur Ω. Ici le champ V dérive du hamiltonien Hvia le crochet de Poisson. Un tel flot est dit hamiltonien. Flots hamiltoniens De façon plus générale, considérons une fonction f (correspondant à une observable indépendante du temps). Sous le flot hamiltonien, la valeur de cette observable f (x(t)) dans un état dynamique, x(t), évolue avec le temps comme df (x(t)) = {f, H}(x(t)) (1.24) dt En particulier pour un hamiltonien (indépendant du temps), l’énergie E(t) = H(x(t)) est évidemment conservée dE = {H, H} = 0 (1.25) dt comme toute quantité dont le crochet de Poisson avec le hamiltonien s’annule. Si le hamiltonien H = H(x, t) et l’observable f = f (x, t) dépendent explicitement du temps, l’équation d’évolution est df ∂f = + {f, H} i.e. dt ∂t
df (x(t), t) ∂f (x(t), t) = + {f, H}(x(t), t) (1.26) dt ∂t
Mesure de Liouville La mesure de Liouville est l’élément de volume naturel dans l’espace des phases, définie comme Y dµ(x) = d2N x = dq i dpi (1.27) i
Cette mesure est invariante sous les flots hamiltoniens. Le volume d’un ensemble dans l’espace des phases ne change pas lorsqu’il évolue suivant le flot hamiltonien.
1. Rappels de mécanique classique et quantique
9
Variétés symplectiques et structures de Poisson La formulation générale de la dynamique hamiltonienne fait appel au concept de variété symplectique. Structure symplectique : Pour un système à n degrés de liberté indépendants, l’espace des phases Ω est une variété de dimension M = 2n. Considérons x = {xi } un système de coordonnées locales x = {xi } sur (une partie de) Ω. L’espace de phase Ω est muni d’une structure symplectique, c’est-à-dire d’une 2-forme extérieure fermée non dégénérée ω=
1 ωij (x)dxi ∧ dxj 2
Nous utilisons les notations standard du calcul différentiel sur les variétés et la convention d’Einstein de somme sur les indices répétés. Dire que ω est une forme extérieure équivaut à dire que la matrice (ωij ) est antisymétrique wij (x) = −wji (x)
(1.28)
Dire que cette forme est fermée équivaut à dire que sa différentielle extérieure est zéro dω = 0
⇐⇒
∂i ωjk (x) + ∂j ωki (x) + ∂k ωij (x) = 0
(1.29)
(avec ∂i = ∂/∂xi ), et dire qu’elle est non dégénérée équivaut à dire que la matrice antisymétrique ω ¯ (x) = [ωij (x)] est inversible partout (pour tout x). Les éléments de matrice de son inverse sont notés avec des exposants (même convention qu’en géométrie riemannienne). (¯ ω −1 )ij = ω ij Crochet de Poisson : Le crochet de Poisson de deux observables f et g est défini comme {f, g} = {f, g}ω = ω ij ∂i f ∂j g
(1.30)
L’identité de Jacobi 1.20 est équivalente à la condition de fermeture dω = 0. La donnée du crochet de Poisson { , } est équivalente à la donnée de la forme symplectique ω car on a évidemment {xi , xj } = ω ij (x) et les équations d’évolutions 1.23 et 1.24 restent valables.
(1.31)
10
Théorie statistique des champs
Mesure de Liouville : La mesure de Liouville prend une forme invariante sous les transformations canoniques Y dµ(x) = ω n = dxi |ω|1/2 , |ω| = | det(ωij )| (1.32) i
Elle a toujours la propriété qu’elle est invariante sous les flots hamiltoniens. Elle est donc intrinsèque à l’espace de phase, à une normalisation près. Cette normalisation est en fait fixée par la mécanique quantique ! Théorème de Darboux Localement dans l’espace de phase, cette description est équivalente à la formulation en termes de paire de variables conjuguées (qi , pi ) ou q = (qi ), p = (pi ) satisfaisant {qi , pj } = δij . En effet, le théorème de Darboux établit qu’il existe toujours de telles coordonnées locales sur Ω, dans lesquelles la forme symplectique prend la forme triviale 0 1 ... X ω= (1.33) dqj ∧ dpj i.e. (ωij ) = −1 0 . . . . . . .. .. .. j Mais ce n’est pas nécessairement possible globalement, en particulier pour des systèmes avec contraintes (par exemple le cas de la toupie). Dans ce cas l’espace des phases a une topologie non triviale, ce qui donne lieu à des effets physiques nouveaux et importants. Structure de Poisson : Enfin, il faut mentionner que le formalisme le plus général est celui de « structure de Poisson », qui prend en compte les cas où le crochet de Poisson, donc la forme ω −1 = (ωij ), peut être dégénéré (c’est-à-dire que ω −1 peut avoir des valeurs propres qui s’annulent). Dans le formalisme de Poisson, l’espace de phase Ω est muni d’un crochet de Poisson { , } bilinéaire, antisymétrique et satisfaisant l’identité de Jacobi. Les équations d’évolutions sont toujours 1.23-1.24.
1.1.3
Exercices
Exercice 1.1. Principe variationnel pour le hamiltonien Montrer que les équations de Hamilton se déduisent aussi d’un principe variationnel (principe d’action extrémale). Pour cela, considérer la fonctionnelle d’action SH définie à partir du hamiltonien H Z t2 ˙ SH [q, p] = dt (p(t)q(t) − H(q(t), p(t))) (1.34) t1
pour des « trajectoires dans l’espace des phases » arbitraires t → x(t) = (q(t), p(t)) où la position x et l’impulsion p sont des fonctions indépendantes
1. Rappels de mécanique classique et quantique
11
(elles ne satisfont pas les équations de Hamilton). On considérera que les positions initiales et finales q(t1 ) = q1 , q(t2 ) = q2 sont fixées. (1) Montrer que les dérivés fonctionnelles de SH sont ∂H δSH ˙ = −p(t) − (q(t), p(t)) , δq(t) ∂q
δSH ∂H ˙ = q(t) − (q(t), p(t)) (1.35) δp(t) ∂p
(intégrer par partie pour dériver la première équation). En déduire que la condition de stationnarité δSH [x] =0 δx(t) est équivalente aux équations de Hamilton. (2) En utilisant le fait que la vélocité v = q˙ est la dérivée de H par rapport à p, montrer que le lagrangien est la transformée de Legendre du hamiltonien ˙ = pq˙ − H(q, p) L(q, q)
q˙ =
,
∂H(q, p) ∂p
(1.36)
et que p=
˙ ∂L(q, q) ∂ q˙
(1.37)
(3) En déduire que pour une trajectoire classique (solution des équations du mouvement), l’action hamiltonienne est égale à l’action lagrangienne SH [qcl , pcl ] = S[qcl ]
(1.38)
Exercice 1.2. Équations de Hamilton-Jacobi On peut donc considérer l’action d’une trajectoire classique comme fonction des conditions initiales (temps et position) (t1 , q1 ) et finales (t2 , q2 ). S = S(t1 , q1 ; t2 , q2 ) (1) Montrer que l’impulsion finale p2 = p(t2 ) et l’énergie finale E2 = H(q2 , p2 ) sont données par E2 = −
∂S , ∂t2
p2 =
∂S ∂q2
(1.39)
Écrire les formules correspondantes pour l’impulsion et l’énergie initiale p1 et E1 (le hamiltonien peut dépendre explicitement du temps). (2) Montrer que S considérée comme une fonction des quantités finales t = t2 et q = q2 , obéit à l’équation de Hamilton-Jacobi ∂S ∂S = −H q , (1.40) ∂t ∂q équation aux dérivées partielles, du premier ordre en temps, et faisant intervenir simplement le hamiltonien H.
12
Théorie statistique des champs
Exercice 1.3. Transformations canoniques Une transformation canonique est une application x → x0 dans l’espace des phases (donc une application Ω → Ω) qui préserve la structure symplectique. ω(x) = ω(x0 )
(1.41)
La forme symplectique ω s’écrit en termes de ses composantes dans des coordonnées locales différentes x = (xi ) et x0 = (x0k ) = x0 (x) (formules de transformations des formes différentielles sous des changements de coordonnées) 0 ω = wij (x) dxi ∧ dxj = ωkl (x0 ) dx0k ∧ dx0l
(1.42)
∂xi ∂xj (1.43) ∂x0k ∂x0l (1) Montrer que si x → x0 est une transformation canonique, alors c’est équivalent à dire que, en tant que fonctions, les éléments de matrices sont égaux 0 wij (x) = wij (x) (1.44) 0 ωkl (x0 ) = wij (x)
(2) Montrer que les transformations canoniques sont aussi les transformations qui préservent les crochets de Poisson. C’est-à-dire que si on considère deux fonctions f et g et leurs transformées f 0 et g 0 sous la transformation canonique x → x0 f (x) = f 0 (x0 ) , g(x) = g 0 (x0 ) (1.45) on a {f, g} = {f 0 , g 0 }
(1.46)
(3) Montrer que les flots hamiltoniens sont des transformations canoniques.
1.1.4
Rappels de probabilités et de mécanique statistique classique
Hasard et indéterminisme Il n’est pas question de donner ici un panorama complet de la physique statistique, même classique. Des rappels de physique statistique des systèmes à l’équilibre seront donnés dans les chapitres traitant des phénomènes critiques. Ici sont juste rappelées les notions de probabilités, de densité de probabilité, et de moyenne statistique. La mécanique statistique s’attache à la caractérisation des systèmes avec un grand nombre de degrés de liberté (typiquement avec un grand nombre de composants) et donc un très grand nombre d’états accessibles. On ne peut avoir en pratique qu’une connaissance partielle et imprécise de tels systèmes. Il y a plusieurs raisons à cela. Tout d’abord seul un nombre fini de degrés de liberté macroscopiques peuvent être effectivement mesurables et importants pour la dynamique
1. Rappels de mécanique classique et quantique
13
macroscopique. Par exemple en hydrodynamique, seules des quantités moyennées localement, comme la densité, la vitesse et densité d’énergie locale sont pertinentes pour les équations de Navier-Stokes, et accessibles expérimentalement. Une autre situation est celle de systèmes relativement petits en contact, et dans un état stationnaire ou quasi stationnaire, avec un grand système jouant le rôle de thermostat (système fermé échangeant seulement de la chaleur) ou aussi de réservoir de particules (pour un système ouvert). On ne s’intéresse qu’aux propriétés du petit système, et l’effet du couplage au réservoir est traité de façon statistique. Ceci peut être dû aussi au fait que la dynamique microscopique du système, même petit, est stochastique, c’est-à-dire essentiellement chaotique et imprévisible, et que seules des lois statistiques d’évolution peuvent être établies et utilisées. Ceci peut aussi être le cas d’un système parfaitement déterministe, mais dont l’état initial du système est indéterminé. Enfin l’indéterminisme quantique sous-jacent à toute dynamique classique introduit du hasard au niveau microscopique, inhérent à la physique ellemême. Probabilités classiques Les outils mathématiques adéquats pour traiter les propriétés statistiques de tels systèmes classiques sont ceux de la théorie des probabilités. Dans sa formulation axiomatique due à Kolmogorov, un système probabiliste est modélisé par un ensemble Ω des possibilités (les éventualités ou cas possibles), une famille A des évènements (une famille de sous-ensembles de Ω, stable sous l’union et l’intersection et formant une tribu borélienne) correspondant aux tests ou observations possibles, pour lesquelles on pourra attribuer des probabilités, et enfin une mesure ou loi de probabilité qui attribue une probabilité p(E) aux évènements E de A. L’espace de probabilité est donc le triplet (Ω, A, p). La loi de probabilité p(E) attribue à un événement E une probabilité p(E). p(E) est un nombre 0 ≤ p(E) ≤ 1. Il existe deux grandes classes de points de vue sur les probabilités. p(E) peut être vu comme la fréquence de l’évènement E lorsque l’on prépare et observe une suite de réalisations indépendantes du système (c’est le point de vue fréquentiste). Ou alors, p(E) est vu comme le degré de la plausibilité attribué à l’évènement E , étant donné certains priors (c’est le point de vue bayésien). La loi de probabilité satisfait les axiomes p(∅) = 0
,
∅ = évènement toujours faux
(1.47)
p(1) = 1
,
1 = évènement toujours vrai
(1.48)
p(A ∧ B) + p(A ∨ B) = p(A) + p(B)
,
∧ = ET ,
∨ = OU
(1.49)
14
Théorie statistique des champs
Enfin les probabilités conditionnelles obéissent à la loi de Bayes p(A|B) =
p(B|A)p(A) p(A ∧ B) = p(B) p(B)
(1.50)
L’évènement A|B est l’évènement A conditionné par B. p(A|B) est la probabilité que l’événement A se produise, sachant que B s’est produit. La théorie des probabilités s’intéresse aux processus stochastiques, c’est-àdire à l’étude des systèmes dynamiques et des systèmes stochastiques. L’espace Ω est alors l’espace des histoires possibles, c’est-à-dire des évolutions possibles du système avec le temps, dans un certain espace de configurations (ou au moins une certaine sous-classe de ces évolutions). Distribution de probabilités dans l’espace des phases Dans ces rappels nous considérons le cas très restreint où la dynamique d’un système statistique peut être encore traitée comme une dynamique hamiltonienne (éventuellement stochastique et sans quantité conservée). On s’intéressera à l’évolution des probabilités à un instant donné, en fonction du temps. Les corrélations temporelles entre état du système à des instants différents ne sont pas encore discutées. L’espace des phases et l’espace des possibilités pour le système sont alors identifiés. Cet espace Ω est muni d’une mesure standard, la mesure de Liouville. Nous utilisons ici les notations standards (et un peu imprécises) des physiciens. Un état classique correspond à un point x dans l’espace des phases Ω. Un état statistique ou état mixte est décrit par une densité (ou distribution) de probabilité ρ(x) sur Ω. ρ(x) est une distribution positive normalisée Z ρ(x) ≥ 0 , dµ(x) ρ(x) = 1 (1.51) Ω
où dµ(x) est la mesure de Liouville. dµ(x) ρ(x) est simplement la probabilité pour l’état du système d’être dans un voisinage de volume dµ(x) autour de x. Une observable f est une fonction réelle sur l’espace des phases Ω → R. La valeur moyenne de l’observable f dans l’état statistique ρ est notée hf i. Elle correspond en mathématique à l’espérance de f selon la loi de probabilité ρ, qui est notée E[f ]. Elle est donnée par Z hf i = E[f ] = dµ(x) ρ(x) f (x) (1.52) Ω
Entropie Le « degré de désordre » ou d’incertitude de la distribution ρ est quantifié par son entropie (Bolzmann-Gibbs) Z S = − dµ(x) ρ(x) log(ρ(x)) (1.53) (la constante de Boltzmann est normalisée à kB = 1).
1. Rappels de mécanique classique et quantique
15
Équation de Liouville Si la dynamique est déterministe et hamiltonienne, sous l’action du flot t hamiltonien, la fonction de distribution évolue avec le temps ρ(x) → ρ(x; t) selon l’équation de Liouville d ρ(x; t) = {H, ρ} (x; t) dt
(1.54)
si bien que la valeur moyenne de f au cours du temps est donnée par Z Z hf i(t) = dµ(x) ρ(x) f (x(t)) = dµ(x) ρ(x, t) f (x) (1.55) Ω
Ω
Description lagrangienne et eulérienne des flots hamiltoniens De façon générale, considérons une observable f (fonction indépendante du temps), et à partir d’elle l’observable fT dépendant du temps t fT (x; t) = f (x(t))|x(0)=x
(1.56)
Cette observable fT décrit l’évolution en temps de l’observable f en fonction de l’état initial du système x : x(0) à l’instant t = 0. Comme le flot hamiltonien est une transformation canonique, on vérifie que l’évolution temporelle de cette observable fT est donnée aussi par une équation similaire à 1.24, mais qui est maintenant une équation d’évolution à x fixé dfT = {fT , H} dt
i.e.
∂fT (x; t) = {fT , H}(x; t) ∂t
(1.57)
Pour f = xi (une des coordonnées dans l’espace des phases), on retrouve bien sûr les équations de Hamilton. Dans tous les cas, on trouve bien que l’observable énergie=hamiltonien H = HT est indépendant du temps (si la dynamique est indépendante du temps). On remarque aussi que les fonctions de distributions (considérées comme des observables) n’évoluent pas avec le temps t. ρT (x; t) = ρ(x(t); t) = ρ(x) (1.58) Ceci correspond donc au passage d’une représentation de la dynamique t par un flot dans l’espace des phases x(0) → x(t) tandis que les observables f (considérées comme fonctions) ne dépendent pas du temps à une représentation de la dynamique où l’état du système est représenté par un point x dans l’espace des phases et où ce sont les observables fT qui évoluent avec le temps t fT (·, 0) → fT (·, t). C’est l’analogue pour les flots hamiltoniens des deux façons de traiter un flot hydrodynamique en mécanique des fluides : la description eulérienne (le fluide bouge dans un système de coordonnées fixe) versus la description lagrangienne (le système de coordonnée bouge avec le fluide). Ces deux représentations s’avèrent les analogues classiques des représentations de Schrödinger et de Heisenberg de la mécanique quantique.
16
Théorie statistique des champs
Distribution de Gibbs Un cas important est celui de la distribution de Gibbs, qui décrit l’état stationnaire d’un système à température T, c’est-à-dire en équilibre avec un thermostat. Dans ce cas la distribution est 1 1 e−βH(x) , β= (1.59) ρ(x) = Z(β) kB T avec Z(β) la fonction de partition Z Z(β) = dµ(x) e−βH(x)
(1.60)
Physique statistique non hamiltonienne De nombreux problèmes de physique statistique mettent en jeu des systèmes non hamiltoniens : systèmes dynamiques à temps discret, systèmes avec dissipation et sans conservation de l’énergie, systèmes ouverts, etc. Ils ne seront pas traités ici. Nous verrons quelques exemples dans les sections consacrées à la physique statistique et à ses rapports avec la théorie des champs.
1.1.5
Exercices
Exercice 1.4. Discuter la relation entre la loi de Bayes 1.50 et la relation 1.49. Exercice 1.5. Montrer que l’entropie d’une distribution de probabilité est conservée sous une évolution hamiltonienne. Exercice 1.6. On considère un système avec un nombre fini N d’états Ω = {e1 , e2 , · · · , eN }. Il n’est bien entendu plus question d’évolution à temps continu, mais on peut considérer une évolution stochastique à temps discret qui, si le système est dans l’état ei à l’instant t, l’envoie à l’instant t + 1 dans l’état ej avec une probabilité de transition Πij . Un tel processus est appelé une chaîne de Markov, puisque la probabilité de transition ne dépend pas de l’histoire du système aux temps t0 < t. Montrer que si une distribution d’équilibre existe ρi = ρ(ei ), elle satisfait la condition de balance détaillée X X ρi Πij = ρj Πji j6=i
j6=i
Exercice 1.7. Si chaque état ei a une énergie Ei , donner les conditions sur Πij pour que la distribution de Gibbs ρi ∝ exp(−βEi ) soit une distribution d’équilibre. Exercice 1.8. Montrer que la distributionP de Gibbs maximise l’entropie sous la contrainte que l’énergie moyenne hEi = i ρi Ei est fixée.
1. Rappels de mécanique classique et quantique
1.2
17
Mécanique quantique
Cette section rappelle la formulation canonique de la mécanique quantique non relativiste pour des systèmes à un nombre fini de degrés de liberté. Les états quantiques sont représentés par des vecteurs d’un espace de Hilbert et les observables par des opérateurs. La quantification d’un système classique se fait à l’aide du principe de correspondance. La justification du formalisme et les questions d’interprétation, bien qu’importantes, ne seront pas discutées.
1.2.1
Espaces de Hilbert et vecteurs d’états
États et espace de Hilbert L’espace des phases de la mécanique classique Ω est remplacé en mécanique quantique par l’espace de Hilbert H des états quantiques. H est donc un espace vectoriel sur C. Les vecteurs de H sont notés ψ ou |ψi (les « kets » selon la dénomination de Dirac). Les éléments du dual de H, H∗ (les formes linéaires sur H) sont les « bras » et notés φ∗ ou hφ|. H est muni d’une forme hermitienne (une forme antilinéaire à gauche et linéaire à droite, positive et non dégénérée), aussi appelée « produit scalaire » ou « produit hermitien », notée (ψ1·ψ2 ) ou hψ1 |ψ2 i (1.61) telle que (a et b ∈ C, a ¯ et ¯b désignent les complexe conjugués de a et b) (a ψ1 + b ϕ1 · ψ2 ) = a ¯(ψ1 · ψ2 ) + ¯b(ϕ1 · ψ2 ) (ψ1 · a ψ2 + b ϕ2 ) = a(ψ1 · ψ2 ) + b(ψ1 · ϕ2 ) (φ · φ) > 0 si
φ 6= 0
(1.62)
L’espace de Hilbert H est complet pour la norme kψk2 = hψ|ψi (toute suite de Cauchy converge). En général (au moins en physique), on suppose que H admet une base orthogonale dénombrable (espace de Hilbert séparable). Les états quantiques purs sont les « rayons », c’est-à-dire les droites complexes passant par l’origine dans H. Ils sont représentés par les vecteurs unité, tels que k ψ k2 = hψ |ψi = 1, et sont définis modulo une phase arbitraire non observable. Observables et opérateurs Les observables physiques A sont représentées par les opérateurs linéaires (à droite) et auto-adjoints sur H, (aussi appelés opérateurs hermitiques, symétriques ou hermitiens en franglais) tels que A = A† , où A† est le conjugué de A = A. La conjugaison est définie par hA† ψ1 |ψ2 i = hψ1 |Aψ2 i et si elle est notée A† dans la littérature physique, elle est plutôt notée A∗ dans la littérature mathématique. Les opérateurs sur H forment une algèbre associative mais non commutative, souvent notée l’algèbre des observables (c’est un peu
18
Théorie statistique des champs
abusif car elle contient nécessairement les opérateurs non hermitiens qui ne correspondent pas à des observables physiques). Il faut noter que dans la littérature mathématique, la forme hermitienne est généralement linéaire à gauche et antilinéaire à droite. Donc les rôles des bras et des kets sont inversés. Les opérateurs agissent sur les états à gauche, et l’action des opérateurs s’effectue dans le sens d’écriture occidental habituel, ce qui est somme toute plus logique... Mesures et probabilités Comme en mécanique classique, la dynamique d’un système quantique fermé, c’est-à-dire idéalement isolé et sans interaction avec l’extérieur, est déterministe, et donnée par l’équation de Schrödinger. Par contre, tout processus de mesure, c’est-à-dire d’observation d’une observable sur le système, nécessite une interaction avec l’extérieur (l’instrument de mesure, l’observateur, l’environnement) et s’avère un processus non déterministe au sens classique. Le résultat de la mesure est en général aléatoire, même si l’état dans lequel le système a été préparé est connu. La mécanique quantique ne permet que d’attribuer des probabilités aux différents résultats d’une observation. Cet indéterminisme est intrinsèque à la physique quantique. S’il est parfaitement confirmé par les expériences, et si le formalisme mathématique de la physique quantique est parfaitement solide, cet indéterminisme reste amplement discuté. Il est non réductible à un indéterminisme classique qui correspondrait à l’existence de « variables cachées » classiques, non contextuelles ou non locales. En général donc, la mesure d’une observable A (pouvant prendre des valeurs {ai }) sur un système préparé dans un état donné ψ ne donnera pas toujours le même résultat. On obtiendra le résultat ai avec une certaine probabilité pi (ψ). Considérons une mesure idéale projective à la von Neumann (le cas plus général des mesures indirectes ou faibles se déduit de celui-là). La valeur moyenne hai (i.e. l’espérance E[a]) de l’observable A mesurée sur l’état ψ est donnée par la règle de Born, donc par un élément de matrice de l’opérateur A X pi (ψ)ai = hAiψ = hψ|A|ψi (1.63) i
Ceci implique que les résultats possibles ai d’une mesure de A appartiennent au spectre de l’opérateur A. Pour les cas les plus simples d’un opérateur à spectre discret, ce sont les valeurs propres ai de A, qui peut se diagonaliser dans une base d’états propres orthonormés en X A= ai |iihi| , hi|ji = δij (1.64) i
1. Rappels de mécanique classique et quantique
19
La probabilité pi d’obtenir le résultat ai est donc donnée par le module carré de l’amplitude de probabilité hai |ψi pi = |hai |ψi|2
(1.65)
C’est la forme habituelle de la règle de Born. Pour un type très particulier de mesures, les mesures idéales non destructives, après une mesure donnant le résultat ai le système est dans l’état |ii, ou peut être considéré « for all practical purpose » comme un système isolé dans l’état |ii. C’est le fameux concept de « réduction du paquet d’onde ». Il ne sera pas discuté ici en quoi consiste la préparation d’un état, ce qu’est un processus de mesure, ou pourquoi (ou comment) un système donné se trouve dans un état donné après une mesure (c’est le fameux « problème de la mesure »). Dynamique unitaire Comme nous l’avons rappelé, pour un système quantique fermé, toute dynamique (évolution dans le temps) doit être donnée par des transformations linéaires sur les états qui préservent le produit scalaire, afin de conserver les probabilités. De telles transformations doivent donc nécessairement être (au moins pour des systèmes décrits par des espaces de Hilbert de dimension finie, ou des algèbres d’observables suffisamment simples) des transformations unitaires U telles que U † = U −1 , qui sont engendrées par un hamiltonien H. Les transformations unitaires sont l’analogue quantique de transformations canoniques classiques.
1.2.2
Quantification canonique
La procédure « historique » de quantification canonique est la suivante. Partant d’un système hamiltonien classique, par le principe de correspondance, aux observables classiques conjuguées (par exemple position et impulsion pi et qi ) satisfaisant les relations de crochet de Poisson {qi , pj } = δij
(1.66)
on fait correspondre des opérateurs auto-adjoints Pi et Qi qui satisfont des relations de commutation canoniques [Qi , Pj ] = i ~ δij
(1.67)
h est la constante de Planck réduite (Dirac), c’est-à-dire le quantum ~ = 2π d’action. Le commutateur étant
[A, B] = AB − BA Au moins pour les systèmes avec un nombre fini de degrés de liberté, un théorème de Stone et von Neumann assure qu’il existe une représentation unique de ces relations de commutations dans un espace de Hilbert.
20
Théorie statistique des champs
Le hamiltonien quantique est l’opérateur obtenu en remplaçant les p et q classiques par les P et Q quantiques. C’est en général, mais pas toujours, non ambigu. Pour le cas simple de la particule de masse m en une dimension dans un potentiel V (q), le hamiltonien quantique est donc l’opérateur P2 + V (Q) (1.68) 2m La dynamique étant dans ce cas invariante par renversement du temps, l’opérateur H peut se représenter comme un opérateur symétrique et réel. La représentation des états et des observables étant invariante par des transformations unitaires globales, pouvant dépendre du temps (l’équivalent des transformations canoniques classiques), les états et la dynamique du système peuvent se représenter de plusieurs façons équivalentes. Les deux principales sont les représentations de Schrödinger et de Heisenberg. Ce sont les versions quantiques de représentations eulériennes et lagrangiennes classiques discutées en 1.1.4. Nous aurons besoin des deux dans la suite. H=
1.2.3
Représentation de Schrödinger
La représentation de Schrödinger est la plus utilisée dans les calculs de mécanique quantique non relativiste. Elle sera très utile pour la construction de l’intégrale de chemin. Les états sont représentés par des vecteurs qui évoluent avec le temps état au temps t :
ψ(t) ou |ψ(t)i
(1.69)
Les observables sont représentées par des opérateurs indépendants du temps. observable a :
A
(1.70)
Équation de Schrödinger La dynamique est donnée par l’équation de Schrödinger i~
dψ = Hψ dt
(1.71)
Les probabilités sont conservées puisque H = H † . La valeur moyenne d’une observable A au temps t est donc hAiψ(t) = hψ(t)|A|ψ(t)i
(1.72)
Opérateur d’évolution L’opérateur d’évolution U (tf , ti ) entre les temps ti et tf est l’opérateur unitaire qui décrit la transition état au temps ti −→ état au temps tf
(1.73)
1. Rappels de mécanique classique et quantique
21
par U
ψ(ti ) −→ ψ(tf ) = U (tf , ti )ψ(ti )
(1.74)
0
L’élément de matrice hψ |U (tf , ti )|ψi est l’amplitude de probabilité de passer de l’état ψ à l’état ψ 0 quand le système évolue entre ti et tf . U (t) obéit à l’équation de Schrödinger pour cet opérateur i~
d U (tf , ti ) = H(tf )U (tf , ti ) dtf
;
U (ti , ti ) = 1
(1.75)
1 est l’opérateur identité. Dans le cas où H est indépendant du temps, U ne dépend que de tf − ti et est tf − ti H (1.76) U (tf , ti ) = U (tf − ti ) = exp i~ L’exponentielle d’un opérateur est définie par la somme de la série exp(A) =
∞ X 1 k A k!
(1.77)
k=0
qui converge (dans un sens mathématique qui n’est pas précisé ici). Dans le cas général d’un hamiltonien H(t) dépendant du temps, l’équation 1.75 reste valable et sa solution est l’opérateur d’évolution qui est donné par un T-produit (produit ordonné en temps, voir section 1.2.4) Z tf 1 dt H(t) (1.78) U (tf , ti ) = T exp i~ ti
1.2.4
Représentation de Heisenberg
La représentation de Heisenberg est très utile pour les théories relativistes des champs quantiques. C’est en fait la seule vraiment cohérente mathématiquement. Elle est indispensable pour comprendre la relation entre physique statistique des phénomènes critiques et théorie euclidienne des champs. États et opérateurs Dans la représentation de Heisenberg les états quantiques sont redéfinis en fonction du temps t par la transformation unitaire U (−t) sur H, où U (t) est l’opérateur d’évolution 1.76 pour le hamiltonien H, supposé indépendant du temps. On les note donc |ψ; ti = U (−t)|ψi (1.79) Dans la représentation de Heisenberg, sous la dynamique du hamiltonien H les états représentés par des vecteurs indépendants du temps |ψ(t); ti = U (−t)U (t)|ψi = |ψi
(1.80)
22
Théorie statistique des champs
Les observables A (observation de a à l’instant t) sont maintenant représentées par des opérateurs dépendant du temps. Elles sont notées A(t) et redéfinies par observable a au temps t : A(t) = U (−t)AU (t) (1.81) La valeur moyenne d’une observable A au temps t sur un état ψ est hψ|A(t)|ψi = hA(t)iψ
,
ψ = ψ(t = 0)
(1.82)
et on a bien en toute généralité équivalence entre les deux représentations de Heisenberg et de Schrödinger, puisque les valeurs moyennes à un instant t quelconque pour une observable A (à l’instant t = 0) dans un état ψ (à l’instant t = 0) coïncident hAiψ(t) = hA(t)iψ
(1.83)
Attention ! Si A ne commute pas avec H (donc avec U (t)), A(t1 ) et A(t2 ) ne commutent pas si t1 6= t2 . Équations du mouvement quantiques Dans la représentation de Heisenberg le hamiltonien est toujours indépendant de t, H(t) = H. L’équation d’évolution pour un opérateur A (indépendant du temps dans la représentation de Schrödinger) est i~
d A(t) = [A(t), H] dt
(1.84)
où [· , ·] est le commutateur. Pour un système dans un état donné ψ, l’équation d’évolution pour les valeurs moyennes des observables est donnée par le théorème d’Ehrenfest i~
d hA(t)i = h[A(t), H]i dt
(1.85)
Pour la particule dans un potentiel, cette équation donne la version quantique des équations du mouvement classique d 1 Q(t) = P (t) dt m
,
d P (t) = −V 0 (Q(t)) dt
(1.86)
Le théorème d’Ehrenfest se généralise aux théories relativistes des champs quantiques, où il prend la forme des équations de Schwinger-Dyson, ou équations du mouvement quantiques. Mais attention ! Sauf dans des cas très particuliers comme l’oscillateur harmonique, on n’obtient pas les équations du mouvement classique pour les valeurs moyennes car 1 d hQ(t)i = hP (t)i dt m
mais
d hP (t)i = 6 −V 0 (hQ(t)i) dt
(1.87)
1. Rappels de mécanique classique et quantique
23
Corrélations temporelles Dans les calculs de perturbation en mécanique quantique et en théorie des champs, on est amené à calculer des éléments de matrices de produit d’opérateurs à des temps différents, entre des états initiaux et finaux euxmêmes définis à des temps distincts. Considérons l’élément de matrice K(t1 ) qui s’écrit en représentation de Schrödinger K(t1 ) = hψ 0 |U (t0 − t1 )AU ((t1 − t)|ψi
(1.88)
et en représentation de Heisenberg comme K(t1 ) = hψ 0 ; t0 |A(t1 )|ψ; ti
(1.89) 0
Cet objet K(t1 ) correspond à un processus causal si t ≤ t1 ≤ t . C’est l’opération (mathématique) suivante : (1) on part d’un état initial ψ à l’instant t, (2) on le laisser évoluer jusqu’à l’instant t1 , (3) on lui applique l’opérateur A (attention, ce n’est pas une mesure de A), (4) on le laisser évoluer jusqu’à l’instant t0 , (5) enfin on le projette sur l’état final ψ 0 à l’instant t0 . De la même façon on définit les éléments de matrice de produits d’opérateurs à plusieurs temps comme hψ 0 ; t0 | · · · A2 (t2 )A1 (t1 )|ψ; ti (1.90) mais il faut faire attention à l’ordre des différents opérateurs. Ceci correspondra à un processus causal si t < t1 < t2 < · · · < t0
(1.91)
Produit ordonné en temps d’opérateurs (T-produit) Un objet important dans la représentation de Heisenberg est le produit ordonné en temps d’opérateurs, ou « T-produit ». Pour deux opérateurs A1 (t1 ) et A2 (t2 ), le T-produit est défini comme ( A2 (t2 )A1 (t1 ) si t2 > t1 , T [A2 (t2 ) A1 (t1 )] = (1.92) A1 (t1 )A2 (t2 ) si t1 > t2 . Les éléments de matrice de ce T-produit sont en représentation de Schrödinger hψf ; tf |T [A1 (t1 )A2 (t2 )]|ψi ; ti i = ( hψf |U (tf − t2 ) A2 U (t2 − t1 ) A1 U (t1 − ti )|ψi i si t1 < t2 hψf |U (tf − t1 ) A1 U (t1 − t2 ) A2 U (t2 − ti )|ψi i si t2 < t1
(1.93)
Ceci se généralise facilement au produit ordonné de N opérateurs. Attention ! Le produit de deux opérateurs n’est pas bien défini à temps coïncidants t1 = t2 , si les opérateurs ne commutent pas. Ces T-produits jouent un rôle essentiel dans la formulation des théories des champs et leurs relations avec des modèles statistiques. Leurs relations avec les différents « propagateurs » (causal, avancé, retardé) rencontrés en théorie des champs et en physique statistique seront discutées plus loin.
24
1.2.5
Théorie statistique des champs
Fonction d’onde et états propres de position et d’impulsion |qi et |pi
Après cette présentation générale mais un peu formelle (c’est nécessaire pour la suite), nous allons montrer comment on obtient la représentation standard en termes de fonction d’onde dans l’espace ψ(x) et d’opérateurs différentiels. Revenons au système simple d’une particule ponctuelle, non relativiste, de masse m se déplaçant dans l’espace à une dimension R. La position est notée q. L’espace de Hilbert H peut être représenté comme l’espace des fonctions complexes de carré sommable sur R, H = L2 (R). P et Q étant les opérateurs d’impulsion et de position, on définit la famille des états propres de position |qi par |qi ; Q|qi = q|qi ; hq 0 |qi = δ(q 0 − q) (1.94) et ceux d’impulsion par (normalisations du Cohen-Diu-Laloë) Z i 1 dq e ~ pq |qi ; P |pi = p|pi ; hp0 |pi = δ(p0 −p) (1.95) |pi = √ 2π~ Ils permettent une décomposition de l’identité sur H Z Z 1 = dq |qihq| = dp |pihp|
(1.96)
À un état |ψi correspond la fonction d’onde ψ(q) dans l’espace réel et la b fonction d’onde ψ(k) dans l’espace réciproque, donnés simplement par les produits scalaires ψ(q) = hq|ψi √ ψb (p/~) = 2π~ hp|ψi
(1.97) (1.98)
On vérifie que ψb est bien la transformée de Fourier de ψ Z b ψ(k) = dx e−ikx ψ(x) et que le produit scalaire est 2
hψ|ψi =k ψ k =
Z
dq |ψ(q)|2
(1.99)
L’espace de Hilbert est donc bien H = L2 (R). La trace d’un opérateur s’écrit en termes des éléments diagonaux Z Z tr(A) = dq hq|A|qi = dp hp|A|pi (1.100)
1. Rappels de mécanique classique et quantique
25
Les observables Q et P se représentent dans la base des |qi par les opérateurs agissant sur les fonctions d’onde ψ(q) Q=q
;
P =
~ ∂ i ∂q
(1.101)
b et dans la base des |pi par les opérateurs agissant sur les ψ(p) P =p
;
Q = i~
∂ ∂p
(1.102)
Le hamiltonien 1.68 est donc bien dans la base de position, l’opérateur différentiel linéaire agissant sur les fonctions d’onde ψ(q) H=−
~2 ∂ 2 + V (q) 2m ∂q 2
(1.103)
Le lecteur soucieux de rigueur mathématique remarquera que Q et P n’agissent pas vraiment sur L2 (R), et que les |qi et |pi ne forment pas une base dénombrable orthonormée de H. Une formulation rigoureuse nécessite la théorie mathématique des Triplets de Gelfand. On gardera les notations moins rigoureuses des physiciens (Dirac en tête) qui suffiront ici.
1.2.6
P et H comme générateurs des translations dans l’espace et dans le temps
Un dernier point important : P et H sont respectivement les générateurs des opérations de translation dans l’espace et d’évolution dans le temps. En effet, dans la représentation de Schrödinger, on a P
eq0 i~ ψ(q, t) = ψ(q − q0 , t) = état ψ translaté de q0
(1.104)
H
et0 i~ ψ(q, t)) = ψ(q, t + t0 ) = état ψ ayant évolué pendant le temps t0 (1.105) Dans la représentation de Heisenberg, ceci correspond pour H à l’équation de Schrödinger d (1.106) i~ A(t) = [A(t), H] dt Pour P , si f (q) une fonction différentiable de la position, f 0 (q) = df (q)/dq sa dérivée, on a la relation entre opérateurs i~ f 0 (Q(t)) = [f (Q(t)), P ]
1.2.7
(1.107)
Exercices
Exercice 1.9. Dans le cas général d’un hamiltonien H(t) dépendant du temps, 1.76 n’est pas valable. Montrer que l’opérateur d’évolution est donné
26
Théorie statistique des champs
par (attention à l’ordre des opérateurs) U (tf , ti ) =
∞ X
1 ( (i~)k
k=0
Z dt1 · · · dtk H(tk ) · · · H(t1 ) ti 0 correspond à une rotation d’angle −π/2 du temps dans le plan complexe. Cette opération est appelée en théorie quantique des champs une rotation de Wick (voir figure), et τ est appelé le temps euclidien pour la raison suivante. Dans un espace-temps de Minkowski R1,d de d+1 dimension, dont les vecteurs sont X = (t, ~x), la rotation de Wick transforme la métrique de Minkowski en métrique euclidienne sur Rd+1 ds2 = −dt2 + d~x2
→
ds2 = dτ 2 + d~x2
(1.139)
L’avantage de parler de temps euclidien plutôt que de temps imaginaire permet d’éviter certaines confusions terminologiques. Un temps physique imaginaire correspond à un temps euclidien réel, et réciproquement un temps euclidien imaginaire correspond à un temps physique réel. NB : Dans cet ouvrage nous utilisons toujours la convention de 1.139 : la métrique de Minkowski est de signature (− + . . . +) et la métrique euclidienne de signature (+ + . . . +). C’est la convention des livres de Misner-ThorneWheeler et de Weinberg, entre autres (East Coast Metric). Elle diffère de la convention (+ − . . . −) correspondant à écrire ds2 = dt2 − d~x2 , et utilisée dans beaucoup d’ouvrages de physique des hautes énergies comme Bjorken-Drell, Peskin-Schroeder (West Coast Metric).
1.3.4
Exercices
Exercice 1.13. Préparations et matrice densité pour le Qu-bit Le Qu-bit est simplement un système quantique à deux états (donc il peut être vu comme un spin 1/2 ou comme un fermion. Imaginez des modes de préparation différents d’un ensemble d’états purs qui conduisent à la même matrice densité. Exercice 1.14. Entropie d’intrication Montrer que pour un système bipartite A + B, si le système total est dans un état pur, les entropies d’intrications de A par rapport à B et de B par rapport à A sont égales, SA = SB . Exercice 1.15. Équation d’évolution à temps euclidien À quelle équation d’évolution en temps euclidien τ obéit UE (τ ) = U (−iτ ) ? À quoi cela vous fait-il penser pour la particule libre telle que H = P 2 /2m ?
1. Rappels de mécanique classique et quantique
1.4
33
Notes
Ces rappels de mécanique classique et de mécanique quantique sont assez élémentaires et sont basés sur les ouvrages classiques [Arn74] [LL94] [CTDL73a, CTDL73b, CTLD17] Il en existe beaucoup d’autres. Pour une introduction aux aspects plus modernes concernant les systèmes dynamiques, ergodicité, chaos, mécanique statistique hors d’équilibre, etc. qui sont importants pour appréhender les rapports entre mécanique classique, physique statistique et mécanique quantique, consulter par exemple les livres de G. Gallavotti [Gal13] et [Gal99]. L’idée d’étudier les propriétés mathématiques des fonctions de la mécanique quantique à temps imaginaire est initialement due à G.C. Wick [Wic54]. Nous ne discutons pas les concepts fondamentaux à la base de la formulation de la mécanique quantique (sujet toujours débattu, à tort ou à raison). Le lecteur intéressé pourra consulter [Lal18] et pour des aspects des formalismes mathématiques [Dav14], et les références qu’elles contiennent.
Chapitre 2 L’intégrale de chemin : introduction 2.1 2.1.1
Présentation Principe de l’intégrale de chemin
Ce chapitre est consacré à une introduction détaillée au formalisme de la quantification par l’intégrale de chemin. Nous traitons l’exemple simple de la particule dans un potentiel en dimension d’espace D = 1. Ce cas suffit pour exposer le principe et discuter les principaux aspects de l’intégrale de chemin. Ses applications à des situations plus générales (et plus physiques) et ses relations avec la physique statistique seront traitées dans les chapitres suivants. La formulation de la mécanique quantique par l’intégrale de chemin a été introduite par R. Feynman (certaines idées remontant à Dirac), dans le but de l’appliquer à la construction de l’électrodynamique quantique. Sa formalisation et sa relation avec les processus stochastiques ont été approfondies notamment par le mathématicien V. Kac. Elle joue un rôle essentiel pour formuler les relations entre théories des champs et systèmes statistiques. Les probabilités quantiques se calculent à partir des amplitudes de probabilité, et des amplitudes de transition, qui sont dans le formalisme canonique des éléments de matrices d’opérateurs. Par exemple, l’amplitude de probabilité pour l’évolution d’un état initial |INi à un état final |OUTi est (en représentation de Heisenberg) le produit scalaire
A(IN → OUT) = hOUT|INi
(2.1)
Dans le formalisme de l’intégrale de chemin, cette amplitude est donnée par une somme sur toutes les trajectoires (histoires) classiques possibles in → out, qui interfèrent quantiquement avec une phase donnée par l’action classique S
36
Théorie statistique des champs
des trajectoires
A(IN → OUT) =
X
exp
in→out
i S(in → out) ~
(2.2)
Cette somme sur les histoires – ou intégrale de chemin – demande à être définie mathématiquement. Mais insistons dès maintenant sur le fait que l’intégrale de chemin est une représentation différente, mais mathématiquement équivalente à la formulation canonique, de la mécanique quantique. Ce n’est en aucun cas une théorie alternative. Dans beaucoup de cas elle est moins rigoureuse et plus heuristique que la formulation canonique. Mais elle donne une image semi-classique souvent éclairante, et permet de dériver rapidement certains résultats. Si pour les systèmes non relativistes la formulation canonique et l’équation de Schrödinger demeurent sans rivales, en revanche pour les champs relativistes quantiques, l’intégrale de chemin s’avère pour beaucoup de problèmes la meilleure approche. Elle est aussi devenue une source d’inspiration importante pour les mathématiques.
2.1.2
Intégrale de chemin à temps euclidien
Par une rotation de Wick, nous avons vu que l’on peut définir des amplitudes de transition à temps euclidien AE (IN → OUT). Ces amplitudes prennent la forme d’une somme sur les trajectoires à temps euclidien (histoires euclidiennes). La phase associée devient alors un poids réel > 0, associé à action euclidienne SE X 1 (2.3) AE (IN → OUT) = exp − SE (in → out) ~ in→out Ce poids W = exp(−~−1 SE ) est mathématiquement analogue à un poids de Boltzmann en physique statistique W = exp(−βE). L’intégrale de chemin établit une correspondance mathématique entre des problèmes de mécanique quantique et des problèmes de mécanique statistique. Cette correspondance est à la base de la théorie statistique des champs.
2.1.3
Organisation du chapitre
Nous introduisons d’abord en section 2.2 l’intégrale de chemin pour la particule libre, en suivant la présentation standard de Feynman-Hibbs (discrétisation en temps, puis limite continue). Dans ce cas les calculs sont exacts et très simples, se ramenant à des intégrales gaussiennes. Nous traitons sur le même plan l’intégrale de chemin à temps réel et à temps euclidien. Dans la section 2.3, nous traitons le cas de la particule dans un potentiel. Dans ce cas il est nécessaire de discuter la limite du temps continu pour établir l’équivalence entre l’intégrale de chemin et la formulation canonique.
2. L’intégrale de chemin : introduction
37
Dans la section suivante 2.4, nous montrons comment l’intégrale de chemin permet de traiter les observables quantiques en calculant les éléments de matrices des opérateurs. Nous montrons qu’elle construit naturellement les produits ordonnés en temps (T-produits) d’opérateurs. Le cas de l’opérateur impulsion P est discuté, et les ambiguïtés de définition d’opérateurs contenant des produits de P et de Q sont mises en évidence dans l’intégrale de chemin. La section 2.5 est consacrée aux systèmes quantiques à température finie. La fonction de partition peut s’écrire comme une intégrale de chemin à temps euclidien. Il est facile de voir que le temps euclidien doit être considéré comme périodique, avec une relation simple entre la température du système et la « période euclidienne ». La généralisation aux observables quantiques à température finie et aux corrélations temporelles permet une introduction élégante au formalisme de Schwinger-Keldish par l’intégrale de chemin. Tout ceci sera important pour la théorie statistique des champs. Enfin la section 2.6 est consacrée à l’exemple de l’oscillateur harmonique. Nous montrons comment l’intégrale de chemin permet de calculer simplement les corrélations à temps réel et à temps euclidien, et comparons la quantification canonique à l’intégrale de chemin sur des calculs explicites. Ce cas simple permet une introduction aux déterminants fonctionnels, qui jouent un rôle important dans la suite.
2.2 2.2.1
Intégrale de chemin pour la particule libre Intégrale de chemin à temps réel
Considérons une particule libre de masse m en une dimension d’espace. Elle n’est donc soumise à aucune force, et le potentiel externe ne dépend pas de la position. Sa valeur V0 fixe l’énergie au repos. ⇐⇒
V (q) = V0
force F = 0
(2.4)
Le hamiltonien quantique est H=
P2 + V0 2m
(2.5)
L’opérateur d’évolution L’élément de matrice (dans la base des états de position) de l’opérateur d’évolution U (t) = exp i~t H sera noté dans toute la suite U (q 0 , q; t) et correspond à U (q 0 , q; t) = hq 0 |U (t)|qi 0
= hq ; t|q; 0i
représentation de Schrödinger représentation de Heisenberg
(2.6)
C’est l’amplitude de probabilité pour que la particule se propage de q à q 0 pendant le temps t. Cet élément de matrice est souvent appelé le propagateur.
38
Théorie statistique des champs
Il faut noter que le terme propagateur est aussi utilisé pour désigner en théorie quantique des champs des objets un peu différents (les propagateurs avancés, retardés et de Feynman, qui sont en fait des fonctions de corrélations). Ce propagateur U (q 0 , q; t) se calcule facilement pour la particule libre U (q 0 , q; t) =
2iπ~ t m
−1/2
exp
i ~
m (q 0 − q)2 − tV0 2 t
(2.7)
Démonstration : On utilise le fait que, puisque V est constant, le hamiltonien H est diagonal dans la base des états d’impulsion 2 Z p H = dp + V0 |pihp| 2m pour écrire U comme
t hp |U (t)|pi = δ(p − p) exp i~ 0
0
p2 + V0 2m
En utilisant les relations entre |pi et |qi de 1.2.5 de Fourier des fonctions gaussiennes, on obtient U position Z ZZ dp0 dp i(p0 q0 −pq)/~ 0 0 e hp |U (t)|pi = hq |U (t)|qi = 2π~
et donc par transformée dans la base des états de dp ip(q0 −q)/~+ i~t e 2π
p2 2m +V0
d’où le résultat 2.7. Remarques : Notons que c’est le fait que l’opérateur d’évolution doit être bien défini pour Im(t) < 0 qui détermine dans (2.7) la phase 1 π 1−i (i)− 2 = e−i 4 = √ 2
Notons aussi le fait crucial que le terme dans l’exponentielle est égal à l’action de la trajectoire classique pour la particule qui va de q à q 0 en un temps t (donc à vitesse constante). m (q 0 − q)2 − tV0 2 t
=
action classique (q, 0 → q 0 , t)
Pour la particule libre, l’opérateur d’évolution quantique est donc entièrement déterminé par la trajectoire classique correspondante et peut s’écrire formellement i (2.8) U ∝ e ~ action Ceci ne sera plus vrai pour la particule dans un potentiel non constant.
2. L’intégrale de chemin : introduction
39
L’intégrale de chemin à temps discrétisé L’idée de Feynman pour construire une intégrale de chemin est de décomposer l’intervalle de temps [0, t] en N intervalles de temps ∆t = = t/N , N 1 entier, d’écrire l’opérateur d’évolution comme un produit N
U (t) = [U (∆t)]
(2.9)
et d’utiliser la décomposition de l’identité dans la base des états de positions Z dq |qihq| (2.10) 1 = pour insérer N −1 états intermédiaires |qi i aux temps ti = i∆t et aux positions {qi , i = 1, N − 1} entre les U (∆t). On note q0 et qN la position initiale q et la position finale q 0 q0 = q et qN = q 0 (2.11) Le propagateur s’écrit donc comme une intégrale sur les N − 1 positions intermédiaires qi U (q 0 , q; t) =
Z NY −1
dqi U (qN , qN −1 ; ) · · · U (q1 , q0 ; )
(2.12)
i=1
=
2iπ~ m
− N2 Z NY −1 i=1
# N −1 i X (qi+1 − qi )2 dqi exp m − V0 ~ i=0 2 "
(2.13) Maintenant considérons q (t) la trajectoire continue et linéaire par morceaux qui part de q pour arriver en q 0 en passant par chaque qi au temps intermédiaire ti , c’est-à-dire telle que q (ti ) = qi
avec
ti = i = i
t N
(2.14)
Cette trajectoire est représentée sur la figure 2.1. Elle est donnée dans l’intervalle t ∈ [ti , ti+1 ] par q (t) = qi
ti+1 − t t − ti + qi+1 ti+1 − ti ti+1 − ti
(2.15)
Et bien sûr dans chaque intervalle la vélocité est constante q˙ (t) = q˙i =
qi+1 − qi si ti < t < ti+1
(2.16)
40
Théorie statistique des champs
espace de configuration q'
q t i=0 1 2
i-1 i i+1
N temps
Figure 2.1 – Intégrale de chemin à temps discrétisé.
Il est facile de voir par le même argument que pour U (t) que le terme dans l’exponentielle dans la deuxième ligne de 2.12 n’est rien d’autre que l’action classique S[q ] de cette trajectoire q N −1 X (qi+1 − qi )2 m − V0 = S[q ] (2.17) 2 i=0 Donc l’élément de matrice de l’opérateur d’évolution peut s’écrire comme une intégrale sur les trajectoires linéaires par morceaux q (s) Z i 0 S[q ] (2.18) U (q , q; t) = D [q (s)] exp ~ q (0)= q q (t)= q 0
La mesure sur ces trajectoires est notée D [q (t)] =
Y ti
2iπ~ dq(ti ) m
−N/2 (2.19)
Ces trajectoires ne sont plus des trajectoires classiques pour une particule libre. La vitesse est discontinue aux instants ti . Notons deux choses : – pour la particule libre, le résultat est exact et nous avons juste utilisé le fait que la convolution de gaussiennes est une gaussienne ; – le résultat est indépendant du pas de temps , et valable pour n’importe quelle décomposition de l’intervalle [0, t] en intervalles 0 = t0 < t1 < t2 < · · · < tN −1 < tN = t. Il faut faire intervenir dans la mesure les pas de temps i = ti − ti−1 .
2. L’intégrale de chemin : introduction
41
L’intégrale de chemin à temps continu Il est donc possible de prendre la limite → 0 pour définir formellement l’intégrale sur les chemins continus q(s) comme Z Z i i D[q(s)] exp S[q] = lim D [q (s)] exp S[q ] (2.20) →0 ~ ~ q (0)= q q(0)= q q(t)= q 0
q (t)= q 0
Cette limite ne dépend pas des détails de la discrétisation en temps, et définit l’intégrale de chemin de Feynman. Les amplitudes de probabilité d’évolution dans l’espace des positions, donc l’opérateur d’évolution, s’écrivent comme une somme sur tous les chemins possibles pour la particule, avec un poids complexe, donnée par une phase, égale à l’action de cette trajectoire. Cette intégrale de chemin est aussi appelée « somme sur les histoires » (non classiques) de la particule. Nous allons revenir plus précisément un peu plus tard sur la nature de l’espace des chemins sur lequel cette intégrale est effectuée, de même que sur la nature des « fonctions intégrables » sur cet espace et leur relation avec les observables quantiques. Avant cela, nous allons définir l’intégrale de chemin (toujours pour la particule libre) à temps imaginaire.
2.2.2
Intégrale de chemin à temps imaginaire
Opérateur d’évolution à temps euclidien Nous avons vu que l’opérateur d’évolution U (t) est bien défini pour des temps complexes dans le 1/2 plan inférieur (Im(t) ≤ 0). Considérons un temps t purement imaginaire et définissons le temps euclidien τ comme τ = it
;
τ >0
(2.21)
L’opérateur d’évolution U devient l’opérateur d’évolution euclidien UE (τ ), défini comme h τ i U (t) = UE (τ ) = exp − H (2.22) ~ Pour la particule libre les élément de matrice de UE sont une fonction gaussienne réelle −1/2 2π~τ 1 m (q 0 − q)2 0 0 UE (q , q; τ ) = hq |UE (τ )|qi = exp − + τ V0 m ~ 2 τ (2.23) Intégrale de chemin euclidienne, action euclidienne On peut répéter les calculs précédents et construire une représentation en termes d’intégrale de chemins euclidiennne q(σ) (c’est-à-dire intégrale sur des
42
Théorie statistique des champs
chemins dépendant d’un temps euclidien σ) pour les éléments de matrices de UE . Le résultat est de la forme Z 1 (2.24) UE (q 0 , q; τ ) = D[q(σ)] exp − SE [q] ~ q(0)= q q(τ )= q 0
La phase est remplacée par l’exponentielle d’une quantité réelle SE [q], qui est donnée par Z τ m dq dσ SE [q(σ)] = q(σ) ˙ 2 + V0 ; q(σ) ˙ = (2.25) 2 dσ 0 SE [q] est naturellement appelée l’action euclidienne de la trajectoire q(σ). La mesure DE [q(σ)] est également réelle DE [q(σ)] =
Y
dq(σi )
i
2π~ m
−N/2 (2.26)
Noter le changement de signe devant V0 dans l’action, qui vient simplement du fait que lors de la rotation de Wick dt → −idτ
et
q˙ → iq˙
(2.27)
À temps euclidien, la mesure sur les chemins DE [q(σ)] et le facteur d’action exp(−SE [q]/~) sont réels et positifs. L’intégrale de chemin discrétisée est maintenant une intégrale absolument convergente. On va voir plus loin que l’intégrale de chemin euclidienne est en fait une intégrale sur une variable aléatoire dépendant du R temps euclidien, q(τ ) avec une mesure de probabilité dµ[q] = D[q] exp(− q˙2 /2~), autrement dit c’est une intégrale stochastique. Ce processus stochastique q(τ ) n’est autre que le processus de Wiener, c’est-à-dire le mouvement brownien en une dimension.
2.3
La particule dans un potentiel V (q)
Le résultat pour la particule libre est déjà physiquement très suggestif mais mathématiquement très simple (il s’agit juste d’écrire une gaussienne comme un produit de convolution de gaussiennes). Le point très important est que l’intégrale de chemin s’étend au cas général d’une particule dans un potentiel, et de particules en interaction. Considérons donc une particule de masse m, toujours en une dimension, dans un potentiel V (q), supposé « suffisamment régulier », en pratique une fonction continue et dérivable. Le hamiltonien quantique est H=
P2 + V (Q) 2m
(2.28)
2. L’intégrale de chemin : introduction
2.3.1
43
Limite à temps court de l’opérateur d’évolution
Le principe de l’intégrale de chemin étant de découper le temps en petits intervalles, ce qui est important est de déterminer le comportement à temps court de l’opérateur d’évolution dans le cas général. Pour simplifier nous considérons d’abord le cas du temps euclidien τ = it. Comportement à temps court de l’opérateur d’évolution euclidien Considérons l’élément de matrice de l’opérateur d’évolution euclidien UE (q 0 , q; τ ) dans la limite de temps court τ → 0, q − q 0 restant d’ordre O(1). Considérons la trajectoire euclidienne classique q¯(σ) partant de q au temps initial σ = 0 et se terminant à q 0 au temps final σ = τ , donc à vélocité euclidienne constante q˙ q(s) =
τ −σ σ q + q0 τ τ
,
q0 − q q˙ = τ
(2.29)
L’action euclidienne de cette trajectoire est S E (q, q 0 ; τ ) = SE [¯ q] =
m (q 0 − q)2 + τ V (q 0 , q) 2 τ
(2.30)
avec V (q 0 , q) la moyenne linéaire du potentiel V (q) sur l’intervalle [q, q 0 ]. V (q 0 , q) =
1 q0 − q
Z
q0
dr V (r)
(2.31)
q
On a le résultat fondamental suivant. Lemme : comme
L’opérateur d’évolution UE (τ ) se comporte à temps court (τ → 0)
UE (q 0 , q; τ ) =
τ →0
2π~ τ m
−1/2
1 exp − S E (q, q 0 ; τ ) + O(τ 2 ) ~
(2.32)
avec S E (q, q 0 ; τ ) donné par 2.30 Démonstration de 2.31 : Partons de l’équation de Schrödinger euclidienne pour UE (voir l’exercice 1.15) ∂ ~2 ∂ 2 0 −~ UE (q 0 , q; τ ) = − + V (q ) UE (q 0 , q; τ ) ∂τ 2m ∂q 02 Elle se reécrit pour le log WE (q 0 , q; τ ) = − ~ log UE (q 0 , q; τ )
44
Théorie statistique des champs
comme 1 ∂ ~ ∂2 WE − WE = 2 0 ∂τ 2m ∂q 2m
∂ WE ∂q 0
2
+ V (q 0 )
(2.33)
En supposant que les solutions de cette équation se développent en série de Laurent en τ = 0, et en prenant pour ansatz WE (q 0 , q; τ ) = S E (q 0 , q; τ ) +
~ log(τ ) + O(τ 2 ) 2
(2.34)
on montre facilement que l’équation 2.33 est satisfaite à des termes d’ordre τ 2 près, puisque V (q 0 , q) satisfait l’équation différentielle (q 0 − q)
∂ V (q 0 , q) + V (q 0 , q) = V (q 0 ) q0
et est la seule solution non singulière quand q limq0 →q V (q 0 , q) = V (q).
=
q 0 , et satisfait
Comportement à temps court de l’opérateur d’évolution (temps réel) Un résultat similaire est valable pour le comportement à temps court de l’opérateur d’évolution à temps réel U (q 0 , q; t) −1/2 2iπ~t i U (q 0 , q; t) = exp S(q 0 , q; t) + O(t2 ) (2.35) t→0 m ~ avec S(q 0 , q; t) l’action classique pour la particule se déplaçant à vitesse constante entre q et q 0 pendant le temps t S(q 0 , q; t) =
m (q 0 − q)2 − t V (q, q 0 ) 2 t
(2.36)
On voit donc que l’identité U = exp(i/~ × Action) n’est plus valable dans le cas général, mais le redevient aux temps courts.
2.3.2
Intégrale de chemin pour la particule dans un potentiel
Intégrale de chemin à temps réel Nous pouvons donc maintenant répéter les étapes conduisant à la représentation en intégrale de chemin de l’opérateur d’évolution. En décomposant le temps d’évolution t en N = t/ petits intervalles de temps ∆t = , on obtient une intégrale de chemin approchée Z N i U (q 0 , q; t) = D[q ] exp S[q (s)] 1 + O(2 ) (2.37) ~ q(0)=q q(t)=q 0
2. L’intégrale de chemin : introduction
45
L’intégrale est toujours effectuée sur les trajectoires linéaires par morceaux, la vélocité est constante dans les intervalles ti < s < ti+1 et discontinue aux ti = i. L’action S[q ] est toujours l’action classique. La mesure D[q ] sur les trajectoires est la même que pour la particule libre, donnée par 2.19. Il suffit de remarquer que les termes O(2 ) négligés dans la discrétisation sont d’ordre t/ N = 1 + O(t) (2.38) = 1 + O(2 ) 1 + O(2 ) Ils sont donc négligeables dans la limite des temps continus → 0. Z i S[q (s)] D[q ] exp U (q 0 , q; t) = lim →0 ~
(2.39)
q(0)=q q(t)=q 0
La formule d’intégrale de chemin 2.37 devient donc exacte dans la limite continue. On obtient ainsi la représentation générale de l’intégrale de chemin à temps réel pour l’opérateur d’évolution, écrite en omettant la discrétisation et la limite continue (considérées comme implicites) Z i 0 S[q(s)] (2.40) U (q , q; t) = D[q(s)] exp ~ q(0)=q q(t)=q 0
avec l’action classique pour la trajectoire q(s) à temps réel 0 < s < t 2 Z m dq − V (q) S[q] = ds 2 ds
(2.41)
Cette intégrale de chemin correspond bien dans le cas général à une somme sur les histoires X i U = e ~ ×Action chemins
Intégrale de chemin à temps euclidien De façon similaire on obtient l’intégrale de chemin pour l’opérateur d’évolution à temps euclidien comme somme sur les trajectoires q(σ) en temps euclidien 0 < σ < τ Z 1 0 UE (q , q; τ ) = lim DE [q (σ)] exp − SE [q (σ)] (2.42) →0 ~ q(0)=q q(τ )=q 0
avec l’action euclidienne Z SE [q] =
dσ
m 2
dq dσ
2 + V (q)
qui généralise l’action euclidienne définie pour la particule libre.
(2.43)
46
Théorie statistique des champs
Une discrétisation équivalente Nous allons voir un peu plus loin que dans l’intégrale de chemin dominent les trajectoires q(t) telles que |q(ti ) − q(ti−1 )|2 ∼
~ |ti+1 − ti | m
Si V est régulier (continu et dérivable), ceci implique que l’on peut remplacer la moyenne sur les trajectoires par la moyenne sur les extrémités V (qi , qi−1 ) =
V (qi ) − V (qi−1 ) + O(|qi , qi−1 |2 ) 2
(formule de Taylor). Il est alors justifié de remplacer dans l’intégrale de chemin discrétisée la moyenne du potentiel vu pendant un intervalle de temps par la moyenne des potentiels aux positions initiales et finales de l’intervalle N −1 X
V (qi , qi−1 )
par
i=1
N −1 X i=1
V (qi ) + V (qi−1 ) 2
(2.44)
dans l’action. Ceci simplifie les expressions des intégrales discrétisées.
2.3.3
Dérivation par la formule de Trotter-Kato
Dans le cas d’un potentiel V dépendant de q mais indépendant de t, l’intégrale de chemin peut être également dérivée de façon opératorielle en utilisant la formule de Trotter-Kato. Cette formule énonce que pour deux opérateurs A et B on a n eA+B = lim eA/n eB/n (2.45) n→∞
Cette formule est une conséquence de la formule de Baker-Campbell-Hausdorff t2
et(A+B) = etA etB e 2 [B,A]+··· = etA etB 1 + O(t2 )
(2.46)
où les · · · représentent une série infinie de commutateurs emboîtés formés avec des tA et des tB, donc une série en tk avec k > 2. Prenant t = 1/n et en élevant le tout à la puissance n, on obtient n A/n B/n n eA+B = eA/n eB/n 1 + O(1/n2 ) = e e (1 + O(1/n)) (2.47) D’où le résultat (on ne précisera pas ici pour quelle classe d’opérateurs et quelle topologie la limite existe...). Il suffit de prendre pour A et B les opérateurs t t t P2 , B = V (Q) , n= (2.48) A= i~ 2m i~ ∆t et d’utiliser la décomposition de l’unité dans la base des états de position pour obtenir l’intégrale de chemin générale (avec la prescription 2.44).
2. L’intégrale de chemin : introduction
2.3.4
47
Exercices
Exercice 2.1. Intégrales gaussiennes (1) Montrer que pour A réel et positif (A > 0) Z ∞ p dx exp −x2 A/2 = 2π/A
(2.49)
−∞
(2) Montrer que ce résultat reste valable si A est complexe tant que Re(A) > 0 (c’est-à-dire −π/2 < Arg(A) < π/2), et que ceci fixe la déter√ mination de A. (3) En déduire que le résultat reste valable quand Arg(A) √ = π/2 et Arg(A) = −π/2 (A imaginaire). Quelle est la détermination de A à prendre dans ces deux cas ? (4) En déduire que la transformée de Fourier de la gaussienne g(x) = exp −x2 A/2
(2.50)
est la gaussienne gˆ(k) =
p
2π/A exp −k 2 /(2A)
(2.51)
Exercice 2.2. Propagateur et équation de Schrödinger Calculer explicitement à partir de 2.7 la dérivée d’ordre un par rapport à t et celles d’ordre un et deux par rapport à q (ou q 0 ) de U (q 0 , q; t) donné par 2.7. Vérifier que U obéit à l’équation de Schrödinger pour la particule libre et que lim U (t) = 1
t→0
Attention, le noyau de l’identité 1 est une distribution (la fonction de Dirac), donc il faut appliquer U à une fonction test pour le vérifier proprement.
2.4 2.4.1
Observables et fonctions de corrélations Opérateurs et intégrale de chemin
Il reste à comprendre comment s’expriment les observables (c’est-à-dire les opérateurs du formalisme canonique) dans le formalisme de l’intégrale de chemin. Nous cherchons donc à calculer les éléments de matrice incluant un opérateur A(t), de la forme (en représentation de Heisenberg) hq 0 , t|A(t1 )|q, 0i
(2.52)
Pour cela il suffit d’utiliser la décomposition de A dans la base des états de position x 0 A= dq1 dq1 |q10 i hq10 |A|q1 i hq1 | (2.53)
48
Théorie statistique des champs
pour obtenir hq 0 , t|A(t1 )|q, 0i =
x
dq10 dq1 hq 0 , t|q10 , t1 i hq10 , t1 |A(t1 )|q1 , t1 i hq1 , t1 |q, 0i (2.54) qui peut se représenter comme : l’intégrale de chemin de q à q1 × l’élément de matrice de A entre q1 et q10 × l’intégrale de chemin de q10 à q 0 . Ceci est représenté sur la figure 2.2.
Figure 2.2 – Intégrale de chemin avec insertion d’un opérateur A(ti ).
2.4.2
Observable de position Q
Pour l’observable de position Q à un instant donné c’est simple, puisque hq10 |Q|q1 i = q1 δ(q10 − q1 ) On obtient une représentation en intégrale de chemin Z i hq 0 , t|Q(t1 )|q, 0i = D[q] exp S[q] q(t1 ) ~
(2.55)
(2.56)
où on insère l’observable q(t1 ) dans l’intégrale. On a bien une correspondance entre observable quantique (opérateur) en quantification canonique et observable classique correspondante (variable aléatoire dans l’intégrale de chemin), telle qu’elle est attendue par le principe de correspondance opérateur Q(t) ↔
variable aléatoire q(t)
(2.57)
2. L’intégrale de chemin : introduction
49
Les valeurs moyennes quantiques (éléments de matrices) de l’opérateur Q sont égales aux valeurs moyennes (au sens de la mesure) de l’observable classique q dans l’intégrale de chemin.
Figure 2.3 – Intégrale de chemin avec l’opérateur Q(t).
C’est la même chose si l’observable F (t) commute avec Q(t), et s’écrit donc comme une fonction standard f (Q) de l’opérateur position Q(t) à un instant donné, f étant une fonction régulière réelle (typiquement un polynôme) q → f (q) de la position. Dans ce cas, on a hq10 |f (Q)|q1 i = f (q1 ) δ(q10 − q1 )
(2.58)
donc le principe de correspondance opérateur ↔ fonction f (Q)(t)
2.4.3
↔
f (q(t))
(2.59)
Plusieurs observables et produits ordonnés en temps
À quoi correspond l’intégrale de chemin lorsque l’on insère maintenant deux telles observables A(t) = A(q(t)) et B(t) = B(q(t)) à deux temps différents t1 et t2 ? Z i D[q] exp S[q] A(t1 ) B(t2 ) (2.60) ~ Il est simple de voir que si t1 < t2 on obtient hq 0 , t|B(t2 ) A(t1 )]|q, 0i, alors que si t1 > t2 on obtient hq 0 , t|A(t1 ) B(t2 )]|q, 0i toujours en représentation
50
Théorie statistique des champs
Figure 2.4 – Intégrale de chemin avec deux opérateurs A(t1 ) et B(t2 ).
de Heisenberg. On obtient donc l’élément de matrice du produit ordonné en temps des deux opérateurs Z i 0 hq , t|T [Q(t1 ) Q(t2 )]|q, 0i = D[q] exp S[q] q(t1 ) q(t2 ) (2.61) ~ où T [ ] est le produit ordonné en temps. L’intégrale de chemin ordonne en temps « automatiquement » les produits d’opérateurs. C’est normal, les trajectoires q(t) sur lesquelles est effectuée l’intégrale de chemin sont déjà ordonnées dans le temps. On ne peut pas « mesurer » q(t2 ) avant q(t1 ) si t2 > t1 . Ceci se généralise à des produits d’un nombre quelconque d’opérateurs.
2.4.4
Observable d’impulsion P
Définition de P Les choses sont un peu plus délicates pour l’observable d’impulsion P . L’intégrale de chemin est construite dans l’espace des positions, donc en référence à l’observable Q, et P ne commute pas avec Q. Les éléments de matrice de P sont ~ ∂ ~ ∂ hq 0 |P |qi = δ(q 0 − q) = − δ(q 0 − q) (2.62) 0 i ∂q i ∂q Insérons P au temps ti = i dans l’intégrale de chemin discrétisée. Le terme faisant intervenir les variables à ti dans l’intégrale est Z Z dqi dqi0 U (qi+1 , qi0 ; ) hqi0 |P |qi i U (qi , qi−1 ; ) (2.63)
2. L’intégrale de chemin : introduction
51
En intégrant par partie sur qi (resp. sur qi0 ) pour faire agir la dérivée par rapport à qi dans hqi0 |P |ii sur le U à gauche (resp. à droite), on obtient Z Z ~ ∂ U (qi , qi−1 ; ) dqi dqi0 U (qi+1 , qi0 ; ) δ(qi0 − qi ) i ∂qi Z ~ ∂ = dqi U (qi+1 , qi ; ) U (qi , qi−1 ; ) i ∂qi Il suffit d’utiliser le comportement à temps court de U (qi , qi−1 ; ) (2.35) pour obtenir ~ ∂ qi − qi−1 U (qi , qi−1 ; ) = m U (qi , qi−1 ; ) (1 + O()) (2.64) i ∂qi Nous pouvons donc identifier l’observable impulsion P (t) dans l’intégrale de chemin discrétisée avec p = m v, où v est la vitesse moyenne dans l’intervalle de temps qui contient t. Autrement dit, l’élément de matrice avec une insertion de P est donné par Z i hq 0 , t|P (t1 )|q, 0i = lim D [q] exp S [q] p (t1 ) (2.65) →0 ~ avec q(ti+1 ) − q(ti ) p (t) = m q˙ (t) , q˙ (t) = , ti < t < ti+1 ti+1 − ti On a bien l’identification impulsion = masse × vitesse conforme au principe de correspondance et aux équations du mouvement P (t)
←→
p (t) = m q˙ (t)
(2.66)
Mais attention ! L’observable impulsion p(t) dans l’intégrale de chemin est portée par un intervalle de temps [ti , ti+1 ], et non pas par un instant ti dans la discrétisation. Ceci est représenté sur la figure 2.5. Ambiguïtés des produits d’opérateurs Ceci a des conséquences importantes. En quantification canonique, des observables classiques impliquant à la fois la position q et l’impulsion p souffrent d’ambiguïtés. Il faut préciser dans quel ordre on associe les opérateurs Q et P qui ne commutent plus. Par exemple l’observable classique q2 p2 peut se représenter par les opérateurs hermitiens QP 2 Q ou P Q2 P , qui sont différents. De la même façon, il faut préciser dans l’intégrale de chemin quelle discrétisation est choisie pour construire les observables quantiques correspondantes. Par exemple, l’observable qp peut être construite en insérant q(t) avant p(t), ou en insérant q(t) après p(t). ( q(t )−q(t ) i × q(ti ) q avant p, m i+1 ti+1 −ti (2.67) qp(t) → q(ti+1 )−q(ti ) q(ti+1 ) × m ti+1 −ti p avant q.
52
Théorie statistique des champs
Figure 2.5 – Discrétisation de l’opérateur impulsion P (t) dans l’intégrale de chemin.
Le premier cas correspond à construire l’observable P Q(t), le deuxième l’observable QP (t). La différence étant due aux relations de commutations (voir exercice 2.4). De façon analogue, l’observable quantique P 2 se construit en insérant deux p à deux intervalles de temps successifs, non pas en prenant le carré de p sur un seul intervalle de temps. p2 (t)
→
m
q(ti+1 ) − q(ti ) q(ti ) − q(ti−1 ) ×m ti+1 − ti ti − ti−1
(2.68)
Voir l’exercice 2.5 pour plus de détails. Nous allons voir dans les sections suivantes que ces ambiguïtés sont une conséquence du fait suivant. Les trajectoires dominantes dans l’intégrale de chemin sont des fonctions q(t) (ou q(τ ) pour l’intégrale de chemin euclidienne) qui sont continues mais non dérivables. La vélocité instantanée q(t) ˙ n’est pas bien définie dans la limite du temps continu → 0. La non-commutativité des observables quantiques dans le formalisme canonique est équivalente au comportement singulier à temps court des « trajectoires quantiques » dans l’intégrale de chemin.
2.4.5
Exercices
Exercice 2.3. Limite à temps court des éléments de matrices de P Montrer que la limite aux temps courts de l’élément de matrice hq 0 ; t0 |P (t1 )|q; ti
t < t1 < t0
2. L’intégrale de chemin : introduction
53
est équivalente, quand t → t1 − 0+ , t0 → t1 + 0+ , à hq 0 ; t0 |P (t1 )|q; ti = m
(q 0 − q) 0 0 0 hq ; t |q; ti 1 + O(|t − t|) (t0 − t)
(2.69)
En déduire que dans la représentation de Heisenberg, P (t) peut être défini comme Q(t0 ) − Q(t) (2.70) P (t) = lim m 0 t →t t − t0 Comparer avec les équations du mouvement quantique. Exercice 2.4. Relations de commutation En utilisant les deux définitions possibles du produit p × q (2.67), et la limite à temps court de l’opérateur d’évolution, montrer que dans l’intégrale fonctionnelle lim p q − q p = i~ + O() (2.71) →0
Qu’en déduisez-vous ? Exercice 2.5. Ambiguïtés de P 2 = P × P Montrer que la dérivée seconde de l’opérateur d’évolution se comporte à temps court comme 2 0 2 ~ ∂ m 0 0 2 (q − q) − i~ U (q , q ; ) = m U (q 0 , q 0 ; ) (1 + O()) i ∂q 0 2 (2.72) En déduire que l’opérateur P 2 ne se représente pas dans l’intégrale de chemin en insérant le carré de l’impulsion discrétisée P 2 (t) 9 lim p (t)2
(2.73)
→0
mais en insérant P 2 (t) → lim p (t)2 − i~ →0
m
(2.74)
Expliquer pourquoi les éléments de matrices de P 2 (t) doivent être bien définis dans la limite continue. Pouvez-vous expliquer pourquoi p2 (t) n’est pas bien défini dans l’intégrale fonctionnelle quand → 0 ? Montrer que la définition 2.74 correspond à celle de 2.68. Exercice 2.6. Développement à temps court de produit d’opérateurs Q1 : En partant de la définition de Q(t) en représentation de Heisenberg, du Hamiltonien H = P 2 /2m+V (Q) et des relations de commutation [Q, P ] = i~, développer à temps court t → 0 le produit Q(t/2)Q(−t/2) pour t > 0 à l’ordre t3 . En déduire que le produit ordonné en temps de deux Q s’écrit en représentation de Heisenberg comme un développement autour de t = 0
54
Théorie statistique des champs
1 T [Q(t/2)Q(−t/2)] = Q2 (0) − i~ |t|1 2m 1 2 1 2 1 0 |t|3 V ”(Q)(0) + O(t4 ) − t P (0) + QV (Q)(0) + i~ 4m m 24 m2 (2.75) (noter les valeurs absolues |t| et |t|3 ). Q2 : En utilisant l’équation quantique du mouvement P (t) = m
∂ Q(t) ∂t
(2.76)
montrer que ce développement à temps court permet de ré-obtenir les relations de commutation [Q, P ](0) = lim Q(t/2) P (−t/2) − P (t/2) Q(−t/2) = i~ t→0+
(2.77)
Q3 : En déduire le développement à temps court pour le T-produit de deux opérateurs P T (P (t/2)P (−t/2)) = i~ m δ(t) 1 + P 2 + O(|t|)
(2.78)
Notez que le terme dominant (le plus singulier) du développement est une fonction de Dirac ~ δ(t) et que ce terme est d’origine quantique, car proportionnel à ~. On verra que des développements similaires sont très importants en théorie quantique des champs (développement à courte distance des produits d’opérateurs, ou operator product expansion – OPE).
2.5
Système quantique à température finie : temps euclidien périodique
2.5.1
Intégrale de chemin à temps imaginaire périodique
Pour un système quantique à l’équilibre thermodynamique dans l’ensemble canonique à la température T (état de Gibbs), la fonction de partition est la trace de l’opérateur d’évolution à temps imaginaire τ Z(β) = tr [exp (−βH)] = tr[UE (τ )] ,
β=
1 τ = kB T ~
(2.79)
En partant de la représentation de l’opérateur d’évolution euclidien comme une intégrale de chemin, prendre la trace correspond à intégrer sur les positions initiales et finales q = q 0 Z Z Z 1 tr[UE (τ )] = dq hq|UE (τ )|qi = dq D[q] exp − SE [q] (2.80) ~ q(0)=q q(τ )=q
2. L’intégrale de chemin : introduction
55
La fonction de partition est donc donnée par l’intégrale de chemin euclidiennes sur les trajectoires périodiques (en temps imaginaire) de période τ {q(σ)} tel que q(σ + τ ) = q(σ)
(2.81)
La période τ est proportionelle à l’inverse de la température. On a donc Z 1 (2.82) Z(β) = D[q] exp − SE [q] ~ q(0)=q(τ )
avec la relation fondamentale entre la période τ , la température T et la constante de Planck ~ ~ τ = = ~β (2.83) kB T
temps réel t
t
t temps Euclidien périodique Figure 2.6 – Température finie T ⇔ temps euclidien périodique τ = ~/kB T .
2.5.2
Observables et fonctions de corrélation à température finie
Valeur moyenne d’un opérateur Considérons une observable (opérateur) A. Pour simplifier, nous supposons que A est une fonction de l’opérateur position Q, donc A = A(Q) et A commute avec Q. La valeur moyenne de A dans l’état de Gibbs à température T est définie par tr A e−βH (2.84) hA(t)iβ = hAiβ = tr (e−βH )
56
Théorie statistique des champs
Il est donc donné par le rapport de deux intégrales de chemin à temps euclidien périodique R D[q] exp − ~1 SE [q] A[q(τ0 )] q(0)=q(τ ) R (2.85) hAiβ = D[q] exp − ~1 SE [q] q(0)=q(τ )
Le contour en temps euclidien pour l’intégrale de chemin au numérateur est représenté sur la figure 2.7. L’intégrale de chemin au dénominateur est celle qui définit la fonction de partition. L’instant t auquel est attaché A n’a pas d’importance, puisqu’un état de Gibbs est un état stationnaire.
Figure 2.7 – Contour en temps complexe imaginaire (temps euclidien) E pour évaluer hA(t)iβ à température finie.
Fonctions de corrélation à temps réel Pour deux opérateurs A(t1 ) et B(t2 ) à temps réels différents t1 < t2 , la valeur moyenne du produit (ordonné en temps) de ces deux opérateurs sur l’état de Gibbs (ou fonction de corrrélation de ces deux observables) est définie comme hT [B(t2 )A(t1 )]iβ =
1 tr e−βH B(t2 )A(t1 ) Zβ
t1 < t2
(2.86)
Attention ! L’ordre des opérateurs est important. La trace au numérateur s’écrit en représentation de Schrödinger tr e−βH B(t2 )A(t1 ) = tr [U (−i~β)U (−t2 )BU (t2 − t1 )AU (t1 )] = tr [UE (τ )U (−t2 )BU (t2 − t1 )AU (t1 )]
(2.87)
avec la période en temps euclidien τ = ~β = ~/kB T comme précédemment. Cette trace peut donc s’écrire comme une intégrale de chemin, mais où sont combinés des opérateurs d’évolution en temps réel et en temps imaginaire. Il faut en effet se représenter 2.87 comme résultant de la composition des opérations mathématiques suivantes : 1. création d’un état initial |ψ0 i du système à t = 0 ;
2. L’intégrale de chemin : introduction
57
évolution en temps réel de t = 0 à t = t1 ; application de l’opérateur A à t = t1 ; évolution en temps réel de t = t1 à t = t2 ; application de l’opérateur B à t = t2 ; évolution à rebours en temps réel de t = t2 à t = 0 (pour revenir à l’état initial) ; 7. évolution en temps imaginaire (donc t = −iτ , τ = ~β = ~/kB T ) pour représenter la matrice e−βH ; 8. fermeture en projetant sur l’état initial |ψ0 i ; 9. enfin, sommation sur les états initiaux pour représenter la trace. On doit donc intégrer dans l’intégrale de chemin sur les chemins q(t) avec t défini sur un contour complexe 0 → t1 → t2 → 0 → iτ , et in fine périodique de période τ = i~β. Un tel contour T est représenté sur la figure 2.8. 2. 3. 4. 5. 6.
A(t1 )
B(t2 )
Figure 2.8 – Contour en temps complexe T pour une fonction de corrélation de 2 opérateurs hT [A(1)B(t2 )]iβ à température finie et à temps réel (les opérateurs sont ordonnés en temps).
On a finalement la représentation R hT [B(t2 )A(t1 )]iβ =
T
i
D[q] e ~ S[q] A(t1 )B(t2 ) R i D[q] e ~ S[q] E
(2.88)
Tout ceci se généralise sans difficulté aux fonctions de corrélations à K > 2 opérateurs du type hT [A1 (t1 ) · · · Ak (tk )]iβ . Fonctions de corrélations à temps euclidien La fonction de corrélation à temps réel 2.88 s’obtient en fait à partir de la fonction de corrélation à temps imaginaire (temps euclidien), définie comme 1 −βH tr e B(τ2 )A(τ1 ) Zβ 1 h −(τ −τ2 )H/~ −(τ2 −τ1 )H/~ −τ1 H/~ i = tr e Be Ae Zβ
hB(τ2 )A(τ1 )iβ =
(2.89)
58
Théorie statistique des champs
A(τ1 ) B(τ2 )
Figure 2.9 – Contour en temps complexe E pour une fonction de corrélation de 2 opérateurs hB(τ2 )A(τ1 )iβ à temps euclidien et température finie.
Cet objet n’a de sens que si 0 < τ1 < τ2 < τ = β~. La trace au numérateur 2.89 se représente par l’intégrale de chemin à temps euclidien périodique, où on a inséré les observables A et B aux temps euclidiens τ1 et τ2 Z −βH 1 (2.90) tr e B(τ2 )A(τ1 ) = D[q] e− ~ SE [q] A(τ1 )B(τ2 ) E
Cette intégrale de chemin correspond au contour en temps de la figure 2.9. Le dénominateur est la fonction de partition Z(β) et se représente par l’intégrale de chemin à temps euclidien périodique 2.82. On a donc la généralisation de 2.85 pour la fonction à deux points R D[q] exp − ~1 SE [q] A[q(τ1 )]B[q(τ2 )] q(0)=q(τ ) R hB(τ2 )A(τ1 )iβ = (2.91) D[q] exp − ~1 SE [q] q(0)=q(τ )
Ceci se généralise sans difficulté aux fonctions de corrélations à K > 2 opérateurs du type hA1 (τ1 ) · · · Ak (τk )iβ . Contours en temps complexe Cette fonction de corrélation 2.89 est donc une fonction GAB (τ2 − τ1 ; β) de τ2 − τ1 , avec des propriétés d’analyticité un peu particulières sur laquelle nous reviendrons. L’opérateur d’évolution U (t) étant une fonction analytique du temps t dans le demi-plan complexe Im(t) < 0, on peut en fait déformer librement le contour en temps dans le plan complexe dans la définition de l’intégrale de chemin. L’important est que Im(dt) ≤ 0 (le chemin en temps euclidien tourne toujours dans le même sens) pour que les opérateurs d’évolution U (dt) pour chaque intervalle de temps dt sur le contour soient bien définis. On en déduit que l’on peut effectuer la rotation de Wick τ1 → it1
,
τ2 → it2
(2.92)
2. L’intégrale de chemin : introduction
59
=
Figure 2.10 – L’intégrale de chemin ne dépend pas du « contour complexe en temps » sur lequel on intègre les trajectoires, pourvu que Im(dt) ≤ 0.
pour passer de l’expression de la fonction de corrélation à temps euclidien hB(τ2 )A(τ1 )iβ à la fonction de corrélation à temps réel hT [B(t2 )A(t1 )]iβ .
2.5.3
Limite T → 0 et projection sur le fondamental
Temps euclidien Prendre la limite de température nulle T → 0 correspond à la limite β → ∞, et à projeter sur le niveau fondamental |0i du hamiltonien. Considérons le cas simple où H a un spectre discret E0 < E1 < E2 < · · · et notons |0i, |1i, · · · les états propres correspondants, tels que H|ni = En |ni. La valeur moyenne d’un opérateur A est hn|A|nie−βEn nP −βEn ne
P hA(τ0 )iβ =
(2.93)
Dans la limite T → 0, c’est bien l’état de plus basse énergie qui domine et on obtient lim hA(τ0 )iβ = h0|A|0i
β→+∞
(2.94)
Cette fonction à un point est indépendante du temps euclidien τ0 puisque H est indépendant du temps (invariance par translation dans le temps). Considérons maintenant les fonctions de corrélations avec K opérateurs Ai (τi ) (les temps euclidiens étant convenablement ordonnés 0 < τ1 < τ2 < · · · < τK < β). On obtient lim hAk (τk ) · · · A1 (τ1 )iβ = h0|Ak (τk ) · · · A1 (τ1 )|0i
β→+∞
(2.95)
60
Théorie statistique des champs
En particulier, pour la fonction à deux points on a, en normalisant ~ = 1 donc τ = β pour simplifier PP hn|A2 |mie−σEm hm|A1 |nie−(τ −σ)En n m P −τ E (2.96) hA2 (τ2 )A1 (τ1 )iβ = n e n
avec σ = τ2 − τ1
(2.97)
Dans la limite T → 0, on obtient X lim hA2 (σ)A1 (0)iβ = h0|A2 |mihm|A1 |0ie−σ(Em −E0 ) β→∞
(2.98)
m
À quoi correspondent ces résultats pour l’intégrale de chemin euclidienne ? La limite T → 0 correspond à la limite où la période τ = ~/kB T devient infinie. Dans cette limite le temps euclidien peut être considéré comme une variable réelle variant entre −∞ et +∞. Les conditions aux limites périodiques sont envoyées à l’infini. Les valeurs moyennes des observables sur l’état fondamental sont donc obtenues par des intégrales de chemin à temps euclidien τ ∈ R. Lorsqu’il n’y a pas d’ambiguïté, on les notera simplement R hAk (τk ) · · · A1 (τ1 )i =
1
D[q] e− ~ SE [q] Ak (τk ) · · · A1 (τ1 ) R 1 D[q] e− ~ SE [q]
(2.99)
Attention, ces intégrales de chemins sont normalisées par le facteur 1/Z, de façon à toujours avoir h0|1|0i = h0|0i = 1. Temps réel Lorsque l’on effectue la rotation de Wick τi = iti pour obtenir les fonctions de corrélations à temps réel, on obtient les valeurs moyennes dans le vide des produits ordonnés en temps d’opérateurs de type h0|T [AK (tK ) · · · A1 (t1 )]|0i. |0i est le vide (l’état de plus basse énergie) du modèle dans la représentation de Heisenberg. Il faut se rappeler que le contour d’intégration en temps dans l’intégrale de chemin est du type représenté sur la figure 2.8. Si l’on se rappelle que l’on projette sur le fondamental et que l’on oublie la partie temps euclidien, l’intégrale de chemin à temps réel correspond toujours à un double contour, représenté sur la figure 2.11. A1 (t1 ) |0in i · · ·
A2 (t2 ) · · · |0out i
Figure 2.11 – Intégrales de chemin pour les fonctions de corrélations à temps réel.
2. L’intégrale de chemin : introduction
61
Ces deux contours correspondent à la représentation suivante. L’intégrale de chemin à temps réel permet de calculer des éléments de matrices d’opérateurs entre un état initial |ψin i à un temps initial tin et un état final |ψout i à un temps final tout . Dans notre cas les états initiaux et finaux sont tous les deux l’état fondamental |0i, mais avec une phase |0in i = |0; tin i = ei
tin E0 ~
i
|0out i = |0; tout i = e
|0i avec
tout E0 ~
|0i avec
tin → −∞ tout → +∞
(2.100) (2.101)
L’intégrale de chemin représentée avec la figure 2.11 correspond à écrire h0|T [A1 (t1 ) · · · AK (tK )]|0i =
h0out |T [A1 (t1 ) · · · AK (tK )]|0in i h0out |0in i
(2.102)
le contour supérieur (orienté positivement en temps) représentant le numérateur h0|T [A1 (t1 )AK (t2 )]|0i et le contour inférieur (orienté négativement en temps) représentant le dénominateur (h0out |0in i)−1 = h0in |0out i. La phase E0 (tout − tin ) se compense entre le numérateur et le dénominateur. Dans le cas de la mécanique quantique non relativiste tout ceci est relativement élémentaire. Pour une théorie invariante relativiste, des champs quantiques, le fondamental |0i est appelé le vide de la théorie. Les valeurs moyennes sur l’état fondamental de produits d’opérateurs sont appelées valeurs moyennes dans le vide (vacuum expectation values ou en abrégé v.e.v’s). Elles sont de la forme h0|T [A1 (x1 ) · · · AK (xK )]|0i, les Ai étant maintenant des opérateurs locaux dépendant d’un vecteur d’espace temps x = (t, ~x). Elles portent le nom de fonctions de corrélations ou de fonctions de Green, lorsque les opérateurs sont ordonnés en temps (T-produit), et de fonctions de Wightman dans le cas général où les opérateurs ne sont pas ordonnés en temps.
2.6
L’oscillateur harmonique
L’oscillateur harmonique est un système simple, pour lequel il est possible de calculer exactement des observables par les méthodes d’intégrale de chemin et de comparer aux résultats obtenus par la quantification canonique. En effet l’action classique est quadratique dans la variable de position q(t), et les intégrales de chemin sont des intégrales gaussiennes. Ce faisant nous allons déjà rencontrer des problèmes de divergences à haute fréquence et de régularisation.
62
Théorie statistique des champs
2.6.1
Quantification canonique
Hamiltonien et spectre Le hamiltonien classique H de l’oscillateur harmonique unidimensionnel est
m ω2 2 p2 + q (2.103) 2m 2 m est la masse et ω = 2π f la pulsation, f étant la fréquence propre. En quantification canonique, le hamiltonien H s’exprime en fonction des opérateurs de création et d’annihilation a† et a H=
~ω (aa† + a† a) , [a, a† ] = 1 2 r r P mω P mω † a= √ − iQ , a =√ + iQ 2~ 2~ 2~mω 2~mω Les niveaux d’énergies sont bien sûr H=
En = ~ω(n + 1/2)
(2.104) (2.105)
(2.106)
et la fonction de partition à température finie Zβ =
∞ X
e
−βEn
= 2 sinh
n=0
1 ~ω 2 kB T
(2.107)
Fonction à deux points Les fonctions de corrélation (valeurs moyennes dans le vide et dans des états de Gibbs) peuvent être calculées dans le formalisme canonique à partir de la forme explicite des états propres de H. Elles peuvent également être calculées en utilisant les équations du mouvement quantique, voir section 1.2.4. Ces équations 1.86 s’écrivent d 1 Q(t) = P(t) dt m
,
d P(t) = −mω 2 Q(t) dt
(2.108)
Donc, pour une fonction de corrélation à deux points, on peut écrire 2 d 2 + ω hT [Q(t)Q(0)]iβ = 0 si t 6= 0 (2.109) dt2 Il faut faire attention à ce qui se passe à t = 0. Les relations de commutations entre Q, P et H permettent de montrer que le produit T [Q(t)Q(0)] admet le développement à temps court T [Q(t)Q(0)] = Q2 (0) − i~ t→0
1 |t| · 1(0) + O(t2 ) 2m
(2.110)
2. L’intégrale de chemin : introduction Puisque
d2 dt2 |t|
63
= 2δ(t), on obtient l’équation différentielle avec second membre 2 i~ d 2 +ω hT [Q(t)Q(0)]iβ = − δ(t) (2.111) 2 dt m
En faisant la rotation de Wick t = −iτ la fonction à deux points euclidienne G(τ ) = hQ(τ )Q(0)iβ
(2.112)
satisfait l’équation
d2 − 2 + ω2 dτ
hQ(τ )Q(0)iβ =
~ δ(τ ) m
(2.113)
avec la condition que cette fonction doit être une fonction périodique de τ G(τ ) = G(τ + ~β)
(2.114)
puisque le temps euclidien est périodique de période ~β pour décrire un état de Gibbs avec β = 1/kB T . Enfin, le propagateur peut aussi être calculé explicitement, par exemple en résolvant l’équation de Schrödinger.
2.6.2
Action et intégrale de chemin
Action et action euclidienne L’action classique est Z
m 2 (q˙ − ω 2 q 2 ) (2.115) 2 L’action euclidienne correspondante est Z m (2.116) SE [q] = dτ (q˙2 + ω 2 q 2 ) 2 Pour retrouver les résultats de la quantification canonique par l’intégrale de chemin, Z i D[q] exp S[q] (2.117) ~ il suffit d’utiliser des propriétés des intégrales gaussiennes. On développe l’action S[q] autour d’une solution classique qc (t) en écrivant Z Z Z 1 00 S[qc + q˜] = S[qc ] + dt q˜(t)St0 [qc ] + dt dt0 q˜(t) q˜(t0 ) St,t 0 [qc ] (2.118) 2 avec δS[q] δ 2 S[q] 0 00 St [qc ] = , St,t0 [qc ] = (2.119) δq(t) qc δq(t)δq(t0 ) qc S[q] =
dt
δ/δq(t) désigne la dérivée fonctionnelle par rapport à q au temps t. Le développement s’arrête à l’ordre deux car l’action est quadratique. Le terme d’ordre un en q˜ s’annule par les équations du mouvement. En effet St0 [q] = −m q¨(t) − mω 2 q(t)
(2.120)
64
Théorie statistique des champs
Hessienne et déterminant fonctionnel La dérivée seconde de l’action est appelée la hessienne (ou matrice hessienne) de l’action. Elle doit en fait s’écrire comme une distribution 00 00 0 2 0 St,t 0 [q] = −m δ (t − t ) − mω δ(t − t )
(2.121)
C’est le noyau intégral de l’opérateur différentiel −m
d − mω 2 dt2
(2.122)
agissant sur des fonctions de t. On peut écrire l’intégrale de chemin 2.117 comme Z i i1x 0 0 00 exp S[qc ] × D[˜ q ] exp dt dt q˜(t) q˜(t ) St,t0 [qc ] (2.123) ~ ~2 et formellement l’intégrale gaussienne sur les fluctuations q˜ s’exprime en fonction du déterminant fonctionnel de cet opérateur différentiel −1/2 00 det St,t (2.124) 0 [qc ] Ce déterminant est le hessien. Pour l’oscillateur harmonique l’opérateur différentiel 2.122 ne dépend pas de qc . C’est une conséquence simple du fait que l’action est quadratique en q(t). Par contre il dépendra implicitement des conditions aux limites du problème considéré, en particulier du temps. On va présenter maintenant quelques calculs explicites d’intégrale de chemin pour l’oscillateur harmonique. On reviendra de façon plus systématique sur ce type de calculs et sur leur extension au cas d’une action générale plus loin (limite classique et développements semi-classiques).
2.6.3
L’oscillateur harmonique à temps euclidien
Étudions d’abord l’intégrale de chemin à temps euclidien. La trajectoire euclidienne classique qc (τ ) est la solution des équations du mouvement à temps euclidien, avec conditions initiales et finales données d2 q = ωq , dτ 2
q(τ1 ) = q1 ,
q(τ2 ) = q2
(2.125)
Elle est unique et donnée par qc (τ ) =
1 (q1 sinh(ω(τ2 − τ )) + q2 sinh(ω(τ − τ1 ))) sinh(ω(τ2 − τ1 ))
(2.126)
L’action euclidienne pour cette trajectoire classique est cl SE [qc ] = SE (q2 , q1 ; τ ) =
mω (q12 + q22 ) cosh(ω(τ2 − τ1 )) − 2q1 q2 2 sinh(ω(τ2 − τ1 ))
(2.127)
2. L’intégrale de chemin : introduction
65
Comme on l’a vu, l’intégrale de chemin est gaussienne. L’opérateur d’évolution euclidien (le propagateur) peut s’écrire, développant les fluctuations autour de la solution classique q = qc + q˜ −1/2 Z 1 1 ∂2 2 SE [q] −~ e− ~ SE [qc ] = « det » − 2 + ω UE (q2 , q1 ; τ2 − τ1 ) = D[q] e ∂τ (2.128) L’opérateur différentiel euclidien (la hessienne) est 00 SE =−
∂2 + ω2 . ∂τ 2
(2.129)
Il est défini sur l’intervalle I = [τ1 , τ2 ] avec des conditions aux limites de Dirichlet, c’est-à-dire qu’il agit sur l’espace LDir (I) des fonctions ψ(τ ) qui s’annulent aux extrémités ψ(τ1 ) = ψ(τ2 ) = 0). « det » est le déterminant de cet opérateur. Ce determinant n’est en fait pas bien défini, car le produit des valeurs propres est infini, d’ou les « ». En fait la normalisation du déterminant est fixée par la mesure (également singulière) dans l’intégrale de chemin. On peut l’obtenir facilement en remarquant que pour ω = 0 on retrouve la particule libre, pour laquelle on connaît la normalisation de l’intégrale de chemin. On va donc écrire ∂2 2π ~ (τ2 − τ1 ) « det » − 2 = (2.130) ∂τ m et on utilise la relation det(AB) = det(A) det(B) pour décomposer " 2 −1 # ∂2 ∂2 ∂ 2 2 « det » − 2 + ω = « det » − 2 × det 1 − ω (2.131) ∂τ ∂τ ∂τ 2 Le deuxième déterminant dans le membre de droite de (2.131) est le déterminant d’un opérateur pseudo-différentiel non local. Ce déterminant est bien défini. En effet les vecteurs propres ψk de cet opérateur sont les mêmes que ∂ ceux de ∂τ , donc avec valeurs propres λk (on note τ = τ2 − τ1 ) τ ω 2 ψk (σ) = sin(πkσ/τ ) , λk = 1 + , k ∈ N+ (2.132) πk Ce déterminant est donc donné par un produit infini convergent, qui se calcule exactement " 2 −1 # Y ∞ τ ω 2 sinh(ωτ ) ∂ 2 = (2.133) det 1 − ω = 1+ ∂τ 2 πk ωτ k=1
On obtient donc finalement UE (q2 , q1 ; τ2 −τ1 ) = hq2 , τ2 |q1 , τ1 i =
r
mω 1 exp − SE [qc ] 2π ~ sinh(ω(τ2 − τ1 )) ~ (2.134)
66
Théorie statistique des champs
Le lecteur peu à l’aise avec ces manipulations peut discrétiser l’intégrale de chemin en N intervalles de temps ∆τ = τ /N et discrétiser l’action, auquel cas 00 l’opérateur SE devient une matrice de taille finie (N − 1) × (N − 1), calculer exactement le déterminant, puis prendre la limite N → ∞. On réobtient les résultats de l’intégrale de chemin dans le continu. Enfin, on peut vérifier explicitement que 2.134 satisfait l’équation de Schrödinger à temps euclidien (équation de la chaleur), et se comporte à temps court τ 1/ω comme le propagateur de la particule libre, donc satisfait également la condition initiale UE (q2 , q1 ; 0) = δ(q1 − q2 ).
2.6.4
L’oscillateur harmonique à temps réel
Pour obtenir l’opérateur d’évolution en temps réel, il suffit de faire la rotation de Wick τ = it, sinh(it) = i sin(t) pour obtenir U (q2 , q1 ; t2 − t1 ) = hq2 , t2 |q1 , t1 i =
r
mω exp 2iπ ~ sin(ω(t2 − t1 ))
i S[qc ] ~ (2.135)
avec l’action de la trajectoire classique (oscillations) qc (t) = q1
sin(ω(t2 − t)) sin((ω(t − t1 )) + q2 sin(ω(t2 − t1 )) sin(ω(t2 − t1 ))
(2.136)
donnée par mω (q12 + q22 ) cos(ω(t2 − t1 )) − 2q1 q2 (2.137) 2 sin(ω(t2 − t1 )) q mω Enfin, on peut remarquer que le facteur 2iπ ~ sin(ω(t devant l’exponen2 −t1 )) Sc =
tielle de l’action classique dans 2.135 correspond à l’identité pour le déterminant fonctionnel (à temps réel). −1 ∂2 ∂2 sin(ωt) c « det » = 2π~ − S (q2 , q1 ; t) = 2π~ ∂t2 mω ∂q1 ∂q2 E
(2.138)
Cette forme simple sera justifiée et généralisée plus tard. On remarque également que ce coefficient est indépendant des conditions initiales et finales q1 et q2 , mais qu’il dépend du temps t, et qu’il est singulier quand t est un multiple de la demi-période P de l’oscillateur harmonique t=
n P 2
,
P =
1 2π = f ω
,
n∈Z
(2.139)
Ceci s’explique par l’existence de points conjugués : toutes les trajectoires classiques partant d’un point q1 au temps 0 aboutissent alors au même point q2 = (−1)n q1 au temps t, comme on le discutera plus loin.
2. L’intégrale de chemin : introduction
2.6.5
67
Les fonctions de corrélation
Les fonctions de corrélation se calculent très facilement grâce à l’intégrale de chemin. Considérons la fonction à deux points à temps euclidien et à température finie T , G(τ ) déjà considérée dans 2.112. Elle s’écrit comme une valeur moyenne (un cumulant) dans l’intégrale de chemin euclidienne périodique R D[q]e−SE [q] q(0)q(τ ) R (2.140) G(τ ) = hq(0)q(τ )i = D[q]e−SE [q] Comme l’intégrale de chemin est gaussienne, G(τ ) est donné par l’élément de matrice (plus précisément le noyau intégral) de l’inverse de la dérivée seconde 00 de l’action SE , donc l’inverse de SE donné par 2.129 G(τ ) =
−1 ~ d2 − 2 + ω02 m dσ 0,τ
(2.141)
On en déduit immédiatement que G satisfait l’équation différentielle d 2 m − 2 + ω0 G(σ) = ~ δ(σ) (2.142) dσ et est périodique de période euclidienne PE = ~β = ~/kB T . Cette équation 2.142 n’est rien d’autre que l’équation quantique du mouvement 2.113 déjà discutée dans le cadre de la quantification canonique. Mais ici elle est dérivée directement de l’intégrale de chemin et des propriétés élémentaires des intégrales gaussiennes, sans utiliser le formalisme opératoriel et les relations de commutation entre Q et P (ou a et a† ). 2.142 permet d’obtenir la forme explicite des fonctions de corrélations. Pour simplifier, on normalise ~=1 ,
m=1
(2.143)
La solution de l’équation est le propagateur 1 G(σ) =
1 cosh(ω0 (σ − β/2)) 2ω0 sinh(ω0 β/2)
pour σ ∈ [0, β]
(2.144)
La fonction de Green (propagateur ou fonction de corrélation à deux points à temps réel) à température finie est obtenue simplement par rotation de Wick τ = it 1 ω0 β G(t) = hT [Q(t)Q(0)]iβ = coth cos(ω0 |t|) − i sin(ω0 |t|) 2ω0 2 (2.145) 1. Dans la littérature, le terme « propagateur » est utilisé à la fois pour les éléments de matrice de l’opérateur d’évolution (en mécanique quantique) et pour les fonctions à 2 points (en théorie des champs).
68
Théorie statistique des champs
Noter qu’elle dépend de |t| et est donc symétrique en t avec une singularité en t = 0, car il s’agit d’un produit ordonné en temps (T-produit). Prendre la limite de température nulle T → 0 i.e. β → ∞ permet d’obtenir la fonction de corrélation euclidienne G0 (σ) =
1 −ω0 |σ| e 2ω0
(2.146)
et la fonction de corrélation à temps réel G0 (t) = h0|T [Q(t)Q(0)]|0i =
2.7
1 (cos(ω0 |t|) − i sin(ω0 |t|)) 2ω0
(2.147)
Notes
L’intégrale de chemin a été proposée et formulée de façon précise par R. Feynman, [Bro05] et [Fey48]. Certains aspects avaient été anticipés par P. Dirac. L’ouvrage ancien de Feynman et Hibbs [FH65] et sa réédition [FH65] sont toujours utiles. La présentation donnée ici est standard. Le lecteur intéressé par les aspects mathématiques pourra consulter par exemple le livre de Albeverio, Høegh-Krohn et Mazzucchi [AHKM08] et la monographie de P. Cartier et C. DeWitt-Morette [CDM10]. La section 2.5.2 peut être vue comme une première introduction au formalisme de Schwinger-Keldish pour les sytèmes quantiques hors d’équilibre, voir par exemple le livre de Kamenev [Kam11].
Chapitre 3 Intégrale de chemin et physique statistique 3.1
Introduction
Les trajectoires ou histoires q(t) (ou (τ ) à temps euclidien) dans l’intégrale de chemin peuvent être considérées comme des variables aléatoires. À temps euclidien, l’intégrale de chemin correspond à définir une distribution de probabilité sur ces variables. Les fonctions de corrélations sont des valeurs moyennes relatives à cette loi. Il y a donc une relation mathématique étroite entre intégrales de chemin et théorie des probabilités, qui conduit à considérer l’intégrale de chemin comme un problème de mécanique statistique. Nous présentons ici les deux applications principales.
3.2
Intégrale de chemin et processus stochastique
L’intégrale de chemin euclidienne peut être considérée comme un processus stochastique, le temps euclidien τ correspondant à la variable temps réel du processus. Ce processus s’avère être un processus de base en probabilité (et en physique), le processsus brownien. L’étude des propriétés à temps court de ce processus permet de répondre à la question : quelles sont les trajectoires qui « dominent » dans l’intégrale de chemin ? Nous allons voir que ce sont des trajectoires q(τ ) qui sont continues mais qui ne sont pas différentiables. Les fluctuations de vitesse instantanée sont infinies. Pour cela considérons toujours la particule sur une ligne (D = 1).
70
3.2.1
Théorie statistique des champs
Intégrale de chemin euclidienne et processus brownien
La particule libre à temps euclidien comme processus stochastique Comme on l’a vu, on peut considérer que le potentiel V (q) est localement constant, donc nous revenons d’abord au cas de la particule libre V (q) = V0 = 0 L’intégrale de chemin euclidienne est alors une intégrale sur la variable q(τ ) (τ est le temps euclidien), avec une mesure dµ[q] positive définie simplement par R 1 ~ ˙ )]2 c= (3.1) dµ[q] = D[q] e− 2c dτ [q(τ m R la mesure D[q] étant normalisée de façon à ce que dµ[q] = 1. Autrement dit, dµ[q] est une mesure de probabilité pour la variable aléatoire q(τ ), qui définit un processus stochastique. Pour définir proprement ce processus stochastique, revenons à la discrétisation initiale du temps. Au lieu des qi = q(ti ), considérons comme variables dans l’intégrale de chemin les incréments successifs de position, que nous attachons aux intervalles de temps [ti , ti+1 ]. Pour simplifier nous attachons à cet intervalle l’étiquette demi-entière i + 21 , et nous notons l’incrément de position ωi+ 12 et l’intervalle de temps i+ 12 qi+1 = qi + ωi+ 12 ou avec ωi+ 12 = ω(ti+ 21 ) et ti+ 12 =
i+ 12 = ti+1 − ti
,
(3.2)
ti +ti+1 2
q(ti+1 ) = q(ti ) + ω(ti+ 12 )
(3.3)
Si la position initiale q0 reste fixée, mais qu’on relaxe la contrainte sur la position finale, la mesure sur les qi se réécrit comme une mesure sur les ωi Y Y dqi = dωi (3.4) i=1,2,···
i=1/2,3/2,···
et l’action discrétisée m (qi+1 − qi )2 = 2 ti+1 − ti i=0,1,··· X
X j= 12 , 32 ,···
m 2 ω 2 j j
(3.5)
Les ωj sont donc des variables aléatoires indépendantes distribuées suivant une loi normale standard (loi gaussienne) d’espérance nulle et de variance proportionnelle à l’intervalle de temps ωj = 0 ,
ωi ωj = δij
~ i m
(3.6)
3. Intégrale de chemin et physique statistique
71
On a évidemment i− 12
i− 12
q(ti ) = qi = q0 +
X
ωj
,
ti =
j= 12 , 32
X
j
(3.7)
j= 21 , 32
Limite à temps continu Dans la limite du temps continu, ces équations deviennent quelque chose de familier. Il suffit de changer les ωj en ωj p η(tj ) = ηj = m/~ (3.8) j et de prendre la limite du temps continu (les j → 0) pour réécrire 3.3 comme une équation différentielle stochastique r ~ dq(t) = σ η(t) , σ = (3.9) dt m La variable aléatoire η(t) est un bruit blanc η(t) = 0 ,
η(t)η(t0 ) = δ(t − t0 )
(3.10)
Mouvement brownien et processus de Wiener Ce processus stochastique est bien connu des mathématiciens et des physiciens. C’est le processus de Wiener, ou processus brownien Bt . On a donc Z t q(t) = σ Bt , Bt = η (3.11) Les valeurs moyennes des fonctionnelles de q, F [q] (en notation mathématique l’espérance E[F [q]] de F ) sont Z hF [q]i = dµ[q] F [q] (3.12) et sont assez facilement calculables, soit par des techniques d’intégrale fonctionnelles (la mesure dµ[q] étant gaussienne), soit de façon équivalente par des méthodes probabilistes de calcul stochastique (calcul d’Itô). Attention, la définition précise de la dérivée d’un processus stochastique et le calcul des valeurs moyennes d’intégrales temporelles de fonctions de q sont un peu délicats car la vitesse instantanée de q n’est pas bien définie (voir la section suivante). Ceci se traduit par l’apparition de termes nouveaux (dus aux fluctuations quantiques) dans certaines expressions. Ces problèmes sont connus et traités en physique quantique par les techniques de développement à temps court (et plus généralement de développement à courte distance) des produits d’opérateurs. En mathématique et en théorie des processus stochastiques, ils sont traités par le calcul d’Itô.
72
Théorie statistique des champs
Figure 3.1 – L’intégrale de chemin à temps euclidien comme processus stochastique.
3.2.2
Trajectoires moyennes et fluctuations
Non-dérivabilité des trajectoires typiques Calculons par exemple la valeur moyenne du carré de la vitesse moyenne de la particule mesurée sur un intervalle de temps [τ, τ 0 ]. On trouve (par exemple en remarquant que ∆q = q(τ 0 ) − q(τ ) est une variable aléatoire gaussienne avec une distribution donnée par l’opérateur d’évolution euclidien UE (q(τ ), q(τ 0 ); ∆τ ) ∼ exp(−c∆q 2 /2∆τ ) avec ∆τ = τ 0 − τ , de par la définition même de l’intégrale de chemin euclidienne) 2 h q(τ ) − q(τ 0 ) i = c |τ − τ 0 |
,
c=
~ m
(3.13)
Et de façon plus générale, les moments d’ordre supérieurs se comportent comme 2k h q(τ ) − q(τ 0 ) i ∝ ck |τ − τ 0 |k (3.14) Donc les trajectoires q(τ ) sont en probabilité des fonctions continues q(τ ) dont les accroissements sont bornés comme k
|q(τ ) − q(τ 0 )| < ck |τ − τ 0 |αk avec ici α=
1 2
quand τ − τ 0 → 0
(3.15)
(3.16)
3. Intégrale de chemin et physique statistique
73
De telles fonctions sont appelées des fonctions Hölder-continues avec un exposant α. Une fonction dérivable est évidemment Hölder α = 1 mais les trajectoires typiques dans l’intégrale de chemin Euclidienne sont Hölder α = 1/2, donc non dérivables. Les vitesses moyennes calculées pendant un intervalle ∆q sont bien définies et finies en moyenne, mais ces de temps ∆τ > 0, v = ∆τ moyennes divergent à temps court comme v=
∆q ∼ ∆τ −1/2 ∆τ
(3.17)
Trajectoire dominante et fluctuations Si on cherche à déterminer maintenant les trajectoires dominantes intervenant dans l’intégrale de chemin pour l’opérateur d’évolution entre les points q et q 0 pendant l’intervalle de temps [τ, τ 0 ], la trajectoire la plus probable celle R est qui minimise l’action euclidienne pour la particule libre SE [q] ∝ (q) ˙ 2 . C’est la trajectoire classique qcl à vitesse constante q˙cl (σ) = vcl =
q0 − q τ0 − τ
(3.18)
Mais les trajectoires typiques (qui dominent dans l’intégrale de chemin) sont des trajectoires non classiques proches de cette trajectoire classique, mais non dérivables (voir figure).
espace de configuration q'
q t
Figure 3.2 – Intégrale de chemin dans la limite continue : les trajectoires dominantes sont continues (et concentrées autour de la trajectoire classique dans la limite ~ → 0), mais ne sont pas dérivables.
74
Théorie statistique des champs
3.2.3
Cas général et processus de diffusion/absorbtion
Cas général V (q) 6= 0 : Dans le cas général d’un potentiel V 6= 0, la mesure d’intégration sur les chemins q(τ ) est maintenant 1
dµV [q] = dµ[q] e− ~
R
V (q)
(3.19)
C’est toujours une mesure de probabilité sur la variable aléatoire q(τ ), définie sur les processus de Wiener, mais qui ne correspond plus à un simple mouvement brownien. Cela dit, les propriétés à temps court de ces nouveaux processus ne sont pas changées. Comme on va le discuter plus tard à propos de la limite semi-classique, les trajectoires typiques sont des trajectoires Hölder 1/2 proches de la trajectoire classique qui extrémise l’action (ici l’action euclidienne SE [q]). Relation avec les processus de diffusion Le mouvement brownien est une description microscopique d’un processus de diffusion. Ceci peut se voir ici en remarquant que pour la particule libre, à temps euclidien (c’est-à-dire en transformant t → −iτ ), l’équation de Schrödinger pour la fonction d’onde ψ(q, t) devient ∂ 1 ψ(q, τ ) = ∆q ψ(q, τ ) (3.20) ∂τ 2m~ qui n’est rien d’autre que l’équation de la chaleur, c’est-à-dire l’équation de diffusion pour la densité de probabilité d’une particule classique dont l’évolution est donnée par le mouvement brownien ! Attention ! ici (la particule libre en temps euclidien) ψ joue le rôle d’une densité de probabilité ρ alors qu’en mécanique quantique à temps réels la fonction d’onde ψ est une amplitude de probabilité. Dans le cas général, l’équation de Schrödinger euclidienne ∂ 1 ψ(q, τ ) = ∆q ψ(q, τ ) + V (q) ψ(q, τ ) ∂τ 2m~
(3.21)
décrit un processus de diffusion avec un terme supplémentaire d’absorption/création de matière (suivant le signe de V (q)). De façon générale, les intégrales de chemin sont un outil important pour étudier les processus stochastiques et les processus de diffusion (formule de Feynman-Kac).
3.2.4
Intégrale de chemin à temps réel
À temps réel, la mesure sur les chemins q(t) est (formellement) i
dµ[q] = D[q] e ~ S[q]
(3.22)
Ce n’est plus une mesure de probabilité (réelle positive et normalisée) mais une mesure complexe, qui est en fait une distribution (au sens mathématique)
3. Intégrale de chemin et physique statistique
75
sur l’espace des chemins. Les facteurs de phase exp(iS/~) se compensent entre trajectoires voisines q(t) et q(t) + δq(t), sauf pour des trajectoires « voisines » d’une trajectoire classique qui extrémise l’action S[q] (voir plus loin la discussion de la limite semi-classique). Néanmoins là aussi, par le même type de calcul que dans le cas euclidien, les trajectoires dominantes ne sont pas dérivables, mais sont de type Hölder-1/2. Nous ne discuterons pas à ce stade le nombre et la structure des trajectoires qui dominent l’intégrale de chemin. Nous allons voir plus loin que ce caractère discontinu des fluctuations de vitesses dans l’intégrale de chemin est une caractéristique quantique très importante, puisque c’est par là qu’apparaît la non-commutativité des opérateurs P et Q dans l’intégrale de chemin.
3.3
Mécanique quantique euclidienne et physique statistique 1D
3.3.1
L’intégrale de chemin comme fonction de partition d’une chaîne d’oscillateurs classiques
Correspondance quantique/statistique 1D Revenons à l’intégrale de chemin euclidienne qui permet de définir la fonction de partition Zq d’un système quantique à l’équilibre à température finie (état de Gibbs). Partant du système unidimensionnel d’une particule dans un potentiel, cette intégrale de chemin est (l’indice q est pour « quantique ») Z Zq =
1 SE [q(τ )] −~
D[q(τ )] e
Z SE [q(τ )] =
m dτ 2
dq dτ
2 + V (q(τ )) (3.23)
Si on discrétise le temps euclidien, l’action euclidienne discrétisée est X m (qi+1 − qi )2 + ∆τ V (qi ) , qi = q(τi ) , τi = i∆τ SE [q] → 2 ∆τ i∈Z (3.24) où ∆τ est le pas de temps, on peut réécrire cette intégrale de chemin comme la fonction de partition d’une chaîne unidimensionnelle d’oscillateurs classiques si = q(τi ) ∈ R. Considérons donc les qi comme des spins classiques continus si = q(τi ) ∈ R avec une distribution de probabilité locale pour les spins continus si de la forme Y 1 m 2 dµ({s}) = dsi exp − e(si ) e(s) = s + ∆τ V (s) (3.25) ~ ∆τ i
76
Théorie statistique des champs
et avec un couplage ferromagnétique entre plus proches voisins , |i − j| = 1, correspondant à une énergie de couplage E pour la configuration microscopique de spin {si } E[{si }] = −J
X
si si+1
,
J=
i
m ∆τ
(3.26)
Cette énergie de configuration E[{si } est la même que celle du modèle d’Ising unidimensionnel, mais ici les spins sont continus, alors que pour le modèle d’Ising s = ±1. La fonction de partition du système quantique Zq est aussi la fonction de partition Zstat de cette chaîne de spin classique Z Z Y 1 1 Zq = Zstat = dµ[{si }] e− ~ E[{si }] = dsi e− ~ Hstat [{si }] (3.27) i
Fluctuations quantiques comme fluctuations thermiques classiques Dans cette reformulation, ~ joue le rôle d’une température Tstat qui pour ce système statistique classique (la chaîne de spin) n’est pas la température du système quantique (kB étant la constante de Boltzmann) kB Tstat = ~
(3.28)
Attention ! Cette température Tstat ∝ ~ n’est pas la température Tq du système quantique initial. Cette analogie température système classique Tstat
←→
constante de Planck ~ (3.29)
est mathématiquement naturelle. ~ contrôle l’amplitude des fluctuations quantiques du système quantique initial, tandis que Tstat contrôle l’amplitude des fluctuations thermiques du système statistique équivalent. Action euclidienne comme énergie des micro-états Normalisons la température pour que kB = 1. La fonction de partition s’écrit donc Z Y 1 (3.30) Zq = Zstat = dsi e− Tstat Hstat [{si }] i
avec l’énergie totale Hstat [{s}] d’une configuration microscopique de la chaîne de spin (micro-état) Hstat [{s}] =
X i
e(si ) + EIsing [{s}] =
X m (Si+1 − Si )2 + ∆τ V (Si ) 2∆τ i (3.31)
3. Intégrale de chemin et physique statistique
77
Cette énergie totale Hstat [{s}] pour une configuration {si } de la chaîne de spin n’est rien d’autre que l’action euclidienne (discrétisée) SE [q] de la trajectoire euclidienne correspondante {q(τi )} pour le système quantique de départ. si = q(τi ) ,
Hstat [{s}] = SE [q]
(3.32)
Exemple de l’oscillateur harmonique Dans le cas de l’oscillateur harmonique, où l’action euclidienne est Z m 2 SE [q] = dτ q˙ + ω 2 q 2 (3.33) 2 le système statistique équivalent est une chaîne d’oscillateurs couplés linéairement (chaîne harmonique). L’énergie Hstat [{s}] est X κ1 κ2 s2i + (si+1 − si )2 (3.34) Hstat [{s}] = 2 2 i avec les constantes κ1 = mω 2 ∆τ
,
κ2 =
m ∆τ
(3.35)
Exemple de l’oscillateur anharmonique Si le potentiel V (q) pour le système quantique initial est un potentiel quartique V (q) = a q 2 + b q 4 , b>0 le système statistique équivalent est une chaîne d’oscillateurs anharmoniques, toujours couplés linéairement. Ce système est intéressant car dans le cas où le terme harmonique est négatif a 1 Cette analogie s’étend sans difficulté à des systèmes quantiques plus généraux. Le cas le plus simple correspond à une particule quantique non relativiste en dimension d > 1. Dans ce cas la position de la particule ~q est un vecteur à d composante. Le paramètre d’ordre local du système statistique correspondant ~ à d composantes devient un spin vectoriel S ~i ~q(τi ) ↔ S
(3.39)
La chaîne de spin reste un système unidimensionnel, car c’est le temps euclidien τ = it du système quantique qui devient la coordonnée d’espace du ~ qui acquiert système statistique. C’est l’espace du paramètre d’ordre local S plus de dimensions. On a toujours une équivalence entre ces deux types de problèmes, et on peut considérer que via l’intégrale de chemin euclidienne un système quantique (non relativiste) est toujours équivalent à la limite continue d’un système statistique en 1 dimension. C’est seulement en considérant des théories quantiques relativistes (des théories quantiques des champs) que l’on pourra étendre ces méthodes à l’étude de systèmes statistiques étendus en dimensions D > 1. Revenant au cas des systèmes quantiques non relativistes et des systèmes statistiques unidimensionnels, nous allons voir maintenant que cette équivalence s’étend aux fonctions de corrélations. En particulier il existe une relation entre les longueurs de corrélation du système statistique et le spectre du système quantique correspondant.
3.3.2
Longueur de corrélation et énergie d’excitation (energy gap)
On considère toujours ce système quantique de hamiltonien H, mais à température finie Tq . Le système de spin 1d correspondant est caractérisé par Hstat [{s}] ≡ SE [q] et sa température Tstat . Pour simplifier les notations, nous normalisons de façon à ce que dans la suite ~ = 1 , kB = 1
=⇒
Tq = 1/β , Tstat = 1
Fonction de corrélation : Considérons pour le système quantique la fonction de corrélation euclidienne de deux opérateurs A et B aux temps euclidiens τ1 < τ2 . On note le temps entre les deux opérateurs τ0 τ0 = τ2 − τ1 > 0
(3.40)
La fonction de corrélation est hB(τ2 )A(τ1 )iβ
tr e−(β−τ0 )H Be−τ0 H A = tr (e−βH )
80
Théorie statistique des champs
Supposons (pour simplifier) que H a un spectre discret E0 < E1 < E2 < · · · et notons les états propres |ni, n = 0, 1, 2 · · · Alors on peut diagonaliser H et on obtient P −(β−τ0 )En −τ0 Em n,m hn|A|mihm|B|nie P −βE (3.41) hB(τ2 )A(τ1 )iβ = n ne Limite de température nulle : Dans la limite de température nulle Tq → 0, i.e. β → ∞, on projette sur le fondamental n = 0. hB(τ2 )A(τ1 )i0 =
X
h0|A|mihm|B|0ie−τ0 (Em −E0 )
(3.42)
m
Dans cette limite, on a évidemment hA(τ1 )iT =0 = h0|A|0i, idem pour B. Fonction de corrélation connexe : La fonction de corrélation connexe est définie comme hB(τ2 )A(τ1 )iconn. = hB(τ2 )A(τ1 )i − hB(τ2 )ihA(τ1 )i 0
(3.43)
Elle correspond à la notion de cumulant (d’ordre 2) en statistique, qui décrit les corrélations (d’ordre 2) entre les fluctuations autour des valeurs moyennes ¯ ¯ hABiconn. = h(A − A)(B − B)i ,
A¯ = hAi ,
¯ = hBi B
(3.44)
On soustrait donc la contribution du fondamental |0i et on obtient une somme sur les états excités X hB(τ2 )A(τ1 )iconn. = h0|A|mihm|B|0ie−τ0 (Em −E0 ) (3.45) 0 m6=0
Comportement à grand temps : Le comportement à grand temps euclidien τ0 est dominé par le premier état excité n = 1 (sauf si les éléments de matrices h0|A|mi ou h0|B|mi s’annulent) hB(τ2 )A(τ1 )iconn. ∝ e−τ0 (E1 −E0 ) 0
(3.46)
avec ∆E = E1 − E0
le gap en énergie du système
(3.47)
Donc les fonctions de corrélations des opérateurs décroissent exponentiellement à grand temps euclidien, avec un temps de corrélation qui est l’inverse du gap en énergie τcorr = 1/∆E (rappel : on a normalisé ~ = 1).
3. Intégrale de chemin et physique statistique
81
Longueur de corrélation du système statistique : Passons au système statistique correspondant, une chaîne de spins classiques si . La fonction de corrélation connexe hQ(τ2 )Q(τ1 )iconn. est égale à la fonction de corrélation de 0 deux spins hsi sj iconn. du système statistique avec la distance |i − j| = τ0 /∆τ (∆τ est le pas de discrétisation en temps). Elle décroît donc exponentiellement, avec une longueur de corrélation ξcorr reliée au gap en énergie du système quantique ∆E, par hsi sj iconn. ∝ e−|i−j|/ξcorr.
3.3.3
,
ξcorr. =
∆τ ∆E
(3.48)
Dictionnaire : mécanique statistique 1D – mécanique quantique
En résumé, on a le dictionnaire général entre un système statistique en une dimension (type chaîne de spin classique) à température Tstat et un système quantique en temps euclidien (donc à température finie Tq ), ici toujours avec la normalisation kB = 1. Certaines des notions seront définies dans la partie physique statistique de l’ouvrage.
Système statistique 1 d
Système quantique
coordonnée d’espace
x
τ = it
temps euclidien
maille élémentaire
∆x
∆τ
discrétisation de τ
paramètre d’ordre local
s(x)
q(τ )
position (degré de liberté)
micro-état
s = {s(x)}
q = {q(τ )}
trajectoire euclidienne
température
Tstat
~
constante de Planck
taille du système
L
β = 1/Tq
inverse de la température
énergie d’un micro-état
Hstat [{s}]
SE [q]
action euclidienne
matrice de transfert
T
UE (∆τ )
opérateur d’évolution euclidien
longueur de corrélation
ξ
1 E1 −E0
inverse du gap en énergie
Et on peut construire en général un système quantique (non relativiste) en temps euclidien comme limite continue d’un système statistique 1D. Ceci se généralise en plus de 1 dimension. Une théorie des champs (euclidienne) en D-dimensions peut être obtenue comme limite continue d’un système statistique sur un réseau en D-dimensions.
82
3.3.4
Théorie statistique des champs
Exercices
Exercice 3.1. Oscillateur anharmonique Considérons le cas du potentiel quartique V (q) = a q 2 + b q 4
,
b>0
Montrer que le système statistique équivalent est une chaîne d’oscillateurs anharmoniques, toujours couplés linéairement. Que se passe-t-il si le terme harmonique est négatif a 0, c > ? r a qmin = ±q0 = 2b Que pouvez-vous dire sur la distribution locale p(si ) des spins ? Pouvez-vous construire une limite dans laquelle le système devient équivalent à une chaîne de spins d’Ising si = ±1 ? Exercice 3.2. Deux oscillateurs couplés Partant de deux oscillateurs harmoniques quantiques couplés, de hamiltonien quantique H=
1 1 m1 ω12 2 m2 ω12 2 Q1 + Q2 + g Q1 Q2 P12 + P22 + 2m1 2 2m2 2
(3.49)
montrer que le système statistique classique correspondant consiste en deux chaînes de spins couplées. Exercice 3.3. Systèmes quantiques en dimension d > 1 En partant de systèmes quantiques en dimension d > 1, par exemple un oscillateur harmonique en dimension d = 2 ou d = 3 (voir la section 8.11), pouvezvous trouver le système statistique classique unidimensionnel correspondant ? Expliquer pourquoi le système statistique reste unidimensionnel.
3.4
Notes
Cette section est standard et s’inspire des ouvrages classique [ID91], [Par98], [ZJ02]. Les relations entre intégrales de chemin et processus stochastiques sont un domaine classique des mathématiques, initié entre autres par M. Kac (la relation entre processus stochastiques et équations de diffusions est souvent appelée dans la littérature formule de Feynman-Kac, voir [KBD79].
Chapitre 4 L’intégrale de chemin : présentation générale 4.1
Introduction
L’intégrale de chemin a été présentée en détail dans le chapitre 2 pour un système simple à un seul degré de liberté classique : la particule en une dimension. Dans ce chapitre nous discutons la quantification de systèmes plus généraux, mais gardant un nombre fini de degrés de liberté classiques. Le principe de la quantification par l’intégrale de chemin reste le même. Nous discutons ensuite quelques aspects plus avancés de la quantification par intégrale de chemin.
4.2 4.2.1
Systèmes à plusieurs degrés de liberté Une particule en dimension D > 1
Pour une particule classique de masse m en D dimension dans un potentiel externe V (~q), la position de la particule est donnée par le vecteur ~q(t) ∈ RD . L’action classique est Z S[~q] =
t
ds 0
m 2
(~q˙(s))2 − V (~q(s))
(4.1)
On répète facilement les étapes conduisant à représenter l’opérateur d’évolution comme une intégrale de chemin sur toutes les trajectoires possibles ~q(s) allant de la position initiale ~qi à la position finale ~qf (d’abord en discrétisant en temps si = i∆t, puis en prenant la limite continue ∆t → 0) Z U (~qf , ~qi ; t) =
q ~(0)=~ qi q ~(t)=~ qf
i
D[~q(s)] e ~ S[~q]
(4.2)
84
Théorie statistique des champs
La mesure dans l’intégrale de chemin est maintenant D[~q(s)] =
N −1 Y
dD ~q(si )
i=1
2iπ ~ ∆t m
−DN/2 (4.3)
Tous les résultats du chapitre précédent vont se généraliser sans peine.
4.2.2
N particules en interaction
Ceci se généralise sans peine au cas de N particules discernables en D dimensions, et en interaction. Les particules sont étiquetées par a = 1, · · · N , elles peuvent être de masses ma différentes, et leurs interactions sont décrites par des potentiels à un corps Ua (~q), par des potentiels d’interaction à deux corps, Vab (~qa − ~qb ), etc. Une configuration instantanée du système est notée {~q(t)} = {~qa (t)}a=1,N . La forme générale de l’action classique pour un tel système est ! Z t X ma X X 2 ˙ S[{~q}] = ds (~qa (s)) − Ua (~qa (s)) − Vab (~qa , ~qb ) − · · · 2 0 a a a 0. Les états à n > 1 fermions sont exclus par le
5. Systèmes à N -corps : bosons, fermions, spin
145
principe d’exclusion de Fermi. L’espace de Hilbert des états (espace de Fock) est donc H = C2 . Les opérateurs de création a† et d’annihilation a sont définis par a|0i = 0 ,
a|1i = |0i ,
a† |0i = |1i ,
a† |1i = 0
(5.144)
Ils sont hermitiques conjugués et satisfont les relations d’anticommutation a2 = (a† )2 = 0 ,
{a, a† } = aa† + a† a = 1
(5.145)
{ · , · } = [ · , · ]+ est l’anticommutateur. L’opérateur nombre de fermions F et le hamiltonien H sont F = a† a ,
H = E0 a† a
(5.146)
Pour définir une intégrale de chemin pour le fermion comme pour le boson, il faut définir des chemins dans un espace avec une coordonnée analytique α, puis faire correspondre à cette coordonnée α et à sa conjuguée α ¯ les opérateurs d’annihilation et de création chemin : t → α(t)
;
observables : a(t) → α(t) ,
a† (t) → α ¯ (t)
Pour les fermions les opérateurs a et a† satisfont des relations d’anticommutation, pas de commutation. Une intégrale de chemin ne pourra donc pas faire intervenir des « nombres ordinaires ». La solution est de considérer les « coordonnées » α et α ¯ comme étant des objets anti-commutants, qui sont des générateurs d’une algèbre non-commutative, l’algèbre de Grassmann.
5.3.2
Algèbres de Grassmann
Algèbre complexe à une variable Définition : Nous considérons ici l’algèbre de Grassmann 2 G, qui est l’algèbre associative unitale sur C engendrée par les deux « variables » anticommutantes α et α ¯ (appelées souvent « nombres de Grassmann ») qui satisfont les règles de multiplication α2 = α ¯2 = 0 ;
{α, α ¯ } = (αα ¯+α ¯ α) = 0
(5.147)
Un élément général g de G s’écrit donc, dans la base (1, α, α ¯, α ¯ α) de G considéré comme espace vectoriel (de dimension 4) sur C g = a0 + a1 α + a2 α ¯ + a3 α ¯α ,
ai ∈ C .
(5.148)
Les coefficients ai sont des nombres « ordinaires » ai ∈ C qui commutent avec α et α ¯ . Cette algèbre G est associative (g1 g2 )g3 = g1 (g2 g3 ), mais non commutative. 2. Cette algèbre est parfois appelée algèbre extérieure, car à ce stade l’algèbre est la même que celle des produits extérieurs des formes différentielles. Cette similarité s’arrête là. Les dérivées par rapport aux générateurs n’ont rien à voir avec les dérivées extérieures de formes différentielles.
146
Théorie statistique des champs
Conjugaison : G est muni d’une involution ∗ , généralisant la conjugaison complexe. Elle est telle que α∗ = α ¯, α ¯ ∗ = α, et (αα ¯ )∗ = αα ¯ . Donc g ∗ = ∗ ∗ ∗ a ¯0 + a ¯2 α + a ¯1 α ¯+a ¯3 α ¯ α et plus généralement (g1 g2 ) = g2 g1 . ∗ est l’analogue pour G de la conjugaison hermitienne † pour les matrices complexes. L’algèbre G peut être considérée naïvement comme l’algèbre des fonctions g = g(α, α ¯ ) des deux variables anticommutantes α et α ¯ . Mais G ne peut pas être représentée comme une algèbre de matrices. Les mathématiciens diront que ce n’est pas une C∗ -algèbre, elle ne peut pas être considérée comme une algèbre d’observables sur un espace non-commutatif « quantique ». L’analogie avec un espace de fonctions conduit à définir des opérations de différentiation et d’intégration par rapport aux variables de Grassmann sur G. Différentiation : On choisit les règles habituelles ∂ ∂ ∂ ∂ ∂ ∂ 1= 1 = 0, α= α ¯=1, α ¯= α=0 (5.149) ∂α ∂α ¯ ∂α ∂α ¯ ∂α ∂α ¯ Mais attention, comme les α et α ¯ anticommutent, les dérivées aussi. On impose donc 2 2 ∂ ∂ ∂ ∂ ∂ ∂ = = + =0 (5.150) ∂α ∂α ¯ ∂α ∂ α ¯ ∂α ¯ ∂α ce qui implique que ∂ ∂ α ¯ α = −¯ α, α ¯α = α (5.151) ∂α ∂α ¯ Intégration : L’intégration sur les variables de Grassmann est définie de façon à respecter les règles d’intégration par parties Z ∂ dα g=0 ∂α On peut dire que « l’espace des variables de Grassmann n’a pas de bord », ou que l’intégrale de Grassmann est invariante sous un changement de variable α → α + θ, θ étant une variable de Grassmann auxiliaire. L’intégration est définie par Z Z Z dα α = 1 , dα 1 = dα α ¯=0 Z Z Z d¯ αα ¯=1 , d¯ α 1 = d¯ αα = 0 (5.152) Pour un élément général g = a0 + a1 α + a2 α ¯ + a3 αα ¯ ; on a donc Z Z Z dα g = a1 − a3 α ¯, d¯ α g = a2 + a3 α , d¯ αdα g = −a3 On note que pour les variables de Grassmann intégration = différentiation ! Z ∂ dα ≡ ∂α
5. Systèmes à N -corps : bosons, fermions, spin
147
Intégrale gaussienne : L’exponentielle est définie dans les algèbres de Grassmann G par la série entière X exp(g) = g n /n! n
qui ne contient qu’un nombre fini de termes à cause de l’anticommutation. Dans notre cas l’intégrale gaussienne de la fonction exp(−¯ αAα) = 1 − A¯ αα est simplement Z ¯ d¯ α dα e−αAα = A
(5.153)
Les algèbres de Grassmann de dimension finie sont définies en étendant cette construction à un nombre fini de générateurs anticommutants. Algèbre de Grassmann réelle à N variables (N )
L’algèbre de Grassmann réelle G = GR est engendrée par N variables anticommutantes {αi ; i = 1, N } telles que {αi , αj } = 0 ∀ i, j. G est une algèbre de dimension 2N Rsur R. Les règles d’intégration et de dérivation sont R les mêmes : dαi 1 = 0, dαi αi = 1, etc. Une forme quadratique αi Aij αj n’a de sens que pour Aij = −Aji , donc pour des matrices antisymétriques. L’intégrale gaussienne donne Z p (5.154) dα e−αi Aij αj /2 = Pfaff[A] = det[A] Le pfaffien d’une matrice antisymétrique A est défini comme la racine carrée de son déterminant, et n’est non nul que si N = dim(A) est pair. Algèbre de Grassmann complexe à N variables En fait, la plupart du temps, on aura à considérer l’algèbre graduée com(N ) plexe A = GC engendrée par 2N éléments anticommutants αi , α ¯ i , i = 1, N avec une conjugaison ∗ (involution) qui étend la conjugaison complexe (c ∈ C, c∗ = c¯) telle que αi∗ = α ¯ i , (g1 g2 )∗ = g2∗ g1∗ . Les monômes pairs de α commutent, les monômes impairs Ranticommutent R entre eux. Intégration et dérivation généralisent le cas réel dαi 1 = 0, dαi αi = 1, ainsi que pour les α ¯i. On définit l’intégration sur les 2N variables de Grassmann comme Z Z Z Z Z Z d[¯ α, α] = d¯ α dα = d¯ α1 dα1 · · · d¯ αN dαN (5.155) R Notez que g est un scalaire (pur nombre complexe) si on intègre sur tous les générateurs de A. La mesure ainsi définie d¯ αdα est invariante sous les transformations unitaires X α → U · α c’est-à-dire αi → Uij αj , U = (Uij ) ∈ SU (N ) (5.156) j
148
Théorie statistique des champs
Intégrale gaussienne : A = [Aij ] étant une matrice hermitienne, N × N , la formule fondamentale pour l’intégrale gaussienne sur des variables de Grassmann est Z d[¯ α, α] e−α¯ i Aij αi = det[A] (5.157) Démonstration : le plus simple est de développer l’exponentielle (seuls les N premiers termes sont non nuls) et de vérifier que l’intégrale sélectionne les produits de N coefficients de A qui contribuent au déterminant, les relations d’anti-commutation donnant les signatures des permutations. Théorème de Wick : Enfin les valeurs moyennes de produit de variables grassmanniennes ¯ R d[¯ α, α] α ¯ a1 · · · α ¯ ap αb1 · · · αbp e−αAα R (5.158) h¯ αa1 · · · α ¯ ap αb1 · · · αbp i = ¯ d[¯ α, α] e−αAα sont données par un théorème de Wick fermionique h¯ αa1 · · · α ¯ ap αb1 · · · αbp i =
X
(−1)σ
appariements α ¯ a αb
Y
h¯ αa αb i
(5.159)
paires
Les facteurs de signe (−1)σ viennent des règles d’anticommutation quand on réorganise les variables de Grassmann en produit de paires αα ¯ ordonnées. C’est la signature de la permutation α ¯α ¯ · · · αα · · · → α ¯ αα ¯ α · · · . Exemples : 1 hαi α ¯j i = (5.160) A ij hαi αj α ¯k α ¯l i =
5.3.3
1 1 1 1 − A il A jk A ik A jl
(5.161)
États cohérents fermioniques
Définition : Ces règles algébriques de calcul sur G permettent de représenter l’espace de Fock d’un fermion à l’aide d’états cohérents et de variables de Grassmann, comme pour les bosons. Partant du fermion à un seul état, un état cohérent |αi est défini comme † 1 1 ¯ |αi = e− 2 αα+αa |0i = 1 − α ¯ α |0i + α|1i (5.162) 2 α est un générateur de G, donc |alphai est un élément de l’espace vectoriel H ⊗ G, le produit de G par l’espace de Fock H = C2 . On peut formellement le considérer comme une fonction de α et de α ¯ à valeur dans H.
5. Systèmes à N -corps : bosons, fermions, spin
149
Avec les règles de conjugaison, le dual (le « bra ») de cet état (le ket) est 1 − 12 αα+ ¯ αa ¯ hα| = h0| e = 1− α ¯ α h0| + α ¯ h1| (5.163) 2 et on a bien hα|αi = 1. Les règles de calcul sur les nombres de Grassmann permettent de travailler sur l’espace de Fock du fermion de la même façon que pour le boson. Décomposition de l’identité : On vérifie que (décomposition de l’unité) Z 1 = d¯ α dα |αi hα| = |0ih0| + |1ih1| (5.164) Opérateurs et principe de correspondance : De façon générale un opérateur peut s’écrire comme un produit 3 de a et de a† , et se représenter comme Z p † q a a = d¯ α dα |αi αp α ¯ q hα| (5.165) Ceci n’est évidemment non nul que si p, q = 0 ou 1. Attention ici à l’ordre des α’s et à la façon dont ils sont insérés entre les bras et les kets (anticommutation) ! Trace d’un opérateur et fermions « antipériodique » : Attention, la formule pour la trace d’un opérateur sur H est par contre modifiée par rapport au cas bosonique. On a Z tr[U] = d¯ α dα hα|U| − αi = h0|U|0i + h1|U|1i (5.166) ¯ α |0i−α|1i. Ceci correspond à une intégrale où d’après 5.162 |−αi = 1 − 21 α sur les variables fermioniques (α, α ¯ ) avec une condition d’antipériodicité en α. Opérateur (−1)F et fermions périodiques : Calculer une intégrale de chemin avec des conditions aux limites périodiques donne la trace de l’opérateur multiplié par l’opérateur (−1)F Z d¯ α dα hα|U|αi = h0|U|0i − h1|U|1i = tr[(−1)F U] (5.167) où F est le nombre fermionique de l’état F|0i = 0, F|1i = |1i. Ce résultat se généralise aux intégrales de chemins pour des fermions à plusieurs états considérés plus loin. Cet opérateur (−1)F joue un rôle très important dans l’étude des anomalies et des théories quantiques topologiques. 3. C’est un produit anti-normal, les a† sont à droite des a.
150
Théorie statistique des champs
Enfin une formule utile est la définition de la « fonction de Dirac » pour les variables de Grassmann Z ¯ ¯ = F (α, α δ(α, β) = (α − β)(¯ α − β) car dβ¯ dβ δ(α, β) F (β, β) ¯ ) (5.168)
5.3.4
Intégrale de chemin fermionique
Opérateur d’évolution Avec le hamiltonien 5.146 et la définition 5.162 des états cohérents |αi, l’opérateur d’évolution correspond à une « rotation » de la base de l’algèbre t (α, α ¯ ) → (α(t), α(t)) avec α(t) = e i~ E0 α. Son action et ses éléments de matrice dans la base des états cohérents sont simplement U (t)|αi = |α(t)i ,
1
¯
t E 0 αβ ¯
¯ ββ)+e i~ hα|U (t)|βi = e− 2 (αα+
(5.169)
Intégrale de chemin On peut donc écrire l’opérateur d’évolution en découpant l’intervalle de temps [0, t] en N petits intervalles [ti , ti+1 ] de durée = t/N , donc ti = i, et en attachant des variables de Grassmann αi et α ¯ i à chaque ti . On obtient une intégrale de chemin grassmannienne α(ti ) = αi , α ¯ (ti ) = α ¯i Z i ¯ hα|U (t)|βi = D[¯ α(s)] D[α(s)] e ~ S[α(s),α(s)] (5.170) α(0)=β,α(t)=α
avec l’action fermionique S S[α(t), α ¯ (t)] N X ~ ~ = [(¯ αi − α ¯ i−1 )αi−1 − α ¯ i (αi − αi−1 )] + e i~ E0 − 1 α ¯ i αi−1 2i i i=1 Z t ~ = ds (α ¯˙ (s+ )α(s− ) − α ¯ (s+ )α(s ˙ − )) − E0 α ¯ (s+ )α(s− ) + · · · 2i 0 (5.171) On a fait attention ici à bien ordonner en temps les produits de α ¯ et α, c’est important car ils anticommutent. La mesure est Y D[¯ α(s)] D[α(s)] = d¯ αi dαi (5.172) i
Fonction de partition Pour la fonction de partition à température finie Te , il faut faire la rotation de Wick. On obtient une intégrale de chemin euclidienne sur les chemins α(σ),
5. Systèmes à N -corps : bosons, fermions, spin
151
σ ∈ [0, T ], avec la période T = ~β = ~/kB Te , mais avec des conditions aux limites antipériodiques α(0) = −α(T ) (à cause de 5.166) Z 1 ¯ Z[β] = tr e−βH = D[¯ α]D[α] e− ~ SE [α,α] (5.173) α(0)=−α(T )
avec l’action euclidienne obtenue par rotation de Wick s → −iσ Z T ~ dσ (−α ¯˙ α + α ¯ α) ˙ + E0 α ¯α SE [α(σ), α ¯ (σ)] = 2 0 On peut donc l’écrire comme un déterminant d E0 Z[β] = det + dτ ~ AP
(5.174)
(5.175)
d où le suffixe AP indique que l’opérateur différentiel D = dτ + E~0 est le même que pour le boson, mais il agit sur l’espace des fonctions antipériodiques sur l’intervalle [0, T ], D : ψ → ψ˙ − E0 /~ ψ avec ψ(τ + T ) = −ψ(τ ). On peut maintenant calculer ce déterminant par la même méthode que pour le boson. d log(Z(β)) = −βh¯ α(0+ )α(0)iβ (5.176) dE0 où maintenant α et α ¯ sont des variables fermioniques, donc anticommutantes.
h¯ α(0+ )α(0)iβ = −hα(0)¯ α(0+ )iβ = −G(0− ) =
e−βE0 1 + e−βE0
(5.177)
G est maintenant le propagateur pour le fermion. En intégrant on retrouve bien la distribution de Fermi-Dirac, comme il se doit Z(β) = 1 + e−βE0
5.3.5
(5.178)
Fermions à N états, espace de Fock
Ce formalisme devient intéressant pour un système avec N états à une particule (ou modes propres), que j’étiquette par a ∈ {1, · · · , N }, chacun d’énergie Ea . Une base de l’espace de Fock H est fournie par les états |{na }i = |n1 , · · · , nN i, où les na = 0 ou 1 sont les nombres d’occupation de l’état a d’énergie Ea . On définit les opérateurs de création a†a et d’annihilation aa par ( 0 si na = 0, P (5.179) aa | · · · , na , · · · i = nb (−1)b D/2. Il s’avère qu’elle se prolonge en une fonction méromorphe
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
273
dans C, avec des pôles en s = D/2 − n, n entier ≥ 0, donc en particulier en s = 0 pour les dimensions D paires ! Ces pôles sont d’origine UV. Considérer s 6= 0 régularise la théorie à une boucle, comme D 6= 4 en régularisation dimensionnelle. Étendre cette régularisation au-delà d’une boucle n’est pas trivial. On notera qu’il serait alors nécessaire de régulariser le propagateur (−∆ + V 00 (ϕ))−1 , ce qui peut se faire par un régulateur analytique similaire 1 −∆ + V 00 (ϕ)
1 (−∆ + V 00 (ϕ))1+s
−→
(8.22)
Nous n’allons pas discuter davantage cette procédure. L’étude rigoureuse de la structure de la fonction ζ(s) requiert entre autres l’étude du noyau de la chaleur dans un champ de fond. Mais la régularisation par fonction ζ est importante pour l’étude générale des anomalies dans les théories de jauge, la gravitation et les théories des cordes.
8.2.5
Exercices
Exercice 8.1. Régularisation par « smearing » dans l’espace réel On modifie la théorie φ4 définie dans l’espace des positions continu RD (donc non discrétisé), mais en changeant le terme d’interaction pour qu’il devienne non local. Pour cela, on introduit une fonction C∞ (de préférence positive et régulière) à support compact de taille typique a et d’intégrale 1, par exemple une gaussienne χa (x) ∝ exp(−x2 /(2a2 )), et on définit le champ régularisé par smearing comme Z φa (x) =
dD y χa (x − y)φ(y)
(8.23)
et le terme d’interaction comme reg. Sint. [φ]
g = 4!
Z
dD x φa (x)4
(8.24)
L’action libre, donc le propagateur, restant inchangée. Montrer que cette régularisation rend fini UV les amplitudes des diagrammes à une boucle discutés précédemment. Quelles sont les propriétés d’invariance de la théorie que vous pouvez respecter et lesquelles seront violées par une telle procédure ? Exercice 8.2. Régularisation de Pauli-Villars et modification de l’action du champ libre Montrer que la régularisation de Pauli-Villars, modification du propagateur dans la représentation d’impulsion par des termes donnés par 1 1 → 2 k 2 + m2 k + m2
Λ2 2 k + Λ2
P (8.25)
274
Théorie statistique des champs
correspond à modifier la partie libre de l’action S0 [φ] → S0reg. [φ] en rajoutant au terme (∂µ φ)2 des termes quadratiques en φ, mais faisant intervenir des dérivées d’ordres supérieurs, par exemple (∆φ)2 . Pouvez-vous écrire explicitement cette action régularisée ? Exercice 8.3. Volume de la sphère en dimension D Montrer que le volume de la sphère unité SD−1 dans RD (c’est une variété de dimension D − 1) est donné par VD = Vol(SD−1 ) =
2 π D/2 Γ(D/2)
(8.26)
et que l’on peut donc prolonger analytiquement cette formule pour D ∈ C. Pour obtenir ce résultat, on peut calculer l’intégrale gaussienne R D d ~x exp(−~x2 ), d’abord directement, puis en séparant les D − 1 variables angulaires et la variable radiale x = |~x|. Vérifiez que l’on retrouve les résultats connus pour D ∈ N entier positif. Que remarquez-vous pour des dimensions négatives ? Exercice 8.4. Régularisation dimensionnelle dans l’espace des impulsions Utiliser 8.26 pour calculer directement 8.11 et 8.13 (plus difficile) par des intégrales dans l’espace des impulsions en dimension D non entière. Exercice 8.5. Régularisation dimensionnelle pour la théorie massive En utilisant les formules pour les intégrales elliptiques, pouvez-vous donner une formule explicite faisant intervenir la fonction hypergéométrique 2 F1 pour l’amplitude massive du graphe à une boucle de 8.12 en dimension D non entière ? La formule utile est Z 1 Γ(c) xb−1 (1 − c)c−b−1 (1 − zx)−a dx (8.27) 2 F1 (a, b, c; z) = Γ(b)Γ(c − b) 0
8.3 8.3.1
Les divergences UV en D = 4 Présentation du problème
Nous analysons maintenant les divergences UV de la théorie φ4 . Nous nous limitons au cas des amplitudes à l’ordre d’une boucle, qui est simple et suffit pour comprendre le principe de base. Le cas général sera abordé plus loin. Nous allons d’abord discuter la théorie φ4 en dimension D = 4. C’est le cas le plus important en théorie quantique des champs (notre espace-temps est de dimension 1+3 et les théories fondamentales sont les théories de jauge, qui sont précisément renormalisables en dimension 4). Pour la physique statistique et les phénomènes critiques, D = 4 est précisément (généralement) le cas limite (la dimension critique supérieure) où les effets de la renormalisation
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
275
et des fluctuations deviennent importants. La compréhension de la théorie de Wilson des phénomènes critiques en D < 4 et des calculs perturbatifs passent en partie par l’étude du cas D = 4. Enfin, et ceci est relié aux deux points précédents, la théorie φ4 classique possède une symétrie supplémentaire d’invariance d’échelle (et en fait d’invariance conforme) en dimension 4.
8.3.2
Tadpole et fonction à 2 points
La divergence de la fonction à 2 points est causée par le diagramme en tadpole. Avec un régulateur dans l’espace des impulsion Λ, l’amplitude contient une divergence en Λ2 mais aussi une divergence logarithmique en log(Λ), donnée par
= T (m, Λ) = A Λ2 − 2
m2 log (Λ) + O(1) (4π)2
(8.28)
A est une constante (un pur nombre) qui dépend du choix précis de régularisation. Le coefficient du log(Λ) est par contre universel, c’est-à-dire indépendant du détail de la régularisation. Le terme restant en O(1) est un terme fini quand Λ → 0. En général, il va dépendre de la masse. Exemple : Avec un régulateur dur |k| < Λ l’intégrale se calcule exactement Z Λ d4 k 1 2π 2 1 T (m, Λ) = = dk 2 4 2 2 4 (2π) 0 k + m2 |k| −m2phys , comme représenté en figure 8.1.
Im(S)
−4 m2
− m2
0
Re(S)
Figure 8.1 – Structure analytique de la fonction à deux points dans la variable S = p2 (p est l’impulsion euclidienne).
Un résultat général de théorie des champs, basé sur la représentation spectrale de Källén-Lehmann de la fonction à deux points, montre que la fonction ˆ (2) (p) a bien cette structure analytique, avec un pôle simple en p2 = −m2 , G R des coupures dues aux états à N ≥ 2 particules le long de l’axe réel négatif partant de p2 = −(N m)2 (et d’éventuelles singularités dues aux résonances et aux états liés dans les seconds feuillets). Puisque la fonction à deux points et la fonction irréductible sont reliées par ˆ (2) (p) = G R
1 (2) ˆ ΓR (p)
(8.57)
la relation 8.55 est satisfaite. Pour la théorie φ4 à l’ordre d’une boucle, il n’est pas nécessaire d’introduire de contreterme en (∂φ)2 . Donc on peut choisir A1 = 0
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle La masse physique est donc donnée par 1 m2phys = m2R + ~ gR T (mR , Λ) + B1 + O(~2 ) 2
283
(8.58)
m2phys est à la fois différent de la masse classique m2R , et du terme en φ2 dans l’action renormalisée B = m2R + ~B1 . Couplage physique De façon similaire, le couplage physique sera différent du couplage de départ. Une définition possible dans le cas de la théorie massive est de définir gphys comme la valeur de la fonction irréductible à 4 points à l’origine, donc lorsque p1 = p2 = p3 = p4 = 0. Cependant on va voir que cette procédure souffre de divergences IR pour la théorie de masse nulle, et n’est pas la plus adéquate si l’on veut vraiment isoler et comprendre le rôle de l’échelle de renormalisation. Nous reviendrons sur cette question dans la section suivante.
8.5 8.5.1
Renormalisation de la théorie de masse nulle à D = 4 Théorie classique, invariance d’échelle
Nous montrons maintenant la procédure de renormalisation qui permet de construire une théorie quantique cohérente. Nous traitons d’abord la théorie de masse nulle. Ce cas est important, car c’est la théorie de masse nulle qui décrit le point critique des modèles magnétiques dans la classe du modèle d’Ising, comme on va le voir dans le chapitre sur les phénomènes critiques. La théorie classique de masse nulle est invariante d’échelle (et en fait invariante conforme). Cette symétrie est à la base de l’analyse du groupe de renormalisation. La théorie classique de masse nulle est donnée par l’action euclidienne Z g 4 1 D 2 d x (∂µ φ) + φ (8.59) 2 4! et ne dépend que d’un paramètre, la constante de couplage g. En D = 4 elle est invariante sous les transformations d’échelle φ(x) → φλ (x) = λ−1 φ(λx)
(8.60)
et en fait sous les inversions 1 ˜ φ(x) → φ(x) = φ |x|2
x |x|2
(8.61)
284
Théorie statistique des champs
qui avec les transformations d’échelles et les transformations euclidiennes forment le groupe conforme SO(4, 2). Cette invariance d’échelle est conséquence du fait que en D = 4 la constante de couplage g est sans dimension (le champ φ étant de dimension 1) et donc que pour tout φ (pas seulement les solutions des équations du mouvement), S[φ] = S[φλ ]. À la symétrie sous les transformations d’échelle est associé par le théorème de Noether un courant conservé, relié au tenseur énergie-impulsion par g 4 1 µ 2 µ ν µ (∂φ) + φ (8.62) Jéchelle = T ν x − φ∂ φ , Tµν = ∂µ φ∂ν φ − δµν 2 4!
8.5.2
Renormalisation de la masse
La théorie quantique est de masse nulle si mphys = 0. Il faut donc que la fonction irréductible à 2 points s’annule en p = 0 mphys = 0
⇔
(2)
ΓR (p = 0) = 0
On a vu en 8.51 que la masse physique est donnée par 1 2 2 mphys = mR + ~ B1 + gR T (mR ) + O(~2 ) . 2
(8.63)
(8.64)
Il faut donc partir à l’ordre des arbres de la théorie avec une masse renormalisée nulle mR = 0, et à l’ordre ~ ceci fixe complètement le contreterme de (0) masse à une boucle B1 . On note B1 ce contreterme pour la théorie de masse nulle et on a donc (0)
B1
1 1 Λ2 = B1 |mR =0 = −gR T (mR = 0) = −gR 2 32 π 2
(8.65)
La fonction irréductible renormalisée à 2 points est donc (2)
ΓR (p) = p2 + ~ p2 A1 + O(~2 )
8.5.3
Non-renormalisation de la fonction d’onde à une boucle
La fonction à deux points est alors finie UV, on n’a pas besoin d’introduire de contreterme en (∇φ)2 . On choisit simplement A1 = 0
⇒
(2)
ΓR (p, mR = 0, gR ) = p2 + O(~2 )
(8.66)
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
285
L’absence de divergence est due au fait que le tadpole dans la fonction à deux points ne dépend pas du moment externe. On va voir que ceci n’est plus vrai aux ordres supérieurs, et que en général la fonction à deux points Γ(2) (p) contient une divergence logarithmique en p2 log(Λ) proportionnelle au carré du moment externe p2 , en plus de celles en Λ2 et en m2 log(Λ). Dans d’autres théories des champs comme φ3 ou l’électrodynamique quantique (QED), de telles divergences sont déjà présentes à une boucle. L’introduction d’un tel contreterme est appelée en théorie quantique des champs une « renormalisation de fonction d’onde » ou une renormalisation du champ.
8.5.4
Renormalisation de la constante de couplage
La divergence de la fonction à 4 points disparaît si on renormalise la constante de couplage g avec un contreterme pour φ4 de la forme
C1 =
2 gR
3 1 2 (4π)2
2 Λ log +b µ2
(8.67)
où µ est une échelle de masse ou d’impulsion. Il faut introduire cette échelle µ pour que le terme en log(Λ) soit sans dimension. Ce paramètre est appelé échelle de renormalisation ou échelle de soustraction et pour obtenir une théorie finie il peut être choisi arbitrairement. Sa signification physique sera discutée plus loin. Dans 8.67, b est le terme, dépendant des détails la procédure de régularisation, présent dans 8.35. b = 1 pour le cut-off sharp. Il peut être absorbé dans une redéfinition de µ, mais il est gardé pour obtenir des expressions universelles pour les amplitudes renormalisées. Avec ce choix de contreterme la fonction à 4 points renormalisée pour la théorie de masse nulle est 4 1 X IR (p1 + pi , mR = 0; µ) + O(~2 ) 2 i=2 (8.68) La fonction IR est l’amplitude renormalisée du diagramme irréductible à 4 pattes, qui vaut (4)
2 ΓR (pi , gR , mR = 0; µ) = gR − ~ gR
IR (p, mR = 0; µ) =
1 log (4π)2
µ2 p2
(8.69)
Avant de discuter la signification physique des paramètres gR et de µ, regardons comment on renormalise la théorie massive.
286
8.6 8.6.1
Théorie statistique des champs
Renormalisation de la théorie massive pour D = 4 Principe
On cherche donc à construire une théorie renormalisée finie UV avec une masse physique différente de zéro, donc non invariante d’échelle. Pour cela, on part de la théorie avec une masse renormalisée mR non nulle, et la procédure de renormalisation de masse doit être modifiée.
8.6.2
Fonction à 4 points
Le contreterme de constante de couplage C1 pour la théorie de masse nulle (donné par 8.67) suffit pour rendre également finie UV la fonction à 4 points de la théorie massive avec mR 6= 0. C’est une conséquence de 8.36. La formule 8.72 reste valable, avec les amplitudes renormalisées pour la théorie massive définies maintenant comme 2 Λ 1 log + b (8.70) IR (p, mR ; µ) = lim I(p, mR ; Λ) − Λ→∞ (4π)2 µ2 et données explicitement par s 2 4 m2R µ 1 1 log − 2 1 + 2 arctanh q IR (p, mR ; µ) = 4 m2 (4π)2 m2R p 1 + p2R (8.71) La fonction à 4 points est (4)
2 ΓR (pi , gR , mR ; µ) = gR − ~ gR
4 1 X IR (p1 + pi , mR ; µ) + O(~2 ) (8.72) 2 i=2
C’est un objet sans dimension, donc fonction des variables sans dimension (4) pi /µ et de mR /µ, de la forme ΓR (pi /µ, g, m/µ).
8.6.3
Fonction à 2 points et renormalisation de masse
Par contre d’après 8.28, pour que la fonction à 2 points soit finie UV, le contreterme de masse B1 = B1 (0) donné par 8.65 ne suffit pas. Une divergence logarithmique additionnelle en log(Λ) proportionnelle à m2 est présente. Il faut donc ajouter au contreterme de masse 8.65 un second terme dépendant de la masse renormalisée. Le plus simple est de le choisir proportionnel à m2R et de prendre donc un contreterme de masse de la forme (0)
(1)
B1 (mR ) = B1 + m2R B1
(8.73)
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
287
avec
2 1 1 Λ 1 (1) 2 Λ , B1 = gR log (8.74) = −gR 32π 2 2 (4π)2 µ2 Là aussi, à cause de la divergence en log(Λ) il faut introduire une échelle de (1) renormalisation µ. Pour simplifier on a pris dans B1 la même échelle µ que pour la renormalisation de la constante de couplage g, mais a priori on aurait pu choisir un µ0 6= µ. Avec ce choix de contreterme, la fonction à 2 points renormalisée est bien finie UV 1 (2) ΓR (p, gR , mR ; µ) = p2 + m2R + ~ gR m2 log(m2R /µ2 ) + O(~2 ) (8.75) 32 π 2 R (0) B1
(2)
C’est un objet de dimension 2, de la forme µ2 ΓR (p/µ, gR , mR /µ). La masse physique est donnée à l’ordre d’une boucle par 1 m2 log(m2R /µ2 ) + O(~2 ) (8.76) m2phys = m2R + ~ gR 32 π 2 R La masse physique (une quantité observable) dépend de façon non triviale de la masse renormalisée mR (un paramètre de la théorie). Cette dépendance peut s’écrire sous la forme générale d’une fonction sans dimension mphys = µ m(gR , mR /µ) Dans notre calcul à une boucle m(g, m) = m(1 + c g log(m) + · · · ).
8.6.4
Un autre choix de renormalisation : µ = mR
Dans le cas de la théorie massive un autre choix simple pour l’échelle de soustraction µ est de la choisir égale à la masse renormalisée mR . µ = mR
(8.77)
Ce qui conduit immédiatement à l’identification mphys = mR
(8.78)
Les tadpoles sont entièrement soustraits du développement perturbatif. Ce choix d’échelle de soustraction est naturel pour les théories massives. Historiquement c’est celui adopté en électrodynamique quantique (QED), et celui dans lequel les équations de Callan-Symanzik (équations du Groupe de Renormalisation) ont été d’abord formulées. Par contre avec ce choix la limite de masse nulle mR → 0 est singulière pour la fonction à 4 points (apparitions de divergences IR). Ce choix de procédure de soustraction n’est donc pas naturel pour construire une théorie de masse nulle, comme les théories de jauge non abéliennes où la masse des quantas élémentaires (gluons et quarks) n’est pas directement observable à cause du phénomène du confinement. Notre choix est également naturel pour les applications à la physique statistique, où le paramètre m2R va correspondre à l’écart à la température critique, que l’on peut faire varier continûment.
288
8.7
Théorie statistique des champs
Échelle de renormalisation et couplages effectifs
Revenons maintenant sur la signification physique de l’introduction d’une échelle de soustraction µ. Dans cette discussion, ~ ne jouera pas de rôle, donc il sera fixé à ~ = 1.
8.7.1
Conditions de normalisation et couplages renormalisés
L’échelle de renormalisation Les paramètres renormalisés gR et mR sont des paramètres qui permettent de définir une théorie continue. Dans notre procédure ils sont donnés par le choix des contretermes, donc à la procédure de renormalisation choisie, et en particulier au choix de l’échelle de renormalisation µ effectué pour construire la théorie continue. En apparence, en quantifiant une théorie classique dépendante de deux paramètres g et m, on obtient une théorie quantique renormalisée qui dépendant de trois paramètres gR , mR et µ. La présence d’un paramètre additionnel n’est qu’apparente. La dépendance en µ est la conséquence d’une propriété extrêmement importante des théories quantiques. Les paramètres (couplages et masses) qui caractérisent une théorie quantique des champs dépendent de l’échelle (d’énergie, ou de distance) à laquelle ils sont définis (et mesurés). Conditions de normalisation pour la théorie de masse nulle Les calculs pour la théorie φ4 le montrent explicitement. Les calculs précédents à une boucle correspondent à la procédure générale suivante. La théorie renormalisée de masse nulle est définie par trois conditions de normalisation qui fixent la constante de couplage renormalisée gR , la masse mR et la normalisation du champ. Deux de ces conditions dépendent du choix d’une échelle de renormalisation µ. La première condition fixe la masse physique à zéro mphys = mR = 0, (0) et détermine le contreterme de masse B1 pour le terme en φ2 dans l’action renormalisée SR (2)
ΓR (p = 0) = 0
(8.79)
La deuxième fixe la normalisation du champ φ (qui est en fait un « champ renormalisé ») et détermine le contreterme « de fonction d’onde » A1 pour le terme en (∇φ)2 . On peut l’écrire comme condition sur la dérivée de la fonction
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
289
à deux points à une impulsion de référence 4 p0 , qui dépend explicitement de l’échelle de normalisation µ ∂ (2) ref Γ (p ) = 1 ∂p2 R 0
|pref 0 |=µ
,
(8.80)
et à une boucle elle implique que le contreterme est nul, A1 = 0, si bien que (2)
ΓR (p) = p2 + O(g 2 )
(8.81)
La troisième condition porte sur la fonction à 4 points. Elle définit la constante de couplage gR et détermine le contreterme de constante de couplage C1 . On peut l’écrire comme valeur de la fonction à 4 points pour un choix de référence des impulsions {pref i } qui dépend explicitement de l’échelle de normalisation µ (4)
ΓR ({pref i }) = gR
,
ref ref ref ref ref |pref 1 + p2 | = |p1 + p3 | = |p1 + p4 | = µ
(8.82)
comme illustré ici µ µ
gR = µ µ
Figure 8.2 – La constante de couplage gR est donnée par la valeur de la fonction (irréductible) à quatre point à un point de référence d’ordre µ dans l’espace des impulsions.
La fonction à 4 points renormalisée de masse nulle étant comme on l’a vu g2 |p1 + p2 ] |p1 + p3 ] |p1 + p4 ] (4) 3 ΓR (p) = gR + R 2 log + O(gR ) (8.83) 16 π µ µ µ Conditions de normalisation pour la théorie massive Pour la théorie massive, les conditions de normalisation 8.80 et 8.82 peuvent être conservées, mais il faut modifier 8.79 pour définir la masse renormalisée mR et le contreterme de masse B1 (mR ). Ici nous avons imposé deux conditions. D’abord que le contreterme de masse B(gR , mR ; Λ) dans l’action renormalisée SR soit linéaire en m2R (mR étant la masse renormalisée) B(gR , mR ; Λ) = B (0) (gR ; Λ) + m2R B (1) (gR ; Λ) ,
(8.84)
4. Pour la théorie de masse nulle à une boucle on peut prendre p0 = 0, mais ce n’est pas possible aux ordres plus élévés, la présence de log(p) implique des divergences IR dans 8.80 pour p0 = 0.
290
Théorie statistique des champs
et ensuite une condition de normalisation pour la fonction à 2 points pour une valeur particulière de la masse renormalisée mR = µ. Dans notre calcul à une boucle, cette condition est (2)
ΓR (p, mR , gR ; µ) = 2µ2
si
|p| = µ et mR = µ
(8.85)
ou de façon équivalente (à une boucle) mphys (gR , mR ) = mR
pour mR = µ
(8.86)
mais à ce stade ces détails ne sont pas très importants.
8.7.2
Échelle de renormalisation et redéfinition des couplages
Nous avons vu sur l’exemple du calcul à une boucle que pour la même théorie quantique, deux choix différents d’échelle de renormalisation, µ ou µ0 , conduisent à des valeurs différentes des paramètres renormalisés, (gR , mR ) 0 ou (gR , m0R ), sans que les fonctions de corrélations soient modifiées (à une renormalisation près du champ φ, discutée dans la section suivante 8.7.3), et donc sans que le contenu physique de la théorie soit changé. On a donc (pour les fonctions irréductibles à 2 et 4 points, à l’ordre d’une boucle) (2)
(2)
0 ΓR (p, gR , mR ; µ) = ΓR (p, gR , m0R ; µ0 ) (4)
(4)
0 ΓR (pi , gR , mR ; µ) = ΓR (pi , gR , m0R ; µ0 )
(8.87)
Changer l’échelle de renormalisation µ → µ0 se réabsorbe dans une redéfinition 0 des couplages gR → gR et mR → m0R . Pour la théorie φ4 , avec notre schéma de renormalisation, ce changement est explicitement à une boucle 0 µ 3 0 3 2 log gR = gR + gR + O(gR ) (8.88) 2 16 π µ 0 µ 1 2 2 m0R = m2R 1 + gR log + O(g ) (8.89) R 16 π 2 µ Ceci est illustré sur la figure 8.3 pour la théorie de masse nulle (un seul paramètre gR ). Une même théorie physique est décrite par des paramètres renormalisés différents, en fonction du choix de l’échelle de renormalisation. Ceci s’étend à des choix différents de schémas de renormalisation, incluant le choix d’une (ou plusieurs) échelle(s) de renormalisation pour les paramètres renormalisés (couplages, masses, etc.). C’est donc le couple schéma et échelle de renormalisation + paramètres renormalisés qui spécifie à quelle théorie physique (et donc renormalisée) on a affaire dans nos calculs, mais des couples différents peuvent correspondre à la même théorie. Une théorie physique est donc caractérisée par une classe d’équivalence
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
291 e1
ori thé gR
rie 2
théo g’R
théori
e3
µ
µ’
Figure 8.3 – Les points dans le plan (g, µ) sur une même lige noire décrivent la même théorie, dans des paramétrisations différentes. Les lignes noires différentes décrivent des théories physiques différentes. L’espace des théories φ4 de masse nulle est étiqueté par l’espace des paramètres (g, µ), quotienté par les changements d’échelle de renormalisation.
dans l’espace des paramètres renormalisés, modulo les changements d’échelles de renormalisation. Mais ceci veut également dire que considérer une théorie avec des couplages fixés, mais renormalisée suivant des schémas différents (en particulier avec des choix de µ différents) n’est rien d’autre que considérer la théorie renormalisée dans un schéma fixé, mais pour des valeurs différentes des couplages renormalisés. Tout ceci va s’avérer très important pour dériver les équations du groupe de renormalisation.
8.7.3
À propos de la renormalisation du champ
En général, à cause de la renormalisation du terme en (∇φ)2 (qui est absente à l’ordre de une boucle pour la théorie φ4 ) il y aura lors d’un changement de µ une redéfinition du champ φ → φ0 = Z0 φ, qui implique que les relations 8.88 deviennent pour les fonctions irréductibles à N points dans le cas général (N )
ΓR (pi , gR , mR ; µ) = Z0
N
(N )
0 ΓR (pi , gR , m0R ; µ0 )
(8.90)
Le facteur de renormalisation Z0 du champ est trivial à l’ordre d’une boucle 2 Z0 = 1 + O(gR )
(8.91)
292
Théorie statistique des champs
2 Mais à l’ordre gR , il sera non trivial et contiendra des termes en log(µ0 /µ), similaires à ceux de 8.88. De façon générale, il sera une fonction Z0 (gR , µ0 /µ) de gR et µ0 /µ.
8.7.4
Les fonctions β du groupe de renormalisation
Définition des fonctions bêta pour φ4 La façon dont varient les paramètres renormalisés en fonction de l’échelle de renormalisation µ pour une théorie physique donnée est codée dans les « fonctions bêta » (fonctions β) de la théorie. Cette dénomination ne renvoie pas à une classe de fonctions mathématiques précises 5 , mais aux fonctions qui caractérisent le flot dans l’espace des couplages engendrés par les changements de µ. L’origine en est historique, elle vient des choix de notation dans les premiers énoncés des équations de Callan-Symanzik, mais elle est universellement utilisée. Considérons donc la théorie φ4 renormalisée suivant le schéma des sections 8.5 et 8.6, avec une échelle de soustraction µ0 fixée, et des paramètres 0 et m0R fixés. Cette même théorie, dans le schéma de renormarenormalisés gR lisation caractérisé par une échelle de renormalisation différente µ 6= µ0 , est caractérisée par des paramètres renormalisés différents gR et mR . La relation 0 0 entre (gR , m0R , µ0 ) et (gR , mR , µ) est la même que celle entre (gR , m0R , µ0 ) et (gR , mR , µ) dans 8.88. Les fonctions bêta du groupe de renormalisation sont simplement les différentielles des paramètres renormalisés gR et mR en fonction du logarithme de l’échelle de renormalisation µ, la théorie physique étant déterminée, donc 0 les paramètres (gR , m0R , µ0 ) fixés. Fonction β : La fonction β(gR ) associée au couplage gR est définie comme ∂ (8.92) β(gR ) = µ gR ∂µ g 0 ,m0 ,µ0 R
R
Fonction γ : La fonction γ(gR ) associée à la masse ∂ 2 γ(gR ) = µ log(mR ) ∂µ g 0 ,m0 ,µ0 R
(8.93)
R
Fonction η : Quand une renormalisation du champ est présente, la fonction η(gR ) est définie par ∂ η(gR ) = 2µ log(Z0 ) (8.94) ∂µ g 0 ,m0 ,µ0 R
R
5. Aucun rapport avec les fonctions bêta d’Euler, par exemple.
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
293
Ces définitions sont en fait générales, et ne sont pas limitées à la théorie renormalisée à une boucle. Le fait que les transformations par rapport à µ (les termes de gauche dans les définitions) prennent une forme locale dans les paramètres renormalisés (les termes de droite) est une conséquence simple du fait que les changements d’échelles de renormalisation µ forment un groupe multiplicatif, autrement dit il est équivalent de passer de µ0 → µ = S0 × µ0 ou de passer de µ0 → µ1 = S1 ×µ0 puis de µ1 → µ2 = S2 ×µ1 si S0 = S2 ×S1 . Fonctions à une boucle La forme explicite des fonctions à l’ordre d’une boucle s’obtient simplement en utilisant 8.88 et en effectuant un changement infinitésimal d’échelle de soustraction µ → µ(1 + δµ/µ). Par exemple partant de 8.88, le terme de gauche étant fixé, on obtient la variation du terme de droite 3 −1 6 2 log(µ /µ) + δµ gR (8.95) 0 = δgR 1 + gR 0 (4π)2 (4π)2 µ 2 ) pour la variation δgR , En ne gardant que les termes dominants (d’ordre gR on obtient la fonction bêta à une boucle
β(gR ) = gR 2
3 3 + O(gR ) 16 π 2
(8.96)
De façon similaire on obtient la fonction γ γ(gR ) = gR
1 2 + O(gR ) 16 π 2
(8.97)
Enfin, puisqu’il n’y a pas de renormalisation du champ à une boucle, on a 2 η(gR ) = 0 + O(gR )
(8.98)
Interprétation de l’équation différentielle Avec cette définition, les courbes g = g(µ) sur la Figure 8.3 (représentant les couples (µ, gR ) correspondant à une même théorie physique) sont simplement les courbes intégrales de l’équation différentielle d g(µ) = β(g(µ)) d log(µ)
(8.99)
Dimensions anormales On va voir en section 8.8 et 8.8.4 que les fonctions β, γ et η correspondent aux « dimensions anormales » des paramètres de la théorie φ4 , c’est-à-dire aux corrections quantiques aux dimensions d’échelle des paramètres gR , m2R et du champ φ de la théorie renormalisée.
294
8.7.5
Théorie statistique des champs
Exercices
Exercice 8.8. Écrire le contreterme de masse pour la condition de renormalisation pour la fonction à deux points (2)
ΓR (p, mR , gR ; µ) = m2R
si
|p| = µ
et calculer la fonction γ correspondante. Exercice 8.9. Faire de même pour la condition de renormalisation (2)
ΓR (p, mR , gR ; µ) = m2R
si
|p| = 0
La relation linéaire 8.84 entre le contreterme B et m2R est-elle encore satisfaite ? Exercice 8.10. Calculer le contreterme pour la condition de renormalisation µ = mR = mphys
8.8 8.8.1
(8.100)
Transformations d’échelle et groupe de renormalisation Transformations d’échelle et constantes de couplage effectives
Examinons maintenant comment les fonctions irréductibles se transforment lorsque l’on dilate les distances entre les points par un facteur d’échelle S, ou de façon équivalente lorsqu’on contracte les moments par un facteur 1/S x → xS = S x
,
p → pS = p/S
Il s’agit maintenant d’une transformation physique ! On cherche à comparer des observables différentes dans la même théorie. En partant des expressions pour les fonctions renormalisées, on montre qu’un tel changement d’échelle est équivalent à changer gR en une constante de couplage effective gR → geff = gR (S), et mR en une masse effective m → meff = mR (S), En effet, d’après l’expression explicite des fonctions irréductibles renormalisées à une boucle, on a (4)
(4)
ΓR (pi /S; gR , mR , µ) = ΓR (pi ; gR , mR S, µS) (4)
= ΓR (pi ; gR (S), mR (S), µ) (2)
(8.101)
(2)
ΓR (p/S; gR , mR , µ) = S 2 ΓR (p; gR , mR S, µS) (2)
= S 2 ΓR (p; gR (S), mR (S), µ)
(8.102)
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
295
La première égalité découle d’une analyse dimensionnelle classique, elle utilise juste la dimensionnalité des fonctions irréductibles et des couplages. La deuxième égalité prend en compte les fluctuations quantiques et la renormalisation. Elle utilise la variation des couplages sous un changement de µ, donné par 8.88 et étudiée précédemment. Il suffit de remplacer dans 8.88 0 gR → gR (S), µ0 → µ et µ → Sµ et pour la masse m0R → mR (S) et mR → SmR , on obtient explicitement pour la constante de couplage gR (S) et la masse mR (S), à l’ordre d’une boucle 3 3 2 log(S) + O(gR ) gR (S) = gR − gR 2 16 π 1 2 2 2 2 mR (S) = S mR 1 − gR log(S) + O(gR ) 16 π 2
(8.103)
L’interprétation est donc la suivante. La constante de couplage renormalisée gR et la masse renormalisée mR sont bien des paramètres effectifs qui dépendent de l’échelle – des « running parameters » en anglais. En appliquant ces résultats à une boucle à des transformations d’échelles infinitésimales S = 1 + δS leur variation avec le facteur d’échelle S se réécrit sous forme différentielle avec les fonctions β et γ comme S
∂ gR (S) = −β(gR (S)) , ∂S
8.8.2
S
∂ 2 m (S) = 2 − γ(gR (S)) m2R (S) ∂S R (8.104)
Transformations d’échelle pour les fonctions de corrélation
Il est facile de revenir aux fonctions de corrélation renormalisées à N points (N ) GR (définies par 8.47) dans l’espace des positions. Pour cela il suffit de réexprimer les fonctions connexes en fonction des fonctions irréductibles P et d’effectuer une transformée de Fourier (sans oublier les fonctions δ 4 ( i pi ) de conservation des impulsions externes). On obtient l’effet d’une dilatation x → S x sur les fonctions à N points (N )
(N )
GR (xi S; gR , mR ; µ) = Z(S)N GR (xi ; gR (S), mR (S); µ)
(8.105)
gR (S) et mR (S) sont les paramètres effectifs définis juste au-dessus. Z(S) est le facteur de changement d’échelle sur le champ (renormalisé) φ. A l’ordre d’une boucle pour φ4 c’est juste un facteur classique (la dimension canonique de φ est égale à 1 en D = 4). Z(S) = S −1
(8.106)
Dans un cas où il y a une renormalisation du champ on aura Z(S) = S −1 Z0 (S)
(8.107)
296
Théorie statistique des champs
où Z0 (S) est le facteur discuté précédemment dans 8.90. On va voir que ces relations sont toujours vérifiées aux ordres suivants du développement perturbatif pour la théorie renormalisée. Les fonctions R(S), mR (S) et Z(S) seront calculables ordre par ordre en perturbation.
8.8.3
Flots du groupe de renormalisation
Le groupe de renormalisation Cette propriété pour les fonctions de corrélation de la théorie quantique des champs φ4 est tout à fait semblable au résultat de l’analyse du groupe de renormalisation de Wilson dans l’espace réel pour des systèmes statistiques près d’un point critique. L’équation 8.105 est l’exact analogue du résultat de l’analyse de Wilson sur un modèle statistique impliquant des champs locaux (spins) φ et dépendant de paramètres (couplages) κ, et un cut-off à courte distance a. L’analyse de Wilson énonce que l’effet d’une dilatation des distances dans l’espace réel x → Sx
(8.108)
par un facteur d’échelle S peut se réabsorber (en intégrant sur les degrés de liberté entre les échelles a et Sa) dans une renormalisation des couplages κ → κ(S) et des champs φ → Z(S)−1 φS . En effet 8.105 énonce simplement le fait que pour la théorie φ4 en dimension 4, sous une dilatation 8.108, la constante de couplage g, la masse m et le champ φ doivent être re-échelonnés (« rescalés » en franglais) comme g → g(S) , m2 → m2 (S) ,
φ → φS = Z(S) φ
(8.109)
Ces transformations forment un groupe abélien, multiplicatif dans le paramètre d’échelle, puisque si on note RS ces transformations (donc g(S) = RS (g)), on a évidemment RS1 S2 = RS1 ◦ RS2
(8.110)
Ce groupe de transformations est le groupe de renormalisation. Ce concept de groupe de renormalisation a été introduit en théorie quantique des champs, comme groupe d’invariance sous les changements d’échelles de renormalisation, pour QED dans les années 1950 (Stueckelberg et Petermann, Gell-Mann et Low). Sa formulation comme effet des transformations d’échelle a été développée dans les années 1970 (Callan et Symanzik), concomitamment de l’introduction du concept de groupe de renormalisation en physique statistique, principalement due à Wilson (où c’est d’ailleurs un semi-groupe plutôt qu’un groupe de transformation).
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
297
Relation avec les flots de Wilson Anticipons la partie Physique statistique de cet ouvrage et les notations du chapitre consacré au groupe de renormalisation de Wilson (tome 2). Les transformations 8.104 pour ces paramètres se réécrivent dans le langage du groupe de renormalisation de Wilson comme des équations de flot pour les paramètres effectifs uR (S) (couplage) et tR (S) (température réduite). S est un facteur de transformation d’échelle dans l’espace (donc l’inverse d’un facteur d’échelle sur les impulsions). La relation entre ces paramètres et ceux utilisés pour φ4 est uR = gR , tR = m2R (8.111) Les équations de flot de Wilson sont, avec les fonctions de Wilson Wu et Wt (flots IR) et la dimension anormale du champ ∆φ S
∂ uR = Wu (uR ) , ∂S
S
∂ tR = Wt (gR , tR ) ∂S
(8.112)
∂ log Z = ∆φ (gR ) (8.113) ∂S Le calcul avec les méthodes de Wilson pour une théorie φ4 à l’ordre d’une boucle donne explicitement S
Wu (uR ) = − Wt (uR , tR ) = tR
3 u2 + O(u3R ) 16 π 2 R
2−
1 2 u + O(u ) R R 16 π 2
∆φ (uR ) = −1 + O(u2R )
(8.114) (8.115) (8.116)
On peut donc identifier les fonctions de Wilson et les fonctions β, γ et η introduites précédemment. Les relations (avec gR = uR et tR = m2R ) sont Wu (uR ) = − β(gR ) ,
Wt (uR , tR ) = m2R (2 − γ(gR ))
(8.117)
et
η(gR ) (8.118) 2 Nous allons discuter plus loin les flots du groupe de renormalisation pour la théorie φ4 en dimension D 6= 4. En théorie des champs, on va pouvoir définir les fonctions βκ pour chaque paramètre renormalisé sans dimension κ de la théorie. La relation générale entre les fonctions βκ , qui donnent la dépendance des paramètres renormalisés κR en fonction de l’échelle de renormalisation choisie µ, et les fonctions de Wilson Wκ , qui donnent la dépendance des paramètres effectifs κeff. en fonction d’un facteur d’échelle dans l’espace S, est simplement et de façon générique ∆φ (uR ) = −1 −
Wκ = −βκ
(8.119)
298
Théorie statistique des champs
8.8.4
Équations de Callan-Symanzik
Les relations 8.88 qui donnent la dépendance dans l’échelle de renormalisation µ des fonctions renormalisées, et 8.105 qui donnent la dépendance dans l’échelle S des fonctions renormalisées, prennent des formes différentielles simples sous des variations de µ et de S. Ces équations différentielles sont appelées équations du Groupe de Renormalisation, ou équations de Callan(N ) Symanzik. Elles sont écrites ici pour les fonctions de corrélations GR . Dépendance dans l’échelle de soustraction µ En utilisant 8.112, on obtient l’équation
∂ η(gR ) ∂ ∂ (N ) 2 + β(gR ) +N + γ(gR ) mR GR (xi , gR , m2R ; µ) = 0 µ 2 ∂µ ∂gR ∂mR 2 (8.120)
Noter que le terme supplémentaire en N η(g)/2, dû à la renormalisation du champ, et absent à l’ordre d’une boucle (η(g) = O(g 2 )), a été inclus. Dépendance dans le facteur d’échelle S Si maintenant on fait une transformation d’échelle (une dilatation sur les positions) par un facteur S, on obtient S
∂ ∂ ∂ + β(gR ) + −2 + γ(gR ) m2R +N ∂S ∂gR ∂m2R
1+
η(gR ) 2
(N )
GR (Sxi , gR , m2R ; µ) = 0 (8.121) Comme signalé précédemment, ces équations sont la version différentielle des équations de flot du groupe de renormalisation de Wilson pour des fonctions de corrélations de modèles statistiques. En effet, elles se réécrivent ∂ ∂ ∂ S − Wg (gR ) − Wt (gR , m2R ) − N ∆ (g ) φ R ∂S ∂gR ∂m2R (N )
GR (Sxi , gR , m2R ; µ) = 0 (8.122) Équation de Callan-Symanzik pour la théorie massive Enfin considérons la première équation (dépendance dans l’échelle de soustraction) pour la théorie massive m2R > 0 et dans le cas où l’échelle de soustraction µ est prise égale à la masse renormalisée mR , c’est-à-dire µ = mR 6= 0
(8.123)
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
299
Dans ce cas, 8.120 devient l’équation de Callan-Symanzik. ∂ γ(gR ) ∂ η(gR ) β(gR ) + 1+ mR +N ∂gR 2 ∂mR 2 (N )
GR (xi , gR , m2R ; µ = mR ) = 0 (8.124) Ceci est la forme originelle de l’équation de Callan-Symanzik. Dans la littérature, la dénomination d’équation de Callan-Symanzik est souvent donnée à toute forme d’équation de groupe de renormalisation.
8.9 8.9.1
Renormalisation de φ4 en dimension D < 4 Introduction
En dimension D < 4, la théorie φ4 de masse nulle n’a plus de divergences UV à une boucle, une fois la masse physique fixée à zéro. De façon générale la théorie massive n’aura qu’un nombre fini de divergences UV, qui se réabsorbent dans une renormalisation de la masse. Mathématiquement la construction d’une théorie des perturbations est donc beaucoup plus simple en dimension D < 4 qu’en dimension D = 4. Techniquement il n’est pas nécessaire de renormaliser le couplage pour contrôler le comportement à courte distance de la théorie. Néanmoins, dans ce cas également, les paramètres de l’action renormalisée de départ, qui permettent de définir une théorie quantique φ4 par intégrale fonctionnelle (ou par quantification canonique) ne sont pas égaux aux paramètres physiques (masse et couplage), et pour la théorie de masse nulle, les corrections quantiques impliquent que le couplage physique ne peut être défini qu’en référence à une échelle de masse, comme pour la théorie φ4 en D = 4. Il est donc naturel de définir une théorie φ4 en termes de paramètres renormalisés (m2R et gR ) et de s’intéresser à la relation entre ces paramètres renormalisés et l’échelle de renormalisation µ. Cette approche est à la base des applications de la théorie perturbative des champs aux phénomènes critiques et au concept de développement en epsilon de Wilson-Fisher, qui seront discutés en détail dans la partie consacrée au groupe de renormalisation de Wilson. Le calcul à une boucle présenté ici va illustrer cette approche. Il sera effectué pour toute dimension D < 4, se sera un premier exemple d’utilisation de la régularisation dimensionnelle (calcul en dimension D non entière), et du processus de renormalisation par soustraction minimale (soustraction des pôles en = 4 − D). Une discussion précise de la construction de la théorie φ4 de masse nulle en dimension D < 4 doit prendre en compte l’existence de divergences IR dans la théorie des perturbations (qui se traduisent en fait par l’apparition de termes non analytiques dans la constante de couplage, mais ceci est une autre histoire...). Les divergences IR n’apparaissent pas dans les
300
Théorie statistique des champs
calculs à une boucle présentés ici, et surtout n’invalident pas les conclusions sur la structure des flots du groupe de renormalisation. On va toujours fixer ~ = 1 et noter la dimension de l’espace D =4−
8.9.2
Théorie renormalisée en D < 4
Le principe est le suivant : on renormalise la théorie pour D < 4 comme en D = 4, c’est-à-dire qu’on renormalise le couplage g et la masse m2 en référence à une échelle de renormalisation µ. On va procéder de façon à ce que dans la limite D → 4 les fonctions de corrélations soient égales à celles de la théorie renormalisée à D = 4 construites précédemment, donc finies UV. Amplitudes en D < 4 Les amplitudes de Feynman des diagrammes à une boucle en tadpole (fonction à 2 points) et en bulle (fonction à 4 points) ont été calculées en dimension D < 4 dans la section consacrée à la régularisation dimensionnelle (voir 8.11). On trouve pour le diagramme en tadpole (Λ est un régulateur dur sur les impulsions)
D
= (4π)− 2 ΛD−2
D 2 + (4π)− 2 mD−2 Γ (D − 2)Γ(D/2)
2−D 2
+ ··· (8.125)
La notation o(1) veut dire des termes qui tendent vers 0 quand Λ → ∞. Le diagramme en bulle est fini en D < 4 et pour la théorie de masse nulle il vaut (voir 8.13) Γ 4−D Γ(D − 2) D−4 −D 2 2 = (4π) |p| + ··· (8.126) D−2 2 Γ 2 On note le pôle en D = 4 (divergence UV) venant de Γ(4 − D)/2). Renormalisation de constante de couplage On renormalise la constante de couplage comme en D = 4 en définissant le couplage renormalisé gR comme la valeur de la fonction à 4 points de la théorie de masse nulle au point de renormalisation |p1 +p2 | = |p1 +p3 | = |p1 +p4 | = µ (relation 8.82). Ceci revient à introduire un contreterme en φ4 (fini quand D < 4) g → gB = gR + C1
,
2 C1 = gR
3 µ− − Λ− CD 2
(8.127)
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle avec CD = 2 (4π)−D/2
Γ
6−D 2
Γ D−2 2 Γ(D − 2)
301
2 (8.128)
On a gardé dans le contreterme un terme Λ− qui disparaît dans la limite Λ → 0 (si D < 4) pour pouvoir discuter la limite D → 4 plus tard. La fonction à 4 points renormalisée pour la théorie de masse nulle vaut alors (pour Λ = ∞) 4
X |p1 + pi |− − µ− (4) 2 1 ΓR (p) = gR − gR CD 2 − i=2
(8.129) (4)
Pour la théorie massive, on aura une formule plus compliquée pour ΓR faisant intervenir des fonctions hypergéométriques. Je ne les écris pas explicitement. Renormalisation de masse On procède de même pour définir la masse renormalisée. On introduit d’abord un contreterme de masse en ΛD−2 pour obtenir la théorie de masse nulle, puis un contreterme de masse linéaire dans la masse renormalisée m2R et dépendant de l’échelle de soustraction µ pour définir une théorie massive. Le contreterme de masse en φ2 correspond à une renormalisation de masse de la forme − C0D Λ2− − Λ− 2 2 (0) 2 (1) 2 2 µ m → mB = B + mR B = mR + gR + mR − 2 2− (8.130) avec C0D = 2 (4π)−D/2 /Γ(D/2) (8.131) Le terme divergent UV est celui du tadpole en 2 ≤ D < 4. On a gardé le terme en Λ− qui disparaît dans la limite Λ → ∞. La fonction à deux points renormalisée est (2)
ΓR (p) ' p2 + m2R + gR
C0D 2 µ− − m− R mR + ··· 2
(8.132)
Là encore, la masse renormalisée mR n’est pas la masse physique mphys , mais un paramètre commode pour caractériser la théorie renormalisée. La relation entre mR et la masse physique mphys est m2phys = m2R + gR
C0D 2 µ− − m− R mR + ··· 2
(8.133)
On voit bien que quand mR → 0, mphys → 0, du moins tant que < 2, c’està-dire que D > 2 (les théories de masse nulle posent de toute façon problème en D = 2, du moins en théorie des perturbations).
302
Théorie statistique des champs
8.9.3
Paramètres renormalisés sans dimension
En D 6= 4 le couplage gR a une dimension − (en échelle de masse) et m2 est toujours de dimension 2. [g] = [`]
[m2 ] = [`]−2
,
(8.134)
La théorie renormalisée est définie par référence à l’échelle de renormalisation µ. Pour analyser comment les paramètres varient avec l’échelle de soustraction et sous les transformations d’échelle, il faut comparer des purs nombres (des quantités sans dimension). Plutôt que de considérer les paramètres renormalisés gR et m2R dimensionnés, il est donc naturel de considérer les paramètres renormalisés sans dimension uR et tR définis par uR = gR µ−
,
tR = m2R /µ2
(8.135)
En termes de ces paramètres, les fonctions à 2 et 4 points (à une boucle) s’écrivent −/2
(2)
ΓR (p; uR , tR ; µ) = p2 + µ2 tR + µ2 uR
C0D 1 − tR 2
+ ···
(8.136)
"
# 3 − X 1 (|p + p |/µ) − 1 1 i = 0; µ) = µ uR − u2R CD + ··· 2 − i=2 (8.137) Les relations entre paramètres renormalisés uR et tR et les paramètres nus gB et m2B deviennent (4) ΓR (pi ; uR , tR
3 1 − (µ/Λ) gB = µ uR + u2R CD + ··· 2 1 (µ/Λ)−2 1 − (µ/Λ) m2B = µ2 tR + uR C0D − + tR + ··· 2 2−
8.9.4
(8.138)
(8.139)
Les fonctions β du groupe de renormalisation
Comme pour D = 4, on définit les fonctions bêta βu et βt associées aux couplages renormalisés uR et tR comme la variation des constantes de couplages renormalisées avec l’échelle de renormalisation µ, les fonctions de corrélations (donc les constantes nues gB et tB ) étant fixées. βuR = lim
Λ→∞
! ∂ µ uR ∂µ gB ,Λ
,
βtR = lim
Λ→∞
! ∂ µ tR ∂µ gB ,tB ,Λ (8.140)
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
303
Résultats explicites à une boucle : Le calcul explicite (à partir de 8.1368.137 ou de 8.138-8.139 ) donne ces fonctions bêta à une boucle 3 CD u2R + O(u3R ) 2 1 = tR −2 + C0D uR + O(u2R ) 2
βuR = − uR + βtR
8.9.5
(8.141) (8.142)
Paramètres effectifs et transformations d’échelles
Comme en D = 4 on peut sans difficulté étudier comment les fonctions de corrélations du modèle se transforment sous une transformation d’échelle x → Sx. Les fonctions de corrélation varient avec S comme (N )
(N )
GR (Sxi , uR , tR ; µ) = S ∆0 N GR (xi , uR , tR ; µS) (N )
= Z(S)N GR (xi , uR (S), tR (S); µ)
(8.143)
∆0 = 2−D est la dimension canonique du champ φ. Z(S) est le facteur de 2 renormalisation du champ. À une boucle Z est simplement Z(S) = S ∆0 = S
2−D 2
(8.144)
Les paramètres effectifs uR (S) et tR (S) sont sans dimension et sont donc obtenus en intégrant les équations de flot ∂ uR (S) = − βuR (uR (S)) ∂S ∂ tR (S) = − βtR (uR (S), tR (S)) S ∂S
S
(8.145)
Les fonctions β sont donc les composantes du champ de vecteur engendrant les équations de flot dans l’espace des paramètres renormalisés. κ = (uR , tR ) ,
β = (βu , βt ) ,
S
∂ κ = −β(κ) ∂S
(8.146)
Relations entre fonctions β et fonctions de Wilson : On notera l’analogie (en fait l’équivalence) entre les équations de flots 8.145 et 8.147 d’une part, et les équations des flots de renormalisation de Wilson pour les paramètres renormalisés dans l’espace réel, qui seront discutés plus loin, et qui sont engendrés par les fonctions de Wilson Wa relatives aux paramètres κa κ = (κa ) ,
W = (Ws a) ,
S
∂ κ = W (κ) ∂S
(8.147)
On a en fait la relation fondamentale entre fonctions β, telles qu’elles sont définies en théorie des champs à partir de la dépendance des paramètres renormalisés (sans dimension) en fonction de l’échelle de renormalisation µ, et les
304
Théorie statistique des champs
fonctions de Wilson W qui seront définies à partir de la variation des paramètres renormalisés avec l’échelle S lors d’une transformation du groupe de renormalisation de Wilson (intégration des modes k de haute énergie entre Λ/S < |k| < Λ) fonctions de Wilson W = − β
8.9.6
fonctions bêta du GR
(8.148)
Exercices
Exercice 8.11. Équations de Callan-Symanzik Montrer que les fonctions de corrélations en D < 4 obéissent à des équations différentielles du groupe de renormalisation similaires à celle en D = 4, 8.120 et 8.121. Pour la dépendance dans l’échelle de soustraction µ ∂ η(uR ) ∂ ∂ (N ) + βuR (uR ) GR (xi , uR , tR ; µ) = 0 + βtR (tR ) +N µ ∂µ ∂uR ∂tR 2 (8.149) et pour la dépendance dans le facteur d’échelle S ∂ ∂ ∂ S + βuR (uR ) + βtR (uR , tR ) ∂S ∂uR ∂tR D − 2 η(uR ) (N ) +N + GR (S xi , uR , tR ; µ) = 0 2 2 (8.150) En déduire que la dimension d’échelle du champ φ est en général ∆φ = (2 − D − η(uR ))/2 = S
∂ log Z ∂S
(8.151)
Exercice 8.12. Flots du groupe de renormalisation pour les couplages nus L’équivalent de la procédure de groupe de renormalisation de Wilson (voir sections suivantes) est de se demander quels couplages nus, pour des cut-off physiques Λ différents, donnent la même physique à l’échelle µ. Pour cela, il faut considérer les couplages nus sans dimensions, exprimés dans l’échelle du cut-off. uB = gB Λ− , tB = m2B /Λ2 (8.152) Les fonctions de flots (de Wilson) pour les paramètres nus sont définies comme ∂ ∂ Wu B = − Λ uB , W tB = − Λ tB (8.153) ∂Λ ∂Λ uR ,µ uR ,tR ,µ Montrer que les relations 8.138 et 8.139 peuvent se réécrire facilement 3 1 3 1 Λ uB + u2B CD = µ uR + u2R CD (8.154) 2 2
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle 2
Λ
1 1 1 1 + tB uB C0D tB + uB C0D 2 2− 2
2
= µ
305
1 0 1 (8.155) tR + tR uR CD 2
En déduire les fonctions de Wilson à l’ordre d’une boucle 3 WuB (uB ) = uB − CD u2B + · · · (8.156) 2 1 1 WtB (uB , tB ) = 2tB − tB uB C0D + uB C0D + · · · (8.157) 2 2 Exercice 8.13. Covariance des fonctions bêta sous des changements de renormalisation La forme des fonctions bêta dépend de la définition des paramètres renormalisés. Imaginez qu’au lieu de la procédure de renormalisation définissant les paramètres uR et tR (sans dimensions), on utilise une autre procédure qui conduise à de nouveaux paramètres dépendant non linéairement des premiers, de forme générale (à l’ordre d’une boucle) u0R = U (uR , tT ) = a uR + b tR + c u2R + d uR tR + e t2R + · · · t0R = T (uR , tR ) = f uR + g uR + h u2R + i uR tR + j t2R + · · ·
(8.158)
Montrer que les fonctions bêta pour les nouveaux paramètres s’écrivent en fonction des anciennes comme ∂U ∂U βu (uR , tR ) + βt (uR , tR ) βu0 0 (u0R , t0 R) = ∂uR ∂tR ∂T ∂T βt00 (u0R , t0R ) = βu (uR , tR ) + βt (uR , tR ) (8.159) ∂uR ∂tR Calculez-les explicitement à l’ordre d’une boucle pour la théorie φ4 , dans le cas où b = f = 0 (pas de mélange entre uR et tR à l’ordre des arbres) et dans le cas général.
8.10
Analyse des flots du groupe de renormalisation
Rappelons que classiquement, la théorie quantique des champs φ4 décrit des particules relativistes sans spin (bosons scalaires) avec une interaction de contact répulsive. Sa version euclidienne est la limite continue du modèle de Landau-Ginzburg-Wilson qui décrit la théorie du champ moyen (approximation de Landau) des systèmes dans la classe d’universalité du modèle d’Ising (voir tome 2). Les équations de flot du groupe de renormalisation permettent de comprendre comment le couplage (ici répulsif) varie avec l’échelle d’énergie ou de distance, et en particulier son comportement dans la limite des grandes distances ou basses énergies (limite infra-rouge ou IR) et dans la limite des courtes distances ou hautes énergies (limite UV). Bien qu’initialement intéressés par la théorie en D = 4, discutons d’abord le cas de la théorie en dimension D < 4.
306
Théorie statistique des champs
8.10.1
Flots en dimension D < 4, points fixes
Fonction bêta et point fixe de Wilson-Fisher Pour la théorie de masse nulle (mR = 0) la fonction bêta pour la constante de couplage est donnée à une boucle par 8.141 βuR = − uR +
3 CD u2R + O(u3R ) , 2
CD > 0
(8.160)
Si on s’arrête à l’ordre u2R (ordre d’une boucle), ce qui est justifié si = 4 − D est petit, elle est représentée sur la Figure 8.4. Sa caractéristique essentielle est qu’elle a un zéro trivial en u = 0 et un zéro non trivial (positif, à une distance finie du zéro trivial) en u∗R =
2 + O(2 ) 3CR
(8.161)
Ce point fixe est appelé le point fixe de Wilson-Fisher.
β
0
u*
u
D 0 proche de u = 0, le couplage effectif u(S) croît avec S. Par contre pour le point fixe non trivial u∗ βu0 (u∗ ) = + > 0
=⇒
u = 0 est un point fixe stable IR
(8.164)
C’est-à-dire que si on part de u > 0 proche de u∗ , le couplage effectif u(S) tend vers u∗ quand S → ∞. Le point fixe de Wilson-Fisher contrôle donc le comportement à grande distance de la théorie φ4 de masse nulle. Le fait qu’il soit non trivial implique que le comportement à grande distance n’est pas celui de la théorie du champ libre, et que le champ quantique φ(x) aura une dimension d’échelle différente de celle donnée par l’analyse dimensionnelle classique ∆∗φ = ∆φ (u∗ ) 6= ∆0 =
D−2 2
(8.165)
Les flots du groupe de renormalisation pour la théorie massive (tR 6= 0) sont étudiés de la même manière à partir des fonctions βu et βt . En dimension D < 4 ils sont représentés sur la Figure 8.5. On voit que le point fixe à l’origine (appelé le point fixe Gaussien G) est instable IR dans les deux directions. Le point fixe de Wilson-Fisher W est stable IR dans la direction u, mais instable IR dans la direction t. La ligne t = 0 passant par G et W est globalement stable sous le groupe de renormalisation et sépare le domaine t > 0 tel que t(S) → +∞ quand S → ∞, du domaine t < 0 tel que t(S) → −∞. On verra plus loin dans le langage du groupe de renormalisation de Wilson et des phénomènes critiques, que la ligne t = 0 correspond à une surface critique, séparant deux domaines décrivant des phases physiquement différentes
tR
G
W
uR
D 0, bassin d’attraction de t = +∞, correspondant à la phase symétrique où hφi = 0, et le domaine t < 0, bassin d’attraction de t = −∞, correspondant à la phase de symétrie brisée où hφi = ±φ0 6= 0. Bien sûr cette analyse demande à être précisée en tenant compte des termes d’ordres supérieurs en u (renormalisation des amplitudes à plusieurs boucles). Flots UV et limite continue On peut se poser le problème inverse en étudiant les comportements UV des flots, c’est-à-dire en fait comment les couplages nus doivent se comporter avec le régulateur Λ pour une théorie renormalisée dont les couplages sont fixés à l’échelle de renormalisation µ. Ceci a déjà été discuté dans l’exercice 8.12. Il faut juste inverser le sens des flots dans les figures. Il y a alors trois situations possibles. Dans la bande 0 ≤ u < u∗ , les couplages nus (uB (Λ) et tB (Λ)) tendent vers le point fixe gaussien à l’origine. Ceci signifie qu’on pouvait bien construire une théorie renormalisée, finie UV, en partant de la théorie des perturbations qui consiste à développer autour de la théorie du champ libre décrite par le point gaussien (pour la théorie de masse nulle) et la (demi)ligne uR = 0, tR > 0 pour la théorie libre massive. Dans ce domaine de paramètres, la théorie φ4 est dite renormalisable. Sur la ligne instable verticale u = u∗ (qui est la ligne du flot qui s’échappe du point fixe de Wilson-Fisher, les couplages nus (u = u∗ et t quelconques tendent vers le point fixe de Wilson-Fisher u = u∗ , t = t∗ = 0. Ceci signifie qu’on peut construire une théorie continue non triviale, mais qui ne dépend plus que d’un paramètre, la [masse]2 renormalisée tR . Cette théorie des champs est non perturbative dans la constante de couplage uR (puisqu’elle correspond à une valeur bien précise du couplage renormalisé de φ4 , mais elle est renormalisable par rapport au paramètre t. Cette théorie des champs non triviale, massive si t 6= 0, et de masse nulle si t = 0, est appelée la théorie des champs d’Ising (car elle correspond à la limite continue du modèle d’Ising au voisinage de son point critique). Elle décrit également la limite IR de la théorie des champs φ4 , puisqu’elle est définie sur la frontière IR du premier domaine. Enfin, à droite de cette ligne, donc dans tout le demi-plan u > u∗ , les couplages nus s’échappent vers l’infini, et en fait ils divergent déjà pour des Λ finis ! Cet effet sera discuté plus dans le cas D = 4. La théorie est non renormalisable et on s’attend à ne pas pouvoir construire une théorie continue à partir d’une théorie avec cut-off en prenant la limite Λ → ∞. On reviendra sur ces analyses dans la discussion générale sur la renormalisation.
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
8.10.2
309
Flots en dimension D = 4, « esclavage ultraviolet »
Analyse des flots du GR En D = 4, la fonction βu est quadratique et toujours positive 3 1 >0 (8.166) C4 u2R + O(u3R ) , C4 = 2 8π 2 La fonction β et les flots IR du groupe de renormalisation sont représentés sur les Figures 8.6 et 8.7. βu R =
β
0
u D=4
Figure 8.6 – La fonction β pour le couplage renormalisé uR de φ4 en D = 4.
tR
G
uR
D=4 Figure 8.7 – Les flots du GR pour les couplages renormalisés de φ4 en D = 4.
310
Théorie statistique des champs
La différence avec le cas D < 4 est que le point fixe gaussien à l’origine est maintenant un point fixe attractif dans la direction u. Il reste répulsif dans la direction t. En fait les points fixes G et W fusionnent dans la limite D → 4 ! La théorie libre de masse nulle gouverne le comportement à grande distance de la théorie φ4 et le couplage effectif u(S) tend vers zéro quand S → ∞. La théorie est dite asymptotiquement libre dans l’infra-rouge (asymptotiquement libre voulant dire sans interaction dans la limite asymptotique). « Esclavage ultraviolet » et pôle de Landau Il est intéressant d’intégrer explicitement les équations de flot pour u, en partant à une échelle de référence µ d’un couplage renormalisé u0 . En gardant simplement la fonction β à une boucle, on obtient u(S) =
u0 1 + u0 a log(S)
,
a = 3/2C4
(8.167)
S est le facteur d’échelle dans l’espace des positions. On voit qu’à grande distance, c’est-à-dire à petite énergie E → 0, le couplage effectif tend vers zéro comme l’inverse d’un logarithme, donc très lentement u(E) ∝
1 log(1/E)
(8.168)
avec un coefficient universel donné par le coefficient à une boucle de la fonction β. Par contre, si on s’intéresse à la façon dont le couplage effectif se comporte à haute énergie E → ∞, on voit que ueff (E) =
u0 1 + u0 a log(µ/E)
devient infini à une valeur finie de l’énergie 1 Ec = µ exp + a u0
(8.169)
(8.170)
C’est le même type de divergence que celle qui est présente dans la théorie en D < 4 si u > u∗ . Pour D = 4, ces divergences sont présentes dès que la constante de couplage est non nulle ! Cette singularité en énergie (donc en impulsion) ne sera pas visible dans les calculs d’amplitudes à un ordre fini en théorie des perturbations. En effet, Ec est exponentiellement grand quand u → 0 c’est-à-dire tend vers l’infini plus vite que toute puissance de u. Par contre cette singularité est mise en évidence lors des resommations de termes de la série des perturbations effectuées par les flots du groupe de renormalisation. Ce phénomène, complémentaire de la liberté asymptotique IR, est appelé esclavage ultra-violet. Le couplage devient de plus en plus fort à haute
8. La théorie φ4 : Renormalisation à l’ordre d’une boucle
311
énergie, donc à courte distance. Il indique le fait que construire une théorie quantique des champs φ4 en dimension D = 4 est problématique, et probablement impossible. Nous reviendrons sur ces questions plus loin. Un petit point d’histoire. L’électrodynamique quantique (la QED), comme φ4 , a une fonction β positive et présente ce phénomène de singularité UV non perturbative. Landau a été sans doute le premier à soulever ce problème, et à montrer qu’il devait donner lieu à des singularités à hautes énergies dans les amplitudes de diffusion de QED, et à des violations de l’unitarité. Les dénominations « pôles de Landau » et « fantômes de Landau » sont associées à ces phénomènes. A l’époque (années 1960) toutes les théories des champs renormalisables connues présentaient ce problème, et ceci a conduit beaucoup de théoriciens des particules à abandonner la théorie quantique des champs perturbative comme formulation des interactions fondamentales. C’est la découverte au début des années 1970 du fait que les théories de jauges non abéliennes étaient asymptotiquement libres dans l’ultra-violet (et donc fortement couplées dans l’infra-rouge) qui a renversé la donne.
8.11
Renormalisation dimensionnelle
Dans la procédure de renormalisation dimensionnelle (schéma de soustraction minimale, ou MS schème), les intégrales de Feynman sont d’abord régularisées en étant directement calculées en dimension D quelconque, sans régulateur UV, en appliquant la règle Z dD k |k|n = 0 pour n entier, D non entier (8.171) De ce fait dans 8.138, 8.139 les termes en Λ− et Λ2− disparaissent. Les divergences apparaîtront comme des pôles dans le plan complexe en D. Ensuite on applique une prescription de soustraction minimale. On introduit des contretermes pour enlever les pôles en D = 4 ( = 0) et seulement ceux-là. De plus pour simplifier ces contretermes ne contiennent que des pôles en = 0, pas de parties finies (soustraction minimale). Les relations entre paramètres nus (dimensionnés) et paramètres renormalisés (sans dimensions) sont alors 1 3 (8.172) gB = µ uR + u2R C4 + · · · 2 1 1 (8.173) m2B =µ2 tR 1 + uR C4 + · · · 2 avec 1 C4 = (8.174) 8π 2 Les fonctions bêta sont donc 3 βuR = − uR + u2 + O(u3R ) (8.175) (4π)2 R
312
Théorie statistique des champs
β tR
= tR −2 +
1 2 uR + O(uR ) (4π)2
(8.176)
Comme on l’a mentionné, les fonctions β sont les composantes d’un champ de vecteur dans l’espace des paramètres de la théorie. Ce champ de vecteur engendre le flot des transformations du groupe de renormalisation. Les fonctions β se transforment donc comme les composantes d’un vecteur contrariant sous des redéfinitions des couplages. Ceci explique les différences entre les fonctions β dans 8.141-8.142, 8.156 et 8.175-8.176, les trois procédures correspondant à des redéfinitions finies des paramètres sans dimensions.
8.12
Notes
Ce chapitre essaie de présenter la théorie de la renormalisation sur la base de calculs explicites et détaillés à une boucle pour la théorie φ4 . Les calculs se retrouvent déjà dans de nombreux ouvrages, voir en particulier [ZJ02]. Soulignons que notre présentation des équations du groupe de renormalisation et notre définition des fonctions bêta essaient d’être générales. Elle est donc légèrement différente des présentations habituelles, où le terme de fonction bêta est réservé à la fonction β(g) pour la constante de couplage. De même nous essayons de présenter la théorie à D < 4 et à D = 4 en les mettant sur le même pied. Le but est évidemment de traiter dans la seconde partie de cet ouvrage le groupe de renormalisation de Wilson et ses applications en les mettant bien en parallèle, de façon à ce que le lecteur arrive à une vue synthétique de la théorie de la renormalisation.
Chapitre 9 Renormalisation perturbative : aperçu général 9.1
Introduction
Dans ce chapitre nous expliquons très succinctement pourquoi et comment la procédure de renormalisation présentée dans les calculs à une boucle se généralise pour φ4 en dimension 4 à tous les ordres du développement perturbatif. Nous donnerons un bref aperçu historique et mentionnerons rapidement les approches modernes et non perturbatives à la théorie de la renormalisation. Une bonne vision de tous les aspects de la théorie de la renormalisation requiert la compréhension de l’approche dite « Wilsonienne » du groupe de renormalisation en termes de théorie effective à grande distance. Ceci peut être fait dans un cadre purement « théories des champs » mais nous reviendrons sur ces questions après la présentation du formalisme de Wilson dans le cadre de la physique statistique et des phénomènes critiques. La discussion est faite pour la théorie des champs φ4 mais s’étend sans difficulté à d’autres théories.
9.2 9.2.1
Divergences UV et comptage de puissance Exemple à l’ordre de deux boucles
Commençons par analyser les divergences UV qui apparaissent dans la théorie φ4 à l’ordre de deux boucles. Nous allons discuter les divergences des amplitudes IG ({pi }) dans la représentation d’impulsion, à impulsions externes {pi } fixées. Une analyse similaire peut être faite dans la représentation de position (nous y reviendrons) ou dans la représentation paramétrique (temps propre de Schwinger). Il est facile de se convaincre que dans la représentation d’impulsion, les divergences UV sont contenues dans les intégrales sur les impulsions internes
314
Théorie statistique des champs
associées aux parties irréductibles des diagrammes. En effet, les propagateurs entre les parties irréductibles portent des impulsions fixées, combinaisons linéaires des impulsions externes. On ne va donc considérer que les divergences des parties irréductibles. Il est aussi facile de voir que les divergences dues aux tadpoles se factorisent et sont éliminées par la renormalisation de la masse déjà effectuée à une boucle. On va donc ne considérer que les amplitudes des diagrammes irréductibles sans tadpoles. Il n’y a donc plus de diagramme irréductible à une boucle, et un seul diagramme irréductible à deux boucles.
(9.1) Pour les diagrammes à quatre pattes externes, il y a un seul diagramme à une boucle et deux diagrammes à deux boucles (aux permutations des pattes externes près)
,
,
(9.2)
Pour les diagrammes à six pattes externes, il y a un seul diagramme à une boucle, et trois diagrammes à deux boucles (aux permutations des pattes externes près)
,
,
,
(9.3)
Pour les diagrammes à huit pattes externes, il y a un seul diagramme à une boucle, et quatre diagrammes à deux boucles (aux permutations des pattes externes près)
,
,
,
,
(9.4)
On remarque qu’à deux boucles, les diagrammes sont planaires, c’est-à-dire peuvent être dessinés sur un plan sans croisements des lignes. Ceci n’est plus vrai à l’ordre de trois boucles et plus. Voici un exemple de diagramme
9. Renormalisation perturbative : aperçu général
315
irréductible non planaire à quatre pattes externes (le tétraèdre).
(9.5) Commençons par discuter les amplitudes des diagrammes à six et huit pattes. Nous avons vu que les intégrales de Feynman des diagrammes à une boucle sont convergentes en D = 4. En fait le vertex irréductible à six pattes est convergent si D < 6, celui à huit pattes si D < 8, etc. Certains des diagrammes à deux boucles sont divergents en D = 4. Cependant, il est assez facile de voir que cette divergence ne peut venir que de l’intégration sur les impulsions internes qui circulent dans un sous-diagramme irréductible à 4 pattes, donc équivalent au diagramme en bulle de la fonction irréductible à 4 pattes à une boucle. Par exemple, les diagrammes n˚ 1 et n˚ 3 de 9.3 (vertex à 6 pattes à 2 boucles) divergent logarithmiquement en log Λ si on introduit un régulateur UV (Pauli-Villars, « cut-off sharp »), mais ceci est dû aux sous-diagrammes représentés en gras.
←
←
,
(9.6) L’intégration sur l’impulsion de la deuxième boucle est quant à elle convergente en D = 4. Finalement, l’amplitude du diagramme 2 est convergente. Les divergences de ces intégrales de Feynman sont donc dues à la divergence de la fonction à 4 points à une boucle. On peut s’attendre, et en fait on montre facilement, que l’introduction du contreterme à une boucle de la constante de couplage suffit pour supprimer ces divergences. Le cas des diagrammes à deux et quatre pattes est plus compliqué, car ils contiennent de nouvelles divergences qui nécessitent une nouvelle renormalisation à deux boucles. Discutons d’abord le vertex à 4 pattes. En représentation d’impulsion, l’amplitude du premier diagramme à deux boucles est juste le carré de celle du diagramme à une boucle. Donc ce diagramme diverge comme (log Λ)2 mais cette divergence vient là encore de celle du diagramme à une boucle. =
×
(9.7)
Le deuxième diagramme est plus intéressant. Il contient une sousdivergence en log Λ due toujours au même sous-diagramme à une boucle,
316
Théorie statistique des champs
mais également une autre divergence logarithmique globale causée par l’intégration simultanée sur les impulsions des deux boucles internes, donc sur le diagramme tout entier.
→
et
(log Λ)2
(9.8)
C’est une intégrale du type
x
d4 k1 d4 k2
1 1 1 4 2 |k1 | |k1 + k2 | |k2 |2
(9.9)
La singularité UV est maintenant due à des diagrammes imbriqués les uns dans les autres. Enfin, analysons le cas le plus complexe du diagramme de la fonction à deux points. L’amplitude de ce diagramme est donnée par l’intégrale (pour la théorie de masse nulle) I(p) =
x
d4 k1 d4 k2
1 1 1 |k1 |2 |k2 |2 |p + k1 + k2 |2
(9.10)
p est l’impulsion externe. Ce diagramme contient 3 sous-diagrammes divergents à une boucle, représentés ici : ,
→ log Λ
,
(9.11)
L’intégration sur l’impulsion interne circulant sur chaque boucle interne va donner un log Λ. Mais le comptage de puissance (voir plus loin) suggère que lorsque les deux impulsions internes indépendantes k1 et k2 sont grandes et d’ordre Λ, l’intégrale globale diverge quadratiquement, non plus logarithmiquement. → Λ2
(9.12)
Le calcul précis montre que l’amplitude du diagramme diverge en fait avec le régulateur comme I(p) = a Λ2 + b p2 log Λ + m2 (c (log Λ)2 + c’ (log Λ)) + O(1)
(9.13)
Les divergences indépendantes de p correspondent à des termes proportionnels à φ2 dans l’action. Ils seront traités par une renormalisation de masse à deux boucles. La divergence en p2 log Λ est nouvelle par rapport à l’ordre d’une boucle. Elle correspond à un terme proportionnel à (∂µ φ)2 dans l’action et sera traitée par une renormalisation du champ φ.
9. Renormalisation perturbative : aperçu général
317
On voit déjà sur cet exemple que les divergences peuvent venir de diagrammes qui ne sont pas imbriqués les uns dans les autres ou disjoints, mais peuvent se chevaucher. On parle de « overlapping divergences ». C’est un phénomène général qui se produit de plus en plus aux ordres plus élevés. Voici par exemple un diagramme à 5 boucles et ses sous-diagrammes divergents. On voit que deux des sous-diagrammes divergents se superposent partiellement, et que leur intersection est elle-même un diagramme divergent !
(9.14) Le résultat final étant une divergence en (log Λ)3 .
9.2.2
Degré de divergence d’un diagramme
L’analyse générale des singularités UV commence par celle du comportement global de l’intégrale d’un diagramme lorsque toutes les impulsions internes deviennent grandes de la même façon, c’est-à-dire si l’on fait un changement d’échelle global. kinterne → λkinterne (9.15) Pour un diagramme irréductible, l’intégrale va se comporter comme λω
avec
B = nombre de boucles internes,
ω = DB − 2L
(9.16)
L = nombre de lignes internes (9.17)
Pour un diagramme irréductible, donc connexe, de φ4 , on a les relations topologiques entre ces nombres. On a d’abord B =L−V +1 ,
V = nombre de vertex
(9.18)
C’est une relation topologique générale (relation d’Euler pour les graphes). Pour la théorie φ4 , on a d’autre part la relation particulière 2L + N = 4V ,
N = nombre de pattes externes
(9.19)
puisque chaque vertex a 4 pattes externes et chaque ligne deux extrémités. Pour un diagramme connexe, on a donc ω = (D − 4)B + (4 − N ) ω est appelé le degré superficiel de divergence du diagramme.
(9.20)
318
Théorie statistique des champs
Si ω ≥ 0, on s’attend à ce que l’amplitude du diagramme diverge globalement (sans préjuger des divergences venant des sous-diagrammes, c’est-à-dire de l’intégration sur un sous-ensemble des impulsions internes). Le diagramme est dit superficiellement divergent. Si ω > 0, l’amplitude du diagramme diverge comme Λω . Si ω = 0, l’amplitude du diagramme diverge comme log Λ. Si ω < 0, l’amplitude du diagramme sera globalement convergente. Le diagramme est dit superficiellement convergent.
9.2.3
Théories super-renormalisables, renormalisables et non renormalisables
On voit qu’il y a trois cas très différents en fonction de la dimension D. D < 4 cas super-renormalisable Pour D < 4, il n’y a qu’un nombre fini de diagrammes divergents, et ce seulement pour N = 0 (diagrammes du vide) et N = 2 (fonction à deux points). D = 2 : N = 0, B = 1 ou 2 (énergie du vide) et N = 2, B = 1 (tadpole). Donc la renormalisation à une boucle du tadpole suffit à rendre la théorie finie UV. D = 3 : N = 0, B = 1, 2, 3 ou 4 (énergie du vide) et N = 2, B = 1 ou 2. Une fois traitée la fonction à deux points à deux boucles, la théorie sera finie. Il faudra une renormalisation de masse et une renormalisation du champ. La théorie φ4 est dite super-renormalisable. D = 4 cas renormalisable Pour D = 4, tous les diagrammes irréductibles à N = 0, N = 2 et N = 4 pattes sont divergents. Il s’avère que les divergences sont proportionnelles aux opérateurs 1 (diagrammes du vide), φ2 et (∂φ)2 (fonction à deux points) et φ4 (fonction à quatre points). Ils pourront en principe être traités par des renormalisations de l’énergie du vide, de la masse, de la constante de couplage et du champ. La théorie φ4 est dite renormalisable. D > 4 cas non renormalisable Pour D > 4, tous les graphes 1PI avec un nombre arbitraire de pattes N sont divergents à nombre de boucles suffisamment grand. Les fonctions à N points sont toutes divergentes et tous les opérateurs rentrent en jeu dans les divergences. On ne contrôlera plus rien perturbativement. La théorie φ4 est dite non renormalisable.
9. Renormalisation perturbative : aperçu général
319
Dimensionnalité de g : On notera (et ce n’est pas un hasard) que la renormalisabilité de la théorie est directement liée à la dimensionnalité de la constante de couplage > 0 super-renormalisable, [g] = = 4 − D (9.21) = 0 renormalisable, < 0 non renormalisable.
9.2.4
Divergences UV et OPE
La structure générale des singularités à courte distance et la procédure de renormalisation se comprennent assez bien, au moins heuristiquement, dans l’espace réel (espace des positions) grâce au développement à courte distance des produits d’opérateurs (OPE), tel qu’il a été défini pour la théorie du champ libre dans la section 6.6.5, et étudié dans les exercices de la section 6.15. Ceci met bien en évidence l’importance des propriétés de localité des théories quantiques des champs pour leur construction et leurs propriétés. Il faut également garder en tête que la représentation de la théorie des perturbations en diagrammes de Feynman est une représentation extrêmement commode, qui donne une image mentale des processus quantiques (en particulier des processus de diffusion) en termes de processus d’interaction et d’échange de particules (dans des états physiques ou virtuels), mais que ce n’est qu’une représentation. Seule la somme des diagrammes correspond à un objet physique (fonction de corrélation, amplitude de probabilité, élément de matrice ou probabilité) et que d’autres représentations peuvent être mieux adaptées. Au premier ordre en théorie des perturbations, la divergence UV de la fonction à 4 points est causée par le diagramme à une boucle . Dans l’espace des impulsions, l’intégrale correspondante est logarithmiquement divergente à grandes impulsions. Dans l’espace des positions, elle est divergente à courte distance, car elle se comporte en Z Z dDx G0 (x)2 ' dD x |x|(2−D) (9.22) Cette divergence est une conséquence du comportement à courte distance du produit de deux opérateurs composites φ4 (pour la théorie libre) donné explicitement en 6.135. Rappelons que cette OPE est de la forme schématique générale (pour D = 4) φ4 × φ4 = a |x]−8 1 + b |x]−6 φ2 + c |x|−4 (∂φ)2 + d |x|−4 φ4 + · · ·
(9.23)
Ces termes divergents sont engendrés par les sous-diagrammes irréductibles (1PI) présents dans le développement perturbatif et représentés dans la figure suivante. On n’a représenté ni les sous-diagrammes avec des tadpoles (qui sont pris en compte par une renormalisation de masse) ni ceux qui ne sont pas irréductibles (qui donnent des termes sous-dominants).
320
Théorie statistique des champs
4
4
Φ 1
Φ 2
=
1
2
+
1
+
2
+ ···
2
1
(9.24)
À l’ordre suivant en théorie des perturbations, les divergences viennent du comportement à courte distance du produit de trois opérateurs φ4 . h· · · φ4 (x1 ) φ4 (x2 ) φ4 (x3 ) · · · i0
x1 , x2 , x3 → x
(9.25)
Les divergences superficielles viennent du comportement global lorsque les distances entre les trois points sont du même ordre. Mais il faut tenir compte des sous-divergences qui apparaissent lorsque que la distance entre deux des points est beaucoup plus petite que les distances de ces deux points au troisième. Pour traiter proprement les divergences, il faut décomposer le voisinage de la singularité en sous-secteurs (ici au nombre de trois) où les distances sont rescalées vers zéro de façon successive, par exemple : |x2 − x3 | |x1 − x2 | et |x1 − x3 |
secteur (1, (2, 3)) :
(9.26)
On représente ici les sous-diagrammes (sans tadpoles et irréductibles pour simplifier) qui correspondent à l’OPE φ4 × φ4 × φ4 , dans un tel secteur 9.26. 4
4
Φ 1
Φ 2 4
2
=
1 3
Φ 3
(1) 2
2
2
+1
+1
+
3
(3)
2
(4) 2
2
+
1
+
1
3
1 3
3
(5)
(6)
2
+
3
3
(2)
+
1
1
+
1
3
(7)
2
+
1
3
(8)
2
3
(9)
(10) 2
2
+1
2
+1
+1
3
3
3
(11)
(12)
(13)
2
+
1
(9.27)
3
(14)
9. Renormalisation perturbative : aperçu général
321
4
4
Φ 1
Φ 2 4
Φ 3
2
=
1 3
(1) 2
2
2
+1
+1
+
3
(3)
2
(4) 2
2
+
1
+
1
3
1 3
3
(5)
(6)
2
+
3
3
(2)
+
1
1
1
2
1
+ 3
(7)
2
+ 3
(8)
3
(9)
(10) 2
2
+
2
1
+1
3
+
1 3
3
(11)
(12)
(13)
2
+
1
(9.28)
3
(14)
On voit que seuls certains des diagrammes d’ordre trois contribuent à des divergences emboîtées dans le secteur 9.26, donc donnent des divergences en (log Λ)2 . Il s’agit des diagrammes (1) (divergence en 1, énergie du vide), (2), (5) et (6) (divergence en φ2 , masse), et des diagrammes (8), (12) et (13) (divergence en φ4 , constante de couplage). La même analyse peut se répéter aux ordres suivants. Elle permet de voir pourquoi les divergences UV sont proportionnelles à des opérateurs locaux, et que seuls des sous-diagrammes emboîtés de façon compatible (avec les secteurs) contribuent, ce qui permet de traiter la question des « divergences se chevauchant ». On en restera à ce niveau très heuristique de présentation du problème.
322
9.3 9.3.1
Théorie statistique des champs
Renormalisation et contretermes Principe de la récurrence
Le principe général de la construction de la théorie renormalisée est donc celui déjà présenté en 8.4. Action renormalisée Les divergences UV à D = 4 peuvent être soustraites par l’insertion de termes proportionnels à des opérateurs locaux, donc par l’addition de contretermes locaux à l’action classique S[φ]. Ceci définit l’action renormalisée, dépendant des paramètres renormalisés gR couplage renormalisé
,
mR masse renormalisée
du régulateur UV Λ, et d’une échelle de renormalisation µ, Z B 2 C 4 A 2 D (∇φ) + φ + φ + D SR [φ] = d x 2 2 4!
(9.29)
Les coefficients A et B soustraient les divergences des fonctions à deux points, C celles des fonctions à quatre points. Le terme D (optionnel) est ajouté ici pour soustraire les divergences des diagrammes du vide (énergie « point zéro », c’est-à-dire de la densité d’énergie du vide). Ces coefficients sont définis comme une série entière (formelle) en gR , de la forme A= B= C=
∞ X K=0 ∞ X K=0 ∞ X
K gR AK (m2R , Λ, µ) ,
A0 = 1
(9.30)
K gR BK (m2R , Λ, µ) ,
B0 = m2R
(9.31)
C0 = 1
(9.32)
K+1 gR CK (m2R , Λ, µ) ,
K=0
(9.33) L’action renormalisée SR est donc la somme de l’action classique « naïve » S et des contretermes ∆S correspondant aux termes d’ordre K > 0. Z m2R 2 gR 4 1 2 d (∇φ) + φ + φ , ∆S[φ] = SR [φ]−S[φ] (9.34) S[φ] = d x 2 2 4! Il s’agit de montrer que les fonctions de corrélation renormalisées construites à partir de l’action renormalisée R D[φ] φ(z1 ) · · · φ(zN ) e−SR [φ] R hφ(z1 ) · · · φ(zN )iR = (9.35) D[φ] e−SR [φ]
9. Renormalisation perturbative : aperçu général
323
sont ordre par ordre (dans un développement en série formelle en gR ) finies UV dans la limite Λ → 0. Elles seront notées (N )
GR (z1 , · · · , zr ; gR , mR , µ) = lim hφ(z1 ) · · · φ(zN )iR Λ→∞
(9.36)
et vont définir les fonctions génératrices des fonctions de corrélations, des fonctions connexes et des fonctions irréductibles (fonctions de vertex) Z R D ZR [j] = D[φ] e−SR [φ]+ d x j(x)φ(x) (9.37) WR [j] = log ZR [j] Z ΓR [ϕ] =
dD x j(x)ϕ(x) − WR [j] ,
(9.38)
ϕ(x) =
δWR [j] j(x)
(9.39)
Pour être complètement cohérent, on devrait noter φ le champ renormalisé φR , et ϕ le champ de fond renormalisé ϕR . On gardera la notation sans indice R pour simplifier, mais il faut garder en mémoire ce fait quand on comparera deux schémas de renormalisation. En général les contretremes d’ordre K vont contenir des divergences en puissance et logarithmes de Λ, de la forme AK ∝ (log Λ)K 2
(9.40) K
BK ∝ Λ (log Λ)
(9.41)
K
CK ∝ (log Λ)
(9.42)
En fait ce seront des polynômes en log Λ. Il sera commode (mais pas obligatoire) d’écrire le contreterme de masse comme étant linéaire en m2R , donc de la forme B=
∞ X
K gR
0 00 Λ 2 BK (Λ, µ) + m2R BK (Λ, µ)
,
B00 = 0, B000 = 1 (9.43)
K=0 0 00 Les BK (Λ, µ) et BK (Λ, µ) étant des polynômes de degré K en log Λ.
Construction par récurrence La construction de la théorie renormalisée peut procéder par récurrence, en partant du calcul à une boucle (premier ordre en gK , c’est-à-dire K = 1). Si on a montré qu’à l’ordre K en théorie des perturbations, donc en prenant en compte les diagrammes avec B ≤ K boucles, on obtient des fonctions de corrélations finies UV, alors il s’agit de montrer qu’à l’ordre suivant K + 1, c’est-à-dire en calculant les contributions des diagrammes avec B = K + 1 (K) boucles et l’action renormalisée SR [φ] déterminée à l’ordre K, les divergences UV des diagrammes sont causées uniquement par les divergences globales des
324
Théorie statistique des champs
intégrales de Feynman, donc contrôlées par le degré superficiel de divergence des diagrammes de la théorie. Ceci permet de montrer que l’introduction de nouveaux contretermes à l’ordre K + 1, de la forme décrite plus haut, rend la théorie des perturbations finie UV à l’ordre de B = K + 1 boucles.
9.3.2
Théorie nue versus théorie renormalisée
On trouve souvent dans la littérature les mentions de « théorie nue » et de « théorie renormalisée » ainsi que de paramètres nus et renormalisés. Nous les emploierons ici dans le sens suivant. Partant de la théorie régularisée définie par l’action renormalisée SR [φ] et le régulateur Λ, on peut redéfinir un champ nu φB (« B » pour « bare » = nu) par champ nu φB (x) = Z 1/2 φ(x)
(9.44)
afin de réécrire l’action en termes de ce champ nu et d’une masse nue mB et d’un couplage nu gB comme Z m2B 2 gB 4 1 2 D (∇φB ) + φ + φ (9.45) SR [φ] = SB [φB ] = d x 2 2 B 4! B Il faut évidemment Z=A,
m2B =
B , A
gB =
C A2
(9.46)
SB [φB ] sera appelée l’action nue. La relation entre les paramètres nus gB , mB et renormalisés gR , mR est évidemment non linéaire en gR et dépend du régulateur Λ. Les fonctions de corrélations renormalisées (finies UV) h· · · iR s’écrivent en fonction des fonctions de corrélations de la théorie nue h· · · iB comme (à des termes d’ordre O(Λ−2 logk (Λ)) près dans la limite Λ → ∞) hφ(x1 ) · · · φ(xN )iR = Z −N/2 hφB (x1 ) · · · φB (xN )iB
(9.47)
Ceci est évidemment valable pour les fonctions de corrélations connexes, ce qu’on note (N )
(N )
WR (x1 , · · · , xN ; gR , mR , µ) = Z −N/2 WB (x1 , · · · , xN ; gB , mB , Λ) (9.48) et devient pour les fonctions irréductibles (N )
(N )
ΓR (x1 , · · · , xN ; gr , mr , µ) = Z N/2 ΓB (x1 , · · · , xN ; gB , mB , Λ)
(9.49)
Noter le changement de signe pour la puissance du facteur de renormalisation du champ Z, qui vient de la transformée de Legendre. De façon plus compacte, pour l’action effective renormalisée ΓR [ϕ; gR , mR , µ] = ΓB [ϕB ; gB , mB , Λ]
,
ϕB = Z 1/2 ϕ
(9.50)
9. Renormalisation perturbative : aperçu général
9.3.3
325
Échelle de renormalisation et groupe de renormalisation
Exactement comme pour le calcul à une boucle, la théorie renormalisée, donc la forme précise des contretermes, est donnée en choisissant des conditions de renormalisation particulières, à une échelle de renormalisation pour les impulsions µ choisies au départ. Il faut une condition de normalisation pour la fonction à quatre points, qui définit le couplage renormalisé gR , et deux conditions pour la fonction à deux points, qui définissent la masse renormalisée m2R et la normalisation du champ (renormalisé) φ = φR . Là encore, en général, la masse physique de la théorie mphys est différente de la masse renormalisée mR , qui est un paramètre de définition de la théorie. Exactement comme on l’a étudié à l’ordre d’une boucle, pour une théorie quantique donnée, le choix de différentes échelles de normalisations µ et µ0 correspond à différentes valeurs des paramètres renormalisées g et m2 , et à différentes normalisations du champ φ. µ, gR , m2R φ
⇐⇒
2
0 µ0 , gR , m0 R φ0
(9.51)
Ceci conduit à définir les fonctions et les équations du groupe de renormalisation pour la théorie à tous les ordres de la théorie des perturbations. Voir les sections 8.7 et 8.8, où les définitions 8.92, 8.96 et 8.94 pour les fonctions β, γ et η sont maintenant valables à tous les ordres, ainsi que les équations de flot du groupe de renormalisation 8.104 et les équations de flot de Wilson 8.112 et 8.113. Enfin, le choix de différentes procédures de renormalisation, notons-les R et R0 , pour un choix d’échelle de renormalisation qui peut être le même µ = µ0 , conduit à des paramètres renormalisés différents pour la même théorie quantique 0 02 0 µ, gR , m2R φ ⇐⇒ µ, gR (9.52) 0 , m R0 φ Ceci correspond simplement à une redéfinition des couplages renormalisés, c’est-à-dire à un changement de système de coordonnées dans l’espace des théories φ4 renormalisées. Les changements correspondants pour les fonctions bêta et les équations de flot du groupe de renormalisation sont obtenus simplement en se rappelant que les fonctions bêta et les fonctions de Wilson sont les composantes d’un champ de vecteurs (qui engendre les flots du groupe de renormalisation) sur l’espace des théories, donc qu’elles se transforment comme des vecteurs (contravariants).
9.4 9.4.1
Premier aperçu historique La renormalisation de QED
Historiquement, la théorie de la renormalisation a été développée plus ou moins heuristiquement à la fin des années 1940 par les créateurs de la
326
Théorie statistique des champs
QED (Kramers, Bethe, Schwinger, Feynman, Tomonaga, Stuckelberg, Dyson), comme une procédure pour se débarrasser des divergences UV en modifiant le lagrangien par l’adjonction de contretermes eux-mêmes infinis. L’existence de divergences UV avait déjà été découverte dans les années 1930. La théorie de la renormalisation apparaissait alors pour beaucoup (y compris certains de ses inventeurs) comme mystérieuse et assez magique. Le succès de la théorie, les progrès dans sa compréhension mathématique dans le cadre perturbatif, les concepts de couplages effectifs ont permis sa diffusion en physique des hautes énergies. Le concept de groupe de renormalisation et de ses équations a émergé des travaux de Stueckelberg et Petermann, Gell-Mann et Low, Bogoliubov et Shirkov, puis Callan et Symanzik. Jusqu’à la découverte de la liberté asymptotique des théories de jauges non abéliennes, il n’était néanmoins pas clair pour beaucoup de théoriciens (et non des moindres, L. Landau par exemple) que ce soit vraiment cohérent. C’est le développement des idées de théorie effective de basse énergie, et les idées de groupe de renormalisation développées notamment par K. Wilson pour la physique de la matière condensée à partir des concepts de physique des hautes énergies qui a vraiment changé la donne pour les physiciens, et (plus lentement) chez les mathématiciens.
9.4.2
Les démonstrations de la renormalisabilité
Le théorème BPHZ La renormalisabilité de la théorie φ4 à tous les ordres de la théorie des perturbations, ainsi que celle de l’électrodynamique quantique (QED), a été démontrée par Bogoliubov-Parasiuk (BP) et précisée par Hepp-Zimmerman (HZ) dans la représentation d’impulsion des amplitudes de Feynman. Ce résultat fondamental est connu sous le nom de théorème BPHZ. En particulier la méthode montre que l’introduction des contretermes par récurrence est équivalente à effectuer une opération de soustraction des divergences (c’est-à-dire de modification des intégrants sur les impulsions), dite « opération R », qui construit directement des amplitudes de Feynman finies UV à partir d’intégrales convergentes. Cette procédure respecte les propriétés fondamentales de la théorie (unitarité, localité, causalité). Dans cette construction, l’organisation des sous-divergences selon des « secteurs de Hepp » est importante. Ces secteurs sont l’analogue dans l’espace des impulsions des secteurs que l’on a évoqués lors de la discussion sur les relations entre les divergences UV et l’OPE dans l’espace des positions. La méthode a été étendue au cas des théories de masse nulle par Zimmerman-Lowenstein (LZ). Il existe une version où l’opération de soustraction des divergences est réalisée dans la représentation paramétrique (temps propre), due à Bergère-Lam.
9. Renormalisation perturbative : aperçu général
327
La construction de Epstein-Glaser Une construction équivalente de la théorie renormalisée φ4 , dans l’espace des positions, a été obtenue par Epstein-Glaser. Cette construction fait intervenir la théorie des distributions, car, comme on l’a discuté rapidement dans le (N ) cas du champ libre, les fonctions de corrélations GR (Z1 , · · · zN ) sont en fait en général des distributions dans les multivariables z = (z1 , . . . zN ) ∈ RdN , et les produits de champs locaux φ(z1 ) · · · φ(zN ) sont des distributions à valeurs opératorielles agissant sur l’espace de Hilbert de la théorie. Dérivations utilisant les équations du groupe de renormalisation Des dérivations « plus modernes » de la renormalisabilité ont été initiées par Callan et reposent sur l’utilisation des équations de Callan-Symanzik qui permettent d’obtenir le comportement à grandes impulsions/énergies (dont dans le régime UV) des fonctions de corrélations. Si par récurrence on a montré que la théorie est renormalisable à K boucles, le comportement UV des fonctions de corrélations satisfait ces équations de CS, et ceci permet de contrôler les divergences à l’ordre K + 1 sans passer par des opérations de soustraction des amplitudes.
9.4.3
Dérivation à la Wilson
Les idées de Wilson et la formulation du groupe de renormalisation comme flot dans l’espace des théories effectives à basses énergies (limite IR) conduisent à des démonstrations de la renormalisabilité de φ4 en étudiant les comportements de l’action effective en fonction de l’échelle des moments, et de redériver une procédure de renormalisation de la théorie. Cette approche a été initiée par Polchinski en termes de l’action renormalisée. Une approche un peu différente a été proposée par Wetterich en termes de l’action effective renormalisée. Ces deux approches sont en fait équivalentes, via une transformation de Legendre, comme l’a montré Morris. Ces méthodes sont assez largement utilisées. L’approche de Polchinski a conduit à des constructions et des résultats mathématiques rigoureux et non perturbatifs (donc permettant de contrôler les différents termes perturbatifs, voire d’obtenir des résultats exacts sur la théorie non perturbative) par les méthodes de la théorie constructive des champs. L’approche de Wetterich est quant à elle efficace pour les études numériques ou semi-analytiques non perturbatives des flots du groupe de renormalisation dans des cas où la théorie des perturbations ne donne pas de résultats fiables.
328
9.4.4
Théorie statistique des champs
Autres approches
Enfin, mentionnons brièvement des résultats encore plus récents. La structure de la théorie des perturbations et des singularités UV peut être étudiée par les techniques mathématiques des algèbres de Hopf. Cette approche, initiée par Kreimer et Connes, permet d’utiliser des techniques d’algèbre (commutative dans le cas des algèbres de Hopf) pour réorganiser la théorie des perturbations et les divergences UV. Ces idées éclairent d’un nouveau jour les anciens résultats, et sont très fructueuses pour l’étude des propriétés analytique des amplitudes de Feynman et leurs rapports avec divers domaines des mathématiques pures. Les idées de dualité et correspondance AdS/CFT (Anti-de-Sitter/Conformal Field Theory), issues de la théorie des cordes et de la gravité quantique, ont également conduit à un nouveau regard et de nouvelles approches sur la théorie de la renormalisation en théorie des champs. On parle de « renormalisation holographique ». Mais tout ceci dépasse de loin le cadre de cet ouvrage, et les compétences de l’auteur...
9.5
Notes
Les différents aspects de la théorie de la renormalisation perturbative sont déjà bien traités dans les ouvrages de références déjà cités. On peut ajouter l’ouvrage ancien de Bogoliubov et Shirkov [BS59]. Pour une présentation historique récente on pourra regarder la revue de J. Zinn-Justin [ZJ99]. Des exposés sur les aspects plus mathématiques de la théorie de la renormalisation sont disponibles dans le volume du séminaire Poincaré de 2002, celui de V. Rivasseau [Riv03] pour une introduction, de G. Gallavotti [Gal03] pour les applications à la mécanique classique, et celui de A. Connes pour les aspects algèbres de Hopf [Con03]. Pour une introduction aux méthodes de groupe de renormalisation non perturbatives, voir par exemple Delamotte [Del12] et les autres contributions de ce tome.
Index φ4 (théorie), 207, 242, 299 action, 63, 121 action classique, 5, 36 action de Ginzburg-Landau, 131 action effective, 211, 239, 241, 246 action euclidienne, 41, 63, 76, 124, 164, 208 action nue, 280, 324 action renormalisée, 278, 280, 288, 322 algèbre de Grassmann, 145 amplitude de Feynman, 215, 233, 250 amplitude de probabilité, 21, 35 amplitude irréductible, 233 amplitude renormalisée, 285, 286 anomalie, 261, 271 approximation WKB, 88 arbre (graphe), 223 boson, 85, 116, 143, 204 boson chargé, 134, 135 boson relativiste, 135 bra, 17 chaîne de Markov, 17 chaîne de spins, 75 champ électromagnétique, 101 champ de fond (background field), 211, 238 champ libre, 160, 203 champs de Grassman, 152 condensat, 123, 130 condition de normalisation, 288 conservation du nombre de particules, 122, 134 constante de Boltzmann, 15, 76 constante de couplage, 208, 283 constante de couplage effective, 294 constante de Planck, 20, 55, 76
contreterme, 279, 280 contreterme de constante de couplage, 285, 286, 300 contreterme de masse, 284, 286, 301 couplage renormalisé, 300 courant, 260, 261 crochet de Poisson, 8–10, 123 cumulant, 80 décomposition de l’identité, 24, 118, 139, 149 dérivée fonctionnelle, 5, 11, 210 déterminant de van Vleck, 92 développement à courte distance des produits d’opérateurs, 187 développement à temps court, 62 développement à temps court de produit d’opérateurs, 54 développement en , 300 développement en boucles, 230, 249 développement perturbatif, 212 degré superficiel de divergence, 317 densité de niveaux, 98 densité locale de bosons, 134 diagramme connexe, 227 diagramme de Feynman, 181, 182, 188, 214 diagramme du vide, 216, 277 diagramme irréductible, 231, 314 dilatation, 296 dimension anormale, 293, 297 distribution de Bose-Einstein, 132 distribution de Gibbs, 16 divergence infra-rouge, 251, 254, 300 divergence ultra-violette, 178, 251, 255, 274, 313, 319 divergences superposées (overlapping divergences), 317
330 East Coast Metric, 32 échelle de régularisation, 271 échelle de renormalisation, 285, 287, 288, 290, 291, 325 échelle de soustraction, 190 effet Aharonov-Bohm, 105 effet Hall quantique, 143 énergie d’excitation, 79 entropie, 15 entropie de von Neumann, 28 entropie d’intrication, 29, 32, 33 équation d’Euler-Lagrange, 4 équation de Callan-Symanzik, 287, 292, 298, 304 équation de conservation, 261 équation de flot, 295 équation de Gross-Pitaevskii, 135 équation de Hamilton-Jacobi, 12 équation de Klein-Gordon, 106, 135, 160 équation de la chaleur, 74 équation de Liouville, 15 équation de Schrödinger, 21, 43, 47, 103, 130 équation différentielle stochastique, 71 équation du mouvement, 4, 22, 62, 122 équations de Hamilton, 7, 8 équations de Hamilton-Jacobi, 26 équations de Maxwell, 102 équations de Schwinger-Dyson, 199, 258 esclavage ultra-violet, 309 espace de configuration, 3 espace de Fock, 116, 125, 145, 151 espace de Hilbert, 17 espace de probabilité, 13 espace des configurations, 4 espace des phases, 7, 94, 104 espace discrétisé, 127, 166 état cohérent, 116, 125, 137, 138, 148 état de Gibbs, 29, 54, 56, 75, 164 état de plus haut poids, 137, 138 état fondamental, 61 état KMS, 30 état mixte (statistique), 27 état quantique, 18, 22, 29 facteur d’échelle, 295
Théorie statistique des champs facteur de symétrie, 215, 219, 224 fentes d’Young, 93 fermion, 85, 144 Feynman-Kac, 74 flot de Wilson, 296, 297 flot du GR (covariance), 305 flot du groupe de renormalisation, 296, 304 flot hamiltonien, 8 flots du groupe de renormalisation, 305 fluctuation quantique, 76 fluctuation thermique, 76 flux magnétique, 102 fonction β, 306 fonction η, 292 fonction γ, 292 fonction à 2 points, 216, 226, 275, 286, 288, 300 fonction à 4 points, 217, 227, 276, 285, 286, 289, 300 fonction bêta, 292, 302, 303 fonction connexe, 80, 211, 227 fonction connexe à 4 points, 228 fonction d’onde, 24 fonction de Bessel, 174 fonction de corrélation, 55, 67, 165, 180, 210, 295 fonction de Green, 110, 165 fonction de partition, 76, 98, 124, 150 fonction de Wightman, 165 fonction de Wilson, 297, 303 fonction hypergéométrique, 274 fonction irréductible, 211, 235 fonction renormalisée, 279, 294 fonctionnelle génératrice, 209, 212 fonctionnelle génératrice connexe, 229 fonctionnelle génératrice renormalisée, 279 formule de Baker-Campbell-Hausdorff, 46 formule de Trotter-Kato, 46 formule des classes, 221 formule des traces, 100 fréquence de Larmor, 140 fréquences de Matsubara, 179 générateur des translations, 25 gaz de bosons, 124, 133
Index gaz de fermions, 152 GFF (champ libre gaussien), 184 grandes déviations, 238 graphe, 223 graphe connexe, 223 graphe irréductible, 223 groupe conforme, 284 groupe de renormalisation, 296, 327 Hölder continuité, 73 hamiltonien, 7, 20, 42, 161 hessien, 64, 272 identité de Jacobi, 8, 10 intégrale de chemin, 35, 48, 83, 94, 140, 150, 153 intégrale fonctionnelle, 127, 128, 163, 171, 209 intégrale gaussienne, 47, 118, 147, 148 interaction à deux corps, 130 invariance CT, 122 invariance d’échelle, 283 invariance par translation, 263 invariance U(1), 134
331 mouvement brownien, 71 nombre de Betti, 230 nombre de boucles, 223 non renormalisable (théorie), 318 noyau de la chaleur, 113, 202 observable, 18, 47 observable renormalisée, 279 opérateur, 18, 48, 121 opérateur (−1)F , 149 opérateur composite, 191 opérateur d’évolution, 21, 26, 30, 37, 84, 103, 141, 150 opérateur de champ, 129, 161 opérateur différentiel, 64, 151 opérateur local, 183 opérateur pseudo-différentiel, 65 opérateurs de création/annihilation, 62, 145 OPE (Operator Product Expansion), 187, 193, 277, 319 orbite périodique, 99 oscillateur anharmonique, 77, 82 oscillateur harmonique, 61, 77, 131
ket, 17 lagrangien, 4, 160 liberté asymptotique, 310 limite à temps court, 43, 53, 99 limite continue, 41, 45, 111, 120, 171 limite semi-classique, 91, 99, 123, 130 loi de Bayes, 14 longueur de corrélation, 79, 81, 175 mécanique quantique, 17, 153 mécanisme de Higgs, 135 méthode de la phase stationnaire, 91 méthode du col, 88, 91 marche aléatoire, 109, 202 masse physique, 281, 287 masse renormalisée, 281, 286, 287, 301 matrice de Pauli, 136 matrice densité, 27, 29, 32 matrice hessienne, 64 mesure de Liouville, 9, 10 mesure projective, 18 modèle d’Ising, 76 modèle gaussien, 169, 175
paramètre de Schwinger, 201, 255 paramètre effectif, 288, 289, 294 paramètre nu, 302 paramètre renormalisé, 279, 288, 291, 302, 322 particule libre, 37, 70 particule relativiste, 107, 203 pfaffien, 147 phase géométrique, 123, 138, 142 physique statistique, 75 point col, 90 point conjugué, 66 point fixe, 306 point fixe de Wilson-Fisher, 306 point fixe stable, 306 point tournant, 94 pôle de Landau, 310 potentiel à un corps, 129, 152 potentiel chimique, 128 potentiel de Coulomb, 85 potentiel de Yukawa, 179 précession de Larmor, 143 principe d’action quantique, 199
332 principe d’exclusion de Fermi, 145 principe de correspondance, 49, 51, 118, 121, 129, 149 principe de moindre action, 5 principe variationnel, 5, 10 probabilité, 13, 18 probabilité conditionnelle, 14 processus de diffusion, 74 processus stochastique, 17, 70 produit d’opérateurs, 51 produit normal, 121, 187, 189, 277 propagateur, 38, 67, 174, 181, 201 propagateur amputé, 231 propagateur de Feynman, 176 propagateur du boson, 133 QED (électrodynamique quantique), 287 Qu-bit, 32 quantification canonique, 19, 51, 103, 125, 153, 161 quantification de Bohr-Sommerfeld, 101 quantification du spin, 142 quantum de flux, 104 régularisation de Pauli-Villars, 269, 273 régularisation dimensionnelle, 269, 274, 276, 277 régularisation par fonction zêta, 272 régularisation par point splitting, 268, 273 régularisation sur réseau, 109, 267 régularisation ultra-violette, 266 régulateur dur, 268, 275, 276 résolvante, 98 règle de Born, 19 relation d’Euler, 230 relations d’anticommutation, 145, 152 relations de commutation, 20, 53, 129, 162 renormalisable (théorie), 318 renormalisation, 278, 299, 313 renormalisation de constante de couplage, 280 renormalisation de fonction d’onde, 280, 285
Théorie statistique des champs renormalisation de masse, 280, 284, 286 renormalisation dimensionnelle, 311 renormalisation du champ, 291 représentation adjointe, 137 représentation d’impulsion, 252 représentation de Bargmann-Segal, 132 représentation de Heisenberg, 21, 35, 162 représentation de Källén-Lehmann, 282 représentation de position, 250 représentation de Schrödinger, 20, 161 représentation de Schwinger, 255, 270 représentation de SU(2), 136 représentation fondamentale, 137 représentation projective, 139 rescaling, 296 rotation de Wick, 32, 36, 42, 59, 63, 89, 112, 124, 150, 164, 175 schéma de renormalisation, 291 seconde quantification, 125 singularité ultra-violette, 188 sphère de Bloch, 140 spin, 136 ssIntChemSpinExpl, 140 structure de Poisson, 10 SU(2) (groupe), 136 super-renormalisable (théorie), 318 symétrie, 122, 259 T-produit, 21, 23, 26, 50, 54 tadpole, 188, 270, 275, 314 température, 31, 55, 76, 164 temps complexe, 30 temps discrétisé, 39, 44, 70, 75, 119, 127, 141, 167 temps euclidien, 32, 36, 41, 43, 54, 58, 64, 75, 97, 108, 124, 133, 164 temps euclidien périodique, 55, 164 temps propre, 201 temps réel, 44, 56, 66, 112 tenseur énergie-impulsion, 263, 284 terme de contact, 200 théorème d’Ehrenfest, 26 théorème de Darboux, 10 théorème de Ehrenfest, 23
Index théorème de Noether, 259 théorème de Wick, 148, 180, 201, 214 théorie de masse nulle, 283, 288 théorie des champs, 128 théorie effective, 306 théorie massive, 286, 298 théorie renormalisée, 280, 291, 300 transformée de Fourier, 25 transformée de Legendre, 101, 211, 238 transformation canonique, 12, 97
333 transformation d’échelle, 283, 294, 303 transformation de jauge, 102, 103 transformations de Lorentz, 160 variété symplectique, 9 variable aléatoire, 121 vecteur d’état, 17 West Coast Metric, 32
334
Théorie statistique des champs
Bibliographie [AHKM08] S. Albeverio, R. Høegh-Krohn, S. Mazzucchi. Mathematical Theory of Feynman Path Integrals : An Introduction. Lecture Notes in Mathematics. Springer Berlin Heidelberg, 2008. [Arn74] V.I. Arnold. Les méthodes mathématiques de la mécanique classique. Éditions Mir, 1974. [Bal82] R. Balian. Du microscopique au macroscopique : cours de physique statistique de l’École polytechnique, volume 1 of Du microscopique au macroscopique : cours de physique statistique de l’École polytechnique. École polytechnique, 1982. [Bal94] R. Balian. Physique statistique, volume 2 of Bicentenaire (1794-1994). École polytechnique, Département de physique, 1994. [Ber66] F.A. Berezin. The Method of Second Quantization. Academic Press, 1966. [Bré10] E. Brézin. Introduction to Statistical Field Theory. Cambridge University Press, 2010. [Bro05] L. M. Brown. Feynman’s Thesis : A New Approach to Quantum Theory. World Scientific, 2005. [BS59] N. N. Bogoliubov, D. V. Shirkov. The Theory of Quantized Fields. Interscience, 1959. [Car96] J. Cardy. Scaling and Renormalization in Statistical Physics. Cambridge Lecture Notes in Physics. Cambridge University Press, 1996. [CDM10] P. Cartier, C. DeWitt-Morette. Functional Integration : Action and Symmetries. Cambridge Monographs on Mathematical Physics. Cambridge University Press, 2010. [CH08] R. Courant, D. Hilbert. Methods of Mathematical Physics, volume 1. Wiley, 2008. [CL00] P.M. Chaikin, T.C. Lubensky. Principles of Condensed Matter Physics. Cambridge University Press, 2000. [Con03] A. Connes. Symétries galoisiennes et renormalisation. In Birkhäuser, editor, La renormalisation, séminaire Poincaré 2002, volume 30 of Progress in Mathematical Physics. Duplantier, B. and Rivasseau, V., 2003. [CTDL73a] C. Cohen-Tannoudji, B. Diu, F. Laloë. Mécanique quantique -Tome I. Collection Enseignement des sciences, 16. Masson, 1973. [CTDL73b] C. Cohen-Tannoudji, B. Diu, F. Laloë. Mécanique quantique Tome II. Collection Enseignement des sciences. Hermann, 1973. [CTDL92] C. Cohen-Tannoudji, B. Diu, F. Laloe. Quantum Mechanics, 2 Volume Set. Wiley, 1992. [CTLD17] C. Cohen-Tannoudji, F. Laloe, B. Diu. Mécanique quantique Tome III : Fermions, bosons, photons, corrélations et intrication. Savoirs Actuels. EDP Sciences, 2017. [Dav14] F. David. The Formalisms of Quantum Mechanics : An Introduction. Lecture Notes in Physics. Springer International Publishing, 2014.
Bibliographie
335
[DEF+ 99a] P. Deligne, P. Etingof, D.S. Freed, L.C. Jeffrey, D. Kazhdan. Quantum Fields and Strings : A Course for Mathematicians, volume 1. American Mathematical Society, 1999. [DEF+ 99b] P. Deligne, P. Etingof, D.S. Freed, L.C. Jeffrey, D. Kazhdan. Quantum Fields and Strings : A Course for Mathematicians, volume 2. American Mathematical Society, 1999. [Del12] B. Delamotte. An introduction to the nonperturbative renormalization group. In Achim Schwenk and Janos Polonyi, editors, Renormalization Group and Effective Field Theory Approaches to Many-Body Systems, number 852 in Lecture Notes in Physics. Springer, 2012. [Fey48] R. P. Feynman. Space-Time Approach to Non-Relativistic Quantum Mechanics. Reviews of Modern Physics, 20 :367–387, April 1948. [FH65] Richard Phillips Feynman, Albert R Hibbs. Quantum mechanics and path integrals. New York : McGraw-Hill, 1965. [Fra13] E. Fradkin. Field Theories of Condensed Matter Physics. Cambridge University Press, 2013. [Gal99] G. Gallavotti. Statistical Mechanics : A Short Treatise. Theoretical and Mathematical Physics. Springer Berlin Heidelberg, 1999. [Gal03] G. Gallavotti. Renormalisation et mécanique classique. In Birkhäuser, editor, La renormalisation, séminaire Poincaré 2002, volume 30 of Progress in Mathematical Physics. Duplantier, B. and Rivasseau, V., 2003. [Gal13] G. Gallavotti. The Elements of Mechanics. Theoretical and Mathematical Physics. Springer Berlin Heidelberg, 2013. [ID89] C. Itzykson, J.M. Drouffe. Théorie statistique des champs. Number 2, Savoirs Actuels. EDP Sciences, 1989. [ID91] C. Itzykson, J.M. Drouffe. Statistical Field Theory : Volume 1, From Brownian Motion to Renormalization and Lattice Gauge Theory. Cambridge Monographs on Mathematical Physics. Cambridge University Press, 1991. [ID13] C. Itzykson, J. M. Drouffe. Théorie statistique des champs. Savoirs Actuels. EDP Sciences, 2013. [IZ12] C. Itzykson, J.B. Zuber. Quantum Field Theory. Dover Books on Physics. Dover Publications, 2012. [Kam11] A. Kamenev. Field Theory of Non-Equilibrium Systems. Cambridge University Press, 2011. [KBD79] M. Kac, K. Baclawski, M. D. Donsker. Mark Kac : probability, number theory, and statistical physics : selected papers. MIT Press, 1979. [KS85] J.R. Klauder, B.-S. Skagerstam. Coherent States : Applications in Physics and Mathematical Physics. World Scientific, Singapore, 1985. [KSF01] H. Kleinert, V. Schulte-Frohlinde. Critical Properties of [Greek Letter Phi]4-theories. World Scientific, 2001. [Lal18] F. Laloe. Comprenons-nous vraiment la mécanique quantique ? 2ème édition, révisée et augmentée. Savoirs Actuels. EDP Sciences, 2018. [LB06] M. Le Bellac. Quantum Physics. Cambridge University Press, 2006.
336
Théorie statistique des champs
[LB12] M. Le Bellac. Des phénomènes critiques aux champs de jauge - Une introduction aux méthodes et aux applications de la théorie quantique des champs. Savoirs Actuels. EDP Sciences, 2012. [LB13a] M. Le Bellac. Physique quantique : Vol. 1 - Fondements. Savoirs Actuels. EDP Sciences, 2013. [LB13b] M. Le Bellac. Physique quantique : Vol. 2 - Applications et exercices corrigés. Savoirs Actuels. EDP Sciences, 2013. [LBB91] M. Le Bellac, G. Barton. Quantum and Statistical Field Theory. Oxford Science Publ. Clarendon Press, 1991. [LL94] L.D. Landau, E.M. Lifchitz. Physique théorique : Mécanique. Physique théorique. Ellipses Marketing, 1994. [Par98] G. Parisi. Statistical Field Theory. Avalon Publishing, 1998. [Per86] A.M. Perelomov. Generalized Coherent States and Their Applications. Texts and Monographs in Physics. Springer-Verlag, 1986. [Pol87] A. Polyakov. Gauge Fields and Strings, volume 3 of Contemporary concepts in physics, ISSN 0272-2488. CRC Press, 1987. [PS18] M.E. Peskin, D. V. Schroeder. An Introduction To Quantum Field Theory. CRC Press, 2018. [Riv03] V. Rivasseau. Introduction à la renormalisation. In Birkhäuser, editor, La renormalisation, séminaire Poincaré 2002, volume 30 of Progress in Mathematical Physics. Duplantier, B., Rivasseau, V., 2003. [SG09] M. Stone, P. Goldbart. Mathematics for Physics : A Guided Tour for Graduate Students. Cambridge University Press, 2009. [SH82] L. Schwartz, D. Huet. Méthodes mathématiques pour les sciences physiques. Enseignement des sciences. Hermann, 1982. [She07] S. Sheffield. Gaussian free fields for mathematicians. Probability Theory and Related Fields, 139(3) :521–541, 2007. [Tsv07] A.M. Tsvelik. Quantum Field Theory in Condensed Matter Physics. Cambridge University Press, 2007. [Wei95] S. Weinberg. The Quantum Theory of Fields. Number vol. 1 in Quantum Theory of Fields, Vol. 2 : Modern Applications. Cambridge University Press, 1995. [Wic54] G. C. Wick. Properties of bethe-salpeter wave functions. Phys. Rev., 96 :1124–1134, 1954. [Zee10] A. Zee. Quantum Field Theory in a Nutshell : Second Edition. In a Nutshell. Princeton University Press, 2010. [ZJ99] J. Zinn-Justin. Renormalization and renormalization group : From the discovery of uv divergences to the concept of effective field theories. In Zuber J.-B de Witt-Morette C., editor, Proceedings of the NATO ASI on Quantum Field Theory : Perspective and Prospective, number C 530 in NATO ASI Series, pages 375–388. Kluwer Academic Publishers, 1999. [ZJ02] J. Zinn-Justin. Quantum Field Theory and Critical Phenomena. International series of monographs on physics. Clarendon Press, 2002.
Bibliographie
337
[ZJ10] J. Zinn-Justin. Path Integrals in Quantum Mechanics. Oxford Graduate Texts. OUP Oxford, 2010. [ZJ12] J. Zinn-Justin. Intégrale de chemin en mécanique quantique : introduction. Savoirs Actuels. EDP Sciences, 2012.